Meta Enfrenta Processo por Uso de Dados Piratas em Modelos de IA
No centro de uma polêmica, a Meta, dirigida pelo CEO Mark Zuckerberg, é alvo de um processo por direitos autorais. Os advogados dos autores alegam que Zuckerberg deu sinal verde para a equipe dos modelos de IA Llama da empresa utilizar um conjunto de dados composto por ebooks e artigos piratas para treinamento.
O caso, conhecido como Kadrey v. Meta, é apenas um entre muitos processos contra gigantes da tecnologia que desenvolvem inteligência artificial. As acusações dizem respeito ao uso de obras protegidas por direitos autorais sem autorização. Em geral, as empresas como a Meta defendem que estão protegidas pela doutrina de uso justo, que permite o uso de obras protegidas para criar algo novo, contanto que isso seja suficientemente transformador. No entanto, muitos criadores refutam esse argumento.
Revelações Importantes em Documentos Recentes
Documentos recentemente divulgados e não redigidos, apresentados ao Tribunal Distrital dos EUA para o Norte da Califórnia, revelam detalhes cruciais. Os autores, incluindo renomados escritores como Sarah Silverman e Ta-Nehisi Coates, mencionam depoimentos da Meta que mostram que Zuckerberg autorizou a utilização do conjunto de dados conhecido como LibGen para treinar os modelos Llama.
O Que É LibGen?
LibGen, que se define como um agregador de links, possibilita o acesso a obras protegidas de editoras como Cengage Learning, Macmillan Learning, McGraw Hill e Pearson Education. Esta plataforma já enfrentou várias ações judiciais, sendo determinada a fechar e multada em dezenas de milhões de dólares por infrações de direitos autorais.
Preocupações Dentro da Meta
De acordo com o depoimento da Meta, repassado pelos advogados dos autores, Zuckerberg liberou o uso do LibGen, mesmo com a preocupação manifestada por membros da equipe de IA da Meta. O documento cita que empregados da Meta se referiram ao LibGen como um “conjunto de dados que sabemos ser pirata” e expressaram que o uso poderia prejudicar a posição de negociação da Meta com os reguladores.
Aprovação Controverso e Táticas Duvidosas
O arquivo também menciona um memorando dirigido aos decisores da IA da Meta, indicando que, após uma “escalada a MZ”, a equipe foi “aprova para usar o LibGen”. Segundo as declarações, Meta não apenas utilizou, mas pode ter tentado encobrir a infringência de direitos autorais, removendo dados de atribuição do LibGen.
Processos e Implicações Legais
Em novas acusações, os advogados afirmam que um engenheiro da Meta, Nikolay Bashlykov, criou um script para eliminar informações de direitos autorais, como a palavra “copyright”, de ebooks acessados através do LibGen. Isso indica que a empresa não só usava os dados para treinamento, mas também com a intenção de ocultar a violação de direitos autorais.
Torrenting e Consequências Legais
O documento revela que a Meta utilizou torrent para acessar o LibGen, uma prática que gerou desconforto entre seus engenheiros de pesquisa. Os advogados argumentam que a empresa, ao realizar o torrenting, participou efetivamente de outra forma de violação de direitos autorais.
Além disso, a decisão da Meta de ignorar métodos legais para adquirir livros e se envolver em uma rede de torrent ilegal é plausível como prova de violação de direitos autorais. O caso ainda está longe de ser decidido, e o tribunal pode favorecer a Meta caso considere válido o argumento de uso justo.
Reações e Expectativas Futuras
As alegações, no entanto, refletem negativamente na Meta, conforme o juiz Thomas Hixson notou em uma ordem na quarta-feira, ao rejeitar o pedido da Meta de redigir grandes partes do processo. Ele observou que o pedido de sigilo não visava proteger informações sensíveis, mas sim evitar publicidade negativa.
Estamos esperando um retorno da Meta e atualizaremos essa matéria assim que tivermos novidades.