Meta em Foco: Concorrendo com OpenAI e Desafios Legais
Recentemente, mensagens internas divulgadas por um tribunal revelaram que executivos e pesquisadores da Meta estavam obcecados em superar o modelo GPT-4 da OpenAI durante o desenvolvimento do Llama 3. Isso ocorreu em meio a um processo judicial sobre direitos autorais de IA, conhecido como Kadrey v. Meta.
“Honestamente… Nosso objetivo precisa ser o GPT-4,” afirmou Ahmad Al-Dahle, VP de IA Generativa da Meta, em uma mensagem de outubro de 2023 destinada ao pesquisador Hugo Touvron. “Temos 64 mil GPUs a caminho! Precisamos aprender a construir a fronteira e vencer esta corrida.”
Foco na Competitividade
Ainda que a Meta lance modelos de IA abertos, os líderes da empresa estavam mais preocupados em vencer concorrentes que não costumam divulgar os pesos de seus modelos, como Anthropic e OpenAI, que os mantêm por trás de uma API. Executivos e pesquisadores da Meta elevaram o Claude da Anthropic e o GPT-4 da OpenAI como padrões de excelência a serem alcançados.
A startup francesa de IA Mistral, um dos maiores concorrentes abertos da Meta, também foi mencionada várias vezes nas mensagens internas, mas com um tom desdenhoso.
“Mistral é um troco para nós,” disse Al-Dahle em uma mensagem. “Deveríamos ser capazes de fazer melhor,” acrescentou.
Pressão e Agilidade no Desenvolvimento
Hoje, as empresas de tecnologia estão em uma corrida para superar umas às outras com modelos de IA de ponta. No entanto, esses documentos judiciais revelam o quão competitivos os líderes de IA da Meta realmente eram – e continuam a ser. Eles mencionaram em várias conversas sobre como estavam “muito agressivos” em obter os dados certos para treinar o Llama. Em um momento, um executivo chegou a afirmar que “Llama 3 é literalmente tudo o que me importa”, em uma mensagem enviada a colegas.
Os promotores neste caso alegam que os executivos da Meta, em sua corrida para lançar modelos de IA, ocasionalmente cortaram caminhos, utilizando livros protegidos por direitos autorais no processo.
Touvron observou em uma mensagem que a mistura de conjuntos de dados utilizada para o Llama 2 “era ruim” e comentou como a Meta poderia usar uma combinação melhor de fontes de dados para aprimorar o Llama 3. Ele e Al-Dahle discutiram a possibilidade de utilizar o conjunto de dados LibGen, que contém obras protegidas por direitos autorais, da Cengage Learning, Macmillan Learning, McGraw Hill e Pearson Education.
Meta em Busca de Melhoria
“Temos os conjuntos de dados certos lá?” perguntou Al-Dahle. “Há alguma coisa que você queria usar, mas não conseguiu por alguma razão estúpida?”
Mark Zuckerberg, CEO da Meta, já afirmou que está tentando reduzir a diferença de desempenho entre os modelos de IA Llama e os fechados, como os da OpenAI e Google. As mensagens internas mostram a intensa pressão dentro da empresa para alcançar esse objetivo.
“Este ano, o Llama 3 é competitivo com os modelos mais avançados e líder em algumas áreas,” disse Zuckerberg em uma carta de julho de 2024. “A partir do ano que vem, esperamos que os futuros modelos Llama se tornem os mais avançados do setor.”
Lançamento do Llama 3 e Desafios Legais
Quando a Meta lançou o Llama 3 em abril de 2024, o modelo de IA aberto se mostrou competitivo com os líderes fechados da Google, OpenAI e Anthropic, e superou opções abertas da Mistral. No entanto, os dados usados pela Meta para treinar seus modelos – que Zuckerberg supostamente autorizou a usar, apesar de seu status de direitos autorais – estão agora sob análise em várias ações judiciais em andamento.
É interessante observar como a luta por inovações em IA pode gerar não apenas grandes avanços, mas também desafios éticos e legais. O que você acha dessa corrida? Será que o desempenho deve ser priorizado sobre a ética no desenvolvimento de IA?