Uma verdadeira revolução no raciocínio
Pós o lançamento do modelo o1 da OpenAI, um modelo que promete revolucionar o raciocínio, uma onda de modelos semelhantes emergiu de laboratórios rivais de IA. No início de novembro, a DeepSeek, uma empresa de pesquisa em IA apoiada por traders quantitativos, lançou uma prévia do seu algoritmo de raciocínio, o DeepSeek-R1. No mesmo mês, a equipe Qwen da Alibaba revelou um modelo que, segundo eles, é o primeiro “desafiante aberto” ao o1.
Mas o que gerou tanta concorrência? A busca por novas abordagens para refinar a tecnologia de IA gerativa. Como reportou meu colega Max Zeff, as técnicas de “força bruta” para aumentar o tamanho dos modelos já não estão trazendo os resultados esperados.
A pressão competitiva sobre as empresas de IA é intensa. Segundo uma estimativa, o mercado global de IA alcançou $196,63 bilhões em 2023 e pode atingir $1,81 trilhões até 2030.
Diferenças e Desafios
A OpenAI afirma que os modelos de raciocínio podem “resolver problemas mais difíceis” do que os modelos anteriores, representando um passo significativo no desenvolvimento da IA generativa. No entanto, nem todos acreditam que esses modelos sejam o melhor caminho a seguir.
Ameet Talwalkar, professor associado de aprendizado de máquina na Carnegie Mellon, considera o primeiro lote de modelos de raciocínio “bastante impressionante”. Contudo, ele questiona os “motores” de quem diz saber com certeza até onde esses modelos podem levar a indústria.
“Empresas de IA têm incentivos financeiros para oferecer projeções otimistas sobre as capacidades futuras de sua tecnologia,” destacou Talwalkar. “Corremos o risco de nos concentrar miopemente em um único paradigma — por isso, é crucial que a comunidade de pesquisa em IA evite acreditar cegamente no hype e nos esforços de marketing e, em vez disso, se concentre em resultados concretos.”
Custos Elevados e Desempenho
Dois pontos negativos dos modelos de raciocínio são: (1) eles são caros e (2) consomem muita energia. Por exemplo, na API da OpenAI, a empresa cobra $15 para cada ~750.000 palavras que o o1 analisa e $60 para cada ~750.000 palavras que o modelo gera. Isso representa entre 3x e 4x o custo do último modelo “não-raciocínio” da OpenAI, o GPT-4o.
O o1 está disponível gratuitamente na plataforma de chatbot da OpenAI, o ChatGPT, com algumas limitações. Porém, no início deste mês, a OpenAI anunciou um novo nível avançado, o o1 pro, que custa impressionantes $2.400 por ano.
“O custo geral de [modelos de linguagem grandes] para raciocínio certamente não está diminuindo,” afirmou Guy Van Den Broeck, professor de ciência da computação na UCLA.
Um dos motivos pelo qual os modelos de raciocínio custam tanto é que eles exigem muitos recursos computacionais para operar. Ao contrário da maioria das IAs, o o1 e outros modelos de raciocínio tentam verificar seu próprio trabalho enquanto o realizam, ajudando a evitar armadilhas comuns, mas aumentando o tempo necessário para encontrar soluções.
Expectativas Futuras
A OpenAI imagina modelos de raciocínio futuros “pensando” por horas, dias ou até semanas. A empresa reconhece que os custos de uso aumentarão, mas os retornos, desde baterias inovadoras até novos medicamentos contra o câncer, podem compensar esse investimento.
A proposta de valor dos modelos de raciocínio atuais não é tão evidente. Costa Huang, pesquisador e engenheiro de aprendizado de máquina na organização sem fins lucrativos Ai2, observa que o o1 não é um calculador muito confiável e que buscas superficiais nas redes sociais revelam muitos erros do modo o1 pro.
“Esses modelos de raciocínio são especializados e podem ter desempenho abaixo do esperado em domínios gerais,” disse Huang. “Algumas limitações serão superadas mais rapidamente do que outras.”
Van den Broeck afirma que os modelos de raciocínio não estão realizando raciocínio real e, portanto, estão limitados nos tipos de tarefas que podem realizar com sucesso. “O verdadeiro raciocínio funciona em todos os problemas, não apenas naqueles que são prováveis [nos dados de treinamento de um modelo]”, completou.
Diante do forte incentivo de mercado para melhorar os modelos de raciocínio, é razoável apostar que eles se tornarão melhores com o tempo. Afinal, não são só a OpenAI, DeepSeek e Alibaba que estão investindo nesse novo ramo da pesquisa em IA. Investidores e fundadores em indústrias adjacentes estão se unindo em torno da ideia de um futuro dominado pela IA de raciocínio.
No entanto, Talwalkar expressa preocupação de que grandes laboratórios possam restringir esses avanços.
“Os grandes laboratórios têm motivos competitivos para permanecerem secretos, mas essa falta de transparência prejudica gravemente a capacidade da comunidade de pesquisa de interagir com essas ideias,” disse. “À medida que mais pessoas trabalham nessa direção, espero que os modelos de raciocínio avancem rapidamente. Mas, embora algumas ideias venham da academia, dadas as razões financeiras envolvidas, eu esperaria que a maioria – se não todos – os modelos sejam oferecidos por grandes laboratórios industriais como a OpenAI.”