DeepSeek Lança Versão Aberta de Seu Modelo de Raciocínio, DeepSeek-R1
A DeepSeek, laboratório de inteligência artificial da China, acaba de disponibilizar uma versão aberta do seu novo modelo de raciocínio, chamado DeepSeek-R1. Segundo a empresa, ele oferece desempenho semelhante ao modelo o1 da OpenAI em alguns benchmarks de inteligência artificial.
Disponibilidade e Licença
O R1 pode ser encontrado na plataforma de desenvolvimento Hugging Face sob uma licença MIT. Isso significa que ele pode ser utilizado comercialmente sem limitações. De acordo com a DeepSeek, o R1 supera o modelo o1 em benchmarks como AIME, MATH-500 e SWE-bench Verified. O AIME usa outros modelos para avaliar o desempenho, enquanto o MATH-500 é uma coleção de problemas de palavras. Por outro lado, o SWE-bench Verified está focado em tarefas de programação.
Como Funciona o R1
Por ser um modelo de raciocínio, o R1 verifica suas próprias informações, o que o ajuda a evitar erros comuns em outros modelos. Esses modelos levam um pouco mais de tempo, geralmente de segundos a minutos a mais, para encontrar soluções, mas tendem a ser mais confiáveis em áreas como física, ciência e matemática.
Parâmetros e Performance
O R1 possui incríveis 671 bilhões de parâmetros, conforme revelado em um relatório técnico da DeepSeek. Parâmetros são indicadores das habilidades de resolução de problemas de um modelo; geralmente, quanto mais parâmetros, melhor o desempenho.
- R1: 671 bilhões de parâmetros
- Versões “destiladas”: 1,5 bilhões a 70 bilhões de parâmetros
- O menor pode ser executado em um laptop
- R1 completo: requer hardware mais robusto
Ademais, o acesso ao R1 através da API da DeepSeek tem um custo entre 90% a 95% mais barato que o modelo o1 da OpenAI.
Restrições e Limitações
No entanto, existe uma desvantagem em relação ao R1. Sendo um modelo chinês, ele está sujeito a critérios do regulador de internet da China, que assegura que suas respostas “incorporem valores socialistas centrais”. Por exemplo, o R1 não responderá a perguntas sobre a Praça Tiananmen ou sobre a autonomia de Taiwan.
Impacto e Reação do Mercado
A chegada do R1 ocorre poucos dias após a administração Biden ter proposto novas restrições de exportação sobre tecnologias de IA para empresas chinesas. Embora as empresas na China já estivessem impedidas de adquirir chips avançados de IA, as novas regras, se aprovadas, trarão limites ainda mais rígidos.
Recentemente, a OpenAI pediu ao governo dos EUA que apoie o desenvolvimento de IA no país, alertando para o risco de os modelos chineses alcançarem ou até superarem os americanos em capacidade.
Conclusão
Até agora, pelo menos três laboratórios chineses — DeepSeek, Alibaba e Kimi — afirmaram ter desenvolvido modelos que rivalizam com o o1. O primeiro a surgir foi a DeepSeek, que anunciou uma prévia do R1 em novembro passado. Em um comentário nas redes sociais, Dean Ball, pesquisador de IA da Universidade de George Mason, sugeriu que essa tendência indica que os laboratórios de IA da China continuarão a ser “seguidores rápidos” no cenário global.
Como ele mencionou, “o desempenho impressionante dos modelos destilados da DeepSeek… significa que raciocinadores muito capazes continuarão a proliferar amplamente e serão executáveis em hardware local, longe dos olhos de qualquer regime de controle centralizado”.