DeepSeek Lança Modelo de Raciocínio Open Source

Lucas Fuad
20/01/2025
17:37

Blog / Notícias / Inteligência Artificial / DeepSeek Lança Modelo de Raciocínio Open Source

Nota: Algumas imagens são meramente ilustrativas e, em sua maioria, geradas pelo MidJourney.

DeepSeek Lança Versão Aberta de Seu Modelo de Raciocínio, DeepSeek-R1

A DeepSeek, laboratório de inteligência artificial da China, acaba de disponibilizar uma versão aberta do seu novo modelo de raciocínio, chamado DeepSeek-R1. Segundo a empresa, ele oferece desempenho semelhante ao modelo o1 da OpenAI em alguns benchmarks de inteligência artificial.

Disponibilidade e Licença

O R1 pode ser encontrado na plataforma de desenvolvimento Hugging Face sob uma licença MIT. Isso significa que ele pode ser utilizado comercialmente sem limitações. De acordo com a DeepSeek, o R1 supera o modelo o1 em benchmarks como AIME, MATH-500 e SWE-bench Verified. O AIME usa outros modelos para avaliar o desempenho, enquanto o MATH-500 é uma coleção de problemas de palavras. Por outro lado, o SWE-bench Verified está focado em tarefas de programação.

Como Funciona o R1

Por ser um modelo de raciocínio, o R1 verifica suas próprias informações, o que o ajuda a evitar erros comuns em outros modelos. Esses modelos levam um pouco mais de tempo, geralmente de segundos a minutos a mais, para encontrar soluções, mas tendem a ser mais confiáveis em áreas como física, ciência e matemática.

Parâmetros e Performance

O R1 possui incríveis 671 bilhões de parâmetros, conforme revelado em um relatório técnico da DeepSeek. Parâmetros são indicadores das habilidades de resolução de problemas de um modelo; geralmente, quanto mais parâmetros, melhor o desempenho.

R1: 671 bilhões de parâmetros
Versões “destiladas”: 1,5 bilhões a 70 bilhões de parâmetros
O menor pode ser executado em um laptop
R1 completo: requer hardware mais robusto

Ademais, o acesso ao R1 através da API da DeepSeek tem um custo entre 90% a 95% mais barato que o modelo o1 da OpenAI.

Restrições e Limitações

No entanto, existe uma desvantagem em relação ao R1. Sendo um modelo chinês, ele está sujeito a critérios do regulador de internet da China, que assegura que suas respostas “incorporem valores socialistas centrais”. Por exemplo, o R1 não responderá a perguntas sobre a Praça Tiananmen ou sobre a autonomia de Taiwan.

Impacto e Reação do Mercado

A chegada do R1 ocorre poucos dias após a administração Biden ter proposto novas restrições de exportação sobre tecnologias de IA para empresas chinesas. Embora as empresas na China já estivessem impedidas de adquirir chips avançados de IA, as novas regras, se aprovadas, trarão limites ainda mais rígidos.

Recentemente, a OpenAI pediu ao governo dos EUA que apoie o desenvolvimento de IA no país, alertando para o risco de os modelos chineses alcançarem ou até superarem os americanos em capacidade.

Conclusão

Até agora, pelo menos três laboratórios chineses — DeepSeek, Alibaba e Kimi — afirmaram ter desenvolvido modelos que rivalizam com o o1. O primeiro a surgir foi a DeepSeek, que anunciou uma prévia do R1 em novembro passado. Em um comentário nas redes sociais, Dean Ball, pesquisador de IA da Universidade de George Mason, sugeriu que essa tendência indica que os laboratórios de IA da China continuarão a ser “seguidores rápidos” no cenário global.

Como ele mencionou, “o desempenho impressionante dos modelos destilados da DeepSeek… significa que raciocinadores muito capazes continuarão a proliferar amplamente e serão executáveis em hardware local, longe dos olhos de qualquer regime de controle centralizado”.

Automatize seu negócio

Autor

Lucas Fuad

Visuailzer co-founder

Advogado e Programador, especialista em Direito Digital e Desenvolvimento de Sistemas. Domina linguagens de programação e segurança da informação. Atua na interface entre Tecnologia e Direito, oferecendo soluções inovadoras e estratégicas para empresas, com foco em compliance, eficiência e resultados concretos.

Assuntos Relacionados

All Posts
Dicas e Tutoriais
Games
Notícias

Back
Inteligência Artificial
Negócios
Produtividade
Tecnologia
Política

DeepSeek Lança Modelo de Raciocínio Open Source

DeepSeek Lança Versão Aberta de Seu Modelo de Raciocínio, DeepSeek-R1

Disponibilidade e Licença

Como Funciona o R1

Parâmetros e Performance

Restrições e Limitações

Impacto e Reação do Mercado

Conclusão

Autor

Lucas Fuad

Visuailzer co-founder

Palavras Chaves Populares

Categorias

Assuntos Relacionados

Novas Imagens do Drone Dobrável DJI Fli...

Limitações da Quantização em Modelos...

Google Não Usará Fatos Verificados no ...

Descontos Imperdíveis no Echo Show para...

Lenovo pode lançar handheld com SteamOS...

Detrans Alertam Sobre Golpe de SMS: Como...

Links Importantes

Categorias

Editores

Parcerias