OpenAI Anuncia Novos Modelos de Raciocínio: O3 e O3-Mini
No último dia do Ship-mas, a OpenAI apresentou um novo conjunto de modelos de raciocínio, chamados O3 e O3-Mini. O site The Verge foi o primeiro a reportar que um novo modelo de raciocínio seria revelado durante este evento.
A empresa não está lançando esses modelos hoje e reconhece que os resultados finais podem evoluir com um treinamento posterior. No entanto, a OpenAI está aceitando inscrições da comunidade de pesquisa para testar esses sistemas antes do lançamento público, cuja data ainda não foi definida. Em setembro, a OpenAI lançou o modelo O1 (codenome Strawberry) e agora está pulando diretamente para o O3, evitando o O2 para não gerar confusão ou conflitos de marca com a empresa britânica de telecomunicações chamada O2.
Novas Funcionalidades do Modelo O3
O termo raciocínio tem se tornado uma palavra da moda na indústria de IA, e basicamente, refere-se ao processo em que a máquina divide as instruções em tarefas menores, resultando em resultados mais eficazes. Esses modelos frequentemente mostram o trabalho para chegar a uma resposta, ao invés de simplesmente fornecer uma resposta final sem explicação.
De acordo com a empresa, o O3 supera os recordes de desempenho anteriores em diversas áreas. Ele bateu seu antecessor em testes de programação (chamados SWE-Bench Verified) em 22,8% e teve um desempenho superior ao do Cientista Chefe da OpenAI em programação competitiva. O modelo quase tirou nota máxima em uma das competições matemáticas mais difíceis (chamada AIME 2024), errando apenas uma questão e alcançando 87,7% em um benchmark para problemas de ciência em nível de especialista (denominado GPQA Diamond). Em desafios de matemática e raciocínio que geralmente desafiam a IA, o O3 conseguiu resolver 25,2% dos problemas — enquanto nenhum outro modelo passou de 2%.
Desempenho Superior e Alinhamento Deliberativo
A OpenAI afirma que o O3 apresenta desempenho superior a outros modelos de raciocínio em benchmarks de codificação. Além disso, a empresa anunciou novas pesquisas sobre alinhamento deliberativo, que exige que o modelo de IA processe decisões de segurança passo a passo. Em vez de simplesmente aplicar regras de sim/não, esse paradigma exige que a IA raciocine ativamente se a solicitação de um usuário se encaixa nas políticas de segurança da OpenAI.
A companhia afirma que, ao testar esta abordagem com o O1, o modelo mostrou-se muito melhor em seguir as diretrizes de segurança do que modelos anteriores, incluindo o GPT-4.
Opinião Final
Essas novidades trazidas pela OpenAI demonstram um avanço significativo em inteligência artificial, especialmente na forma como os modelos lidam com o raciocínio e a segurança. O O3 parece estar se posicionando para redefinir padrões e provocar mudanças importantes na maneira como interagimos com máquinas inteligentes. Será fascinante ver como esses desenvolvimentos impactarão o mercado e o cotidiano dos usuários.