Empresas chinesas lançam modelos de IA que competem com os da OpenAI
As empresas da China seguem firmes na criação de modelos de inteligência artificial que desafiam as capacidades dos sistemas desenvolvidos pela OpenAI e por outras empresas de IA dos Estados Unidos.
Esta semana, a MiniMax, uma startup apoiada pela Alibaba e pela Tencent, anunciou o lançamento de três novos modelos: MiniMax-Text-01, MiniMax-VL-01 e T2A-01-HD. A MiniMax já levantou cerca de 850 milhões de dólares em investimentos e atualmente é avaliada em mais de 2,5 bilhões de dólares.
Detalhes dos novos modelos da MiniMax
O MiniMax-Text-01 é um modelo focado apenas em texto, enquanto o MiniMax-VL-01 tem a capacidade de entender tanto imagens como textos. Já o T2A-01-HD é um gerador de áudio, especializado em transformar texto em fala.
A MiniMax afirma que o MiniMax-Text-01, que possui 456 bilhões de parâmetros, supera modelos como o Gemini 2.0 Flash, lançado recentemente pelo Google, em benchmarks que avaliam a habilidade de modelos em resolver problemas matemáticos e responder perguntas factuais.
Comparações e desempenho
Os parâmetros de um modelo estão relacionados à sua capacidade de solucionar problemas, e geralmente, quanto mais parâmetros, melhor é a performance. No que diz respeito ao MiniMax-VL-01, a empresa informa que ele rivaliza o Claude 3.5 Sonnet, da Anthropic, em avaliações que exigem compreensão multimodal.
Enquanto o MiniMax-VL-01 não supera o Gemini 2.0 Flash em muitos desses testes, os modelos GPT-4o da OpenAI e Llama 3.1 da Meta também sobressaem em várias avaliações.
Inovações e características únicas
Um ponto a destacar sobre o MiniMax-Text-01 é o seu extenso contexto. O contexto, ou janela de contexto de um modelo, se refere à quantidade de informação que ele pode processar antes de gerar uma resposta. Com uma janela de 4 milhões de tokens, o MiniMax-Text-01 pode analisar cerca de 3 milhões de palavras de uma vez — o equivalente a mais de cinco cópias de “Guerra e Paz”. Para efeito de comparação, isso representa aproximadamente 31 vezes o tamanho da janela de contexto dos modelos GPT-4o e Llama 3.1.
O T2A-01-HD, por sua vez, é um gerador de áudio otimizado para criar fala sintética com opção de ajuste de cadência, tom e tenor em cerca de 17 idiomas, incluindo inglês e chinês. Além disso, ele consegue clonar uma voz a partir de apenas 10 segundos de gravação.
Disponibilidade e restrições
Embora os novos modelos da MiniMax sejam “abertamente” disponíveis, isso não significa que sejam totalmente livres. O MiniMax-Text-01 e o MiniMax-VL-01 não são verdadeiramente open source, pois a empresa não liberou os componentes necessários para recriá-los do zero. Além disso, eles estão sob licença restritiva da MiniMax, que proíbe o uso dos modelos para melhorar IA concorrentes e exige licenças especiais de plataformas com mais de 100 milhões de usuários ativos mensais.
Controvérsias e implicações legais
A MiniMax, fundada em 2021 por ex-funcionários da SenseTime, já teve seus produtos envolvidos em polêmicas. O aplicativo Talkie, que usa avatares de figuras públicas como Donald Trump e Taylor Swift, foi removido da App Store da Apple por razões “técnicas” não especificadas, e muitos desses indivíduos não deram consentimento para serem retratados.
Recentemente, a MiniMax também enfrentou acusações de plágio, com a iQIYI, um serviço de streaming chinês, processando a empresa por alegadamente ter treinado seus modelos utilizando conteúdos protegidos por direitos autorais.
Novas diretrizes do governo dos EUA
Os novos modelos chegam em um momento em que a administração Biden está propondo restrições mais rigorosas para a exportação de tecnologia de IA para a China. As empresas chinesas já tinham limitações na compra de chips de IA avançados, mas as novas regras podem resultar em restrições ainda maiores para a aquisição de tecnologia de semicondutores.
Na quarta-feira, a administração Biden anunciou medidas adicionais que visam impedir a exportação de chips sofisticados para a China. Com isso, fábricas de chips e empresas de embalagem que desejam exportar certos modelos estarão sujeitas a requisitos de licenciamento mais amplos, a menos que adotem maior rigor na supervisão das transações com clientes chineses.
Opinião
O avanço da MiniMax e o lançamento de seus novos modelos demonstram que a competição na área de IA está cada vez mais acirrada. No entanto, as questões de ética e legislação são cruciais. Como vimos, os modelos de IA não apenas transformam a tecnologia, mas também levantam questões importantes sobre direitos autorais e consentimento. O que se espera é uma discussão mais aberta e clara sobre como essas tecnologias devem ser regulamentadas e utilizadas no futuro.