O sonho de transformar “Ela” em realidade: a jornada de Alexis Conneau
Alexis Conneau tem refletido intensamente sobre o filme “Ela”. Nos últimos anos, ele se tornou obcecado em tentar transformar a tecnologia de voz fictícia do filme, chamada Samantha, em uma realidade.
Conneau utiliza até mesmo uma imagem do personagem de Joaquin Phoenix como sua bandeira no Twitter.
Com o Modo de Voz Avançado do ChatGPT, um projeto que Conneau iniciou na OpenAI após realizar um trabalho semelhante na Meta, ele apresenta um grande avanço. O sistema de IA processa voz de forma nativa e interage, conversando de maneira semelhante a um humano em suas respostas.
A nova startup: WaveForms AI
Atualmente, ele está à frente de uma nova startup chamada WaveForms AI, que busca desenvolver algo ainda melhor.
Conneau passa boa parte do tempo pensando em como evitar a distopia retratada no filme. Em entrevista ao TechCrunch, ele afirmou: “Ela apresenta uma distopia, certo? Não é um futuro que queremos. Queremos trazer essa tecnologia – que agora existe e existirá – para um propósito positivo. Desejamos fazer exatamente o oposto do que a empresa no filme faz.”
Construir a tecnologia sem a distopia parece uma contradição, mas Conneau está determinado. Ele acredita que sua nova startup de IA ajudará as pessoas a “sentirem a AGI” com os ouvidos.
Início promissor e objetivos ambiciosos
Nesta segunda-feira, Conneau lançou a WaveForms AI, uma nova empresa de LLMs de áudio que treina seus próprios modelos fundamentais. O objetivo é lançar produtos de áudio com IA em 2025, competindo com as ofertas da OpenAI e Google. A startup conseguiu levantar $40 milhões em financiamento inicial, conforme anunciado na segunda-feira, liderado pela Andreessen Horowitz.
A presença de Marc Andreessen – que destacou anteriormente que a IA deve fazer parte de todos os aspectos da vida humana – é um indicativo do interesse pessoal em sua iniciativa.
A influência de “Ela” e os desafios éticos
É notável que a obsessão de Conneau pelo filme “Ela” pode ter causado problemas para a OpenAI em certo ponto. Scarlett Johansson enviou uma ameaça legal à startup de Sam Altman no início deste ano por conta de semelhanças com sua personagem, forçando a OpenAI a desativar uma das vozes que se assemelham à dela. A OpenAI negou ter tentado replicar sua voz.
Entretanto, é inegável o quanto o filme influenciou Conneau. No seu lançamento, em 2013, a IA era uma ficção científica. Naquele tempo, a Siri da Apple estava apenas ganhando notoriedade e era bastante limitada. Mas hoje, a tecnologia parece assustadoramente próxima.
A nova era das interações com IA
Plataformas de companheirismo baseadas em IA, como Character.AI, alcançam milhões de usuários semanalmente que buscam apenas conversar com seus chatbots. Este setor está emergindo como uma utilização popular da IA generativa – apesar de alguns resultados trágicos e perturbadores que podem surgir.
O CEO da WaveForms AI é cauteloso em relação ao espaço de companheirismo de IA, não sendo esse o foco central de sua nova empresa. Conneau acredita que as pessoas utilizarão os produtos da WaveForms de formas inovadoras – como conversar com um AI por 20 minutos no carro para aprender sobre algo. Ele prefere que a empresa seja mais “horizontal”.
Compreendendo a inteligência emocional da IA
Conneau não acredita em um futuro onde a interação humano-IA substitua a interação humano-humano. Para ele, as interações serão complementares. Ele defende que a IA pode aprender com os erros das redes sociais. Por exemplo, ele acredita que a IA não deve focar em otimização de “tempo gasto na plataforma”, uma métrica comum de sucesso que pode levar a hábitos prejudiciais como o doomscrolling. Ele quer garantir que a IA da WaveForms esteja alinhada com os melhores interesses humanos.
Conneau explica que o nome do projeto da OpenAI, Modo de Voz Avançado, não reflete o quão distinto é a tecnologia em relação ao modo normal de voz do ChatGPT. O antigo modo de voz apenas traduzia a voz em texto, executava no GPT-4 e convertia o texto de volta em fala, mas o Modo de Voz Avançado quebra o áudio da voz em tokens e processa esses tokens diretamente em um modelo transformador específico de áudio, permitindo uma latência muito baixa.
Como criar conexões mais significativas
Conneau aposta que a IA generativa de hoje não precisa ser muito mais inteligente do que o GPT-4o para criar produtos melhores. Em vez de melhorar a inteligência subjacente desses modelos, como a OpenAI está fazendo, a WaveForms está focada em tornar a IA mais conversacional.
“Haverá um mercado de pessoas que utilizarão a IA generativa e escolherão a interação que for mais agradável para elas”, conclui Conneau.
Por fim, a nova startup também tem a responsabilidade de assegurar que os usuários não desenvolvam vícios em suas criações. O venture capitalist Martin Casado, da Andreessen Horowitz, que ajudou nos investimentos, acredita que conversar mais com a IA pode ser mais benéfico do que interagir com pessoas aleatórias na internet.
Embora algumas empresas vejam o desenvolvimento de relacionamentos afetivos com a IA como um sinal de sucesso, isso pode ser interpretado como um total fracasso social, como o filme “Ela” tentou retratar. Essa é a linha que a WaveForms terá que equilibrar no futuro.