ElevenLabs Lança Plataforma para Criação de Bots de Conversação com Inteligência Artificial
A ElevenLabs, startup que oferece serviços de clonagem de voz por IA e uma API de texto para fala, anunciou na última segunda-feira uma nova funcionalidade: a possibilidade de construir bots de conversação completos.
A companhia revelou que agora os usuários podem desenvolver agentes de conversação na plataforma para desenvolvedores da ElevenLabs, com variáveis personalizáveis como tom de voz e duração das respostas.
Foco na Criação de Agentes de Conversação
A ElevenLabs tem se concentrado principalmente em fornecer diferentes vozes e ferramentas de IA para serviços de texto para fala. Sam Sklar, chefe de crescimento da empresa, explicou ao TechCrunch que muitos de seus clientes já utilizavam essa funcionalidade para criar agentes de conversação. No entanto, ele destacou que os maiores desafios eram a integração da base de conhecimento e o manejo de interrupções dos clientes. Foi por isso que a empresa decidiu desenvolver um pipeline completo para bots de conversação.
Construção de Agentes Conversacionais
Os usuários podem acessar suas contas ElevenLabs e iniciar a construção de um agente de conversação escolhendo um modelo ou criando um novo projeto. Eles podem selecionar o idioma principal do agente, a primeira mensagem e o prompt do sistema para definir a persona do agente.
Os desenvolvedores também precisam escolher o modelo de linguagem (Gemini, GPT ou Claude), a temperatura das respostas (para determinar o nível de criatividade das respostas) e o limite de uso de tokens.
Além disso, podem ajustar outros aspectos como voz, latência, estabilidade, critérios de autenticação e máximo de duração da conversa com o agente de IA.
Integração de Bases de Conhecimento e Módulos Personalizados
Os usuários podem adicionar sua própria base de conhecimento, como um arquivo, URL ou bloco de texto, para aprimorar o funcionamento do bot de conversação. Além disso, é possível integrar seu próprio LLM customizado com o bot. O SDK da ElevenLabs é compatível com Python, Javascript, React e Swift. A empresa também disponibiliza uma API WebSocket para maior personalização.
As empresas podem definir critérios para coletar determinados dados, como nome e e-mail dos clientes que interagem com o agente, além de critérios de avaliação em linguagem natural para definir o sucesso ou fracasso da interação.
Perspectivas Futuras
A ElevenLabs está aproveitando seu pipeline existente para a parte de texto para fala. A empresa está desenvolvendo capacidades de reconhecimento de fala para este novo produto de IA conversacional. Embora não esteja oferecendo sua API de transcrição independente no momento, a empresa pode considerar essa possibilidade no futuro, competindo assim com as APIs de reconhecimento de fala do Google, Microsoft e Amazon, além de APIs especializadas como o Whisper da OpenAI, AssemblyAI, Deepgram, Speechmatics e Gladia.
Com planos de captação de recursos avaliados em mais de $3 bilhões, a ElevenLabs também está em competição com outra startups de voz, como Vapi e Retell. A empresa acredita que suas personalizações e a capacidade de alternar entre modelos lhe conferem uma vantagem competitiva em relação à OpenAI.