Google busca inovar com o Gemini, sua suíte de IA generativa
A Google está fazendo ondas com o Gemini, sua suíte de modelos, aplicativos e serviços de IA generativa. Mas afinal, o que é o Gemini? Como ele pode ser utilizado? E como se compara a outras ferramentas de IA generativa, como ChatGPT da OpenAI, Llama da Meta e Copilot da Microsoft? Para facilitar o acompanhamento das novidades do Gemini, montamos um guia prático que será constantemente atualizado com novos modelos, recursos e notícias sobre os planos do Google envolvendo o Gemini.
O QUE É O GEMINI?
O Gemini é a tão aguardada família de modelos de IA generativa da Google, desenvolvida pelos laboratórios de pesquisa em IA da empresa, DeepMind e Google Research. O Gemini se apresenta em quatro versões:
- Gemini Ultra
- Gemini Pro
- Gemini Flash, uma versão mais rápida e “destilada” do Pro, que também conta com uma versão ligeiramente menor e mais rápida, chamada Gemini Flash-8B.
- Gemini Nano, composta por dois modelos menores: Nano-1 e o mais avançado Nano-2, que pode rodar offline.
Todos os modelos Gemini foram treinados para serem nativamente multimodais, ou seja, capazes de lidar e analisar mais do que apenas texto. A Google afirma que eles foram pré-treinados e ajustados em uma variedade de dados públicos, proprietários e licenciados — incluindo áudios, imagens e vídeos, além de bases de código e textos em diversas línguas.
Isso diferencia o Gemini de modelos como o LaMDA da Google, que foi treinado exclusivamente com dados textuais e não pode gerar ou entender nada além disso.
DIFERENÇAS ENTRE APLICAÇÕES E MODELOS DO GEMINI
O Gemini é distinto das aplicações do Gemini que rodam na web e em dispositivos móveis (anteriormente conhecidas como Bard). As aplicações Gemini são clientes que conectam aos diversos modelos do Gemini e sobrepõem uma interface semelhante a um chatbot. Assim como o ChatGPT e o Claude da Anthropic.
O aplicativo Gemini para web está disponível, e no Android, o aplicativo Gemini substitui o assistente Google existente. Já no iOS, os aplicativos Google e Google Search servem como clientes Gemini na plataforma.
RECURSOS AVANÇADOS DO GEMINI
Os aplicativos Gemini não são a única forma de aproveitar os recursos dos modelos do Gemini em tarefas. Funcionalidades impulsionadas pelo Gemini estão gradativamente sendo incorporadas em aplicativos e serviços essenciais da Google, como Gmail e Google Docs.
Para utilizar a maioria dessas funcionalidades, é necessário assinar o Google One AI Premium Plan. Este plano, que custa $20, fornece acesso ao Gemini em aplicativos do Google Workspace, permitindo o que a Google chama de Gemini Avançado, que traz seus modelos mais sofisticados para as aplicações Gemini.
INTEGRAÇÃO DO GEMINI EM VÁRIOS SERVIÇOS
No Gmail, o Gemini aparece em um painel lateral que ajuda a redigir e resumir e-mails. E no Google Docs, auxilia na criação e refinamento de conteúdo, enquanto no Google Slides, gera slides e imagens personalizadas. E não para por aí!
De acordo com a Google, o Gemini também chegou ao Google Maps, permitindo que os usuários resumissem avaliações de cafeterias ou recebessem recomendações sobre como passar um dia em uma cidade estrangeira.
GENERAÇÃO DE IMAGENS COM IMAGEN 3
Os usuários do Gemini podem gerar arte e imagens utilizando o modelo interno Imagen 3. Este modelo oferece uma melhor compreensão dos comandos de texto, traduzindo-os em imagens com mais criatividade e detalhes, além de reduzir artefatos visuais. Contudo, a capacidade de gerar imagens de pessoas foi reinstaurada recentemente após uma pausa inicial devido a reclamações sobre imprecisões históricas.
CONCLUSÃO
Embora o Gemini ainda esteja em desenvolvimento, suas aplicações e potencial de uso estão se expandindo rapidamente. A Google tem um longo caminho pela frente, mas os avanços já são impressionantes. Agora, cabe a você explorar tudo que essa nova tecnologia tem a oferecer!