ChatGPT da OpenAI Integra-se a Aplicativos de Programação no macOS
Na última quinta-feira, a OpenAI anunciou que o aplicativo ChatGPT para desktop no macOS agora é capaz de ler códigos em algumas ferramentas de programação focadas em desenvolvedores, como VS Code, Xcode, TextEdit, Terminal e iTerm2.
Isso significa que os desenvolvedores não precisarão mais copiar e colar seus códigos no ChatGPT, uma prática comum até agora. Com a nova funcionalidade ativada, a OpenAI enviará automaticamente a seção do código em que você está trabalhando para o chatbot, como contexto, junto com sua solicitação.
No entanto, ao contrário de ferramentas populares de codificação assistida por IA, como Cursor ou GitHub Copilot, o ChatGPT ainda não consegue escrever código diretamente nos aplicativos de desenvolvedor por conta própria.
Nova Funcionalidade Chamada “Trabalhar com Aplicativos”
A funcionalidade, denominada “Trabalhar com Aplicativos”, está longe de ser um agente de IA, mas a OpenAI afirma que fazer o ChatGPT compreender outros aplicativos é um “pilar fundamental” para o desenvolvimento de sistemas agentais. Um dos maiores desafios que os agentes de IA enfrentam atualmente é entender o resto da tela do computador, em vez de apenas solicitações ou suas próprias respostas.
A OpenAI declarou que está focando essa funcionalidade em aplicativos de codificação inicialmente, possivelmente porque assistentes de codificação por IA se tornaram uma das aplicações mais populares para Modelos de Linguagem de Grande Escala (LLMs). A novidade está disponível para usuários Plus e Teams atualmente, e será disponibilizada para os usuários Enterprise e Edu nas próximas semanas. A empresa também aponta que, no futuro, o ChatGPT poderá trabalhar com outros tipos de aplicativos, especificamente aqueles voltados para tarefas de escrita.
“Isso não é feito para ser um agente; é uma forma de colaborar com ferramentas de codificação para começar, e haverá mais ferramentas chegando em breve” – Alexander Embiricos, líder de produto da OpenAI.
Funcionamento da Integração
Em uma demonstração realizada com a TechCrunch, um funcionário da OpenAI abriu o aplicativo ChatGPT e um ambiente Xcode contendo um projeto simples de modelagem do sistema solar — embora nele estivesse faltando a Terra. O funcionário selecionou uma aba do Xcode dentro do ChatGPT, instruindo o chatbot a olhar para o aplicativo, e pediu ao chatbot para “adicionar os planetas que estavam faltando”. O chatbot conseguiu completar a tarefa, escrevendo uma linha de código que representava a Terra, seguindo o formato do restante do projeto. No entanto, foi necessário colar a resposta do ChatGPT de volta no ambiente.
Para ler diferentes aplicativos, a OpenAI depende principalmente da API de acessibilidade do macOS para ler texto e traduzi-lo para o ChatGPT. O leitor de tela do macOS, que auxilia na funcionalidade VoiceOver da Apple, existe há quase duas décadas e é considerado bastante confiável para a maioria dos aplicativos comuns, ainda que essa não seja a regra para todos.
Para alguns aplicativos, como o VS Code da Microsoft, o recurso “Trabalhar com Aplicativos” exige que os usuários instalem uma extensão especial para consultar conteúdo. Como o nome sugere, o leitor de tela da Apple só consegue ler textos, o que impede o ChatGPT de compreender elementos visuais, como fotos, a orientação de objetos ou vídeos.
O recurso irá enviar suas últimas 200 linhas de código através do ChatGPT junto com cada solicitação para certos aplicativos. Para outros, todo o código na sua janela mais à frente será utilizado como entrada para o chatbot. Você pode destacar seções de código ou texto para ajudar o ChatGPT a se concentrar na parte correta do projeto, mas o ChatGPT também incluirá o texto ao redor. Tudo isso sugere que serão utilizados muitos tokens de entrada.
Desafios e Futuro da Integração
Ainda não está claro como a OpenAI planeja expandir esse recurso para outros aplicativos que não são compatíveis com o leitor de tela da Apple. A Anthropic, uma das concorrentes da OpenAI, lançou um sistema de IA que analisa capturas de tela da área de trabalho de um usuário para entender e utilizar outros aplicativos. No entanto, a abordagem da Anthropic apresenta muitas limitações, sendo lenta e sujeita a erros em sua forma atual.
A OpenAI está lançando essas funcionalidades inicialmente no macOS, pouco antes da Apple lançar uma integração com o ChatGPT em dezembro. Não está claro quando o recurso “Trabalhar com Aplicativos” estará disponível para o Windows, sistema operacional desenvolvido pela maior apoiadora da OpenAI, a Microsoft.
Fonte: TechCrunch