ChatGPT ganha agente ‘faz tudo’ para combinar pesquisas e ações no dia a dia

A OpenAI lançou nesta quinta-feira (17) o ChatGPT Agent, um agente “faz tudo” capaz de executar diferentes tarefas pedidas pelo consumidor. O objetivo é reunir todas as funções desempenhadas pela IA na mesma ferramenta, como fazer pesquisas complexas, raciocinar, interagir com páginas da web e até criar apresentações de slides.

A empresa entrou no ramo da IA agêntica no começo do ano com os recursos Deep Research e Operator, mas ambos funcionavam separadamente. O Agent reúne todas as habilidades e usa um computador virtual para atender a todo o pedido de uma vez.

Durante o lançamento, o CEO da empresa, Sam Altman, pontuou que os recursos de navegação na web e pesquisa aprofundada foram valorizados pelos usuários, mas a comunidade ainda queria um agente unificado para tarefas mais sobrecarregadas.


Entre no Canal do WhatsApp do Canaltech e fique por dentro das últimas notícias sobre tecnologia, lançamentos, dicas e tutoriais incríveis.

Um computador dentro do ChatGPT

É importante destacar que a novidade não é um navegador baseado em IA como o Comet, lançado pela Perplexity. O Agent roda dentro do ChatGPT enquanto usa um computador virtual com navegador, terminal de comando e outras ferramentas.

O navegador combina opções de texto para fazer pesquisas aprofundadas em páginas da web e extrair informações, além de trazer uma opção visual para entender a interface de um site e realizar ações nele, como reservar um hotel. Há, ainda, suporte para gerar imagens e acessar APIs de terceiros para vincular dados.

Todo o processo é monitorado pelo humano — para evitar erros, o Agent pede a confirmação de diversos comandos antes de executá-los, principalmente em tarefas mais sensíveis como criar um e-mail ou confirmar uma compra online. 

Casos de uso

A OpenAI trouxe alguns exemplos de uso da ferramenta. No primeiro deles, o prompt indica um convite de casamento, pede dicas de roupas considerando o horário e a temperatura do local, e ainda pede para reservar um hotel.

O modo Agent, então, abre a máquina virtual para pesquisar todas as informações e ainda avançar com a compra da hospedagem, com as etapas acontecendo no mesmo lugar.

Outro exemplo mostrou o terminal em ação: o agente pesquisou os dados de benchmark do novo modelo, criou uma apresentação de slides e ainda preencheu o arquivo com imagens geradas pela própria IA do ChatGPT.

A desenvolvedora reforça que o Agent Mode superou outros modelos da casa nos testes de performance, incluindo o Humanity’s Last Exam. Em média, os pedidos mais complexos levam de 20 a 30 minutos para serem finalizados.

ChatGPT Agent faz tarefas de pesquisa, análise e criação dentro do próprio chatbot (Imagem: Reprodução/OpenAI)

Disponibilidade 

O modo Agent fica disponível a partir de hoje (17) para assinantes dos planos pagos Pro, Plus e Team, mas com limites mensais de pedidos: o plano Pro (de mais de R$ 1 mil) tem direito a 400 pedidos por mês, enquanto os outros são limitados a 40 por mês.

Confira outras matérias sobre IA:

VÍDEO: Essa IA vai mudar suas apresentações?

Leia a matéria no Canaltech.