A OpenAI lançou nesta quinta-feira (17) o ChatGPT Agent, um agente “faz tudo” capaz de executar diferentes tarefas pedidas pelo consumidor. O objetivo é reunir todas as funções desempenhadas pela IA na mesma ferramenta, como fazer pesquisas complexas, raciocinar, interagir com páginas da web e até criar apresentações de slides.
- Vai escrever com o ChatGPT? 7 dicas para gerar bons textos com a IA
- Mais de R$ 1 mil por mês: por que há planos de IA que custam uma fortuna?
A empresa entrou no ramo da IA agêntica no começo do ano com os recursos Deep Research e Operator, mas ambos funcionavam separadamente. O Agent reúne todas as habilidades e usa um computador virtual para atender a todo o pedido de uma vez.
Durante o lançamento, o CEO da empresa, Sam Altman, pontuou que os recursos de navegação na web e pesquisa aprofundada foram valorizados pelos usuários, mas a comunidade ainda queria um agente unificado para tarefas mais sobrecarregadas.
–
Entre no Canal do WhatsApp do Canaltech e fique por dentro das últimas notícias sobre tecnologia, lançamentos, dicas e tutoriais incríveis.
–
Um computador dentro do ChatGPT
É importante destacar que a novidade não é um navegador baseado em IA como o Comet, lançado pela Perplexity. O Agent roda dentro do ChatGPT enquanto usa um computador virtual com navegador, terminal de comando e outras ferramentas.
O navegador combina opções de texto para fazer pesquisas aprofundadas em páginas da web e extrair informações, além de trazer uma opção visual para entender a interface de um site e realizar ações nele, como reservar um hotel. Há, ainda, suporte para gerar imagens e acessar APIs de terceiros para vincular dados.
Todo o processo é monitorado pelo humano — para evitar erros, o Agent pede a confirmação de diversos comandos antes de executá-los, principalmente em tarefas mais sensíveis como criar um e-mail ou confirmar uma compra online.
Casos de uso
A OpenAI trouxe alguns exemplos de uso da ferramenta. No primeiro deles, o prompt indica um convite de casamento, pede dicas de roupas considerando o horário e a temperatura do local, e ainda pede para reservar um hotel.
O modo Agent, então, abre a máquina virtual para pesquisar todas as informações e ainda avançar com a compra da hospedagem, com as etapas acontecendo no mesmo lugar.
Outro exemplo mostrou o terminal em ação: o agente pesquisou os dados de benchmark do novo modelo, criou uma apresentação de slides e ainda preencheu o arquivo com imagens geradas pela própria IA do ChatGPT.
A desenvolvedora reforça que o Agent Mode superou outros modelos da casa nos testes de performance, incluindo o Humanity’s Last Exam. Em média, os pedidos mais complexos levam de 20 a 30 minutos para serem finalizados.
Disponibilidade
O modo Agent fica disponível a partir de hoje (17) para assinantes dos planos pagos Pro, Plus e Team, mas com limites mensais de pedidos: o plano Pro (de mais de R$ 1 mil) tem direito a 400 pedidos por mês, enquanto os outros são limitados a 40 por mês.
Confira outras matérias sobre IA:
- O que garante o uso gratuito do ChatGPT, Gemini e demais IAs? 6 motivos
- O que é um navegador com IA e o que ele tem de diferente? Entenda
- Tem risco enviar fotos nossas ao ChatGPT, Gemini e outras IAs? Entenda
VÍDEO: Essa IA vai mudar suas apresentações?
Leia a matéria no Canaltech.