bukib
0 bukibs
Columbus, Ohio
Hora local: 08:14
Temperatura: °C
Probabilidade de chuva: %

Imita fala humana: nova IA do ChatGPT fala e ouve ao mesmo tempo

Imitação de Fala Humana: O Novo Modelo de Voz do ChatGPT

A OpenAI está lançando um novo modelo de voz bidirecional para o ChatGPT, conhecido internamente como “GPT-Bidi-1”. Essa ferramenta revoluciona a dinâmica de conversação, permitindo que a inteligência artificial ouça e fale simultaneamente. O recurso está sendo liberado gradualmente para um grupo selecionado de usuários do aplicativo, tanto na versão web quanto na versão mobile.

O objetivo dessa atualização é aproximar a camada de voz das capacidades já existentes nos modelos de texto da companhia. A mudança estrutural se baseia na tese de que a fala se tornará o principal meio de acesso à inteligência artificial nos próximos anos. Com isso, a OpenAI busca criar uma experiência mais natural e intuitiva para os usuários.

Características do Novo Modelo

O GPT-Bidi-1 traz várias mudanças significativas em relação ao modelo anterior. Algumas das principais características incluem:

  • Interrupções Naturais: O usuário pode interromper o ChatGPT no meio de uma resposta, e o modelo consegue mudar o foco do assunto imediatamente, sem travamentos ou reinicializações.
  • Ajustes de Ritmo: O modelo emite pequenos avisos naturais, como um “okay”, quando detecta que a pessoa reduziu a velocidade da fala ou fez uma pausa breve.
  • Retenção de Memória: A ferramenta mantém a linha de raciocínio ao longo de interações longas, corrigindo uma falha crônica do sistema anterior que descartava contextos antigos da conversa.
  • Silêncio Prolongado: O robô deixa de dar respostas precipitadas durante pausas mais demoradas do interlocutor.

Além disso, o GPT-Bidi-1 também traz mudanças na interface e tiers de processamento. O modelo aparece listado no menu de seleção de modelos, e a bolha flutuante de conversação assume a cor amarela quando o usuário seleciona o novo motor de voz.

A tecnologia está em desenvolvimento desde o início de 2026, e a expectativa é que o modelo seja expandido em um formato de adesão opcional. Com essa atualização, a OpenAI busca criar uma experiência mais natural e intuitiva para os usuários, e está um passo mais perto de tornar a fala o principal meio de acesso à inteligência artificial.

Este conteúdo pode conter links de compra.

Fonte: link