Humano ou IA? Saiba como identificar voz gerada por inteligência artificial


Vozes geradas por IA podem enganar usuários menos experientes, aumentando risco de golpes ou disseminação de fake news; confira cinco sinais para prestar atenção Vozes geradas por inteligência artificial já são uma realidade e podem confundir usuários menos experientes. No entanto, existem dicas úteis para quem deseja checar se determinada voz foi gerada por IA ou por um humano. Ao identificar uma voz feita com IA, a pessoa pode descobrir que um podcast ou vídeo não foi feito por humanos. Além disso, esse conhecimento pode livrar usuários de golpes usam vozes de IA para enganar vítimas, por exemplo. A seguir, confira cinco sinais específicos que podem ajudar a identificar se uma voz é feita por inteligência artificial.
🔎Você ouviria uma banda feita por IA? 600 mil fizeram isso sem saber; entenda
🔔Canal do TechTudo no WhatsApp: acompanhe as principais notícias, tutoriais e reviews
Lista aponta cinco dicas para descobrir se uma voz foi gerada por inteligência artificial
Alex Knight/Unsplash
📝 Inteligência artificial é perigosa? Veja no Fórum do TechTudo
1. Ausência de pausas naturais
Uma das formas de verificar se uma voz foi gerada por IA é a falta de pausas naturais
Reprodução/Freepik
Uma das formas de verificar se uma voz foi gerada por inteligência artificial é a ausência de pausas naturais, que acontecem quando pessoas falam. Dessa maneira, mesmo que o áudio tenha sido feito com a ajuda de uma ferramenta de IA avançada, o resultado ainda pode apresentar algumas inconsistências.
Por exemplo, mesmo que a voz pareça realmente humana, é possível que a interação entre as vozes não seja natural, como ocorre em uma conversa entre pessoas. Ou seja, vozes geradas por IA em um podcast, por exemplo, podem não terminar a frase antes de a outra começar a falar ou podem fazer pausas sem sentido — o que também não soa natural.
2. Falhas aleatórias na voz
Vozes criadas com IA também podem apresentar falhas aleatórias
Igor Omilaev /Unsplash
As vozes criadas com ferramentas de inteligência artificial também podem apresentar falhas aleatórias, sobretudo as que são desenvolvidas em modelos de IA mais básicos. Por isso, é importante prestar atenção e ouvir o áudio com calma para analisar possíveis erros. Apesar da IA estar evoluindo, a tecnologia não é perfeita nem isenta de inconsistências.
Caso o usuário suspeite que o conteúdo foi criado com inteligência artificial, o primeiro passo é ouvi-lo com atenção para notar se todas as palavras são totalmente pronunciadas e se essa pronúncia está realmente correta. Na voz humana, também é possível existirem erros de sotaques, gírias, variações linguísticas, entre outros.
3. A voz fica inconsistente se for ouvida em velocidade maior
Áudio feito ocm IA pode ficar inconsistente se for reproduzido em velocidade maior
Igor Omilaev/Unsplash
Mais um indício de que a voz foi gerada por IA acontece quando o usuário reproduz o áudio em uma velocidade maior do que a normal, como em 1,25x, 1,5x, 1,75x ou 2x. Essa perspectiva pode deixar mais evidente que a voz é robótica e não parece de fato a voz natural de uma pessoa.
Dessa forma, os usuários podem notar inconsistências no áudio, como se ele fosse um meme ou algo que não parece real. Situação semelhante pode ocorrer quando uma música é criada por inteligência artificial, mas depois é reproduzida em uma velocidade maior. Isso gera uma desconfiança de que o conteúdo não foi feito por humanos.
4. A voz não tem respiração ou suspiros
Voz gerada por IA pode não ter respiração ou suspiros
Reprodução/Freepik
Além da falta de pausas naturais, outro sinal de que o áudio foi gerado por uma ferramenta de IA é a ausência de respiração ou de suspiros da pessoa que está falando. Em um vídeo ou podcast, por exemplo, mesmo com uma excelente edição, o público pode ouvir a respiração dos apresentadores, suspiros e outros sons que surgem quando uma pessoa fala.
Se esses elementos não estão presentes em um áudio, há grandes chances de ele ter sido desenvolvido por uma ferramenta de inteligência artificial. Mesmo que as IAs consigam replicar algumas interações humanas, os resultados podem não ter o mesmo efeito.
5. Dificuldade para retratar as emoções humanas naturalmente
Voz feita por inteligência artificial tem dificuldade com emoções humanas
Reprodução/Freepik (rawpixel.com)
Os áudios gerados por IAs costumam ter dificuldade para retratar as diversas emoções humanas de maneira natural. Na prática, elas podem ficar excessivamente robóticos ou dramáticos. Eles não conseguem equilibrar naturalmente as emoções, como acontece com as pessoas.
Com isso, as vozes geradas por inteligência artificial podem ficar desalinhadas, causando estranhamento em quem está ouvindo. Em alguns momentos, esses áudios de IAs podem ser neutros demais ou mostrar uma animação, paixão ou empolgação que forçada ou desnecessária para o contexto.
Com informações de Make Use Of.
Mais do TechTudo
Veja também: Você sabe diferenciar um vídeo real ou feito com IA? Testamos o público!
Você sabe diferenciar um vídeo real ou feito com IA? Testamos o público!