O Gemini Google é um chatbot de inteligência artificial útil para diversas tarefas do dia a dia, mas apresenta falhas para gerar imagens profissionais que podem ser usadas no LinkedIn e em outras plataformas. Mesmo quando recebe uma foto real de referência e um comando detalhado, que traz dados como objetivo da imagem, descrição da pessoa e cenário, a IA do Google tem dificuldade de oferecer um resultado satisfatório. Recentemente, nós testamos as habilidades do ChatGPT realizando a mesma tarefa e foi impossível não fazer uma comparação. A seguir, confira os detalhes do teste os resultados obtidos pelo TechTudo no Gemini Google.
🔎ChatGPT pode tirar do papel aquele projeto que você vive adiando; saiba como
🔔Canal do TechTudo no WhatsApp: acompanhe as principais notícias, tutoriais e reviews
Teste revela que Gemini tem dificuldade para gerar fotos profissionais realistas
Reprodução/Thaisi Carvalho
📝 Como usar o ChatGPT para melhorar a produtividade no trabalho? Veja no Fórum do TechTudo
Teste revela se o Gemini consegue gerar imagens profissionais
O primeiro passo do teste foi selecionar uma foto que a IA do Google iria usar como base para fazer as alterações solicitadas. Depois, era necessário formular um prompt completo, com o máximo de informações possíveis, incluindo o objetivo da imagem, como: “Quero criar uma foto profissional para ser utilizada como imagem de perfil no meu LinkedIn”. Em seguida, fizemos uma descrição da pessoa que aparece na foto usada como referência, solicitando que o Gemini Google usasse a imagem como base, mas que fizesse alterações no estilo.
O comando usado foi: “Use esta foto real como base e faça as seguintes alterações nela: mantenha a mesma pessoa retratada na imagem, que é uma mulher branca, com cabelo liso e escuro, óculos, olhos castanhos e um sorriso no rosto, vestida com um casaco preto, usando um colar prata e com uma expressão sorridente, mas crie um estilo parecido com o das fotografias feitas em estúdios profissionais, com um cenário azul neutro ao fundo, para transmitir uma imagem profissional”.
Por fim, o TechTudo pediu que o Gemini mantivesse o mesmo enquadramento da foto de referência: “A imagem deve ser feita somente do ombro para cima, como na foto de referência.”
Resultado 1
Gemini apresenta dificuldades para gerar fotos profissionais mesmo com comandos detalhados
Reprodução/Thaisi Carvalho
O comando utlizado foi: “Quero criar uma foto profissional para ser utilizada no meu perfil do LinkedIn. Use esta foto real como base e faça as seguintes alterações nela: mantenha a mesma pessoa retratada na imagem, que é uma mulher branca, com cabelo liso e escuro, óculos, olhos castanhos e um sorriso no rosto, vestida com um casaco preto, usando um colar prata e com uma expressão sorridente, mas crie um estilo parecido com o das fotografias feitas em estúdios profissionais, com um cenário azul neutro ao fundo, para transmitir uma imagem profissional. A imagem deve ser feita apenas do ombro para cima, como na foto de referência.”
Embora tenha recebido um comando detalhado, o Gemini Google não conseguiu fazer os ajustes na foto real da pessoa, usada como referência. Ao invés disso, a IA seguiu os detalhes do comando, mas criou uma nova foto, que não corresponde à pessoa verdadeira. Então, testamos mais algumas alterações no prompt para tentar melhorar a imagem.
Resultado 2
Testes mostram que Gemini apresenta dificuldade em gerar fotos profissionais
Reprodução/Thaisi Carvalho
Comando utilizado foi: “Use esta foto como base para criar uma imagem profissional que eu possa usar no meu LinkedIn. Faça as seguintes edições na foto base: crie um estilo parecido com o das fotografias feitas em estúdios profissionais. A pessoa retratada na imagem é uma mulher branca, com cabelo liso e escuro, óculos, olhos castanhos e um sorriso no rosto. A mulher está vestida com um casaco preto, usa um colar prata e mantém uma expressão sorridente. A imagem deve ser feita apenas do ombro para cima, como na foto de referência. O cenário ao fundo deve ser neutro, na cor azul, para transmitir uma imagem profissional. A foto deve ser realista e o nível de qualidade deve se assemelhar ao de uma câmera profissional.”
Mais uma vez, o chatbot de IA não conseguiu usar a foto de referência e criou uma nova imagem totalmente artificial.
Resultado 3
Teste mostra desempenho do Gemini para gerar fotos profissionais
Reprodução/Thaisi Carvalho
Usamos o seguinte prompt “Use esta foto como base para criar uma foto profissional para usar como imagem de perfil no meu LinkedIn. A imagem deve ter um estilo parecido com o das fotografias feitas em estúdios profissionais. A pessoa retratada na imagem é uma mulher branca, com cabelo liso e escuro, óculos, olhos castanhos e um sorriso no rosto. A mulher está vestida com um casaco preto, usa um colar prata e mantém uma expressão sorridente. A imagem deve ser feita apenas do ombro para cima, como na foto de referência. O cenário ao fundo deve ser neutro e sem estampas para transmitir uma imagem profissional. A foto deve ser realista, o nível de qualidade deve se assemelhar ao de uma câmera profissional.”
Pela terceira vez, o Gemini criou uma nova imagem totalmente artificial e não atendeu às expectativas do teste, com pouca preservação da foto base.
Comparação com o ChatGPT
Em relação a outros softwares de inteligência artificial, como o ChatGPT, o Gemini oferece resultados pouco adequados para o propósito de gerar uma foto profissional. Isso porque, nos testes do TechTudo, o chatbot de IA da OpenAI conseguiu compreender um comando detalhado e de usar uma foto de referência para fazer as edições solicitadas pelo usuário. Confira o prompt e o resultado:
“Quero criar uma foto profissional para ser utilizada como imagem de perfil no meu Linkedin. O estilo da imagem deve ser semelhante a fotografias tiradas em estúdios profissionais. A pessoa retratada na imagem é um homem branco, cabelo cacheado, possui um sorriso no rosto e uma barba e bigode. O homem está vestido com uma camisa com listras azuis e brancas e usa um cordão de prata. Mantém uma expressão sorridente e apenas a imagem do rosto acima dos ombros. O cenário ao fundo deve ser básico, um azul-claro sólido para transmitir uma imagem profissional. A foto deve ser realista, o nível de qualidade deve se assemelhar ao de uma câmera profissional.”
O ChatGPT pode ser utilizado como um editor de imagens para fotos profissionais
Reprodução/Luã Souza
Com informações de Gemini Google .
Mais do TechTudo
Veja também: 6 concorrentes do ChatGPT que você deveria testar
6 concorrentes do ChatGPT que você deveria testar