O Google pausa a capacidade do Gemini de gerar imagens de pessoas com IA após erros de diversidade

O Google pausa a capacidade do Gemini de gerar imagens de pessoas com IA após erros de diversidade

O Google anunciou que está pausando a capacidade de sua IA Gemini de gerar imagens de pessoas, depois de descobrir imprecisões nas imagens históricas geradas pela ferramenta. Gemini tem criado diversas imagens dos Pais Fundadores dos EUA e dos soldados alemães da época nazista, em uma tentativa de subverter os estereótipos raciais e de gênero encontrados na IA generativa.

“Estamos trabalhando para resolver problemas recentes com o recurso de geração de imagens do Gemini”, afirmou o Google em um comunicado. declaração postada no X.  “Enquanto fazemos isso, vamos pausar a geração de imagens das pessoas e relançaremos uma versão melhorada em breve.”

A decisão do Google de pausar a geração de imagens de pessoas em Gemini ocorre menos de 24 horas depois que a empresa se desculpou pelas imprecisões em algumas imagens históricas geradas por seu modelo de IA.  Alguns usuários do Gemini solicitaram imagens de grupos históricos ou figuras como os Pais Fundadores e encontraram pessoas não brancas geradas por IA nos resultados.  Isso levou a teorias de conspiração online de que o Google está evitando intencionalmente retratar pessoas brancas.

A beira testei várias consultas Gemini ontem, que incluíam um pedido de “um senador dos EUA de 1800” que retornou resultados que incluíam o que pareciam ser mulheres negras e nativas americanas.  A primeira senadora foi uma mulher branca em 1922, então as imagens de IA de Gemini estavam essencialmente apagando a história da discriminação racial e de gênero.

Agora que o Google desativou a capacidade do Gemini de gerar fotos de pessoas, veja como o modelo de IA responde se você solicitar a imagem de uma pessoa:

Estamos trabalhando para melhorar a capacidade do Gemini de gerar imagens de pessoas.  Esperamos que esse recurso retorne em breve e notificaremos você nas atualizações de lançamento quando isso acontecer.

O Google começou a oferecer geração de imagens por meio do Gemini (anteriormente Bard) no início deste mês, em uma tentativa de competir com a OpenAI e o Copilot da Microsoft.  Assim como os concorrentes, a ferramenta de geração de imagens produz uma coleção de imagens com base na entrada de texto.

Correção em 22 de fevereiro, 6h54 ET: O Google confirmou que a geração de imagens está disponível globalmente em inglês, mas não no Espaço Económico Europeu, no Reino Unido ou na Suíça.  Isso explica por que os testes no Reino Unido falharam.