Alphabet lançará geração de imagens de pessoas no Gemini após pausa

28 de ago. de 202416:21 UTC

O Google GOOG, da Alphabet, disse na quarta-feira que atualizou o modelo de criação de imagens de IA da Gemini e lançaria a geração de imagens de pessoas nos próximos dias, após meses de pausa no recurso.

Em fevereiro, o Google pausou sua ferramenta de IA que cria imagens de pessoas, após imprecisões em algumas representações históricas geradas pelo modelo.

Os problemas, em que o modelo de IA retornava imagens históricas que às vezes eram imprecisas, geraram críticas dos usuários.

A empresa disse que trabalhou para melhorar o produto, aderir aos "princípios do produto" e simulou situações para encontrar pontos fracos.

O recurso será disponibilizado primeiro para usuários pagos do chatbot Gemini AI, começando em inglês e, posteriormente, será lançado o modelo para atrair mais usuários e idiomas.

O Google disse que melhorou o modelo Imagen 3 para criar melhores imagens de pessoas, mas não geraria imagens de pessoas específicas, crianças ou conteúdo gráfico.

O Dall-E da OpenAI, o CoPilot da Microsoft e, recentemente, o Grok da xAI estão entre outros chatbots de IA que agora podem gerar imagens.

A gigante dos mecanismos de busca também disse que, nos próximos dias, os assinantes dos planos Gemini Advanced, Business e Enterprise terão acesso a bate-papos com "Gems" ou chatbots personalizados para propósitos específicos.

Os usuários podem escrever instruções específicas para propósitos específicos e criar um Gem, poupando tempo de reescrever requisições do usuário para casos de uso repetitivos.

Alphabet lançará geração de imagens de pessoas no Gemini após pausa

Mais notícias de Reuters