ReutersReuters

Alphabet lançará geração de imagens de pessoas no Gemini após pausa

O Google GOOG, da Alphabet, disse na quarta-feira que atualizou o modelo de criação de imagens de IA da Gemini e lançaria a geração de imagens de pessoas nos próximos dias, após meses de pausa no recurso.

Em fevereiro, o Google pausou sua ferramenta de IA que cria imagens de pessoas, após imprecisões em algumas representações históricas geradas pelo modelo.

Os problemas, em que o modelo de IA retornava imagens históricas que às vezes eram imprecisas, geraram críticas dos usuários.

A empresa disse que trabalhou para melhorar o produto, aderir aos "princípios do produto" e simulou situações para encontrar pontos fracos.

O recurso será disponibilizado primeiro para usuários pagos do chatbot Gemini AI, começando em inglês e, posteriormente, será lançado o modelo para atrair mais usuários e idiomas.

O Google disse que melhorou o modelo Imagen 3 para criar melhores imagens de pessoas, mas não geraria imagens de pessoas específicas, crianças ou conteúdo gráfico.

O Dall-E da OpenAI, o CoPilot da Microsoft e, recentemente, o Grok da xAI estão entre outros chatbots de IA que agora podem gerar imagens.

A gigante dos mecanismos de busca também disse que, nos próximos dias, os assinantes dos planos Gemini Advanced, Business e Enterprise terão acesso a bate-papos com "Gems" ou chatbots personalizados para propósitos específicos.

Os usuários podem escrever instruções específicas para propósitos específicos e criar um Gem, poupando tempo de reescrever requisições do usuário para casos de uso repetitivos.

Entrar ou criar uma conta gratuita para ler essa notícia

Mais notícias de Reuters

Mais notícias