Alphabet lançará geração de imagens de pessoas no Gemini após pausa
O Google GOOG, da Alphabet, disse na quarta-feira que atualizou o modelo de criação de imagens de IA da Gemini e lançaria a geração de imagens de pessoas nos próximos dias, após meses de pausa no recurso.
Em fevereiro, o Google pausou sua ferramenta de IA que cria imagens de pessoas, após imprecisões em algumas representações históricas geradas pelo modelo.
Os problemas, em que o modelo de IA retornava imagens históricas que às vezes eram imprecisas, geraram críticas dos usuários.
A empresa disse que trabalhou para melhorar o produto, aderir aos "princípios do produto" e simulou situações para encontrar pontos fracos.
O recurso será disponibilizado primeiro para usuários pagos do chatbot Gemini AI, começando em inglês e, posteriormente, será lançado o modelo para atrair mais usuários e idiomas.
O Google disse que melhorou o modelo Imagen 3 para criar melhores imagens de pessoas, mas não geraria imagens de pessoas específicas, crianças ou conteúdo gráfico.
O Dall-E da OpenAI, o CoPilot da Microsoft e, recentemente, o Grok da xAI estão entre outros chatbots de IA que agora podem gerar imagens.
A gigante dos mecanismos de busca também disse que, nos próximos dias, os assinantes dos planos Gemini Advanced, Business e Enterprise terão acesso a bate-papos com "Gems" ou chatbots personalizados para propósitos específicos.
Os usuários podem escrever instruções específicas para propósitos específicos e criar um Gem, poupando tempo de reescrever requisições do usuário para casos de uso repetitivos.