ReutersReuters

OpenAI revela novo modelo de IA que funciona com voz e interpreta imagens

A OpenAI, criadora do ChatGPT, anunciou nesta segunda-feira o lançamento de um novo modelo de inteligência artificial chamado GPT-4o, que interpreta voz e interage a partir de texto e imagens.

Os novos recursos de áudio permitem que usuários conversem com o ChatGPT e sejam respondidos em tempo real, sem atrasos, além da possibilidade de interromper o ChatGPT enquanto ele fala, duas características de conversas realísticas consideradas desafiadoras para assistentes de voz de IA, mostraram pesquisadores da OpenAI em um evento transmitido ao vivo.

"Parece a IA dos filmes... Falar com um computador nunca pareceu muito natural para mim; agora é", escreveu Sam Altman, presidente-executivo da OpenAI, em uma publicação.

A OpenAI, apoiada pela Microsoft MSFT, enfrenta uma crescente concorrência e pressão para expandir sua base de usuários do ChatGPT, popular chatbot que cativou o mundo com sua capacidade de produzir conteúdo semelhante ao de um humano.

No evento, os pesquisadores da OpenAI exibiram os novos recursos de assistente de voz do ChatGPT. Em uma demonstração, o ChatGPT usou recursos de interpretação de imagens para resolver uma equação matemática escrita em uma folha de papel.

Em outra demonstração, os pesquisadores mostraram a capacidade do modelo GPT-4o de traduzir idiomas em tempo real.

As demonstrações da OpenAI beiraram a ficção científica, com o ChatGPT e seu interlocutor em certo momento protagonizando uma conversa descontraída. O pesquisador da OpenAI disse ao chatbot que estava de ótimo humor porque estava demonstrando "o quão útil e incrível você é".

O ChatGPT respondeu: "Ah, pare com isso! Você está me fazendo corar!"

Altman publicou no X após a demonstração, "ela", em uma aparente referência ao filme de 2013 de Spike Jones, "Ela", sobre um homem que se apaixona por sua assistente de IA, dublada por Scarlett Johansson.

A diretora de tecnologia da OpenAI, Mira Murati, disse durante conferência da companhia que o novo modelo será ofertado gratuitamente e que é mais eficiente que os modelos anteriores da empresa.

Os usuários pagos do GPT-4o terão limites de capacidade maiores do que os usuários gratuitos da empresa, disse Murati.

O modelo GPT-4o estará disponível no ChatGPT ao longo das próximas semanas, segundo a empresa.

A OpenAI fez os anúncios um dia antes da Alphabet GOOG realizar sua conferência anual para desenvolvedores do Google, na qual a empresa deve exibir novos recursos de IA.

(Reportagem de Anna Tong em San Francisco; e Akash Sriram em Bengalaru; reportagem adicional de Noel Randewich em Oakland, Califórnia, e Jeffrey Dastin em San Francisco)

((Tradução Redação São Paulo, 55 11 56447753))

Entrar ou criar uma conta gratuita para ler essa notícia