Na indústria de inteligência artificial, sem dúvida OpenAI é uma empresa que está na vanguarda. Graças ao ChatGPT, a empresa fundada por Sam Altman ganhou reconhecimento mundial. Por isso, o anúncio de novos produtos e atualizações começou a gerar expectativa assim que foi divulgado.

Agora, com os anúncios em mãos, podemos adiantar que não se tratava de um novo mecanismo de busca nem do GPT-5, tampouco do Sora. Mas houve grandes novidades que explicamos aqui.

Diga olá para GPT-4o, nosso novo modelo principal que pode raciocinar em áudio, visão e texto em tempo real: https://t.co/MYHZB79UqN



Entrada de texto e imagem sendo lançada hoje na API e ChatGPT, com voz e vídeo nas próximas semanas. pic.twitter.com/uuthKZyzYx — OpenAI (@OpenAI) 13 de maio de 2024

Tudo o que você precisa saber sobre as novidades da OpenAI

Curiosamente, este evento aconteceu mesmo a tempo antes do Google I/O 2024, onde um dos seus concorrentes irá revelar as suas novidades para o ano. Também foi dito que esses anúncios foram em resposta ao Llama 3 da Meta, mas na verdade são apenas teorias das redes sociais.

Na prática, a transmissão começou com Mira Murati,, Diretora de Tecnologia da OpenAI, anunciando o lançamento do GPT-4o (sendo o “o” uma abreviação de “omni), sua versão mais avançada até agora em tecnologia de linguagem. A novidade? É que apresenta melhorias significativas em relação ao seu antecessor GPT-4.

"Aceita como entrada qualquer combinação de texto, áudio e imagem e gera qualquer combinação de saídas de texto, áudio e imagem. Pode responder a entradas de áudio em apenas 232 milissegundos, com uma média de 320 milissegundos, o que é semelhante ao tempo de resposta humano em uma conversa", adiantou Murati.

E é que o GPT-4 não só tem a capacidade de processar texto, mas também ampliou suas capacidades para incluir interpretação de áudio e imagens, o que representa um grande salto em como interagimos com a inteligência artificial.

De acordo com o CTO da OpenAI, essa tecnologia estará em breve disponível para todos os usuários do ChatGPT, tanto nas versões gratuitas quanto pagas. “Esta é a primeira vez que realmente estamos dando um grande passo adiante em termos de facilidade de uso”, revelou Murati, acrescentando que “essa interação se tornará muito mais natural e muito, muito mais fácil”.

OpenAI está olhando para o futuro da IA

"Em primeiro lugar, uma parte chave da nossa missão é colocar nas mãos das pessoas ferramentas de IA muito capazes de forma gratuita (ou a um preço excelente). Estou muito orgulhoso de ter feito com que o melhor modelo do mundo esteja disponível gratuitamente no ChatGPT, sem anúncios ou algo do tipo", escreveu Sam Altman em seu blog.

Também, durante o evento foram realizadas várias demonstrações para mostrar a capacidade do GPT-4o em tempo real. Isso incluiu desde resolver equações matemáticas usando a câmera de um smartphone até identificar emoções a partir de expressões faciais, demonstrando seu potencial.

Segundo Murati, as funções de texto e imagens já estão disponíveis a partir de hoje para todos os usuários do ChatGPT. Já o modo de voz será lançado em uma versão alpha para os assinantes do ChatGPT Plus nas próximas semanas. Além disso, o modelo estará disponível por meio da API da OpenAI, com uma estrutura de custos que promete ser mais acessível e eficiente do que as versões anteriores.

"O novo modo de voz (e vídeo) é a melhor interface de computador que já usei. Parece a IA dos filmes; e ainda me surpreende um pouco que seja real. Alcançar tempos de resposta e expressividade ao nível humano acaba sendo uma grande mudança", disse Altman.

E não só isso. Além do lançamento do GPT-4o, a OpenAI anunciou um aplicativo ChatGPT para sistemas operacionais de desktop, com versões demonstradas para macOS e a promessa de uma versão para Windows. Seu objetivo será facilitar o acesso dos programadores às capacidades da IA, permitindo uma integração mais direta e eficaz no processo de desenvolvimento de software.