Em uma virada inesperada do cada vez mais competitivo mercado de Inteligência Artificial (IA), a equipe da Alphabet / Google começou a distribuir demos de sua nova plataforma multimodal denominada Gemini, que, de acordo com os primeiros relatórios, seria muito mais poderosa e precisa do que o GPT-4 e, portanto, superior ao ChatGPT e ao DALL-E 3.

Na verdade, a OpenAI abalou a internet há alguns dias com a liberação do DALL-E 3, a evolução de sua plataforma de Inteligência Artificial capaz de gerar imagens a partir de instruções de texto.

Naquele momento, ao analisar as novas funções, nossa impressão franca era de que finalmente se tornaria um concorrente à altura de tudo o que a Midjourney, a IA geradora de imagens que se estabeleceu como líder neste segmento, pode alcançar.

Mas agora, começaram a surgir os primeiros relatos sobre o Gemini do Google, onde tudo aponta para que sua liberação possa abalar completamente o terreno e mudar permanentemente a inércia deste setor.

Isto significaria apenas uma coisa: problemas graves para Sam Altman e sua companhia OpenAI, pois estaria prestes a perder a vantagem no competitivo mercado.

Gemini do Google esmagaria o Chat-GPT, DALL-E 3 e GPT-4 da OpenAI

De acordo com um relatório do The Information, o Alphabet/Google começou a distribuir a clientes, empresas e desenvolvedores selecionados, o acesso à demonstração de Gemini, sua nova Inteligência Artificial multimodal que será lançada em breve para competir com o OpenAI.

Esta nova IA será capaz de processar mais de um tipo de dados. Assim, supostamente o modelo será capaz de processar imagens e texto, permitindo funções como análise escrita de gráficos visuais. Na verdade, o Gemini estaria tão próximo de ser lançado que, por isso, a grande empresa de tecnologia tem entregado uma primeira versão do modelo para um pequeno grupo de empresas.

Enquanto a empresa já estava trabalhando em sua próxima interação, onde competiria diretamente com o Copilot da Microsoft, também ligado a OpenAI. Nessa etapa, também poderia integrar a geração de imagens tão complexas quanto as da Midjourney.

Imagem: Forbes | Gemini é uma Inteligência Artificial multimodal desenvolvida pelo Google que poderá gerar texto e imagens. O ChatGPT e o DALL-E 3 estão ameaçados

O relatório do site detalha a experiência de uma pessoa que tinha testado a tecnologia do Gemini, confirmando que ela superaria GPT-4, o núcleo que alimenta o ChatGPT, por uma margem ampla.

Uma vez que a IA aproveita os dados do Google sobre o usuário gerados a partir de seus produtos de consumo, bem como as informações coletadas na Internet para gerar respostas mais robustas e consistentes.

Esse detalhe confirma que o modelo seria capaz de compreender com maior precisão as intenções e instruções do usuário, a partir desse respaldo de dados.

O fator mais inquietante é que o Gemini também gera menos respostas erradas e seu percentual de "ilusões" é muito menor que com a Inteligência Artificial da OpenAI.

Talvez estejamos no início provável de uma nova era neste setor, meses depois do estouro gerado por ChatGPT.