Se o Google é o mais poderoso mecanismo de busca da Internet, mesmo desde uma era sem Inteligência Artificial (IA) e nos revolucionou, agora pode nos levar para sabe-se lá onde.

No vertiginoso mundo da Inteligência Artificial, a empresa de Mountain View está prestes a lançar um projeto que poderia mudar completamente o jogo. Chamado Gemini, é a aposta do gigante tecnológico para se tornar a "inteligência artificial mais poderosa" do mundo.

Este movimento, como explicado pela Decrypt, coloca o Google em uma posição de confronto direto com a OpenAI, criadora do ChatGPT, que tem causado sensação desde seu lançamento em novembro passado.

Gemini, de acordo com um relatório da The Information, já está em testes com empresas selecionadas, o que sugere que seu lançamento para consumidores pode estar ao virar da esquina. Mas, o que torna o Gemini tão especial?

O que você precisa saber sobre o Gemini

A chave do Gemini reside na sua capacidade multimodal. Isso significa que ele pode processar e entender diferentes tipos de dados de forma nativa, como texto, imagens, áudio e mais.

Imagem: Forbes | Gemini é uma Inteligência Artificial multimodal desenvolvida pelo Google que poderá gerar texto e imagens. ChatGPT e DALL-E 3 estão em apuros

Sundar Pichai, CEO do Google, afirmou em um discurso recente: "Gemini foi criado do zero para ser multimodal. Embora ainda seja cedo, já estamos vendo capacidades multimodais impressionantes que não são vistas nos modelos anteriores".

Esta capacidade multimodal poderia representar um desafio significativo para o ChatGPT, que, apesar de ser altamente elogiado por sua capacidade conversacional, é principalmente focado em texto. Empresas de diversas indústrias, desde fintech até atendimento médico, estão investindo grandes somas de dinheiro para aproveitar as habilidades conversacionais do ChatGPT.

No entanto, Sundar Pichai parece confiante na abordagem do Google. Quando perguntado se a empresa deveria ter lançado um concorrente do ChatGPT antes, Pichai respondeu: "Não estou totalmente convencido de que teria funcionado tão bem".

Google tem aumentado seu investimento em IA desde 2016 e, segundo Pichai, era necessário mais tempo para aperfeiçoar os seus modelos antes de lançar o Gemini. "Estou muito confortável com onde estamos", afirmou.

Arquivo - O diretor executivo da Alphabet, Sundar Pichai, fala durante um evento da Google I/O em Mountain View, Califórnia, em 10 de maio de 2023. AP (Jeff Chiu/AP)

Gemini e a Sombra do Bard

O caminho para o Gemini não esteve isento de desafios. O lançamento inicial do Google de seu chatbot Bard, baseado no LaMDA, em fevereiro, foi um fracasso depois de falhar em dados básicos sobre o telescópio James Webb. No entanto, o Bard recebeu uma importante atualização para aproveitar o novo modelo multimodal PaLM 2 do Google, que demonstrou superar significativamente seu predecessor.

Em comparação com o ChatGPT Plus, o Bard oferece traduções mais rápidas e contextualizadas, e demonstrou ser competente na geração de código em mais de 20 linguagens de programação. No entanto, o ChatGPT respondeu a este desafio com sua ferramenta Advanced Data Analytics, tornando-se uma poderosa máquina de codificação.

A integração do Bard com o vasto índice de pesquisa em tempo real do Google deu-lhe uma vantagem ao responder perguntas sobre eventos atuais. Além disso, o Google é o principal investidor na Anthropic, a startup por trás do Claude AI, o competidor mais poderoso do ChatGPT até agora. Claude pode lidar com mais de 100.000 tokens de contexto, superando o ChatGPT em termos de qualidade em muitas ocasiões.

Google Bard

Além disso, o Google está adotando uma abordagem de "ecossistema" focada na IA, integrando capacidades gerativas em produtos como Docs, Maps e Search. Recentemente, anunciou novas atualizações de IA destinadas a melhorar a forma como as pessoas encontram e assimilam informações online.

Com Gemini prestes a fazer sua entrada, o império de IA da OpenAI pode estar enfrentando seu maior desafio até agora. No entanto, por enquanto, Sundar Pichai está satisfeito em adotar um enfoque lento e constante na sua busca por liderar a próxima era da Inteligência Artificial.