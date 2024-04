Nas últimas semanas, nossa obsessão por comparar as duas principais plataformas de Inteligência Artificial do planeta cresceu: ChatGPT da OpenAI e Gemini do Google. Mas agora, em uma reviravolta totalmente inesperada, parece que na realidade a IA de Sam Altman teria em suas entranhas a essência de seu concorrente, tudo graças ao YouTube.

Aqui no FayerWayer, a equipe editorial já publicou em mais de uma ocasião uma comparação onde colocamos as duas Inteligências para competir para tentar determinar qual é a melhor. Chegando sempre à invariável conclusão de que na realidade tudo depende de quais são nossos objetivos e como desejamos aplicar essas ferramentas.

Gemini vs ChatGPT Composição

Mas agora descobrimos que na realidade ambas as plataformas não estariam tão distantes uma da outra. Na verdade, parece que a IA da OpenAI em seu núcleo teria contado com uma intervenção direta e determinante da Alphabet, a empresa-mãe por trás do mecanismo de busca, Gemini e YouTube.

Recomendados

ChatGPT tem a alma do Google por YouTube

Resulta que um relatório explosivo publicado pelo jornal The New York Times revela que a OpenAI, empresa de Inteligência Artificial liderada por Sam Altman e responsável por potencializar o Copilot da Microsoft, teria transcrito mais de um milhão de horas de vídeos do YouTube sem autorização, com o objetivo de treinar seu modelo de linguagem GPT-4.

A informação, obtida através de fontes anônimas, garante que a OpenAI teria desenvolvido um programa chamado Whisper exclusivamente com o objetivo de extrair áudio de vídeos da plataforma do Google para convertê-los em texto, tornando-se a base para alimentar o GPT-4, o núcleo sobre o qual o ChatGPT funciona.

Imagem: WIRED YouTube - ChatGPT - Gemini

Isso não seria um caso em que o Google seja a vítima absoluta do caso, já que a empresa proprietária do YouTube também estaria envolvida em práticas semelhantes para treinar seus próprios modelos de IA. Mas em ambos os casos, as empresas estariam violando os direitos autorais dos criadores de conteúdo.

O relatório do Times coincide com uma investigação anterior publicada pelo pessoal da The Information, onde também é denunciada a extração de dados do YouTube e podcasts pela OpenAI para treinar dois de seus sistemas de Inteligência Artificial. Em ambas as situações, os informantes afirmam que a instituição de Sam Altman estava ciente do que estavam fazendo e dos riscos éticos e legais envolvidos no uso do Whisper.

Nas suas próprias políticas, termos e condições de uso, o YouTube explicitamente proíbe o download de transcrições ou trechos de vídeo sem sua autorização, o que torna a ação da OpenAI uma clara violação desses termos de serviço.

O que o YouTube diz sobre a alegada violação da OpenAI com o ChatGPT

No início deste mês de abril de 2024, a equipe da Bloomberg conseguiu abordar o tema dessas práticas de extração e transcrição com o CEO do YouTube, Neil Mohan, que acabou por reconhecer a existência dessas práticas, mas não confirmou se a OpenAI utilizou ou não os dados do YouTube.

“Tenho visto relatórios de que pode ter sido usado ou não (a subtração e transcrição pela OpenAI). Não tenho informações concretas sobre isso”.

Youtube

A parte alarmante é que o relatório também menciona que alguns funcionários do Google tinham conhecimento das atividades da OpenAI, mas não teriam intervindo porque a empresa também recorre a práticas semelhantes para treinar seus próprios modelos de IA.

Em contraste, de acordo com o artigo do Times, a Alphabet só extrairia dados de vídeos com o consentimento explícito do criador dos mesmos, então o ChatGPT teria cometido uma falta grave.

Em todo caso, fica claro que a indústria de Inteligência Artificial tem um sério problema de transparência.