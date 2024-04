Há 9 anos, Sam Altman, juntamente com Greg Brockman, Ilya Sutskever, Elon Musk e outros personagens do mundo da tecnologia, decidiram criar a OpenAI. E embora a empresa tenha mantido um perfil baixo por vários anos, seu crescimento foi meteórico. Após o lançamento do ChatGPT, uma nova revolução ocorreu no mundo, e rapidamente as pessoas começaram a adotar a inteligência artificial para suas tarefas diárias. Até o momento, a OpenAI continua trabalhando em novas inovações. Por exemplo, recentemente anunciaram que estão trabalhando no Sora, uma IA especializada na criação de vídeos, e agora chamaram a atenção internacional com um novo lançamento: Voice Engine.

O mais recente desenvolvimento da OpenAI está relacionado a uma inteligência artificial com capacidade de replicar a voz de uma pessoa ouvindo-a apenas uma vez, oferecendo resultados em apenas 15 segundos. Claro, o Voice Engine ainda não está disponível para os usuários, mas já está gerando altas expectativas e aqui vamos contar tudo o que sabemos a respeito.

OpenAI anuncia Motor de Voz

A nova IA da empresa liderada por Sam Altman está atualmente em fase de prévia, conforme relatado pela empresa. "Desenvolvemos o Voice Engine pela primeira vez no final de 2022 e o utilizamos para potencializar as vozes predefinidas disponíveis na API de conversão de texto para voz, assim como o ChatGPT Voice e o Read Aloud", explicaram em seu site oficial.

Recomendados

Adicionando que estão "adotando uma abordagem cautelosa e informada para uma publicação mais ampla devido ao potencial de uso indevido da voz sintética. Esperamos iniciar um diálogo sobre a implementação responsável de vozes sintéticas e como a sociedade pode se adaptar a essas novas capacidades".

E é que a empresa admite que ainda não está claro se o seu lançamento oficial será em massa ou apenas para alguns poucos. Estamos falando de uma IA que só precisa de uma amostra de áudio de 15 segundos para gerar uma voz que imita com precisão a original, além de adicionar emoções e tons realistas à voz clonada.

Os riscos do Voice Engine

Sem dúvida, o Voice Engine poderia abrir um leque de possibilidades para os criadores de conteúdo multimídia, para criar podcasts em minutos ou para traduzir conteúdos para outros idiomas. O problema? Também acarretaria riscos potenciais de falsificação de voz.

"Nossas políticas de uso proíbem a suplantação de outra pessoa ou organização sem consentimento ou direito legal. Além disso, nossos termos exigem o consentimento explícito e informado do falante original e não permitimos que os desenvolvedores criem formas para que os usuários individuais criem suas próprias vozes. Os parceiros também devem revelar claramente ao seu público que as vozes que ouvem são geradas por IA. Por fim, implementamos um conjunto de medidas de segurança, que incluem marcas d'água para rastrear a origem de qualquer áudio gerado pelo Voice Engine, bem como um monitoramento proativo de como é utilizado", explica a OpenAI.

No entanto, embora o potencial do Voice Engine ainda seja incalculável, a OpenAI prometeu avançar com cautela, limitando por enquanto seu uso a um pequeno grupo de parceiros e com todas as restrições mencionadas anteriormente. Veremos como essa história se desenvolve e se finalmente poderemos ter acesso a essa ferramenta que se mostra revolucionária.