Contents

Os riscos potenciais envolvidos

,

A maquinaria OpenAI não para quando se trata de criar produtos de inteligência artificial. Depois do muito popular ChatGPT, cuja versão GPT-5 pode estar mais próxima do que parece, ou do seu recente e promissor sora, o sistema de criação de vídeos de até 60 segundos tão realistas que parecem autênticos, agora a empresa anunciou um novo software chamado Voice Engine, capaz de recriar a voz humana com IA.

Assim, enquanto os deepfakes proliferam, a OpenAI aperfeiçoa a tecnologia para clonar vozes… embora, segundo a empresa, o faça de forma “responsável”. O Voice Engine está em desenvolvimento há aproximadamente dois anos e é uma expansão da API de conversão de texto em fala existente. A ideia é a seguinte: permitir que os usuários façam upload de qualquer amostra de fala de 15 segundos para gerar uma cópia sintética dessa voz.

Assim como o já citado Sora, Voice Engine ainda não está disponível ao público em geral. Na verdade, está em fase de testes para um pequeno grupo de empresas, o que dá à OpenAI uma margem de tempo antes de um lançamento geral para continuar a depurar o modelo e também para explicar como funciona o modelo e as suas implicações éticas.

O que é Voice Engine e como funciona?

Conforme relato da OpenAI em sua postagem no blog destinada à apresentação do Voice Engine, O desenvolvimento deste software remonta ao final de 2022 e desde então o utiliza para alimentar as vozes predefinidas disponíveis na API Text-to-Speech e os produtos ChatGPT Voice e Read Aloud. Sobre o delicado tema de seu treinamento, Jeff Harris, membro da equipe de produtos da OpenAI, limitou-se a responder ao Techcrunch, que empregou uma combinação de dados licenciados e disponíveis publicamente.

Para usar o Voice Engine Basta uma entrada de texto com uma descrição do que queremos (o prompt) e uma única amostra de áudio de 15 segundos para gerar um clipe de áudio de voz com som natural que se pareça muito com o locutor original'. Embora a amostra base seja pequena, a OpenAI afirma que pode criar vozes emotivas e realistas.

No post do blog você encontra alguns clipes com a referência e o áudio gerado, mudando o tema, a linguagem e até o objetivo (passando de um mero discurso para uma pergunta). Se você testar a audição do áudio original e gerado, certas diferenças poderão ser vistas, mas Elas são semelhantes o suficiente para passarem por autênticas (especialmente se o discurso se ajusta ao que você espera que a pessoa em questão diga).

Entre os possíveis usos do Voice Engine , OpenAI propõe que ele possa servir para auxiliar a leitura de criaturas ou simplesmente pessoas que não sabem ler, com sons naturais, para traduzir conteúdos, para atingir comunidades globais, melhorando o prestação de serviços essenciais em ambientes remotos, suporte a pessoas que não utilizam comunicação verbal, auxílio a pacientes na recuperação da voz, entre outros.

Neste site, OpenAI está revolucionando a transcrição de áudio para texto com Whisper enquanto todos permanecemos focados em ChatGPT e DALL-E

Os riscos do Voice Engine

Embora existam potenciais usos para o bem do Voice Engine, é inevitável pensar em sua capacidade para o mal , pois é a ferramenta perfeita para espalhar desinformação, simplesmente simulando a voz de figuras políticas, celebridades, jornalistas… há muitos fragmentos de áudio para a amostra. Da mesma forma, e tendo em conta a sua experiência, é provavelmente capaz de contornar os diferentes sistemas de autenticação de voz utilizados para segurança, o que colocaria em risco informações confidenciais.

A OpenAI explica que adotou uma abordagem cautelosa para uma maior disponibilidade devido ao seu potencial para uso indevido de voz sintética. De acordo com a empresa,‘Esperamos iniciar um diálogo sobre a implantação responsável de vozes sintéticas e como a sociedade pode se adaptar a essas novas capacidades’. Mais especificamente, a OpenAI está experimentando sistemas de marca d’água para ajudar a diferenciar gravações reais de gravações sintéticas. uns.

Após essas conversas e os testes em pequena escala, eles tomarão a decisão de se e como implementar a tecnologia em escala. Mas por enquanto e como aconteceu com Sora, trata-se de uma mera demonstração de sua habilidade do que pode fazer.

0

A imagem retratada nesta capa apresenta uma colagem de fotografias tiradas por Michal Czyz, bem como por outros colaboradores do Wikimedia Commons.

1

O site fornece informações sobre como a OpenAI, empresa que desenvolve tecnologias de IA como ChatGPT e Dall-E com o envolvimento de Elon Musk como um de seus sócios fundadores, gera receita.

2

*️⃣ Link da fonte:

conta OpenAI em sua postagem no blog , para responder ao Techcrunch , Michal Czyz , Unsplash , Wikimedia Commons ,