Contents

AI de clonagem de voz da OpenAI pronta para lançamento-mas os medos persistem!

Contents

A OpenAI lançou recentemente o Voice Engine, uma solução inovadora de inteligência artificial projetada especificamente para síntese de voz e geração de performances vocais realistas com base em breves trechos de áudio. Esta tecnologia inovadora está agora disponível para acesso público através do site da empresa, onde os visitantes podem explorar vários exemplos de demonstrações que destacam as aplicações potenciais desta ferramenta de ponta. Além disso, os usuários têm a opção de extrair palavras faladas de conteúdo escrito usando a mesma plataforma.

Ao examinar as amostras de áudio fornecidas pela OpenAI, torna-se evidente que os rumores sintetizados exibem uma notável semelhança com as suas respectivas fontes originais, com alguns casos sendo virtualmente indistinguíveis na audição inicial.

A organização pretendia introduzir uma iniciativa experimental em Fevereiro, permitindo aos engenheiros de software aceder à Interface de Programação de Aplicações do Voice Engine, mas esses planos foram suspensos temporariamente devido a uma avaliação interna das potenciais consequências e preocupações morais associadas a esta inovação.

Em alinhamento com a nossa estratégia de manutenção da segurança nacional através de meios artificiais, bem como de cumprimento das nossas obrigações auto-impostas, optámos por fornecer uma demonstração limitada da tecnologia VoiceEngine neste momento, em vez de a divulgar amplamente. O nosso objetivo é mostrar as suas capacidades e, ao mesmo tempo, sublinhar a importância de reforçar a resiliência social em resposta a padrões geradores cada vez mais persuasivos.

/images/angryphoneuser_720.jpg

A introdução deste modelo avançado de IA abre uma infinidade de aplicações potenciais em vários domínios. Por exemplo, ele tem a capacidade de fornecer auxílio à leitura por meio de fala sintetizada e contínua que emula cadência e tom semelhantes aos humanos. Além disso, facilita o alcance global dos criadores de conteúdo, oferecendo serviços de tradução em tempo real, preservando ao mesmo tempo as nuances culturais e as idiossincrasias da língua nativa. Além disso, atende indivíduos que não falam ou têm dificuldade de falar, oferecendo opções de voz personalizadas que aprimoram as habilidades de comunicação. Além disso, apoia aqueles que sofrem de distúrbios da fala durante a fase de recuperação, ajudando-os a recuperar as suas capacidades vocais.

É evidente que a ampla disponibilidade desta tecnologia apresenta riscos significativos, permitindo a criação de réplicas convincentes da voz de um indivíduo utilizando apenas uma breve amostra de áudio de quinze segundos de duração. Esta potencial utilização indevida vai além da mera fraude telefónica e do roubo de identidade, uma vez que alguns especialistas demonstraram, através da sua investigação, que estas técnicas avançadas de síntese de voz podem comprometer as medidas de segurança biométricas baseadas no reconhecimento vocal.

A OpenAI reconhece que o potencial lançamento de sua tecnologia Voice Engine de forma generalizada pode levar a “problemas” e, portanto, elaborou um conjunto de diretrizes projetadas para reduzir qualquer uso indevido. Por exemplo, nos termos do serviço, os utilizadores estão expressamente proibidos de criar representações de terceiros sem o seu consentimento explícito ou autoridade legalmente sancionada. Além disso, aqueles que empregam vozes sintéticas devem obter permissão prévia dos indivíduos cujas amostras vocais foram utilizadas, ao mesmo tempo que comunicam de forma transparente quais enunciados são gerados por computador. Além disso, um recurso intrigante do Voice Engine envolve a incorporação de uma “marca d’água vocal” exclusiva em cada saída de áudio, facilitando a identificação e o rastreamento de padrões de fala artificiais.

Na OpenAI, estamos a adoptar uma estratégia ponderada e bem informada no que diz respeito à implementação do nosso avançado sistema de voz artificial, conscientes da possibilidade de utilização indevida de tal tecnologia. Nosso objetivo é iniciar um discurso sobre a implantação responsável de vozes sintéticas e explorar maneiras pelas quais a sociedade pode acomodar essas capacidades em evolução. À luz destas discussões e dos resultados dos nossos testes preliminares, tomaremos uma decisão mais esclarecida sobre se devemos ou não prosseguir com a implementação em larga escala desta inovação.

*️⃣ Link da fonte:

ele afirma a sociedade,