Contents

Liberando o poder das vozes de IA com a revolucionária tecnologia de fala sintética da OpenAI!

Contents

/images/be8fb7003e014c6151984d0d8bc7d15a40748db38eb7dfcd7a2affa5d3c9ffaf.jpg

@este site – 30 de março de 2024

Você viu o Voice Engine do OpenAI? É um modelo de IA capaz de gerar vozes sintéticas ultra-realistas a partir de uma simples amostra de áudio de 15 segundos. Apenas 15 segundos, sim!

Na verdade, a capacidade de replicar vozes semelhantes às humanas através da inteligência artificial é uma conquista notável. Ao fornecer uma pequena amostra da própria voz, o sistema de IA pode produzir um discurso completo que se assemelha muito às características vocais do locutor. Este avanço tecnológico suscita um sentimento de admiração, bem como uma pitada de desconforto devido às suas potenciais implicações para a privacidade e manipulação de identidade.

A OpenAI está na vanguarda das pesquisas na área e regularmente nos dá dicas sobre doentes como Sora. No que diz respeito ao Voice Engine, desenvolveram o techno no final de 2022 e integraram-no na sua API de síntese de voz, bem como nas funcionalidades de voz do ChatGPT.

Em um breve clipe de áudio, o palestrante expressa brevemente seus pensamentos e opiniões sobre um determinado tópico de maneira direta por aproximadamente 15 segundos.

Com efeito, a seguinte gravação áudio corresponde ao texto transcrito anteriormente:

Mas tenha cuidado, pois grande poder vem com grande responsabilidade (olá Peter!), a OpenAI está jogando a carta da cautela. Eles estão bem cientes de que esta tecnologia poderia ser usada para fins não muito católicos, como criar áudio deepfakes e enganar as pessoas. Como resultado, estão atualmente a implementá-lo em pequena escala, com apenas alguns parceiros de confiança.

O Voice Engine é utilizado por seus parceiros de várias maneiras, permitindo-lhes aproveitar os recursos da plataforma para suas necessidades e objetivos específicos. A plataforma oferece uma gama de funcionalidades que podem ser customizadas de acordo com as necessidades de cada parceiro, permitindo-lhes criar aplicativos de voz de alta qualidade com rapidez e eficiência. Esta flexibilidade permite aos parceiros desenvolver soluções inovadoras adaptadas às preferências e exigências únicas dos seus clientes. Além disso, os parceiros têm acesso aos mais recentes avanços em tecnologia de IA através do Voice Engine, que os capacita a fornecer serviços e produtos de ponta aos seus clientes. No geral, a plataforma oferece uma oportunidade para as empresas expandirem as suas ofertas e permanecerem à frente da curva no atual cenário digital em rápida evolução.

Bem, imagine que eles desenvolvem aplicativos bastante legais! Por exemplo, Age of Learning o utiliza para gerar conteúdo educacional de áudio com vozes naturais e expressivas. Ou HeyGen, que o utiliza para traduzir vídeos para diferentes idiomas, mantendo a voz do locutor original. Além disso, é isso que uso no meu canal do Youtube em inglês e posso afirmar que custa um centavo. Também pode ajudar pessoas não-verbais a se comunicarem com uma voz única, graças ao Livox. E até mesmo devolver a fala aos pacientes que perderam o uso da voz, como afirma o Norman Prince Neurosciences Institute of Lifespan.

Na OpenAI, implementamos diversas medidas para garantir a segurança ao utilizar nossa tecnologia Voice Engine. Isso inclui a proibição do uso do mecanismo para se passar por indivíduos sem sua permissão expressa, a exigência do consentimento explícito do orador original antes de gerar qualquer conteúdo e a implementação de marcas d’água digitais para rastrear a fonte do material gerado. Embora defendamos a eliminação progressiva do reconhecimento de voz como mecanismo de segurança, estamos também a examinar quadros regulamentares que salvaguardarão a preservação das vozes nos sistemas de inteligência artificial, promoverão a sensibilização do público sobre os meios de comunicação deepfake e desenvolverão métodos para identificar as origens das produções de áudio e vídeo..

Resumindo, o Voice Engine é emocionante e preocupante. O que vejo é que abre perspectivas loucas em termos de aplicações, mas também levanta muitas questões sobre o futuro.

Solicito que você leia o artigo abrangente da OpenAI, que fornece um exame completo de sua metodologia, juntamente com vários exemplos ilustrativos para sua consideração.

Fonte

-Inteligência artificial

Descubra um artigo aleatório…

Compartilhe este artigo

*️⃣ Link da fonte:

Sora , Age of Learning , HeyGen , Livox , Lifespan , o artigo OpenAI, Fonte ,