Contents

A solução rápida para uma transcrição precisa!

Contents

/images/08f31b292894c009d779e710dd4b80203ca021cd649033f79d36b94c58863f9b.jpg

@este site — 7 de dezembro de 2023

Na verdade, estou familiarizado com o Whisper, um aplicativo inovador que utiliza inteligência artificial para conversão de fala em texto em várias plataformas linguísticas, incluindo o francês.

Bem, você poderá fazer tudo igual, mas ainda mais rápido, graças ao Distil-Whisper , uma versão lite do Whisper que é 6 vezes mais rápida e usa um modelo de IA 49% menor que seu irmão mais velho. Para completar, Distil-Whisper tem apenas uma taxa de erro de 1%, o que é bastante impressionante.

O inovador algoritmo de divisão empregado por nosso sistema permite transcrever longas gravações de áudio a uma velocidade surpreendentemente nove vezes maior em comparação com a abordagem convencional do OpenAI. As implicações dessa eficiência são profundas, especialmente para indivíduos e organizações que necessitam de processamento extensivo de dados de áudio.

O modelo Distil-Whisper emprega um projeto arquitetônico único, como segue:

/images/510c4d6e7a33ef4a24a57a3e49bfbc1c44abe244dae9eed2deaf94b34e199b0c.jpg

Atualmente, o Distil-Whisper está limitado aos recursos de reconhecimento de fala em inglês; no entanto, dados os rápidos avanços neste domínio, prevê-se que o suporte para idiomas adicionais seja disponibilizado num futuro próximo.

O Distil-Whisper foi desenvolvido como uma alternativa ao Whisper no reconhecimento de fala em inglês, oferecendo vários benefícios significativos. Estes incluem inferência acelerada, maior resistência ao ruído, diminuição das alucinações, utilização em decodificação especulativa e uma licença permissiva adequada para aplicações comerciais. O desenvolvimento desta tecnologia inovadora envolveu treiná-la em aproximadamente 22.000 horas de dados de áudio pseudo-etiquetados em dez domínios distintos e envolvendo mais de 18.000 falantes.

A coleção abrangente de documentação e exemplos ilustrativos pode ser encontrada neste local.

O futuro do reconhecimento de voz parece promissor!

-Inteligência artificial

Descubra um artigo aleatório…

Compartilhe este artigo

*️⃣ Link da fonte:

Distil-Whisper , graças ao seu algoritmo de divisão , Toda a documentação e exemplos de uso estão aqui. ,