Contents

Junte-se ao movimento Open Source com a Mozilla-Oportunidades para falantes de francês

/images/7f3cde70d841e255504f29528c75678cb3f874250bb9a5666b05d30fa6e3b0fd.jpg Criada em 2003, a Mozilla Foundation tem como objetivo fornecer um grande número de serviços gratuitos, incluindo o navegador Mozilla Firefox © Mozilla Foundation

O projeto da Mozilla, cujo objetivo é criar uma base de dados de palavras acessível a todos, lançou recentemente um apelo para avançar em determinadas línguas representativas de minorias, mas também no francês.

Iniciada em julho de 2017, a iniciativa Common Voice procura proporcionar acessibilidade universal a um conjunto de dados vocais com o objetivo de promover avanços em serviços e aplicações através de contribuições coletivas.

O desenvolvimento de estruturas linguísticas de fácil utilização no design de interfaces representa um obstáculo significativo, especialmente com a crescente prevalência de tecnologia avançada de reconhecimento de fala. No entanto, persistem inúmeras disparidades, necessitando de apoio substancial da Mozilla para concretizar o seu objectivo de oferecer uma base de dados abrangente e acessível para uso público.

Francês entre as línguas menos completas

Para construir um banco de dados de voz abrangente, é fundamental acumular uma extensa coleção de diversas vozes. A iniciativa da Mozilla conhecida como Common Voice busca permitir que indivíduos de diversas origens linguísticas contribuam com suas gravações vocais exclusivas. Esta abordagem inclusiva abrange não apenas as línguas amplamente faladas, mas também as línguas menos prevalentes, tendo em conta os sotaques e expressões distintas associadas às comunidades minoritárias. No entanto, este esforço coloca desafios significativos, uma vez que numerosos idiomas estão terrivelmente sub-representados nos actuais conjuntos de dados de voz, conforme destacado pela Mozilla numa declaração recente.

Os conjuntos de dados utilizados pelos sistemas de reconhecimento de voz são controlados predominantemente por um punhado de empresas substanciais, mas existe uma falta aguda de representação para certas variações linguísticas, como dialectos regionais, comunidades marginalizadas e indivíduos com deficiências físicas. Além disso, para muitas variedades linguísticas, a disponibilidade de dados continua a ser escassa ou totalmente inexistente.

A Mozilla pretende resolver esse problema desenvolvendo seu próprio banco de dados de código aberto e disponível gratuitamente. Este banco de dados será útil para diversos fins, como fornecer diferentes sotaques de inglês ou oferecer suporte a vários idiomas, incluindo indonésio, hindi, aragonês, tadjique, siciliano e francês.

/images/df93b84fdd6b925ee4ea933f5f75c6d41a535714ba059a46936d930d4dc4c4f6.jpg Aqui fica um exemplo das frases que nos pedem para registar para enriquecer a base de dados © este site

Adicione sua pedra ao prédio com sua voz

Para que os desenvolvedores Mozilla executem suas tarefas com eficácia, é fundamental que eles tenham acesso a uma ampla variedade de amostras. Actualmente, existe uma procura significativa de recursos em língua francesa, pelo que aqueles que possuem proficiência nesta língua são encorajados a contribuir fornecendo gravações da sua voz. Independentemente da localização geográfica, quer resida na Bélgica, Luxemburgo, Suíça, América do Norte ou Norte de África, os indivíduos interessados ​​podem visitar a página designada do projecto e aderir cuidadosamente às directrizes fornecidas.

Em essência, nossa solução consiste em apresentar uma série de frases para você articular com fluência, com o objetivo de gerar numerosos clipes de áudio que serão posteriormente analisados ​​e convertidos em informações úteis. Além disso, a Mozilla solicita alguns detalhes demográficos para melhorar o calibre do banco de dados e refinar o desempenho da tecnologia de fala para texto; no entanto, observe que todos os dados enviados permanecerão anônimos.

Para aumentar o prazer de usar a ferramenta de tradução de idiomas da Mozilla, os usuários têm acesso a uma variedade de recursos, incluindo atualizações em tempo real sobre o progresso das traduções para cada idioma, informações estatísticas detalhadas sobre o projeto e a capacidade de comparar suas próprias contribuições com aquelas. de outros voluntários.

Fonte: Goodtech

*️⃣ Link da fonte:

na página do projeto, , Goodtech,