Interfaces voix

Mozilla collecte des voix pour un projet de reconnaissance vocale open source

Le projet Common Voice de Mozilla travaille à créer des jeux de données open source et multilingues pour entraîner les technologies vocales exploitant l’intelligence artificielle. Après l’anglais, la collecte d’échantillons vient d’être lancée pour le français, l’allemand et le gallois.

Sur le site web et l’application iOS de Common Voice, les internautes sont invités à «faire don de leur voix» en lisant des phases. (Source: Mozilla)
Sur le site web et l’application iOS de Common Voice, les internautes sont invités à «faire don de leur voix» en lisant des phases. (Source: Mozilla)

La fondation Mozilla estime que les assistants vocaux ne devraient pas être un marché exclusivement dominé par Google, Apple, Amazon et consort. L’éditeur du navigateur Firefox a ainsi mis en place le projet Common Voice, une base de données d’échantillons vocaux voués à entraîner les intelligences artificielles, ouverte et alimentée en mode crowdsourcing. Lancée en juillet dernier, l’initiative s’est dans un premier temps focalisée sur la collecte de voix en langue anglaise. Le français, l’allemand et le gallois viennent d’être ajoutés.

Sur le site web et l’application iOS de Common Voice, les internautes sont invités à «faire don de leur voix» en lisant des phases, afin d’alimenter Deep Speech, le moteur de reconnaissance vocale open source de Mozilla. Les phrases enregistrées passent aussi par un processus de validation par la communauté. Les jeux de données ainsi créés peuvent être téléchargés par quiconque souhaiterait réaliser des applications utilisant les technologies vocales. «Nous pensons que d’importants jeux de données publiquement accessibles favorisent l’innovation et participent à la mise en place d’une concurrence saine pour les technologies vocales utilisant l’apprentissage machine», explique la fondation Mozilla.

Une langue donnée passe au stade de production quand un nombre suffisant de phrases à lire a été collecté par la communauté d’utilisateurs. En plus des quatre langues désormais en production, plus de 40 langues sont en élaboration sur Common Voice. L’objectif de l’initiative est surtout de créer des jeux de données vocales pour un maximum de langues régionales ou minoritaires. Les initiateurs du projet souhaitent par là travailler à garantir l’accessibilité universelle des services et produits basés sur des interfaces vocales, en créent des jeux de données qui permettront que les utilisateurs du monde entier soient compris de manière cohérente, et ce peu importe leur langues et accents particuliers.

Webcode
DPF8_96371