Reconnaissance vocale

Les Suisses alémaniques invités à enregistrer leur dialecte pour aider les IA à les comprendre

Des chercheurs lancent une application web pour collecter des fichiers audio des nombreux dialectes suisses allemands. Il s’agit de générer des jeux de données suffisamment riches pour entraîner des modèles de reconnaissance vocale efficaces pour les chatbots, assistants vocaux et outils de traduction.

Les chercheurs de la ZHAW et de la FHNW espèrent collecter au moins 2000 heures d'enregistrements. (Source: ZHAW)
Les chercheurs de la ZHAW et de la FHNW espèrent collecter au moins 2000 heures d'enregistrements. (Source: ZHAW)

A l’instar de beaucoup de Romands, les IA de reconnaissance vocale peinent à comprendre le suisse allemand. Des chercheurs de l'Université des Sciences Appliquées de Zurich (ZHAW) et de la Haute école spécialisée du nord-ouest de la Suisse (FHNW) espèrent corriger le tir, dans le cadre d'un projet de collecte des dialectes suisses alémaniques.

«Nous voulons collecter et numériser les dialectes suisses», résume Mark Cieliebak du ZHAW-Centre for Artificial Intelligence (CAI). Les chercheurs lancent ainsi un appel aux volontaires, dans l’objectif d'emmagasiner au moins 2000 heures d'enregistrements. «Nous utiliserons les données collectées pour entraîner un algorithme basé sur l'IA à comprendre le suisse allemand et à le convertir automatiquement dans un texte en haut allemand», explique Manfred Vogel de la FHNW.

Application web d’enregistrement audio

Le projet entend combler les lacunes des chatbots et assistants vocaux comme Siri ou Alexa, qui manquent de fichiers audio pour être formé à comprendre les dialectes suisses allemands. Les responsables du projet ajoutent que pour les géants de la tech, le marché suisse est trop petit pour développer une solution. Les chercheurs helvétiques ont ainsi développé leur propre application web, où les volontaires peuvent enregistrer leurs échantillons audio en traduisant des phrases de haut allemand en dialectes. Ils sont également invités à vérifier les enregistrements des autres participants. Les fichiers audio déjà collectés sont listés par cantons, les participants peuvent ainsi savoir quels cantons et dialectes manquent encore de données.

Les données collectées serviront à développer des interfaces vocales pour différentes applications: assistant vocal, sous-titres, ou encore évaluation automatique des appels au service clientèle.

Tags
Webcode
DPF8_218056