MAI-Voice-1 et MAI-1-preview

Microsoft dévoile ses deux premiers modèles d’IA développés en interne

Microsoft a présenté ses deux premiers modèles d’IA développés en interne. L’un est dédié à la voix, l’autre au langage. Tous deux devraient progressivement enrichir Copilot.

Interface de Copilot Labs permettant de tester MAI-Voice-1 et ses voix expressives (Source: Microsoft).
Interface de Copilot Labs permettant de tester MAI-Voice-1 et ses voix expressives (Source: Microsoft).

Le groupe de Redmond franchit une nouvelle étape en intelligence artificielle en dévoilant ses deux premiers grands modèles développés en interne. MAI-Voice-1 se concentre sur la synthèse vocale et MAI-1-preview sur le traitement du langage, avec une intégration prévue dans Copilot, selon un communiqué .

MAI-Voice-1 est un modèle de génération vocale capable de produire une minute d’audio en moins d’une seconde sur un seul GPU. Il est déjà utilisé dans Copilot Daily et les Podcasts et peut être testé via Copilot Labs, où des démonstrations permettent d’essayer des scénarios narratifs et expressifs, précise la firme.

Le communiqué ajoute également que MAI-1-preview est le premier LLM entraîné de bout en bout par Microsoft. Comme le rappelle notamment le média spécialisé The Verge, les outils Copilot reposent aujourd’hui sur les LLM d’OpenAI. Construit sur une architecture mixture-of-experts et pré-entraîné sur environ 15’000 GPU Nvidia H100, MAI-1-preview est conçu pour fournir des réponses adaptées aux requêtes quotidiennes. La firme précise que ce modèle s’adresse en priorité aux particuliers, avec des cas d’usage centrés sur l’assistance textuelle au quotidien. Le modèle est en test public sur la plateforme LMArena et accessible à des testeurs via API. 

Microsoft ajoute que ces deux modèles s’inscrivent dans une démarche plus large, visant à orchestrer plusieurs systèmes spécialisés pour différents cas d’usage. L’entreprise affirme vouloir continuer à combiner ses propres développements, les modèles de partenaires et ceux de la communauté open source afin de proposer les meilleures performances possibles.
 

Webcode
VxeufvJo