Le nouveau modèle IA de Meta brille en vision, mais peine en programmation
Un an après Llama 4, Meta dévoile Muse Spark, un nouveau LLM conçu comme nativement multimodal. S’il rivalise avec les meilleurs en compréhension linguistique et visuelle, il montre encore des limites en programmation et en raisonnement abstrait.
Baptisé Muse Spark, le dernier grand modèle de langage (LLM) de Meta marque une nouvelle étape dans la stratégie IA du groupe, environ un an après Llama 4, jugé «plutôt décevant» fait observer Reuters. Développé au sein des récents Superintelligence Labs, Muse Spark constitue, selon Meta, «le premier résultat d’une refonte fondamentale» de ses activités en intelligence artificielle. Dans un billet de blog, l’entreprise décrit Muse Spark comme un modèle de raisonnement «multimodal de bout en bout». Il peut intégrer des outils, gérer des chaînes de pensée visuelles (visual chain of thought) et orchestrer plusieurs agents.
Meta positionne ce modèle comme une première étape vers une «superintelligence personnelle capable de comprendre votre monde». Grâce à ses capacités multimodales, Muse Spark viserait des cas d’usage hautement personnalisés, comme l’analyse en temps réel de l’environnement ou de l’état de bien-être de l’utilisateur. Le modèle serait aussi capable de générer des mini-jeux ou d’assister dans l’utilisation d’appareils domestiques.
Accès API restreint
Contrairement aux modèles précédents, Meta ne donne pas un accès API généralisé à Muse Spark. Celui-ci est réservé à un cercle restreint de clients sélectionnés. Les utilisateurs peuvent toutefois tester le modèle via la plateforme Meta AI et ses applications.
Meta ne précise pas la taille de cette première version. Le groupe indique seulement avoir conçu un modèle «volontairement compact et rapide», tout en étant capable de traiter des problèmes complexes en sciences, mathématiques ou santé. Une version plus avancée est déjà en développement.
Performances contrastées
Selon des tests relayés par Reuters et réalisés par Artificial Analysis, Muse Spark se hisse au niveau des modèles leaders de Google, OpenAI et Anthropic en compréhension du langage et des images.
En revanche, ses performances en programmation et en raisonnement abstrait restent en retrait. Meta affirme travailler à des améliorations, notamment sur les workflows de développement.
Alex Wang, responsable des Superintelligence Labs, reconnaît que le modèle présente encore des «aspérités» qui seront corrigées avec le temps. Il évoque également la publication future de certaines variantes en open source.
L’actualité IT en Suisse et à l’international, avec un focus sur la Suisse romande, directement dans votre boîte mail > Inscrivez-vous à la newsletter d’ICTjournal, envoyée du lundi au vendredi!