Rho-alpha

Microsoft dévoile un modèle d’IA capable de transformer des instructions en actions robotiques

Microsoft lance Rho-alpha, un nouveau modèle d’IA conçu pour permettre aux robots d’exécuter des tâches physiques à partir d’instructions en langage naturel. Cette approche vise à rapprocher les capacités des modèles d’IA du monde réel.

Un robot contrôlé par le modèle Rho-alpha de Microsoft lors de démonstrations de manipulation à partir d’instructions en langage naturel (Source: Capture d'écran/Microsoft).
Un robot contrôlé par le modèle Rho-alpha de Microsoft lors de démonstrations de manipulation à partir d’instructions en langage naturel (Source: Capture d'écran/Microsoft).

Microsoft Research a dévoilé Rho-alpha, un modèle d’intelligence artificielle conçu pour permettre aux robots d’exécuter des actions physiques à partir d’instructions formulées en langage naturel. L’entreprise inscrit ces travaux dans ce qu’elle qualifie de Physical AI, une approche de recherche visant à étendre les capacités des systèmes d’IA afin qu’ils puissent interagir avec des environnements physiques complexes.

De la compréhension à l’action

Selon Microsoft Research, les modèles d’IA ont atteint un haut niveau de performance dans la compréhension du langage et de la vision, mais restent limités lorsqu’il s’agit d’exécuter des tâches concrètes dans des contextes réels. Rho-alpha entend combler cet écart en combinant perception visuelle, raisonnement et contrôle moteur au sein d’un même modèle.

Issu de la famille de modèles Phi, Rho-alpha est capable de transformer des commandes verbales en signaux de contrôle exploitables par des systèmes robotiques, notamment pour des tâches de manipulation bimanuelle. Pour rappel, la lignée Phi comprend aussi des modèles dédiés au raisonnement, dont Phi-4-reasoning, dévoilé fin avril 2025.

Des démonstrations montrent des robots capables de manipuler des objets ou d’exécuter des gestes précis à partir d’instructions formulées en langage naturel.

Apprentissage entre simulation et réalité

L’un des principaux défis de la robotique intelligente réside dans la rareté de données d’entraînement diversifiées issues du monde réel. Pour y répondre, Microsoft indique avoir combiné des données synthétiques générées en simulation avec des données provenant de démonstrations physiques, afin d’améliorer l’adaptabilité du modèle.

Rho-alpha intègre également des signaux tactiles, avec des travaux en cours pour prendre en compte d’autres modalités de perception, comme la force. Cette approche vise à réduire l’écart entre environnements simulés et conditions réelles, un problème bien connu dans la recherche en robotique. Le modèle est actuellement évalué sur des plateformes robotiques à deux bras ainsi que sur des robots humanoïdes.

Le groupe précise que, dans un premier temps, Rho-alpha est proposé dans le cadre d’un programme d’accès anticipé destiné aux partenaires industriels et aux chercheurs. Il devrait ensuite être mis à disposition via Microsoft Foundry, la plateforme du groupe dédiée aux modèles d'IA.

L’actualité IT en Suisse et à l’international, avec un focus sur la Suisse romande, directement dans votre boîte mail > Inscrivez-vous à la newsletter d’ICTjournal, envoyée du lundi au vendredi! 
 

Webcode
3QXygud7