Microsoft conçoit une infrastructure d’AI-as-a-Service distribuée et surpuissante
Avec le projet Singularity, Microsoft jette les bases d’un service entièrement géré et dédié à l’IA, basé sur une infrastructure tirant parti d’une multitude d'accélérateurs d'IA en mode distribué.

Microsoft a levé le voile sur Singularity, un projet de service d'infrastructure entièrement géré et dédié à l’intelligence artificielle (IA). Dans la pré-publication d’un article académique, les chercheurs de Microsoft expliquent que l'objectif du service consiste à réduire les coûts élevés inhérents au nombre gigantesque de workloads utilisés pour former des modèles de machine learning.
Utilisation intensive des workloads sans perte de fiabilité
Au cœur de Singularity se loge un outil inédit, présenté comme un planificateur capable de préparer de manière transparente et d’accroître de façon adaptative les charges de travail. Il s'agit de permettre une utilisation intensive des workloads sans toutefois en affecter la justesse ou la performance, et ce, en tirant parti d’une multitude d'accélérateurs d'IA en mode distribué, par exemple des GPU ou des FPGA (réseaux de portes programmables in situ). Les auteurs de l'article de Microsoft expliquent que Singularity se fonde sur une approche novatrice, consistant à découpler automatiquement le travail de traitement des ressources de l'accélérateur. Une technique nommée «replica splicing» permet de répartir dans le temps plusieurs instances de travail sur le même périphérique avec un surcoût négligeable, assurent les chercheurs. Aucune date de lancement d’un service commercial n’est annoncée.
Singularity n’est pas un effort isolé de Microsoft en vue de mettre au point une plateforme de calcul ultra puissante dédiée à l’IA. On se souvient qu’en 2020, la firme de Redmond a pour ce faire mis au point l’un des supercalculateurs les plus performant au monde en collaboration avec OpenAI. Une réalisation qui s'inscrit dans un investissement à hauteur d’un milliard de dollars.