Une nouvelle génération de modèles

NVIDIA lance Nemotron 3 pour le développement d’IA agentiques

NVIDIA dévoile Nemotron 3, une nouvelle génération de modèles ouverts destinée au développement d’applications d’IA agentique. Déclinés en trois tailles, la gamme vise à améliorer l’efficacité et la précision des systèmes multi-agents.

(Source: Nvidia)
(Source: Nvidia)

NVIDIA annonce le lancement de Nemotron 3,  une nouvelle famille de modèles ouverts destinée au développement de systèmes d’IA agentique reposant sur des architectures multi-agents. Déclinée en trois tailles (Nano, Super et Ultra), cette génération s’inscrit dans un contexte où les entreprises cherchent à dépasser les simples chatbots GenAI pour construire des architectures multi-agents plus autonomes et spécialisées.

Selon NVIDIA, Nemotron 3 repose sur une architecture hybride de type mixture of experts (MoE), conçue pour répondre aux principaux défis de ces systèmes, notamment les coûts d’inférence, la dérive de contexte et la montée en charge. Le principe consiste à n’activer dynamiquement qu’une fraction des paramètres du modèle en fonction des tâches, afin d’améliorer l’efficacité tout en conservant un haut niveau de précision.

Trois tailles pour des usages agentiques différenciés

La version Nano, déjà disponible, est présentée comme le modèle le plus efficient de la famille. Optimisée pour des tâches telles que le résumé de contenus, la recherche d’information, l’assistance logicielle ou l’automatisation de workflows, elle affiche, selon NVIDIA, un débit de génération de tokens jusqu’à quatre fois supérieur à celui de Nemotron 2 Nano. Elle bénéficie également d’une fenêtre de contexte étendue à un million de tokens, facilitant le raisonnement sur des tâches longues et multi-étapes.

Les versions Super et Ultra, attendues au premier semestre 2026, ciblent des scénarios plus exigeants, impliquant de nombreux agents collaboratifs ou des besoins de raisonnement approfondi. Elles exploitent un format d’entraînement optimisé pour l’architecture Blackwell de NVIDIA, permettant de réduire l’empreinte mémoire tout en maintenant un haut niveau de précision.

Au-delà des modèles eux-mêmes, NVIDIA met en avant une approche résolument ouverte. Le groupe publie simultanément des jeux de données d’entraînement et de post-entraînement totalisant plusieurs milliers de milliards de tokens, ainsi que des bibliothèques open source dédiées à l’apprentissage par renforcement et à l’évaluation de la sécurité des systèmes multi-agents. Ces ressources visent à permettre aux organisations de développer des agents spécialisés, alignés sur leurs propres données, contraintes réglementaires et exigences de souveraineté.

«L’innovation ouverte est au cœur du progrès en intelligence artificielle», affirme Jensen Huang, fondateur et CEO de NVIDIA, qui voit dans Nemotron 3 une brique clé pour démocratiser le développement d’agents IA fiables et transparents à grande échelle.

Plusieurs acteurs industriels et technologiques, dont Accenture, ServiceNow, Siemens, Palantir ou Perplexity, ont déjà annoncé intégrer des modèles Nemotron dans leurs flux de travail.

Tags
Webcode
yg3NATex