Partenariat avec Broadcom

OpenAI dévoile Jalapeño, sa première puce d'inférence pour les LLM (update)

par Alexia Muanza et René Jaun et Vivienne Stary (traduction/adaptation ICTjournal)

Quelques mois après avoir annoncé leur partenariat, OpenAI et Broadcom dévoilent Jalapeño, la première puce d'inférence pour les LLM conçue par OpenAI. Les premiers échantillons fonctionnent déjà en laboratoire, avec un déploiement prévu d'ici fin 2026.

(Image: Levart_Photographer / unsplash.com)
(Image: Levart_Photographer / unsplash.com)

Mise à jour du 25 juin 2026: Huit mois après avoir officialisé leur partenariat autour d’accélérateurs IA appelés à atteindre 10 gigawatts d’ici 2029, OpenAI et Broadcom franchissent une nouvelle étape avec la présentation de Jalapeño, la première puce d'inférence conçue par OpenAI. L'entreprise la présente comme son premier «Intelligence Processor».

Destinée à l'exécution des grands modèles de langage (LLM), la puce a été conçue à partir des besoins observés dans ChatGPT, Codex, l'API et les futurs produits agentiques d'OpenAI. L'entreprise indique également l'avoir développée pour rester compatible avec les futures générations de grands modèles de langage. L'architecture a été conçue avec Broadcom, chargé notamment de la mise en œuvre silicium ainsi que du réseau et de la connectivité, tandis que Celestica intervient sur l'intégration des cartes, des racks et des systèmes.

Selon OpenAI, des échantillons d'ingénierie exécutent déjà des charges de travail de machine learning en laboratoire, à la fréquence et à la puissance visées pour la production. L'entreprise cite notamment des tests avec GPT-5.3-Codex-Spark. Les performances définitives restent en cours de mesure, mais les premiers essais suggèrent des performances par watt nettement supérieures à l'état de l'art actuel. Un rapport technique plus détaillé est attendu dans les prochains mois.

OpenAI indique également que Jalapeño est passé de la conception initiale au tape-out, étape qui marque la finalisation du design avant fabrication, en neuf mois. L'entreprise attribue cette rapidité à la collaboration entre ses équipes d'ingénierie, Broadcom et l'utilisation de ses propres modèles pour certaines tâches de conception et d'optimisation.

Jalapeño constitue la première génération d'une plateforme de calcul appelée à évoluer sur plusieurs cycles. OpenAI prévoit un premier déploiement d'ici fin 2026, avant une montée en puissance progressive avec ses partenaires de centres de données. Dans l'annonce, Hock Tan, CEO de Broadcom, évoque des déploiements à l'échelle du gigawatt avec Microsoft et d'autres partenaires au fil des prochaines générations de la plateforme.

L’actualité IT en Suisse et à l’international, avec un focus sur la Suisse romande, directement dans votre boîte mail > Inscrivez-vous à la newsletter d’ICTjournal, envoyée du lundi au vendredi! 

News du 14 octobre 2025: OpenAI et Broadcom confirment ce qui n’était jusqu’ici qu’une rumeur: les deux entreprises unissent leurs forces pour la production de semi-conducteurs. Concrètement, OpenAI concevra ses propres accélérateurs IA, que Broadcom développera et exploitera conjointement avec elle, selon un communiqué commun.

En concevant ses propres puces et systèmes, OpenAI affirme pouvoir intégrer directement les enseignements tirés du développement de ses modèles et produits d’IA dans la couche matérielle, afin d’atteindre de nouveaux niveaux de performance et d’intelligence.

Broadcom et OpenAI visent une capacité de 10 gigawatts de puissance générée par les accélérateurs produits. Broadcom prévoit de livrer les systèmes à partir du second semestre 2026, avec une montée en puissance jusqu’à fin 2029.

Les racks prévus seront entièrement dimensionnés avec les solutions Ethernet et de connectivité de Broadcom, précisent les deux partenaires. Ils seront déployés tant au sein d’OpenAI que dans les centres de données d’autres entreprises partenaires.

Au cours des derniers mois, plusieurs groupes technologiques ont annoncé des projets d'investissement parfois gigantesques dans OpenAI. Ainsi, OpenAI, Oracle et Softbank prévoient cinq centres de données dédiés à l'IA, alors que Nvidia investit environ 100 milliards de dollars dans le développeur de ChatGPT. 

News du 8 novembre 2024: OpenAI collabore avec Broadcom et TSMC pour développer ses premières puces d'intelligence artificielle. L'entreprise souhaite répondre aux besoins croissants de puissance de calcul de l'IA, comme le rapporte Reuters. OpenAI aurait convenu avec TSMC de produire les premières puces d'ici 2026. Mais le calendrier pourrait encore changer. L'entreprise diversifie en outre son approvisionnement en puces avec des puces d'AMD et de Nvidia.

OpenAI collaborerait déjà depuis des mois avec Broadcom pour ces puces. L'entreprise aurait mis en place une équipe de 20 personnes, sous la direction de Thomas Norrie et Richard Ho qui avaient travaillé au développement des TPU (Tensor Processing Units) chez Google.

Selon la dépêche, OpenAI a envisagé différentes options pour diversifier son approvisionnement en puces et réduire ses coûts d'exploitation. L'entreprise s'attend en effet à une perte de 5 milliards de dollars pour l'année fiscale en cours - fortement dépendante des dépenses en puissance de calcul. OpenAI aurait par ailleurs renoncé à mettre en place un réseau de fabriques.

Tags
Webcode
g8bsVYxR