Inférence IA: AWS mise sur Cerebras et sa technologie liée à l’EPFL
Cerebras Systems et AWS prévoient de lancer une offre d’inférence IA présentée comme plus performante. Au cœur de cette technologie, une puce géante dont le développement est lié à un diplômé de l’EPFL.
AWS et Cerebras Systems annoncent une collaboration visant à proposer, dans les prochains mois, une solution d’inférence pour l’IA générative présentée comme plus rapide que les offres actuelles. Celle-ci sera intégrée à Amazon Bedrock et reposera sur les systèmes CS-3 de Cerebras.
Ce partenariat intervient dans un contexte de montée des usages liés à l’IA agentique, fait observer Cerebras dans son communiqué. Et de souligner que ces usages, notamment dans le développement logiciel, génèrent jusqu’à quinze fois plus de tokens que les interactions conversationnelles. Cette évolution accroît la demande pour des capacités d’inférence rapides, devenues critiques pour certains environnements de production.
Cerebras indique que ses systèmes peuvent atteindre jusqu’à 3000 tokens par seconde. Cette performance repose sur son architecture Wafer-Scale Engine (WSE), dont la version WSE-3 est présentée comme le plus grand processeur dédié à l’IA. L’entreprise affirme que cette puce est 56 fois plus grande que les plus grands GPU et permet des performances d’entraînement et d’inférence plus de 20 fois supérieures, avec une consommation énergétique réduite par unité de calcul.
Le WSE doit en partie son origine à la Suisse: Jean-Philippe Fricker, cofondateur et Chief System Architect de Cerebras Systems, est diplômé de l’EPFL.
Le partenariat avec AWS inclut également le développement d’une architecture d’inférence dite «désagrégée». Celle-ci répartit les charges entre les puces Trainium d’AWS, dédiées au prétraitement, et les systèmes Cerebras. La disponibilité du service est annoncée dans les prochains mois.
Les modalités financières du partenariat avec AWS n’ont pas été divulguées. A noter toutefois que Cerebras a récemment conclu un accord avec OpenAI, dont la valeur pourrait dépasser 10 milliards de dollars, selon Reuters.
L’actualité IT en Suisse et à l’international, avec un focus sur la Suisse romande, directement dans votre boîte mail > Inscrivez-vous à la newsletter d’ICTjournal, envoyée du lundi au vendredi!