Ressources de calcul

Oracle, l'autre grand gagnant qui fournit les géants de l'IA (update)

Nvidia n’est pas la seule entreprise à bénéficier du boom de la demande en ressources de calcul pour former les modèles de GenAI. Oracle annonce qu’OpenAI s'appuie sur ses systèmes aux côtés de ceux d’Azure. L’équipementier déploie par ailleurs sa database dans les datacenters de Microsoft et désormais de Google.

(Source: Oracle)
(Source: Oracle)

Mise à jour du 10 juillet 2024: Le média spécialisé The Information avait rapporté que xAI, l'entreprise d'IA d'Elon Musk, était prête à dépenser 10 milliards de dollars en serveurs cloud d'Oracle (lire ci-dessous). Mais ce projet n’est plus d’actualité. Sur X, Elon Musk a confirmé que sa start-up avait mis fin aux discussions avec Oracle et entend désormais construire elle-même un système pour la formation de son modèle Grok 2. «La raison pour laquelle nous avons décidé de construire le système 100k H100 et le prochain système majeur en interne est que notre compétitivité fondamentale dépend de notre capacité à être plus rapide que n'importe quelle autre entreprise d'IA. C'est le seul moyen de rattraper notre retard», précise le message d’Elon Musk

News du 12 juin 2024: La demande de puissance de calcul nécessaire au développement de modèles d'intelligence artificielle a connu une croissance exponentielle ces dernières années, selon le rapport Artificial Intelligence Index 2024 de l'université de Stanford. Gourmande en ressources, tant en termes d'entraînement que d'inférence, l'IA générative incite les opérateurs de cloud computing à investir massivement dans des systèmes destinés à répondre aux besoins des développeurs de LLM. Dans cette course effrénée, on sait que l'un des grands gagnants est le fournisseur de puces GPU Nvidia, dont les revenus ne cessent de croître (l'entreprise a récemment dépassé Apple pour devenir la deuxième plus grande société cotée en bourse). 

OpenAI recourt à l'infrastructure d’Oracle pour continuer à évoluer

Une autre entreprise américaine se profile petit-à-petit comme l’autre grand gagnant du boom de la GenAI: Oracle. Connue principalement pour ses bases de données, l’entreprise fondée par Larry Ellison s'est également spécialisée dans le hardware, en particulier suite au rachat de Sun Microsystems en 2010, qui lui a permis d'intégrer des serveurs et des systèmes de stockage à son offre. Sa Cloud Infrastructure (OCI) fait aujourd'hui l’objet d’un vif intérêt de la part des fournisseurs de modèles pour la GenAI. Une annonce toute fraîche en témoigne: OpenAI, qui fait appel à Microsoft Azure pour former ses modèles, a choisi Oracle Cloud Infrastructure pour disposer de ressources supplémentaires lui permettant «de continuer à évoluer», dixit son CEO Sam Altman. «La course à la création du plus grand modèle de langage au monde est lancée, et elle alimente une demande illimitée pour l'infrastructure d'IA Gen2 d'Oracle. Des leaders comme OpenAI choisissent OCI car il s'agit de l'infrastructure d'IA la plus rapide et la plus rentable au monde», se félicite de son côté Larry Ellison, désormais Chief Technology Officer d'Oracle. 

Oracle Cloud Infrastructure s'est adjoint un autre acteur de renom dans le domaine de la GenAI: xAI, l'entreprise d'IA d'Elon Musk, qui serait prête à dépenser 10 milliards de dollars en serveurs cloud d'Oracle, selon un article de The Information datant de mai dernier. Ce financement sera utilisé pour fournir le hardware indispensable à l’entraînement des futures versions du chatbot Grok. Selon le site spécialisé Data Centre Dynamics, xAI est déjà un client important d'Oracle. La start-up aurait eu recours aux GPU Nvidia fournis par Oracle pour entraîner la première version de Grok.

Des services de base de données opérés par Oracle dans les datacenters de Microsoft et de Google

Oracle annonce par ailleurs un partenariat avec Google pour la mise à disposition de ses services de bases de données depuis Google Cloud. Commercialisée via Google Cloud Marketplace, la nouvelle offre permet aux entreprises de migrer leur base de données (Oracle Exadata Database Service, Oracle Autonomous Database Service) dans le cloud de Google et d'y connecter les services de ce dernier (y compris IA) avec une latence minime.

Un concept éprouvé que Microsoft propose depuis décembre dernier sur Azure. Dans les deux cas, la collaboration a ceci d'original que les systèmes d'Oracle installés dans les datacenters de Microsoft et de Google sont gérés et opérés par les équipes Oracle. Et la formule semble réussir, puisque Microsoft a annoncé en mars que l'offre Oracle Database@Azure serait étendue à un total de 15 régions dans le monde (elle est disponible à Francfort depuis mars). 

Outre le déploiement et l'exploitation d'infrastructures Oracle au sein des datacenters Azure et Google Cloud, Oracle étend ses propres datacenters. Lors d'un appel avec les analystes, Larry Ellison a indiqué son projet de construire une centaine de centres de données supplémentaires, dont certains de très grande taille.
 

Webcode
dgMY2wS4