GPT-OSS pour les développeurs

OpenAI lance des modèles open weight utilisables localement

par Joël Orizet et NetzKI Bot et traduction/adaptation ICTjournal

OpenAI a publié deux modèles dits «open weight» que les utilisateurs peuvent exploiter et développer sur leur propre infrastructure. Le plus grand modèle est censé atteindre les performances de l'o4-mini sur un seul GPU, tandis que la version plus petite est spécialement conçue pour être utilisée sur des appareils Edge.

(Source : Levart_Photographer / Unsplash.com)
(Source : Levart_Photographer / Unsplash.com)

OpenAI a présenté deux nouveaux modèles de raisonnement, en version «oen weight»: GPT-OSS-120B et GPT-OSS-20B. Un modèle dit open weight est un LLM  dont les paramètres entraînés, c'est-à-dire les pondérations apprises (weights), sont librement accessibles; il peut ainsi être analysé, testé ou perfectionné. Contrairement à un modèle open source, le code sous-jacent n'est toutefois pas nécessairement ouvert ou entièrement libre d'utilisation.

Selon la firme, le modèle le plus grand, avec 120 milliards de paramètres, atteint les performances du modèle de raisonnement interne de la version o4-mini de ChatGPT, tout en ne requérant qu'un seul GPU de 80 gigaoctets. La version plus petite, avec 20 milliards de paramètres, offre quant à elle des capacités de raisonnement sur des appareils Edge de 16 gigaoctets, indique OpenAI.

Avec la publication sous licence Apache 2.0, l'objectif est de réduire les obstacles à l'entrée pour les développeurs et les organisations, en particulier dans les environnements hautement sécurisés ou les pays émergents qui souhaitent exploiter et adapter l'IA sur leur propre infrastructure. L'entreprise met notamment à disposition les poids des modèles sur la plateforme Hugging Face.

Les développeurs peuvent essayer les nouveaux modèles Open Weight d'OpenAI dans le cadre d'une démonstration. (Source : openai.com)
Les développeurs peuvent essayer les nouveaux modèles Open Weight d'OpenAI dans le cadre d'une démonstration. (Source : openai.com)
 

Nouvelle norme de sécurité

En parallèle, OpenAI introduit un nouveau protocole de sécurité appelé «Worst-Case-Fine-Tuning.» Celui-ci vise à simuler l'utilisation abusive des modèles dans des domaines sensibles tels que la biologie et la cybersécurité. Le fabricant promet que cette méthodologie a été vérifiée par des «experts externes.» L'entreprise fournit également le code d'évaluation,  les prompts et les directives d'évaluation. Cela devrait permettre d'améliorer le niveau de sécurité des modèles open weight.

Pour simplifier l’intégration, OpenAI propose aussi des guides pour développeurs et des outils compatibles avec Hugging Face, LLM, Ollama, llama.cpp, ainsi qu’avec les plateformes GPU/accélérateurs appropriées.

Une IA fondée sur des valeurs démocratiques, selon Sam Altman

Sam Altman, CEO d’OpenAI, présente cette publication comme le fruit de «de milliards de dollars de recherche.» L’objectif est de mettre l’IA «entre les mains du plus grand nombre possible de personnes, accessible au monde entier» ainsi que de permettre de nouvelles formes de recherche et de catégories de produits.

Sam Altman, CEO von OpenAI. (Source: openai.com)
Sam Altman, CEO von OpenAI (Source: openai.com)
 

Depuis la création d’OpenAI en 2015, l’entreprise poursuit l’objectif de développer une AGI qui sera bénéfique pour l’humanité. «Dans cette optique, nous sommes ravis que le monde puisse désormais s'appuyer sur un modèle open weight, développé aux États-Unis, imprégnée de valeurs démocratiques, accessible gratuitement et au service de tous», déclare Sam Altman dans le communiqué.

Tags
Webcode
UgzbXvor