Quels nouveaux outils dédiés aux développeurs dans GPT-5.1?
OpenAI vient de publier GPT-5.1, une nouvelle version de son grand modèle de langage qui introduit des fonctions destinées aux développeurs, comme la désactivation du raisonnement pour des cas d’usage sensibles à la latence.
OpenAI vient tout juste de dévoiler GPT-5.1, la nouvelle itération de son grand modèle de langage. Outre les nouveautés annoncées côté utilisateurs grand public, cette nouvelle version s'accompagne de possibilités supplémentaires pour les développeurs.
GPT-5.1 permet désormais de désactiver totalement le raisonnement du modèle en définissant le paramètre «reasoning_effort» sur «none». Ce mode, destiné aux cas d’usage sensibles à la latence, conserve les capacités du modèle tout en accélérant le traitement des requêtes. Selon OpenAI, cette configuration améliore également l’exécution parallèle d’outils, l’écriture de code, la capacité à suivre les instructions, ainsi que l’utilisation de la recherche web via API. Le paramètre «reasoning_effort» peut aussi être ajusté sur «low», «medium» ou «high» afin de mieux équilibrer vitesse, coût et qualité selon le niveau de complexité souhaité.
Par ailleurs, la mise en cache étendue permet aux requêtes de rester actives jusqu’à 24 heures, contre seulement quelques minutes jusqu’à présent. Cette évolution permet de réduire les coûts et d’améliorer la fluidité dans les interactions longues, comme les sessions de programmation ou les dialogues multi-tours.
Promesses de performances accrues et automatisation des modifications de code
GPT-5.1 apporte aussi des améliorations dans la génération de code, selon OpenAI. L’éditeur met en avant un comportement de codage plus modulable, limitant les raisonnements superflus, avec une meilleure qualité de sortie, des messages de mise à jour plus ciblés pendant l’utilisation d’outils et des conceptions front-end plus abouties, notamment en configuration à faible effort de raisonnement. Sur les tâches simples comme les modifications rapides de code, le modèle se montrerait plus réactif sans perte de performance sur les cas plus complexes.
Deux nouveaux outils sont également proposés via l’API Responses. L’outil «apply_patch» permet au modèle de proposer directement des modifications concrètes dans une base de code, sous forme de fichiers à créer, à modifier ou à supprimer. Le processus repose sur des instructions structurées que l’application applique automatiquement, facilitant les workflows de modification en plusieurs étapes. L’outil « shell » permet quant à lui au modèle de suggérer des commandes à exécuter localement sur une machine, avec un retour des résultats pour finaliser les tâches.