ChatGPT Images 2.0

OpenAI fait évoluer son générateur d’images et en élargit les usages

par Valentina Graziano (traduction/adaptation ICTjournal)

OpenAI dévoile une mise à niveau à son modèle de génération d'images. Baptisé ChatGPT Images 2.0, le modèle gagne en rapidité, en créativité et en précision dans le rendu des détails, selon l’entreprise, qui admet toutefois qu’il reste une marge de progression.

(Source: Netzmedien / ChatGPT Images 2.0)
(Source: Netzmedien / ChatGPT Images 2.0)

L'éditeur OpenAI a mis à jour son modèle de génération d’images ChatGPT Images. Selon l’entreprise, cette version 2.0 améliore nettement le suivi des instructions complexes, la restitution des textes et le positionnement des objets.

Jusqu'ici, le modèle produisait des textes de manière plus homogène en anglais et dans les langues à écriture latine qu'en japonais, coréen, chinois ou hindi. Une meilleure génération multilingue est désormais possible, indique l’entreprise sur son blog.

Les styles visuels ont également été retravaillés: OpenAI a perfectionné la génération d'images en style cinématographique, pixel art, manga, bande dessinée et photoréaliste. Les utilisateurs peuvent désormais transformer un selfie en portrait, supprimer un arrière-plan et retoucher des photos en profondeur. De nouveaux formats d'image (de 3:1 à 1:3) sont par ailleurs disponibles pour faciliter la création de bannières, présentations, affiches et visuels adaptés au mobile.

Pour permettre aux développeurs d'intégrer directement la génération et l'édition d'images dans leurs produits et workflows, le modèle sous-jacent «gpt-image-2» est accessible via l'API.

Lorsque le mode «Thinking» est activé, ChatGPT prend davantage de temps pour générer les images, précise OpenAI. En contrepartie, les résultats sont plus élaborés et réfléchis grâce à des recherches supplémentaires sur internet. Dans ce mode, les utilisateurs peuvent également faire générer plusieurs images différentes simultanément. Jusqu'à huit résultats cohérents par requête sont possibles, ce qui serait idéal pour des sets d'affiches, storyboards, bandes dessinées ou campagnes multi-formats.

OpenAI reconnaît toutefois plusieurs limites à son nouveau modèle. Selon l'entreprise, Images 2.0 peine encore à produire une représentation cohérente du monde physique, à restituer fidèlement des détails sur des surfaces masquées, inclinées ou retournées, ou à légender précisément des diagrammes. Les visuels très denses ou aux motifs répétitifs mettent également le modèle à l'épreuve. OpenAI présente ces points comme des axes de travail pour l'avenir.

L’actualité IT en Suisse et à l’international, avec un focus sur la Suisse romande, directement dans votre boîte mail > Inscrivez-vous à la newsletter d’ICTjournal, envoyée du lundi au vendredi! 

Tags
Webcode
jRKmxNBC