Nouvelles capacités

ChatGPT apprend à voir, à entendre et à parler

par Maximilian Schenner et traduction/adaptation ICTjournal

Une nouvelle mise à jour va permettre à ChatGPT de reconnaître les instructions vocales et de prononcer lui-même les réponses à haute voix. Le chatbot d'OpenAI devrait également bientôt être capable d'interpréter des images.

(Source: Matheus Bertelli/pexels.com
(Source: Matheus Bertelli/pexels.com

OpenAI a annoncé une mise à jour importante pour ChatGPT. Le chatbot va bientôt être en mesure de reconnaître les instructions vocales et de prononcer les réponses à voix haute, à la manière d'un assistant vocal comme Siri d'Apple ou Alexa d'Amazon.

ChatGPT raconte une histoire pour dire bonne nuit

OpenAI fait savoir qu'il s'agit d'un modèle Text-to-Speech qui peut générer une voix semblable à celle d'un être humain à l'aide de texte et de quelques secondes d'échantillons de voix. Le système de reconnaissance vocale open source Whisper est utilisé pour transformer les mots prononcés par les utilisateurs en texte. Dans un premier temps, les conversations directes ne seront possibles que sur les appareils mobiles. Sur desktop, la reconnaissance vocale n'existe pas encore.

Dans son annonce, OpenAI propose quelques exemples à écouter. Les utilisateurs peuvent se faire lire une histoire, une recette, un poème, une explication ou un discours et choisir parmi cinq types de voix différents. OpenAI a travaillé avec des professionnels du doublage. 

OpenAI indique en outre collaborer avec plusieurs firmes dont Spotify, qui utilise la technologie pour un test pilote de fonctions de traduction vocale. L'objectif est de permettre aux podcasteurs et podcasteuses de traduire leurs contenus dans leur propre voix en plusieurs langues.

Analyse d'images

ChatGPT se voit en outre doté de nouvelles fonctions dans le domaine de la reconnaissance d'images. «Découvrez pourquoi votre barbecue ne s'allume pas, parcourez le contenu de votre réfrigérateur pour planifier un repas ou analysez un graphique complexe pour obtenir des données liées au travail», écrit le fournisseur d’outils de GenAI. 

ChatGPT peut répondre à un prompt à l'aide d’informations extraites d’une photo téléversée par l’utilisateur ou déjà présente dans la banque d’images d’OpenAI. Pour mettre en évidence certaines parties d'une image, l'application mobile dispose d'un outil de dessin. 

Les clients qui paient pour ChatGPT Plus ou Enterprise auront accès aux nouvelles fonctionnalités au cours des deux prochaines semaines. Par la suite. OpenAI envisage de déployer la mise à jour progressivement pour les autres utilisateurs.
 

Tags
Webcode
4YqPYxAc