IA pour tous

AWS met son machine learning à disposition des développeurs

Amazon Web Services a dévoilé des nouveaux services cloud permettant aux développeurs d’intégrer à leurs apps et chatbots ses technologies d’intelligence artificielle et de machine learning.

Amazon Rekognition permet de créer des applications qui analysent des images, objets, scènes ou visages. (Source: Amazon)
Amazon Rekognition permet de créer des applications qui analysent des images, objets, scènes ou visages. (Source: Amazon)

Amazon Web Services (AWS) n’a pas fait l'économie d'annonces dans le cadre de sa conférence annuelle re:invent, s’adressant aux développeurs. Notamment en matière de technologies d’intelligence artificielle et de machine learning. D’abord avec le service Amazon Lex, qui met à disposition des développeurs le moteur qui fait tourner le chatbot vocal Alexa d’Amazon. Disponible dès à présent en préversion, Lex fournit des capacités de reconnaissance automatique de la parole et de compréhension du langage naturel, pour le développement de chatbots (agents conversationnels). Ces derniers peuvent se programmer et être testés via l’AWS Management Console. Le fournisseur explique qu’à partir de simples questions initiales saisies par le développeur pour mettre Lex sur la bonne piste, le service va ensuite directement construire le modèle linguistique et poser les questions de suivi utiles à l’utilisateur final pour compléter la tâche. Lex peut être paramétré pour appeler le service backend approprié (par exemple un service de réservation de vol) via des fonctions AWS Lambda. Ces dernières peuvent servir à puiser dans les données de sources disparates, dont celles de Salesforce, Microsoft Dynamics, Marketo, Zendesk, QuickBooks et HubSpot.

 

Un service cloud de synthèse vocale capable de gérer les homographes

AWS a aussi dévoilé Amazon Polly, un service cloud de synthèse vocale (Text-To-Speech) qui, dixit Amazon, permet aux développeurs d'ajouter facilement à leurs applications existantes des fonctionnalités vocales naturelles, par exemple pour des lecteurs de news d’actualités, des plateformes d’e-learning, ou tout nouveau produit (appli ou appareil) se servant de la parole. Les développeurs peuvent envoyer du texte à Amazon Polly en utilisant le SDK (kit de développement) ou à partir de la Management Console. Polly génère immédiatement un flux audio qui peut, au choix, être entendu directement ou être stocké en format audio standard. Polly propose 47 voix et supporte 24 langues. Amazon souligne que Polly sait gérer les homographes, les mots orthographiés de la même façon mais prononcés différemment. Le service peut également gérer correctement les unités, fractions, abréviations, devises, dates, heures et autres composantes sophistiquées, promet le fournisseur.

 

Reconnaissance visuelle boostée au deep learning

Enfin, Amazon Rekognition se présente comme un service de reconnaissance d'image puisant dans le deep learning. Rekognition permet de créer des applications qui analysent des images et reconnaissent des visages, des objets et des scènes. AWS assure que le service est en mesure d’isoler des visages dans les images et de détecter des caractéristiques comme le fait qu’un visage est souriant ou que les yeux sont ouverts. Des fonctionnalités avancées d'analyse faciale telles que la comparaison de visages et la recherche faciale sont aussi prises en charge. Les développeurs peuvent par exemple se servir Rekognition pour créer une application qui mesure la probabilité que les visages dans deux images correspondent à la même personne. Ou créer des collections de millions de visages (détectées dans les images) et rechercher un visage similaire à leur image de référence dans la collection, explique AWS.

Webcode
DPF8_17665