Fake for Good

Pour améliorer la qualité des vidéoconférences, NVIDIA recrée algorithmiquement le visage des participants

NVIDIA lance une plateforme cloud permettant aux opérateurs de vidéoconférence de délivrer divers effets s’appuyant sur l’IA et notamment un système de compression inédit basé sur la transmission de points clés du visage.

NVIDIA lance une suite d’outils cloud pour améliorer la qualité de diffusion des appels vidéo. Destinée aux entreprises fournissant des services de vidéoconférence, la plateforme NVIDIA Maxine exploite des algorithmes pour offrir des effets tels que la correction du regard, la super-résolution, la suppression du bruit, ou le rétro-éclairage du visage. Les effets étant générés dans le cloud, ils ne nécessitent aucune adaptation du hardware de l’utilisateur.

Mais l’innovation la plus étonnante introduite par la plateforme consiste à utiliser l’intelligence artificielle pour réduire la bande passante nécessaire à des appels vidéo de qualité. Aux lieu de transmettre l’intégralité du visage d’un participant, l’algorithme en analyse uniquement quelques points clés et reproduit le visage en vidéo du côté des autres participants. On produit en quelque sorte une vidéo truquée mais pour la bonne cause. Cette technologie inédite de compression permet de réduire les exigences de bande passante de 90%, selon l’entreprise.

Outre cette innovation, la plateforme NVIDIA Maxine propose différents outils aux développeurs, comme l’utilisation d’avatars ou l’intégration d’assistants virtuels dotés de capacités de reconnaissance vocale, par exemple pour afficher des sous-titres ou prendre le PV des discussions. D’autres services exploitant des réseaux antagonistes génératifs (GAN) devraient faire leur apparition ultérieurement.

Pour délivrer ces différents effets à grande échelle, la plateforme cloud native s’appuie sur des microservices IA tournant sur des clusters Kubernetes exploitant des processeurs graphiques (GPU). La plateforme Maxine profite par ailleurs de différentes solutions existantes de NVIDIA (Jarvis, DeepStream, TensorRT).

Tags
Webcode
DPF8_192867