Alibaba Cloud lance une IA open source pour la production vidéo
Alibaba Cloud a dévoilé le modèle d'IA open source Wan 2.1-Vace, qui regroupe diverses tâches de production et d’édition vidéo à partir d’entrées multimodales. Cette technologie vise à simplifier la création vidéo basée sur l'IA.

Alibaba Cloud lance le modèle d'IA open source Wan 2.1-Vace pour la production et l'édition vidéo. Selon l'entreprise, l'outil intègre de nombreuses fonctions dans une seule plateforme, dont la génération de vidéos sur la base d'entrées de texte, d'images ou de vidéos, l'édition ciblée de zones vidéo individuelles et l'extension de contenus vidéo via des méthodes de remplissage intelligentes.
Selon l’entreprise, ce modèle d'IA utilise la Video Condition Unit pour traiter différents types d'entrées et une structure d'adaptateur de contexte pour contrôler de manière flexible les caractéristiques temporelles et spatiales. Parmi les fonctions prises en charge figurent le contrôle des mouvements et de la profondeur, le transfert de poses, la recoloration ainsi que le traitement d'objets individuels et de leur environnement.
Wan 2.1-Vace est destiné à la production de contenus pour les médias sociaux, la publicité, le cinéma et la télévision ainsi que pour la création de vidéos de formation. Selon la firme, le code source librement accessible vise à réduire les barrières à l'entrée pour les utilisateurs et de produire des contenus vidéo personnalisables et rentables.
Le modèle est disponible gratuitement en deux versions open source, l’une avec 1,3 milliard de paramètres et l’autre avec 14 milliards - sur Hugging Face, Github et Modelscope, la communauté open source d'Alibaba Cloud.
Wan 2.1-Vace fait partie de la série Wan 2.1, disponible depuis février 2025 via l'offre open source d'Alibaba Cloud. Selon l'entreprise, elle a déjà été téléchargée plus de 3,3 millions de fois.