Gemini élargit ses capacités génératives à la musique
Google Gemini s’enrichit d’un nouvel outil de création générative: le modèle musical Lyria 3 est capable de produire des paroles, de composer la musique et d’y ajouter une voix chantée. L'équipe de Google à Zurich a participé à son développement.
Google DeepMind a annoncé le lancement de Lyria 3, un modèle de génération musicale désormais intégré à Google Gemini. L’outil permet de créer automatiquement, en quelques secondes, un morceau de musique d’environ 30 secondes à partir d’un prompt textuel, d’une image ou d’une vidéo. Il suffit de décrire un genre musical, une ambiance, un souvenir ou même une blague entre initiés pour que l’IA génère à la fois l’accompagnement instrumental, les paroles et une pochette visuelle associée. Une image ou une vidéo peut également servir de point de départ. La qualité du résultat dépend toutefois largement de la précision du prompt, précise l’entreprise.
Avec Lyria 3, l’entreprise entend améliorer trois aspects de la génération audio. Les utilisateurs n’ont plus besoin d’écrire eux-mêmes des paroles, mais seulement de formuler un prompt. Ils disposent également de davantage de contrôle créatif sur des éléments comme le style musical, les voix ou le tempo, et peuvent générer des morceaux plus réalistes et musicalement plus complexes. Google précise toutefois que l’objectif n’est pas de produire des œuvres musicales abouties, mais d’offrir un moyen simple et ludique d’expression créative personnelle.
Le site zurichois de Google a contribué au développement du modèle. Christine Antlanger-Winter, Country Director de Google Switzerland, écrit dans un post LinkedIn: «Je suis particulièrement fière que des équipes de Google DeepMind à Zurich et à Londres aient été fortement impliquées dans le développement de ce nouvel outil.»
Collaboration contre les violations du droit d’auteur
Google DeepMind avait présenté Lyria pour la première fois en 2023. Depuis le début, l’entreprise affirme miser sur un développement responsable et sur la collaboration avec la communauté musicale. Le respect des droits d’auteur et des accords avec des partenaires a également joué un rôle central dans l’entraînement de Lyria 3. «La génération de musique avec Lyria 3 est conçue pour l'expression originale, et non pour imiter des artistes existants», souligne Google. Les œuvres d’autres artistes servent uniquement de source d’inspiration. Des filtres analysent les contenus générés afin de détecter d’éventuelles ressemblances avec des œuvres existantes et une fonction de signalement permet d’identifier de possibles violations de droits.
Les morceaux générés sont marqués avec SynthID, le filigrane imperceptible permettant d’identifier les contenus créés par l’IA de Google. En outre, Google étend dans l’application Gemini ses fonctions de vérification aux contenus audio.
Lyria est disponible dès à présent dans Gemini pour tous les utilisateurs âgés de plus de 18 ans, en anglais, allemand, français, espagnol, portugais, hindi, japonais et coréen. D’autres langues devraient être ajoutées ultérieurement. Les personnes disposant d’un abonnement Plus, Pro ou Ultra bénéficieront de limites d’utilisation plus élevées.
L’actualité IT en Suisse et à l’international, avec un focus sur la Suisse romande, directement dans votre boîte mail > Inscrivez-vous à la newsletter d’ICTjournal, envoyée du lundi au vendredi!