GenAI vs. images authentiques

Google, Meta et OpenAI s'engagent contre les deepfakes en rejoignant la C2PA

Pour faire face à l'augmentation des contenus manipulés, Google, Meta et OpenAI s'associent à la C2PA afin de créer des normes permettant aux utilisateurs de distinguer les contenus authentiques de ceux produits par l'intelligence artificielle. Zoom sur le concept des «Content Credentials» et ses limites.

OpenAI a intégré les métadonnées C2PA aux images créées avec ChatGPT et l'API du modèle DALL-E 3. (Source: C2PA)
OpenAI a intégré les métadonnées C2PA aux images créées avec ChatGPT et l'API du modèle DALL-E 3. (Source: C2PA)

Google, Meta et OpenAI ont rejoint la principale initiative visant à combattre les deepfakes générés par la GenAI. Au sein de la Coalition for Content Provenance and Authenticity (C2PA), les trois géants de la tech vont contribuer aux efforts déjà initiés par de nombreux autres acteurs des contenus numériques dont Adobe, Intel ou encore Microsoft, tous trois membres du comité de pilotage de la C2PA. Cette dernière a pour objectif de mettre en place des standards et techniques interopérables pour permettre aux utilisateurs en ligne de distinguer les photos prises par des appareils réels de celles produites par les outils d’IA générative, notamment à l‘aide d’un système d'étiquetage au niveau des métadonnées. 

L’explosion des deepfakes et autres contenus manipulés est l’une des conséquences problématiques de l'essor de la GenAI. Si ces outils peuvent servir à créer des contenus humoristiques, ils peuvent aussi être exploitées pour détourner et nuire à l’image de personnalités (comme le cas récent de la large diffusion de deepfakes pornographiques avec le visage de la chanteuse Taylor Swift), pour manipuler des élections (des électeurs américains ont reçu de faux messages téléphoniques de Joe Biden lors des primaires démocrates dans l’Etat du New Hampshire), pour frauder (un employé hongkongais a récemment viré plusieurs millions de dollars à des hackers après avoir été trompé par un deepfake de son CFO en visioconférence) ou encore pour détériorer les systèmes d’authentification biométriques mis en place par les entreprises. 

Face à cette évolution, les utilisateurs vont notamment devoir apprendre à se méfier davantage, tandis que l’on attend des acteurs de la tech qu'ils développent des moyens de vérification. Il s’agit là davantage que de supposées expectatives émanant du grand public, puisque les autorités des deux côtés de l'Atlantique ont formulé des directives ou des règles en la matière. Le premier décret de l'administration américain sur l'intelligence artificielle souligne ainsi  la nécessité d'établir des normes et des meilleures pratiques pour identifier et étiqueter le contenu généré par l’IA. De son côté, l'Union européenne indique dans son AI Act que les entreprises technologiques auront l’obligation d'étiqueter les deepfakes et les contenus générés par l'IA, et de concevoir des systèmes de manière à ce que les médias générés par l'IA puissent être détectés. 

A quoi se sont engagés Google, Meta et OpenAI?

La C2PA, ses membres et partenaires, s'attèlent donc à mettre au point des techniques d'identification du contenu généré par l’IA à même de répondre aux pressions légales et aux besoins de transparence du public. A noter que certains des participants à l’initiative travaillaient déjà de leur côté sur leur propre standard. Dans son communiqué annonçant que Google a rejoint, début février, son comité de pilotage, la C2PA précise que la firme de Mountain View va se focaliser sur l'intégration de métadonnées dites «Content Credentials» dans son outil de recherche Google Images. De son côté, Meta a annoncé le développement de nouveaux outils pour détecter les métadonnées C2PA dans les images téléchargées sur les réseaux sociaux Facebook, Instagram et Threads. OpenAI a également rejoint l'initiative. Dans son annonce, l'éditeur emblématique de la GenAI a déclaré qu'il intégrerait les métadonnées C2PA aux images créées avec ChatGPT et l'API du modèle DALL-E 3. Pionnier de l’initiative, Adobe en avait déjà fait de même avec son outil Firefly voici quelques mois. 

Les Content Credentials, quèsaco?

En quoi consiste exactement ces certificats de contenu? La documentation d'Adobe ainsi que le site web dédié au projet indiquent qu’il s'agit d’une technologie open source, se présentant comme un filigrane numérique invisible qui intègre différentes métadonnées concernant un contenu visuel affiché en ligne. Comment a-t-il été créé? Est-il généré par l'IA? Quand a-t-il été créé ou modifié? S’ils répondent aux normes de la C2PA, ces certificats peuvent être lus par divers outils indépendamment de l'environnement logiciel dans lequel le contenu a été créé. Un peu à l’instar des différentes propriétés d’une photo, qui sont automatiquement intégrées à un fichier image et qui peuvent ensuite être lues par divers moyens notamment, sur Windows, via un clic droit sur l'icône du fichier en question. 

Outre des outils intégrés à des logiciels, il est possible de consulter les métadonnées C2PA d’un fichier en le téléversant via le site Content Credentials. Digimarc a par ailleurs développé un plugin sur Chrome avec cette fonctionnalité. 

Ces certificats de contenu ont des limites

Les «Content Credentials» se profilent-ils comme la panacée dans la lutte contre les deepfakes? On peut d’abord observer que le concept ne s'applique pour l'heure qu’au contenu visuel et audio-vidéo, et non à l’écrit produit par la GenAI. En outre, dans son annonce sur l’intégration de ces métadonnées au sein de ChatGPT et Dall-E, OpenAI évoque leurs limites, soulignant qu’elles «peuvent facilement être supprimées, accidentellement ou intentionnellement. Par exemple, la plupart des plateformes de médias sociaux suppriment aujourd'hui les métadonnées des images téléchargées, et des actions telles qu'une capture d'écran peuvent également les supprimer». 

VP Innovation de Digimarc (membre de la C2PA), Dominique Guinard, basé en Suisse romande, explique dans un blog sur Medium: «Les groupes de travail de la C2PA sont conscients de ces problèmes, et la spécification propose des moyens non normatifs (du moins pour l'instant) de créer des "liaisons douces" pour former des liens plus solides entre les biens numériques et les manifestes. L'une de ces solutions est un filigrane numérique qui, associé à un manifeste C2PA, crée un lien solide et bidirectionnel entre le bien et son manifeste. Le manifeste fait référence à l'image et, grâce au filigrane numérique, l'image fait référence au manifeste». 

Notons que des développements en cours vont précisément dans cette direction. Ainsi, Digimarc propose un outil gratuit permettant aux éditeurs de logiciels d'intégrer l'ajout de filigrane à leur solution. Par ailleurs, la dernière version des spécifications de C2PA permet d'indiquer dans les métadonnées qu'un filigrane a été ajouté au fichier. 
 

Tags
Webcode
2oU9dMdK