EPFL

Grâce à l'IA, vous allez enfin comprendre les politiques de confidentialité

| mise à jour

Un groupe d’universitaires de Lausanne, du Wisconsin et du Michigan a mis en ligne deux outils capables de traduire en mots et graphiques simples et intelligibles les illisibles politiques de confidentialité des services web et mobiles.

Les données collectées par Fitbit (Source: Polisis)
Les données collectées par Fitbit (Source: Polisis)

Personne ne lit les politiques de confidentialités des sites et services web ou mobiles. Rédigées sur des milliers de signes par des experts du droit pour protéger l’entreprise et ses salariés, elles multiplient les termes juridiques et les petites lignes pour décourager l’utilisateur de les lire. Finalement, il clique en bas, sur «Accepter», sans savoir ce qu’il accepte.

Cela énerve tout le monde depuis des années mais personne ne faisait rien… jusqu’à ce qu’un groupe de chercheurs de l'Ecole Polytechnique Fédérale de Lausanne (EPFL), de l'Université du Wisconsin et de l'Université du Michigan se saisissent du sujet. Ils viennent de mettre en ligne deux outils :

  • Polisis est une extension Chrome ou Firefox qui traduit les politiques de confidentialités en graphiques interactifs beaucoup plus compréhensibles que les textes initiaux (vidéo explicative ici)

  • PriBot est un bot auquel l’internaute peut poser des questions sur l’usage qui est fait de ses datas par tel ou tel site (vidéo explicative ici)

Tous deux s’appuient sur un algorithme apprenant nourri par des milliers de textes de «Privacy policy» pour trouver l’information utile pour l’internaute, qu’il s’intéresse aux types de données recueillies, au partage qui en est fait à des tiers, à la sécurité qui les entoure ou encore à ses droits d’accès.

Dans un billet de blog publié sur Medium ce 12 février, Hamza Harkous, postdoc à l’EPFL à l’origine de ces travaux explique qu’en 2016, en plein buzz des chatbots, lui et ses collègues ont proposé de remplacer ces imbitables contrats (puisque c’est bien de cela qu’il s’agit) par des conversations. Le système de graphique «Polisis» est né dans un second temps.

En vingt mois, ils ont annoté 115 politiques de confidentialités à l’aide d’un groupe d‘étudiants de l’université de droit de Fordham (New York) pour un premier apprentissage de leur algorithme : il s’est appuyé sur ces simplifications pour «traduire» 130 000 textes de Privacy policies recueillis sur le Google Play Store. Ensuite, à l’aide de 22 réseaux neuronaux, les chercheurs ont hiérarchisé et classés en 22 groupes les différents aspects proposés par les politiques de confidentialités pour pouvoir en livrer cette lecture graphique.

«Vous n'aurez plus jamais à les lire!», assure Hamza Harkous qui partage cette vidéo d’un acteur qui a lu les 73 198 mots des conditions d’utilisation de l’Amazon Kindle en… 9 heures!

Tags
Webcode
DPF8_80241