Data space

Les données de qualité doivent pouvoir circuler

par Georges-Simon Ulrich, Directeur de l’Office fédéral de la statistique (OFS), Président de la Commission de statistique de l’ONU

Même les meilleures données ne sont pas automatiquement utiles. Ce n’est que lorsqu’elles sont facilement trouvables, ­compréhensibles et combinables entre elles qu’elles permettent de produire de nouvelles connaissances ou des services ­numériques facilitant la vie quotidienne. Les plateformes de métadonnées, les registres et d’autres instruments constituent la passerelle qui permet aux données de devenir réellement exploitables pour l’administration, l’économie et la société.

La première partie de cette série s’est intéressée à la qualité des données à la source. Si cette base est indispensable, l’étape suivante est tout aussi déterminante: même des données de haute qualité ne déploient leur valeur que lorsqu’elles peuvent être utilisées efficacement grâce à des plateformes, des outils et des structures organisationnelles appropriés. L'interopérabilité, entendue comme la facilité de recherche, l'accessibilité et l'utilisabilité des données à des fins diverses, ne va pas de soi, mais nécessite des règles claires et des processus harmonisés et coordonnés.

Il ne suffit pas que les données soient techniquement compatibles et disponibles dans des formats uniformes. L’interopérabilité sémantique doit également être assurée: la signification des données doit être clairement définie et comprise de la même manière par toutes les parties prenantes. Il doit en outre être établi sans ambiguïté qui est responsable de quelles données, quelles règles métier et organisationnelles s’appliquent et quelles exigences juridiques doivent être respectées. Lorsque ces conditions sont réunies, la valeur des données augmente avec leur utilisation: les données réutilisées à plusieurs reprises accélèrent les processus administratifs. Elles améliorent la qualité des services pour la population et la clientèle. Et elles permettent aux entreprises et aux institutions de recherche de développer plus rapidement et à moindre coût de nouvelles solutions. Les applications reposant sur l’IA gagnent elles aussi en fiabilité.

Qui peut faire quoi – et qui doit faire quoi?

Lorsque les rôles, les responsabilités et les droits d’accès sont clairement définis, tous les acteurs impliqués savent quelle responsabilité ils portent dans l’écosystème de données. Ce cadre est désigné sous le terme de data governance. Celle-ci détermine qui peut utiliser, fournir et gérer quelles données, de quelle manière et dans quel but.

C’est dans cette perspective que se met actuellement en place l’écosystème de données suisse. Il doit permettre aux acteurs de l’administration, de l’économie, de la science et à la population d’utiliser les données de manière fiable, interopérable et ciblée. Plusieurs espaces de données sont déjà en cours de création en Suisse, notamment dans les domaines de la mobilité, de la santé et de l’énergie. Ces projets illustrent concrètement comment une collaboration fondée sur des règles et des standards communs peut fonctionner tout en créant de la valeur pour la société et l’économie.

La mise en place de l'écosystème de données suisse est réalisée à la demande du Conseil fédéral et en étroite collaboration avec les cantons, les communes et d'autres partenaires. L’objectif est une utilisation coordonnée et durable des données à travers l’ensemble des niveaux de l’État. Une data governance commune garantit que la Confédération, les cantons et les communes puissent coopérer efficacement sans perdre leur autonomie respective. La gouvernance stratégique au sein de l’administration fédérale est assurée par le Data Board de la Confédération, qui réunit les Data Stewards des départements ainsi que de la Chancellerie fédérale. L’Office fédéral de la statistique (OFS) y joue un rôle central: en tant que Swiss Data Steward, il veille à ce que les données et métadonnées restent compatibles, interopérables et utilisables sur le long terme au-delà des frontières des systèmes.

Applicable également à un système fédéral

Plusieurs exemples établis montrent que cela est réalisable dans le système fédéral suisse. Le premier est celui de la statistique publique: depuis le XIXe siècle, elle est fondée sur la comparabilité et la fiabilité. Aujourd’hui, la loi met l’accent sur la réutilisation des données et sur leur compatibilité internationale. Cela est rendu possible par une gouvernance clairement définie et appliquée de manière cohérente.

Un deuxième exemple est le système suisse de géodonnées: il repose sur une structure de gouvernance développée depuis plus de vingt ans, qui permet notamment de relier les géodonnées aux données statistiques. Un troisième exemple est celui des Open Government Data: des standards communs, des rôles clairement définis, des métadonnées facilement accessibles, un plan directeur et des directives pour les autorités garantissent transparence et efficacité.

Pour obtenir d'autres succès de ce type, la mise en réseau entre la Confédération, les cantons et les communes doit être encore plus étroite. Cela permet à toutes les parties prenantes d’avoir une meilleure visibilité sur les données disponibles et les possibilités d’utilisation. Et c’est précisément à ce niveau qu’interviennent les plateformes de métadonnées.

Une carte dans la jungle des données

Les métadonnées décrivent quelles données existent, qui les détient, comment elles sont structurées et dans quelles conditions elles peuvent être utilisées. Pour rendre ces métadonnées accessibles à tous, l’OFS exploite des plateformes dédiées. Celles-ci apportent de la transparence et rendent l’utilisation des données plus prévisible. De la même manière qu’une carte de randonnée permet de s’orienter dans une forêt dense parcourue de nombreux sentiers, les plateformes de métadonnées facilitent la navigation dans un paysage de données complexe.

Sur la plateforme publique d’interopérabilité I14Y (i14y.admin.ch), les autorités de tous les niveaux fédéraux peuvent décrire leurs jeux de données, leurs interfaces électroniques (API) et leurs prestations administratives à l’aide de métadonnées. Les données originales restent auprès des entités responsables. La souveraineté des données et l’autodétermination numérique sont ainsi préservées. En complément, opendata.swiss, la plateforme centrale d’open data de la Suisse, met à disposition du public des données librement utilisables. Elle permet aux autorités, aux chercheurs, aux entreprises et à la population de trouver, télécharger et réutiliser des jeux de données, rendant ainsi visibles et exploitables les potentialités des données ouvertes.

Les plateformes I14Y et opendata.swiss sont actuellement en cours de fusion pour donner naissance à metadata.swiss. Cette nouvelle plateforme doit à terme réunir producteurs et utilisateurs de données, faciliter la collaboration entre les services métiers, l’informatique et la statistique, et soutenir l’harmonisation des données. Les autorités ne seront pas les seules à pouvoir y participer: les entreprises pourront également intégrer directement des données ouvertes, ce qui déclenchera les avantages évoqués de la réutilisation multiple.

Les registres de données de base comme fondement

Les registres de données de base constituent un autre socle essentiel pour la réutilisation des données. Ils sont indispensables pour une statistique et une administration modernes, car ils fournissent des informations fiables, clairement identifiables et réutilisables. Il est essentiel que les objets enregistrés, par exemple des personnes ou des entreprises, puissent être identifiés de manière univoque.

L’OFS gère deux registres d’entreprises: le registre des entreprises et des établissements (REE) ainsi que le registre IDE, qui attribue à chaque entreprise en Suisse un numéro d’identification des entreprises. Pour les données économiques relatives aux entreprises, un registre important existe également en dehors de l’OFS: le registre du commerce. Pour l’utilisation statistique des données relatives aux personnes, l’OFS s’appuie en revanche sur les registres existants de la Confédération, des cantons et des communes. Grâce à l’harmonisation de ces registres, le recensement de la population peut être réalisé depuis 2010 sur une base entièrement administrative. Les bénéfices sont considérables: la population n’a plus à être interrogée dans son ensemble. L’OFS reçoit désormais quatre fois par an les données nécessaires à des fins statistiques. Seule une enquête par échantillonnage est encore menée pour certaines caractéristiques supplémentaires. Cela allège sensiblement la charge pour la population comme pour les autorités concernées.

Des données dignes de confiance

Pour conclure, revenons aux plateformes de métadonnées: leur importance ne cesse de croître à l’échelle mondiale. Une initiative récente de l’OFS, le Trusted Data Observatory (TDO) à Genève, s’inscrit d’ailleurs dans une perspective internationale: il doit servir de plateforme mondiale de métadonnées à laquelle des systèmes d’IA pourront notamment accéder afin d’appuyer leurs réponses sur des faits vérifiables. C’est un enjeu majeur: alors que les réponses générées par les grands modèles de langage reposent principalement sur la technologie elle-même, les données publiques sont, elles, construites de manière intentionnelle, selon des règles, des responsabilités et des standards clairement définis. Le projet est financé par le Département fédéral des affaires étrangères (DFAE) ainsi que par deux fondations.

Outre la promotion de la transparence et d’une prise de décision politique fondée sur les faits, le TDO pourrait également contribuer à lutter contre la désinformation intentionnelle et, ainsi, à renforcer la stabilité des démocraties. Il est donc grand temps de considérer les données dignes de confiance comme un bien commun et de les rendre exploitables en les faisant circuler sur une passerelle solide.

L’actualité IT en Suisse et à l’international, avec un focus sur la Suisse romande, directement dans votre boîte mail > Inscrivez-vous à la newsletter d’ICTjournal, envoyée du lundi au vendredi! 

Webcode
pUu3zXUP