L’EPFL travaille à une nouvelle norme JPEG pour le stockage sur ADN
Le stockage des données dans des molécules d’ADN, un concept exploré depuis plusieurs années, connaît une nouvelle avancée avec un projet mené à l’EPFL. Les chercheurs développent une norme internationale pour compresser et coder les images dans l’ADN, ouvrant la voie à une solution durable et à long terme pour l’archivage massif.

Chaque année, plus de 2000 milliards de photos sont prises dans le monde, selon les chiffres avancés par l’EPFL. Si beaucoup restent stockées localement, une grande partie est conservée dans des centres de données, saturant les capacités des disques durs et des bandes magnétiques. Ces solutions classiques présentent des limites en termes de capacité, de durée de vie et d’impact environnemental. Face à cette explosion des volumes numériques, des chercheurs de l’École polytechnique fédérale de Lausanne (EPFL) travaillent à développer une norme internationale de compression d’image adaptée au stockage sur ADN, une technologie durable et prometteuse.
Un concept qui ne date pas d’hier
Le stockage d’informations dans des molécules d’ADN n’est pas nouveau. Depuis 2015, l’EPFZ a démontré que cette technologie pouvait conserver des données pendant des millions d’années. En 2017, l’EPFL a confirmé son potentiel en stockant des archives, comme celles du Montreux Jazz Festival, incluant des morceaux de Miles Davis et Deep Purple.
Depuis, plusieurs universités suisses, dont l’Université de Genève, travaillent à rendre cette technologie accessible en développant notamment des micro-usines autonomes pour un archivage durable hors des laboratoires.
Ces initiatives espèrent tirer parti du fort potentiel du stockage sur ADN. Le professeur Touradj Ebrahimi, spécialiste du traitement d’image et responsable du Groupe de traitements des signaux multimédias à l’EPFL, explique qu’un seul gramme d’ADN pourrait stocker environ 215 millions de gigaoctets de données, soit l’équivalent de 860’000 disques durs externes. Cette densité exceptionnelle, combinée à la longévité millénaire de l’ADN, fait du stockage sur ADN une solution prometteuse pour l’archivage à très long terme.
JPEG DNA: une norme de compression pour le stockage sur ADN
Face aux défis liés au coût élevé et au temps nécessaire pour écrire et lire les données sur ADN, les chercheurs développent JPEG DNA, une norme internationale de compression et de codage d’images spécialement conçue pour optimiser ce processus. Cette technologie convertit les données numériques binaires en séquences d’ADN composées des quatre nucléotides: adénine (A), thymine (T), cytosine (C) et guanine (G). Ces séquences sont synthétisées, stockées, puis lues par des techniques de séquençage.
Le standard JPEG DNA prend en compte la résilience aux erreurs ainsi que les contraintes biochimiques propres à l’ADN, telles que la fréquence et la disposition des symboles, afin d’assurer la stabilité des molécules. Un algorithme développé par l’équipe encode directement les images au format JPEG sans décodage préalable, réduisant la quantité d’ADN synthétisé et les ressources de calcul.
Selon les indications du professeur Touradj Ebrahimi, les progrès en intelligence artificielle pourraient améliorer ce standard en optimisant l’encodage et la correction d’erreurs, tout en garantissant la compatibilité avec les procédures existantes.
Le comité JPEG vise à officialiser JPEG DNA comme norme internationale dès 2026. Le projet est actuellement présenté au Pavillon suisse de l’Exposition universelle d’Osaka.