Conservation des données

GitHub archive son code open source dans l’Arctique

La plateforme de collaboration et d’hébergement de code GitHub a débuté la production de son projet Arctic Code Vault, dont l’ambition est d’archiver les logiciels libres et open source dans l’Arctique pendant 1000 ans.

Les données seront enfouies sous le permafrost. (Source: Arctic World Archive)
Les données seront enfouies sous le permafrost. (Source: Arctic World Archive)

Le projet Arctic Code Vault de Github, qui veut préserver les logiciels libres pour les futures générations, est entré en production. En novembre dernier, la plateforme de collaboration et d’hébergement de code avait annoncé son intention de stocker les logiciels open source existants dans un coffre-fort enfoui dans l’Arctique. Et plus précisément dans l’Arctic World Archive, une mine de charbon désaffectée située sur l’île de Scalbard en Norvège et reconvertie en centre de stockage des données.

Le dimanche 2 février, GitHub a donc mis son plan en action, en prenant un snapshot de tous les référentiels publics et actifs sur sa plateforme. Ces snapshot sont conditionnés sous la forme d’une image TAR et excluent tout fichier binaire de plus de 100kB. Pour une densité et une intégrité accrues des données, celles-ci sont stockées à l’aide d’un QRCode. Un index et un guide détaillent l’emplacement de chaque référentiel et expliquent comment récupérer les données. Ce manuel offre également aux générations futures un aperçu de ce qu'est un logiciel, une explication de l'open source et de son éthique.

Ces données sont ensuite conservées sur des bobines de film d’un kilomètre de long, fournies et encodées par Piql, une société norvégienne spécialisée dans le stockage de données à très long terme. Ainsi, il serait possible de conserver ces données pendant au moins 1000 ans. La mise en production de l’Arctic Code Vault prendra environ deux mois, et sera donc prête au printemps prochain.

Tags
Webcode
DPF8_169357