Du data center à la capsule ADN – sobriété numérique
Février 2023
Décryptages du gf2i : « Du data center à la capsule ADN : une solution pour la sobriété numérique ?»
La première session des « Décryptages du gf2i » a eu lieu le 24 janvier dernier sur le thème « Du data center à la capsule ADN : une solution pour la sobriété numérique ?».
Pascal BARBRY, directeur de recherche CNRS, chef de l’équipe Physiologie Génomique à l’IPMC (Institut de Pharmacologie Moléculaire et Cellulaire de Sophia-Antipolis), a présenté l’état des recherches concernant le stockage de données sur ADN de synthèse.
Ces travaux partent du double constat de la croissance exponentielle des données et de l’insuffisance des capacités de stockage pour répondre à cette accélération. 80 % des données constituent des données froides auxquelles il n’est jamais accédé bien que leur conservation soit obligatoire. Or, celle-ci nécessite le recours à d’immenses data centers gros consommateurs d’espaces et d’énergie. Il est donc essentiel de développer des solutions alternatives moins énergivores pour stocker ces données.
L’ADN est le support de l’information génétique des êtres vivants. Les découvertes le concernant sont relativement récentes (structure en double hélice de l’ADN découverte en 1953, premier séquençage en 1977, séquençage du génome humain en 2003), mais la connaissance a ensuite très rapidement évolué. Les travaux sur l’ADN ont établi qu’il offre une formidable capacité de stockage et une grande durabilité (il a ainsi été possible de séquencer le génome d’un humain préhistorique ayant vécu il y a plusieurs dizaines de milliers d’années).
Les informaticiens ont compris l’intérêt de ces caractéristiques et travaillent au développement de l’ADN synthétique pour retrouver ces qualités. Bien stocké (préservé de l’oxygène, de l’eau et de la lumière), cet ADN pourrait être récupéré des milliers d’années plus tard après stockage de très grandes quantités de données dans des mini-capsules métalliques.
Toutefois, en l’état actuel de la recherche, cette technologie doit relever trois défis.
- Le premier concerne le coût : la création de l’ADN synthétique est lente et coûteuse. Sa démocratisation permettra de faire baisser les coûts, certes, mais il convient d’accélérer le processus de synthèse pour arriver à concurrencer les serveurs traditionnels.
- Le deuxième réside dans la capacité à produire des systèmes d’encodage/décodage en s’assurant de ne pas altérer la donnée recueillie.
- Le troisième est de savoir récupérer de façon ciblée la donnée stockée dans la capsule. Si des millions de données se trouvent dans une capsule, il faut être capable d’identifier rapidement dans ce stock les données à retrouver et décoder.
Ces trois défis ne pourront être relevés que grâce à des recherches multidisciplinaires en chimie, informatique et biologie au sein des laboratoires européens. La France dispose de compétences réelles avec quelques start-ups reconnues dans le domaine (Imagene, Biomemory, etc.) et il s’agit désormais de passer à la vitesse supérieure et au niveau européen.
Les « Décryptages du gf2i », nouvel espace d’échange et d’information des membres du gf2i, sont des sessions de courte durée (30 minutes d’intervention et 15 de Q/R) en distanciel pour partager l’expertise d’un invité (membre ou non du gf2i) sur un thème ciblé permettant d’appréhender les évolutions de nos environnements.