Le nouveau support de stockage de données de Microsoft pour 10 000 ans : le verre
Le stockage d’archives pose de nombreux défis. Nous voulons des supports extrêmement denses et stables pendant des siècles ou plus, et, idéalement, qui ne consomment aucune énergie lorsqu’ils ne sont pas consultés. Beaucoup d’idées ont circulé, même l’ADN a été considéré, mais l’une des plus simples est de graver des données dans le verre. De nombreuses formes de verre sont très stables physiquement et chimiquement, et il est relativement facile d’y graver des choses.
Il y a eu beaucoup de travaux préliminaires démontrant différents aspects d’un système de stockage basé sur le verre. Mais dans le numéro de mercredi de Nature, Microsoft Research a annoncé le Projet Silica, une démonstration fonctionnelle d’un système capable de lire et d’écrire des données dans de petites plaques de verre avec une densité de plus d’un mégaoctet par millimètre cube.
Écrire sur le verre
Nous avons tendance à penser au verre comme étant fragile, sujet à la casse et capable de s’écouler vers le bas au fil des siècles, bien que cette dernière affirmation soit un mythe. Le verre est une catégorie de matériaux, et divers produits chimiques peuvent former des verres. Avec le bon produit chimique de départ, il est possible de fabriquer un verre qui est, comme le disent les chercheurs, thermiquement et chimiquement stable et résistant à la pénétration de l’humidité, aux fluctuations de température et aux interférences électromagnétiques. Bien qu’il faudrait encore le manipuler de manière à minimiser les dommages, le verre offre le type de stabilité que nous souhaiterions pour un stockage à long terme.
Mettre des données dans le verre est aussi simple que de les graver. Mais c’est là l’un des défis, car la gravure est généralement un processus lent. Cependant, le développement de lasers femtosecondes, des lasers qui émettent des impulsions qui ne durent que 10 à 15 secondes et peuvent en émettre des millions par seconde, peut réduire considérablement les temps d’écriture et permettre de concentrer la gravure sur une très petite zone, augmentant ainsi la densité de données potentielle.
Pour relire les données, il existe plusieurs options. Nous avons déjà eu un grand succès en utilisant des lasers pour lire des données à partir de disques optiques, bien que lentement. Mais tout ce qui peut capter les petites caractéristiques gravées dans le verre pourrait théoriquement fonctionner.
Avec les considérations ci-dessus à l’esprit, tout était en place sur le plan théorique pour le Projet Silica. La grande question est de savoir comment les assembler dans un système fonctionnel. Microsoft a décidé que, juste par prudence, elle répondrait à cette question deux fois.
Un système réel
La différence entre ces deux réponses se résume à la façon dont une unité individuelle de données, appelée voxel, est écrite sur le verre. Un type de voxel qu’ils ont essayé était basé sur la biréfringence, où la réfraction des photons dépend de leur polarisation. Il est possible de graver des voxels dans le verre pour créer une biréfringence en utilisant de la lumière laser polarisée, produisant des caractéristiques plus petites que la limite de diffraction. En pratique, cela impliquait d’utiliser une impulsion laser pour créer un vide de forme ovale, suivie d’une seconde impulsion polarisée pour induire la biréfringence. L’identité d’un voxel est basée sur l’orientation de l’ovale ; puisque nous pouvons résoudre plusieurs orientations, il est possible d’enregistrer plus d’un bit dans chaque voxel.
L’approche alternative consiste à modifier l’ampleur des effets de réfraction en faisant varier la quantité d’énergie dans l’impulsion laser. Encore une fois, il est possible de discerner plus de deux états dans ces voxels, permettant de stocker plusieurs bits de données dans chaque voxel.
Les données cartographiques de Microsoft Flight Simulator gravées sur le support de stockage Silica.
La lecture de ces données dans Silica implique l’utilisation d’un microscope capable de détecter les différences d’indice de réfraction. Pour les passionnés de microscopie, c’est une façon de dire qu’ils ont utilisé la microscopie à contraste de phase. La microscopie fixe les limites du nombre de couches de voxels pouvant être placées dans un seul morceau de verre. Pendant la gravure, les couches étaient séparées par une distance suffisante pour qu’une seule couche se trouve dans le plan de mise au point du microscope à la fois. Le processus de gravure intègre également des symboles permettant au système de microscope automatisé de positionner la lentille au-dessus de points spécifiques sur le verre. De là, le système change lentement son plan focal, se déplaçant à travers la pile et capturant des images qui incluent différentes couches de voxels.
Pour interpréter ces images microscopiques, Microsoft a utilisé un réseau neuronal convolutif qui combine des données d’images qui sont à la fois dans et près du plan de mise au point pour une couche donnée de voxels. C’est efficace car l’influence des voxels voisins change la façon dont un voxel donné apparaît de manière subtile que le système d’IA peut détecter s’il dispose de suffisamment de données d’entraînement.
La dernière pièce du puzzle est l’encodage des données. Le système Silica prend le flux binaire brut des données qu’il stocke et ajoute une correction d’erreur en utilisant un code de parité de faible densité, la même correction d’erreur utilisée dans les réseaux 5G. Les bits voisins sont ensuite combinés pour créer des symboles qui tirent parti de la capacité des voxels à stocker plus d’un bit. Une fois qu’un flux de symboles est créé, il est prêt à être écrit sur le verre.
Performance
L’écriture reste un goulot d’étranglement dans le système, donc Microsoft a développé du matériel capable d’écrire une seule plaque de verre avec quatre lasers simultanément sans générer trop de chaleur. Cela suffit pour permettre une écriture à 66 mégabits par seconde, et l’équipe derrière le travail pense qu’il serait possible d’ajouter jusqu’à une douzaine de lasers supplémentaires. Cela pourrait être nécessaire, étant donné qu’il est possible de stocker jusqu’à 4,84 téraoctets dans une seule plaque de verre, les plaques mesurant 12 cm sur 12 cm et 0,2 cm d’épaisseur. Cela représente plus de 150 heures pour écrire complètement une plaque.
L’aspect jusqu’à du système de stockage a à voir avec la densité de données possible avec les deux différentes façons d’écrire les données. La méthode qui repose sur la biréfringence nécessite plus de matériel optique et ne fonctionne que dans des verres de haute qualité, mais peut compresser plus de voxels dans le même volume, et a donc une densité de données considérablement plus élevée. L’approche alternative ne peut mettre qu’un peu plus de deux téraoctets dans la même plaque de verre, mais peut être réalisée avec du matériel plus simple et peut fonctionner sur n’importe quel type de matériau transparent.
Le verre borosilicate offre une stabilité extrême ; les expériences de vieillissement accéléré de Microsoft suggèrent que les données seraient stables pendant plus de 10 000 ans à température ambiante. Cela a conduit Microsoft à déclarer : Nos résultats démontrent que Silica pourrait devenir la solution de stockage d’archives pour l’ère numérique.
Cela exagère peut-être un peu. Le télescope Square Kilometre Array, par exemple, devrait avoir besoin d’archiver 700 pétaoctets de données chaque année. Cela signifierait que plus de 140 000 plaques de verre seraient nécessaires pour stocker les données de ce seul télescope. Même en supposant que la vitesse d’écriture puisse être augmentée en ajoutant beaucoup plus de lasers, il faudrait plus de 600 machines Silica fonctionnant en parallèle pour suivre. Et le Square Kilometre Array est loin d’être le seul projet générant d’énormes quantités de données.
Cela dit, il y a des caractéristiques qui font de Silica une excellente solution pour ce genre de chose, notamment l’absence totale d’énergie nécessaire pour préserver les données, et le fait qu’elles peuvent être récupérées rapidement si nécessaire, un contraste marqué avec les jours nécessaires pour récupérer des informations à partir de l’ADN, par exemple. De plus, je suis personnellement attiré par un système avec un support de stockage qui ressemble à quelque chose sorti tout droit de la science-fiction.






