L'ADN pour le stockage de vastes données informatiques

Une étude révolutionnaire constitue une étape importante vers le développement d'un Dans l’ADNsystème de stockage basé sur des données numériques.

Ressources données, connaît aujourd’hui une croissance exponentielle en raison de notre dépendance aux gadgets et nécessite un stockage robuste à long terme. Le stockage des données devient peu à peu un défi car la technologie numérique actuelle n’est pas en mesure d’apporter une solution. Un exemple étant que plus de données numériques ont été créées au cours des deux dernières années que dans toute l'histoire du monde. ordinateurs, en fait, 2.5 quintillions d'octets {1 quintillion d'octets = 2,500,000 2,500,000,000 XNUMX téraoctets (To) = XNUMX XNUMX XNUMX XNUMX gigaoctets (Go)} de données sont créés chaque jour dans le monde. Cela inclut les données sur les sites de réseaux sociaux, les transactions bancaires en ligne, les enregistrements des entreprises et des organisations, les données satellitaires, la surveillance, la recherche, le développement, etc. Ces données sont énormes et non structurées. Par conséquent, répondre aux énormes besoins de stockage des données et à leur croissance exponentielle constitue désormais un défi de taille, en particulier pour les organisations et les entreprises qui ont besoin d’un stockage robuste à long terme.

Les options disponibles actuellement sont le disque dur, les disques optiques (CD), les clés USB, les lecteurs flash et les lecteurs de bandes plus avancés ou les disques optiques BluRay qui stockent environ jusqu'à 10 téraoctets (To) de données. De tels dispositifs de stockage, bien qu'utilisés couramment, présentent de nombreux inconvénients. Premièrement, ils ont une durée de conservation faible à moyenne et ils doivent être stockés dans des conditions de température et d'humidité idéales pour pouvoir durer plusieurs décennies et nécessitent donc des espaces de stockage physiques spécialement conçus. Presque tous consomment beaucoup d'énergie, sont encombrants et peu pratiques et peuvent être endommagés lors d'une simple chute. Certains d'entre eux sont très coûteux, sont souvent entachés d'erreurs de données et ne sont donc pas assez robustes. Une option qui a été universellement acceptée par l'organisation est appelée cloud computing - un arrangement dans lequel une entreprise loue essentiellement un serveur "extérieur" pour gérer tous ses besoins informatiques et de stockage de données, appelé "cloud". L'un des principaux inconvénients du cloud computing sont les problèmes de sécurité et de confidentialité et la vulnérabilité aux attaques de pirates. Il existe également d'autres problèmes tels que les coûts élevés impliqués, le contrôle limité par l'organisation mère et la dépendance à la plate-forme. Le cloud computing est toujours considéré comme une bonne alternative pour le stockage à long terme. Cependant, il semble que les informations numériques générées dans le monde dépassent certainement notre capacité à les stocker et des solutions encore plus robustes sont nécessaires pour répondre à ce déluge de données tout en offrant une évolutivité pour prendre également en compte les besoins de stockage futurs.

L'ADN peut-il aider au stockage informatique ?

Notre Dans l’ADN (acide désoxyribonucléique) est considéré comme un support alternatif intéressant pour le stockage de données numériques. Dans l’ADN est le matériel auto-réplicant présent dans presque tous les organismes vivants et constitue notre information génétique. Un artificiel ou synthétique Dans l’ADN est un matériau durable qui peut être fabriqué à l'aide de machines de synthèse d'oligonucléotides disponibles dans le commerce. Le principal avantage de l’ADN est sa longévité en tant que Dans l’ADN dure 1000 XNUMX fois plus longtemps que le silicium (puce de silicium – le matériau utilisé pour la construction ordinateurs). Étonnamment, un seul millimètre cube de Dans l’ADN peut contenir un quintillion d’octets de données ! Dans l’ADN est également un matériau ultracompact qui ne se dégrade jamais et peut être stocké dans un endroit frais et sec pendant des centaines de siècles. L'idée d'utiliser l'ADN pour le stockage existe depuis longtemps, depuis 1994. La raison principale est la manière similaire dont les informations sont stockées dans un ordinateur et dans notre système. Dans l’ADN – puisque les deux stockent les plans d’informations. Un ordinateur stocke toutes les données sous forme de 0 et de 1 et l'ADN stocke toutes les données d'un organisme vivant en utilisant les quatre bases : thymine (T), guanine (G), adénine (A) et cytosine (C). Par conséquent, l’ADN pourrait être appelé un périphérique de stockage standard, tout comme un ordinateur, si ces bases peuvent être représentées par des 0 (bases A et C) et des 1 (bases T et G). L’ADN est résistant et durable, la réflexion la plus simple étant que notre code génétique – le modèle de toutes nos informations stockées dans l’ADN – est transmis efficacement d’une génération à l’autre de manière répétée. Tous les géants du logiciel et du matériel informatique souhaitent utiliser l’ADN synthétique pour stocker de grandes quantités afin d’atteindre leur objectif consistant à résoudre l’archivage à long terme des données. L’idée est de convertir d’abord les codes informatiques 0 et 1 en code ADN (A, C, T, G), le code ADN converti est ensuite utilisé pour produire des brins d’ADN synthétiques qui peuvent ensuite être stockés au froid. Chaque fois que cela est nécessaire, les brins d'ADN peuvent être retirés de la chambre froide et leurs informations décodées à l'aide d'une machine de séquençage d'ADN et la séquence d'ADN sont finalement retraduites au format informatique binaire de 1 et de 0 pour être lues sur l'ordinateur.

Il a été montré1 que quelques grammes d’ADN seulement peuvent stocker des quintillions d’octets de données et les conserver intacts jusqu’à 2000 ans. Cependant, cette simple compréhension s’est heurtée à certains défis. Premièrement, il est assez coûteux et extrêmement lent d'écrire des données sur l'ADN, c'est-à-dire la conversion réelle des 0 et des 1 en bases d'ADN (A, T, C, G). Deuxièmement, une fois les données « écrites » sur l’ADN, il est difficile de trouver et de récupérer des fichiers et nécessite une technique appelée Dans l’ADN séquençage – processus de détermination de l’ordre précis des bases dans un Dans l’ADN molécule - après quoi les données sont décodées en 0 et 1.

Une étude récente2 par des scientifiques de Microsoft Research et de l'Université de Washington ont obtenu un « accès aléatoire » au stockage de l'ADN. L'aspect « accès aléatoire » est très important car cela signifie que l'information peut être transférée vers ou depuis un endroit (généralement une mémoire) dans lequel chaque emplacement, peu importe où dans la séquence, est accessible directement. En utilisant cette technique d'accès aléatoire, les fichiers peuvent être récupérés à partir du stockage d'ADN de manière sélective par rapport à auparavant, lorsqu'une telle récupération nécessitait de séquencer et de décoder un ensemble de données ADN complet pour trouver et extraire les quelques fichiers souhaités. L'importance de « l'accès aléatoire » est encore plus élevée lorsque la quantité de données augmente et devient énorme car elle réduit la quantité de séquençage qui doit être effectuée. C'est la première fois que l'accès aléatoire est montré à une si grande échelle. Les chercheurs ont également développé un algorithme pour décoder et restaurer les données plus efficacement avec une plus grande tolérance aux erreurs de données, ce qui accélère également la procédure de séquençage. Plus de 13 millions d'oligonucléotides d'ADN synthétiques ont été codés dans cette étude qui était des données d'une taille de 200 Mo composées de 35 fichiers (contenant de la vidéo, de l'audio, des images et du texte) d'une taille allant de 29 Ko à 44 Mo. Ces fichiers ont été récupérés individuellement sans erreur. En outre, les auteurs ont conçu de nouveaux algorithmes plus robustes et plus tolérants aux erreurs lors de l'écriture et de la lecture des séquences d'ADN. Cette étude publiée dans Nature Biotechnology dans une avancée majeure montrant un système viable à grande échelle pour le stockage et la récupération d'ADN.

Le système de stockage de l’ADN semble très attrayant car il présente une densité de données élevée, une stabilité élevée et est facile à stocker, mais il présente évidemment de nombreux défis avant de pouvoir être universellement adopté. Peu de facteurs sont le décodage de l'ADN (le séquençage) et la synthèse de l'ADN qui demandent beaucoup de temps et de travail. Dans l’ADN. La technique nécessite plus de précision et une couverture plus large. Même si des progrès ont été réalisés dans ce domaine, le format exact dans lequel les données seront stockées à long terme ainsi que Dans l’ADN est encore en évolution. Microsoft s'est engagé à améliorer la production d'ADN synthétique et à relever les défis pour concevoir un système pleinement opérationnel. Dans l’ADN système de stockage d'ici 2020.

***

Sources)

1. Erlich Y et Zielinski D 2017. DNA Fountain permet une architecture de stockage robuste et efficace. Science. 355 (6328). https://doi.org/10.1126/science.aaj2038

2. Organick L et al. 2018. Accès aléatoire dans le stockage de données ADN à grande échelle. Biotechnologie naturelle. 36. https://doi.org/10.1038/nbt.4079

***

Actualités

Météore produit un bolide et un bang supersonique en plein jour à travers la Nouvelle-Angleterre  

Un fort bang supersonique a été entendu et une boule de feu a été aperçue vers 18h06 UTC samedi 30...

Synthèse d'un analogue du ferrocène sans carbone

La synthèse du premier composé sandwich inorganique sans carbone (un composé d'osmium...

Épidémie de Bundibugyo Ebolavirus en RD du Congo et en Ouganda

L'épidémie actuelle d'orthoebolavirus en République démocratique du Congo...

Les Néandertaliens pratiquaient des interventions dentaires il y a 59 000 ans

La dentisterie préhistorique est bien plus ancienne que 14 000 ans...

Interfaces cerveau-ordinateur (ICO) : vers une fusion entre l'humain et l'IA 

Les essais cliniques en cours sur les interfaces cerveau-ordinateur (ICO)...

Champs de traitement des tumeurs (TTFields) approuvés pour le cancer du pancréas

Les cellules cancéreuses possèdent des parties chargées électriquement et sont donc influencées...

Bulletin

Ne manquez pas

Étude PRIME (essai clinique Neuralink) : le deuxième participant reçoit un implant 

Le 2 août 2024, Elon Musk a annoncé que son...

Hympavzi (marstacimab) : nouveau traitement pour l'hémophilie

Le 11 octobre 2024, Hympavzi (marstacimab-hncq), un anticorps monoclonal humain...

Changement climatique et canicules extrêmes au Royaume-Uni : 40°C enregistrés pour la première fois 

Le réchauffement climatique et le changement climatique ont conduit à...

The Fireworks Galaxy, NGC 6946 : Qu'est-ce qui rend cette galaxie si spéciale ?

La NASA a récemment publié la spectaculaire image lumineuse du...

Un nouveau médicament qui empêche les parasites du paludisme d'infecter les moustiques

Des composés ont été identifiés qui pourraient prévenir les parasites du paludisme...

Le minéral de magnésium régule les niveaux de vitamine D dans notre corps

Un nouvel essai clinique montre comment le magnésium minéral a...
Équipe SCIEU
Équipe SCIEUhttps://www.scientificeuropean.co.uk
Scientifique Européen® | SCIEU.com | Avancées significatives de la science. Impact sur l'humanité. Esprits inspirants.

Météore produit un bolide et un bang supersonique en plein jour à travers la Nouvelle-Angleterre  

Un fort bang supersonique a été entendu et une boule de feu a été observée vers 18h06 UTC le samedi 30 mai 2026 au-dessus de la Nouvelle-Angleterre, dans le nord-est des États-Unis. La boule de feu brillante (bolide) était…

Synthèse d'un analogue du ferrocène sans carbone

La synthèse du premier composé sandwich inorganique sans carbone (un ion osmium pris en sandwich entre deux cycles de bore) constitue une avancée fondamentale en chimie. Ce composé était recherché par les chimistes depuis…

Épidémie de Bundibugyo Ebolavirus en RD du Congo et en Ouganda

Il est confirmé que l'épidémie actuelle d'orthoebolavirus en République démocratique du Congo (RDC) et en Ouganda est causée par l'espèce Orthoebolavirus bundibugyoense (virus Bundibugyo),...