Informations

L'ADN comme support de stockage numérique ; séquences algorithmiquement évitées pour des raisons de sécurité (ou devraient-elles l'être) ?

L'ADN comme support de stockage numérique ; séquences algorithmiquement évitées pour des raisons de sécurité (ou devraient-elles l'être) ?


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

La sécurité pour l'environnement est probablement aussi implicite ici, mais l'accent devrait être mis sur les personnes susceptibles d'entrer en contact avec de grandes quantités d'ADN synthétique utilisé pour coder l'information en tant que support de stockage de données.


L'idée d'utiliser l'ADN comme support de stockage numérique n'est pas nouvelle. Deux articles sont énumérés ci-dessous, mais il y en a beaucoup d'autres.

Récemment, le concept a été mis en évidence par l'annonce d'un "film" encodé à l'aide de CRISPR-Cas. Une vidéo de l'Université Harvard explique le processus :

Dans cette vidéo, les chercheurs du Wyss Institute et de la Harvard Medical School, George Church et Seth Shipman, expliquent comment ils ont conçu une nouvelle technologie basée sur le système CRISPR qui permet l'enregistrement chronologique d'informations numériques, comme celles représentant des images fixes et animées, dans des bactéries vivantes. Crédit : Institut Wyss de l'Université Harvard

Pour plus d'informations, veuillez visiter : https://wyss.harvard.edu/taking-cells…

au dessous de: un GIF montrant les données originales, et le "film" interprété à partir de l'enregistrement dans l'ADN. Du Los Angeles Times :

DVR ADN ? Les scientifiques ont téléchargé un court métrage d'un cheval au galop dans l'ADN de bactéries vivantes et ont pu le récupérer avec un taux de réussite de 90 %. (Seth Shipman)

L'application immédiate dans le travail du Harvard Wyss Institute semble être (d'après ma compréhension de la vidéo) in situ l'enregistrement des données, où les informations pertinentes pour une expérience sont enregistrées dans l'ADN des cellules impliquées dans l'expérience. Ainsi, l'utilisation d'une image en mouvement est un moyen de ramener à la maison le point clé de « l'enregistrement chronologique de l'information numérique ».

D'autres utilisations impliquent l'ADN lui-même, stocké à l'extérieur des cellules vivantes, en tant que simple support de stockage de masse.

QUESTION: Je me demande s'il y a des séquences qui sont susceptibles d'être évitées algorithmiquement en tant que pratique standard pour des raisons de sécurité (ou devraient l'être) lors de l'utilisation de l'ADN comme support de stockage numérique. L'ADN peut être manipulé par du personnel informatique plutôt que par des biologistes qualifiés, ou expédié, ou autrement ne pas être traité avec la même diligence en matière de sécurité que l'ADN synthétique est manipulé par les chercheurs aujourd'hui.

Quelques autres discussions sur l'ADN en tant que support de stockage :

Stockage d'informations numériques de nouvelle génération dans l'ADN, Église, Gao, Kosari, 2012. doi:10.1126/science.1226355

Vers un stockage d'informations pratique, de grande capacité et nécessitant peu d'entretien dans l'ADN synthétisé, Goldman et al. 2013. doi: 10.1038/nature11875


Pour plus d'informations sur le travail de données codées temporellement, voir le excellentes réponses À la question Que signifie « écrire une image et un GIF dans l'ADN des bactéries » ?

Éditer: Je vais citer un commentaire ici juste pour m'assurer que le mot sécurité n'est pas mal interprété comme intégrité des données ou la sécurité des bactéries:

Quand on parle de des problèmes de sécurité liées à la manipulation d'échantillons biologiques ou biomoléculaires, c'est la sécurité des personnes qui nous préoccupe. Règles de sécurité, procédures de sécurité, cours de sécurité, lunettes de sécurité, ce sont pour la sécurité de l'humain, pas la sécurité de l'échantillon.


Oui, il pourrait y avoir des séquences qu'un système basé sur l'ADN ne pourrait pas stocker/très bien gérer : des séquences d'ADN répétitives.

Non seulement de telles séquences posent de nombreux problèmes lors du séquençage («lecture des données»), mais elles sont également plus susceptibles de former des éléments de structure secondaires tels que des boucles, car l'ADN répétitif peut se lier à lui-même de différentes manières. Cela signifie que, à l'instar des répétitions naturelles, ils sont plus susceptibles de muter pendant l'amplification de l'ADN (le nombre de « copies » peut assez facilement changer), ce qui rend les « données » plus instables.

Un moyen possible de résoudre ce problème serait d'utiliser des formats de données spécialisés qui évitent autant que possible la répétition des données (similaire au fonctionnement des fichiers zip ou jpg)

Sinon, je suis d'accord avec Nathan, que l'ADN en soi n'est pas dangereux (puisqu'il ne fera rien en dehors des cellules, et les bactéries utilisées en biologie moléculaire sont généralement inoffensives à moins que vous ne commenciez à les manger en grande quantité ou à les faire entrer dans votre corps). ). La possibilité que l'ADN puisse en quelque sorte coder pour des protéines toxiques est très très faible, et vous pouvez simplement vérifier que les « données » dans l'ADN ne forment pas une protéine par hasard de toute façon.


Même si les lecteurs d'ADN (pour lui donner un nom) sont manipulés par des professionnels de l'informatique au lieu de biologistes qualifiés, nous pouvons toujours nous attendre à ce que l'environnement soit suffisamment propre pour qu'aucun organisme n'ait tendance à en être affecté. De plus, comme le souligne @nathan dans l'autre réponse, l'ADN libre ne peut rien faire par lui-même. C'est comme un livre ouvert, vous ne pouvez rien en tirer à moins d'avoir un lecteur (protéine) pour cela. Il n'y a eu aucun rapport affirmant que l'ADN étranger (appelé ADN acellulaire ou ADN cf pour l'homme) n'a jamais causé de problèmes de santé. En fait, il n'y a aucun rapport de cf-ADN même transcrit par des humains. Vous voudrez peut-être aussi y jeter un œil pour en savoir plus. Cependant, comme l'a souligné @AlanBoyd dans les commentaires, les organismes résidant à l'intérieur des humains pouvez capter l'ADN flottant librement de leur environnement. Par exemple, Heliobacter pylori a été montré par Stingl et al, 2009 pour reprendre l'ADN libre de son environnement. En gardant cela à l'esprit, il y a des chances que les lecteurs d'ADN puissent être nocifs (si, par hasard, le lecteur contient des gènes qui pourraient fournir une certaine résistance aux antibiotiques à l'agent pathogène). Certains microbes présentent un phénomène connu sous le nom de compétence naturelle, c'est-à-dire qu'ils prélèvent simplement l'ADN plasmidique de leur environnement, le divisent en parties par des enzymes de restriction et l'ajoutent dans leur génome. Ces organismes, qui possèdent généralement des pilules sexuelles pour l'absorption d'ADN, peuvent constituer une menace majeure pour l'utilisation du lecteur d'ADN si les utilisateurs de lecteurs d'ADN font preuve de prudence lors de la manipulation et de la manipulation de l'ADN, car une partie de cet ADN pourrait leur fournir une résistance ou une capacité aux antibiotiques. d'infecter les humains. Cependant, nous pouvons empêcher cela en veillant à ce qu'il n'y ait pas de sites de reconnaissance d'enzymes de restriction dans l'ADN du lecteur, de sorte que l'organisme ne puisse pas couper l'ADN pour la ligature dans son propre génome.


Je dirais non pour deux raisons.

La première est que je ne connais aucune séquence d'ADN qui soit en soi infectieuse. Vous auriez besoin de la machinerie cellulaire appropriée pour en faire quoi que ce soit. Si je ne me trompe pas, même la plupart des procaryotes ont des défenses variées contre l'incorporation de morceaux aléatoires d'ADN dans leurs systèmes. Sinon, ils n'auraient jamais de cœurs stables. Les virus et les bactéries, etc. doivent utiliser des stratégies pour contourner ces systèmes de défense.

La deuxième raison, même si je me trompe sur la première, est que ce système doit être conçu pour être le plus libre possible des influences extérieures. Un système conçu pour minimiser l'influence externe minimise également de manière inhérente l'influence vers l'extérieur, au moins dans ce cas.

Cela ne serait pas géré par les informaticiens à moins qu'il ne soit massivement automatisé d'une manière ou d'une autre. Encore une fois aucune idée de la forme finale, donc difficile à dire.


Je me demande s'il y a des séquences qui sont susceptibles d'être évitées algorithmiquement en tant que pratique standard pour des raisons de sécurité (ou devraient l'être) lors de l'utilisation de l'ADN comme support de stockage numérique.

Je ne pense pas que les séquences elles-mêmes soient le problème ici, autant que la procédure utilisée pour les intégrer dans des bactéries pour le stockage de données, qui, à mon avis, ne présente pas de risque direct pour l'homme.

Dans l'article Shipman-Church, les données d'images vidéo sont codées en morceaux de 27 bases de long, interrompus par de courts espaceurs PAM et des codes-barres pour faciliter le reséquençage (pour la lecture des données dans le temps).

Les plus gros oligonucléotides de 35 bases sont administrés à la bactérie hôte par électroporation - choquant efficacement les cellules, ce qui ouvre la membrane cellulaire pour permettre aux oligonucléotides de pénétrer dans le système Cas1/Cas2 existant de la bactérie pour s'intégrer dans le génome.

L'électroporation peut être utilisée pour délivrer des oligos in vitro, dans des cultures de cellules humaines, mais généralement pas dans des humains vivants. Des protocoles de sécurité et de contamination en laboratoire sont utilisés pour éviter l'exposition aux réactifs et limiter les risques d'électrocution.

Même ainsi, choquer les gens ne suffirait pas car les séquences elles-mêmes ne suffisent pas à constituer le risque. Efforts d'édition de gènes humains CRISPR in vivo se concentrent généralement sur le système Cas9. Les cellules humaines n'expriment pas Cas9, de sorte que la protéine bactérienne aurait été livrée avec la séquence cible, qui utiliserait des techniques de livraison non utilisées dans cet article (par exemple, injection ou livraison à base de lipides).

Cela peut même devoir être fait de manière à contourner l'immunité à la protéine Cas9, ou être dirigé contre les cellules souches ou une autre population spécifique aux cellules pour avoir l'effet souhaité.

Une séquence de 27 bases pourrait théoriquement cibler des gènes critiques pour la santé - par exemple, la suppression ou l'insertion d'une séquence de 27 bases dans un oncogène ou un gène suppresseur de tumeur, par exemple, fourni avec la plate-forme CRISPR-Cas9. Mais pour administrer cela, vous auriez besoin d'un protocole entièrement différent de celui décrit dans l'article de Shipman-Church, afin que ce support de stockage commence à créer la possibilité d'un danger pour la sécurité des humains.


En allant au papier Goldman-Birney (paywall), ils ne stockent pas leurs données dans des bactéries, mais synthétisent simplement des chaînes d'oligonucléotides d'ADN et les stockent efficacement dans des gouttes de graisse (littéralement). Lorsqu'ils souhaitent récupérer des données, ils effectuent un séquençage au fusil de chasse avec une couverture élevée pour récupérer la séquence d'origine.

A ce titre, il n'y a pas de risque réel d'incorporation dans des cellules humaines, à part la micro-injection, et donc pas de risque réel direct de sous-séquences transcrites et traduites en protéines pathogènes ou particules virales, etc.

Bien que les données de séquence puissent elles-mêmes contenir des agents pathogènes, votre informaticien devrait apporter sa propre machinerie et protocoles protéiques pour que quelque chose de néfaste se produise. Le séquençage est ce qui est fait pour affecter la récupération des données, pas la transcription/traduction, et le séquençage n'active aucun code dans la séquence sous-jacente.


Voir la vidéo: Sauvegarder les données sur un support de stockage (Décembre 2022).