Informations

Quelle est la langue d'enseignement de l'ADN?

Quelle est la langue d'enseignement de l'ADN?


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

L'ADN porte la plupart des instructions génétiques utilisées dans le développement, le fonctionnement et la reproduction de tous les organismes vivants connus et de nombreux virus (Wikipédia).

Sait-on déjà comment les séquences d'ATCG créent ces instructions ? Ou de manière équivalente, quel est le langage d'enseignement de l'ADN ? Mon intérêt dans cette question est de savoir si nous comprenons déjà comment les séquences d'ATCG peuvent créer, par exemple, un épiderme humain avec un excès d'un minéral déterminé ou changer la forme des cellules pour des géométries plus fondamentales (triangles, rectangles, losanges, etc.).

S'il vous plaît, pardonnez-moi pour cette question stupide : je ne suis pas un biologiste.


Ce langage s'appelle le code génétique. Mais avant de parler de ce code spécifique, il est important de parler de la façon dont le code est lu. Veuillez noter que la réponse ci-dessous est une simplification de la réalité.

Mécanisme par lequel le code est lu

Pour faciliter les choses (la réalité est un peu plus compliquée), l'ADN est "formaté" en ARN qui est ensuite "formaté" en protéines. Lorsque le "formatage" se produit, nous ne perdons pas le format précédent mais nous avons seulement copié les informations dans un nouveau format. Le formatage de l'ADN en ARN est appelé transcription et le formatage de l'ARN en protéines est appelé traduction.

Les protéines sont les unités actives qui affectent les activités cellulaires. L'activité des protéines est fonction de leur séquence. En conséquence, le langage/code que nous devons comprendre est la relation entre l'ADN et les protéines.

Systèmes numériques de l'ADN

L'ADN, comme vous l'avez dit, est écrit en quaternaire (=système numérique à la base 4). Les quatre lettres sont appelées A, T, C et G qui signifie Adénine, Thymine, Cytosine et Guanine (4 nucléotides).

Systèmes numériques de protéines

Les protéines, quant à elles, sont codées dans un système en base 21 (21 acides aminés).

Redondance

Parce que $4^2=16<21$, nous devons utiliser (au moins) 3 lettres dans l'ADN pour coder 1 acide aminé. Parce que $4^3=64>21$, nous avons nécessairement plusieurs codes de 3 nucléotides qui correspondent au même acide aminé. Nous parlons de redondance. En informatique, un octet est une suite de 8 bits. En biologie, un codon est une série de 3 nucléotides.

Code

Ci-dessous le code :

, oùPhe,Leu,Ser, etc… sont l'abréviation d'acides aminés spécifiques.Phepar exemple est la phénylallanine.

Comme vous pouvez le voir dans le tableau ci-dessus, la plupart de la redondance est causée par des changements dans la troisième lettre du codon. Plus d'informations sur les raisons pour lesquelles c'est le cas sur ce post.

Il existe 4 codons spéciaux.

  • AOT: Est le début codons. C'est une indication de l'endroit où la traduction doit commencer.
  • UAG,SAUetUGAsommes arrêter codons. Ils indiquent où la traduction doit s'arrêter.

Confusions possibles

Dogme central de la biologie moléculaire

La relation unidirectionnelle entre l'ADN, l'ARN et les protéines a été appelée le dogme central de la biologie moléculaire. Bien sûr, il n'y a pas de place pour le dogme en science et le terme est très mal utilisé. Il est intéressant de noter que le dogme central de la biologie moléculaire est partiellement faux car cette relation entre l'ADN, l'ARN et les protéines n'est pas nécessairement unidirectionnelle. La transcriptase inverse est une enzyme qui reformate l'ADN à partir de l'ARN.

Code génétique

Si vous recherchez sur Google "code génétique", la plupart des résultats afficheront la lettreUau lieu de la lettreT. La raison en est que le code est souvent présenté pour la relation entre l'ARN et l'ADN et la seule différence dans le code entre l'ARN et l'ADN est queT(Thymine) est remplacé parU(Uracile).

ARNm vs ARN

Tous les ARN ne sont pas destinés à être traduits en protéines. Seuls les ARNm (m signifie « messager ») le sont. Par exemple, le processus de traduction est lui-même catalysé par l'ARN (appelé ARNr, où « r » signifie « ribosomique »)

Notez également que l'ADN est d'abord transcrit en pré-ARNm qui est ensuite modifié en ARNm avant d'être traduit.

Tout l'ADN est-il transcrit ?

Non. Chez les eucaryotes (qui comprennent à peu près tous les êtres vivants auxquels vous pouvez penser à l'exception des bactéries et des virus), la plupart de l'ADN n'est pas transcrit. Le reste est utilisé à des fins réglementaires ou peut ne pas être utilisé du tout. Les régions (appelées locus/loci) de l'ADN en cours de transcription sont appelées gènes


Les fonctions de l'ADN et des protéines sont déterminées par leur forme, et bien que leur forme soit principalement déterminée par leur séquence, il n'existe aucun moyen informatique de concevoir des protéines à partir de zéro pour faire ce que nous voulons. La modélisation est tout simplement trop complexe.


Le code génétique

Considérez les quatre nucléotides qui composent l'ADN comme les lettres d'un alphabet. Pour épeler un mot (dans ce cas un acide aminé), trois “lettres” de notre alphabet sont nécessaires. Étant donné que seulement environ 20 acides aminés composent toutes les protéines, avoir un alphabet de quatre lettres est plus que suffisant pour épeler les 20 “mots” (voir les calculs qui suivent). Le code génétique est universel (presque) pour tous les êtres vivants. Cela signifie que le code triplet épelle le même acide aminé dans différents organismes, des dauphins aux plantes en passant par les bactéries !

Séquence de nucléotides # Acides aminés codés
une 4 1 = 4 (pas assez)
deux 4 2 =16 (pas assez)
Trois 4 3 =64 (plus qu'assez)


CHANGER LA LANGUE DE L'ADN

L'ADN est le code génétique de la vie - une sorte de manuel d'instructions moléculaires qui se transmet de la cellule mère à la cellule fille. Cet ensemble d'instructions est lu par la cellule et traduit en protéines, qui remplissent des fonctions spécifiques au sein de la cellule. La molécule d'ADN elle-même est constituée d'une séquence linéaire de quatre désoxyribonucléotides : l'adénine (A), la guanine (G), la cystéine (C) et la thymine (T), qui forment à leur tour l'alphabet de l'information génétique. La séquence de ce code linéaire conduit à la synthèse de protéines à travers les processus cellulaires de transcription et de traduction. Pour vous donner une idée générale des choses, les cellules transcrivent d'abord les informations de l'ADN en ARN messager (ARNm), une sorte de copie temporaire du gène. L'ARNm est ensuite lu trois nucléotides à la fois (connu sous le nom de codon triplet – qui, si nous considérons les nucléotides comme des lettres de l'alphabet, les codons triplets sont les mots), traduit en une chaîne d'acides aminés et, après quelques modifications , devient une protéine. Cette série d'événements est communément appelée Le dogme central. C'est ainsi que les choses fonctionnent, des règles à respecter si vous le souhaitez. Cependant, récemment, dans la bactérie E. coli, les scientifiques ont modifié la machinerie cellulaire pour lire et traduire un quadruplé codon[1], élargissant la capacité de codage de l'ADN et le langage des gènes.


Figure 1 : Transcription et traduction.

ARNm en protéine : la machinerie translationnelle

La traduction est le processus par lequel l'ARNm est lu et traduit en une chaîne d'acides aminés. Ce processus a lieu au niveau des organites appelés ribosomes, qui se lient et glissent le long de l'ARNm et servent de cadre pour la traduction du message génétique. Au fur et à mesure que chaque codon triplet est lu (par exemple AGC), une molécule d'ARN de transfert (ARNt) apporte un acide aminé spécifique au ribosome, et cet acide aminé est ensuite chimiquement lié à l'acide aminé précédent par une liaison peptidique. Fondamentalement, ces molécules d'ARNt sont comme des serveurs. Chacun est entraîné à prendre une commande spécifique à partir d'un certain codon triplet et à récupérer l'acide aminé correspondant à cette commande. Sur un bras du ‘T’ se trouve une boucle d'anticodon contenant le codon triplet complémentaire (pour ACG, ce serait UGC) à celui de l'ARNm. Sur un autre bras se trouve une tige acceptrice qui se fixe à l'acide aminé correspondant au codon triplet (dans ce cas la sérine). Une fois que la molécule d'ARNt a livré son acide aminé au complexe de traduction, elle flotte pour être rechargée avec un autre acide aminé. Ceci est fait par des enzymes appelées aminoacyl-ARNt synthétases (ARS), qui reconnaissent à la fois la boucle anticodon et la tige acceptrice des ARNt et attachent l'acide aminé correspondant. Ces ARS garantissent essentiellement que les serveurs d'ARNt prennent la bonne commande. Une fois la chaîne d'acides aminés transcrite, elle est repliée et modifiée pour devenir une protéine.

Étude sur les acides aminés et les protéines non naturels

Alors pourquoi quelqu'un voudrait-il modifier le langage de l'information génétique ? La réponse réside dans notre besoin d'étudier les protéines et les processus cellulaires dont elles sont responsables. Un code génétique élargi permet l'incorporation d'acides aminés non naturels dans les protéines, ouvrant la porte à des méthodes expérimentales auparavant indisponibles. Bien que la mutation de l'ADN par mutagenèse dirigée ait longtemps été utilisée pour échanger un acide aminé naturel contre un autre, cette approche est limitée à l'échange entre les propriétés trouvées dans la nature. Par exemple, l'acide aminé asparagine, qui est polaire, peut être remplacé par de la leucine, qui ne l'est pas. Cependant, des acides aminés non naturels peuvent être créés avec des propriétés qui peuvent servir de nouveaux outils dans l'étude des protéines [2]. Voici quelques possibilités :

– Sondes biophysiques : les acides aminés modifiés contenant des groupes fluorescents peuvent être utilisés pour visualiser la localisation des protéines et les interactions protéine-protéine au sein d'une cellule. Les acides aminés avec des modifications ajoutées synthétiquement, comme les chaînes latérales phosphorylées ou glycosylées, peuvent également être utilisés pour étudier l'effet de ces modifications intracellulaires naturelles sur la structure et la fonction des protéines.

– Groupes photoréactifs : les acides aminés avec des groupes photoréactifs peuvent être utilisés comme déclencheur induit par la lumière qui peut activer une certaine fonction protéique. Des études ont utilisé des chaînes latérales « en cage » qui cachent des parties réactives ou importantes d'une protéine. La photodécroissance sert alors à « allumer » le système pour l'étude.

Étiquettes structurelles : les atomes lourds ou les étiquettes de spin peuvent être utilisés dans les méthodes utilisées pour les études structurelles telles que la spectroscopie, la RMN et la cristallographie.

Travaux antérieurs sur l'expansion du code génétique

A la fin de chaque gène se trouve l'un parmi plusieurs arrêter codons. Ceux-ci conduisent au recrutement d'un ARNt correspondant qui termine la transcription du gène. La découverte que certains ARNt mutés pouvaient supprimer ces codons ambres ou stop a été faite il y a trente ans [3]. Depuis lors, les ARNt suppresseurs d'ambre ont été largement étudiés comme moyen d'insérer un acide aminé non naturel dans une protéine.

Il y a, cependant, un problème à essayer d'utiliser des codons d'arrêt pour coder des acides aminés non naturels, il n'y a qu'un nombre limité de ces codons d'arrêt. Par conséquent, un tel système de traduction modifié peut au mieux ajouter un ou deux acides aminés modifiés dans une protéine. Le fait d'avoir des ARNt suppresseurs codant pour des codons d'arrêt pourrait également affecter la traduction de nombreux autres gènes. L'utilisation d'un code génétique étendu avec un codon quadruplet comme moyen d'ajouter des acides aminés non naturels contourne ces restrictions. Tous les ARNt modifiés et les aminoacyl-ARNt synthétases peuvent utiliser un tout nouvel ensemble de "mots" génétiques à quatre lettres indépendants des codons triplets naturels.

Des ARNt capables de lire un codon quadruplet ont été trouvés naturellement en tant que suppresseurs de frameshift. Ils ont été nommés ainsi parce qu'ils suppriment les mutations de l'ADN qui ajoutent un seul nucléotide. Un tel ajout, sans la présence du suppresseur de décalage de trame, entraînerait un déphasage de tous les codons triplets suivants. En d'autres termes, si une seule lettre est ajoutée à la phrase “THE CAT WAS FAT” et que l'espacement est conservé le même, la phrase devient “THX ECA TWA SFA”. La phrase n'a plus de sens. La même chose arrive aux codes génétiques lorsque vous ajoutez un “ supplémentaireX” nucléotide, c'est ce qu'on appelle une mutation de décalage du cadre de lecture. L'analyse de ces ARNt suppresseurs de déphasage a révélé qu'ils avaient une seule base ajoutée dans leur boucle d'anticodon, leur permettant de lire un codon de quatre bases correspondant sur l'ARNm. Depuis leur découverte, les ARNt modifiés ont été utilisés pour incorporer des acides aminés naturels en réponse à des codons quadruplés dans E. coli [4]

Codons quadruplés et acides aminés non naturels

Afin de créer un in vivo système capable de transcrire un codon quadruplet en un acide aminé non naturel, vous avez besoin de quatre choses. (1) La première exigence est un acide aminé non naturel. Dans leur article, Schultz et al. utilisé homoglutamine car il est très similaire au résidu de glutamine naturel. (2) Un gène muté contenant un nucléotide supplémentaire formant un codon quadruplet est également nécessaire. Dans ce cas, AGGA a été utilisé. Ceci est relativement facile à créer en utilisant la technique de mutagenèse dirigée. (3) Il faut également un ARNt muté qui puisse être spécifiquement chargé avec l'acide aminé non naturel et qui soit capable de reconnaître le codon quadruplet. (4) Enfin, une aminoacyl-ARNt synthétase mutée est nécessaire pour charger spécifiquement l'ARNt susmentionné avec l'acide aminé non naturel. Ces deux derniers composants ont occupé le plus de temps dans le laboratoire de Schultz.

Pour que l'expérience fonctionne, l'ARNt du codon quadruplet et l'aminoacyl-ARNt synthétase doivent être orthogonaux. Cela signifie que l'ARNt ne peut pas être chargé de naturel E. coli les aminoacyl-ARNt synthétases et l'homoglutamine-ARNt synthétase ne doivent pas charger la E. coli ARNt. Cela garantit que seul le gène avec le codon quadruplet ajouté peut incorporer l'homoglutamine dans la protéine. Pour augmenter la probabilité d'orthogonalité, les candidats ARNt et ARS ont été choisis parmi les membres de la famille des archaebactéries – choisis parce qu'ils sont très distincts de la E. coli versions. Pour que l'ARNt puisse lire le codon quadruplet AGGA, la séquence de la boucle anticodon a été remplacée par la séquence UCCU complémentaire. De plus, la tige acceptrice a été mutée pour s'adapter à la fixation de l'acide aminé homoglutamine non naturel.


Figure 2 : Un acide aminé modifié est ajouté
à une protéine en utilisant un codon quadruplet.

S'assurer que les aminoacyl-ARNt synthétases (ARS) chargent l'ARNt mutéUCCU avec l'homoglutamine a nécessité deux changements. Premièrement, des résidus spécifiques dans le site actif de l'ARS ont été modifiés afin qu'il se lie à la fois à l'ARNtUCCU tige acceptrice et homoglutamine. Deuxièmement, la partie de l'ARS qui reconnaissait la boucle d'anticodon de l'ARNt a été supprimée. Cela évite d'avoir à passer à l'ARS pour reconnaître un codon quadruplet sur l'ARNt. Étant donné que la reconnaissance de l'ARNt approprié se produit déjà dans le site actif, la spécificité est maintenue.

Étonnamment, avec ces quelques changements apportés à deux acteurs clés du processus transcriptionnel, Shultz et al. changé un processus fondamental de la vie. Ce travail préliminaire démontre que la possibilité de modifier les gènes pour mieux comprendre leur fonction ne se limite pas aux acides aminés naturels et au codon triplet standard. Bien que dans ce cas, un homologue proche ait été utilisé comme acide aminé non naturel codé, il est possible d'utiliser de nouveaux résidus pour étudier la structure et la fonction des protéines.

Anderson, J.C., Wu, N., Santoro, S.W., Lakshman, V., King, D.S., & Schultz, P.G. Un code génétique étendu avec un codon quadruplet fonctionnel. PNAS 101, 7566-71 (2004).

Dougherty, D.A. Acides aminés non naturels comme sondes de la structure et de la fonction des protéines. Opinion actuelle en biologie chimique 4, 645-52 (2000).

Capecchi, M.R., Hughes, S.H., Wahl, G.M. Les super-suppresseurs de levure sont des ARNt altérés capables de traduire un codon non-sens in vitro. Cellule 6, 269-77 (1975).

O’Connor, M. Les insertions dans la boucle anticodon de tRNAGln (sufG) et tRNALys favorisent le décodage quadruplet de CAAA. Nucleic Acids Research 30, 1985-90 (2002).


L'ADN n'est peut-être pas le livre d'instructions de la vie - juste une liste confuse d'ingrédients

La vision commune de l'hérédité est que toutes les informations transmises d'une génération à l'autre sont stockées dans l'ADN d'un organisme. Mais Antony Jose, professeur agrégé de biologie cellulaire et de génétique moléculaire à l'Université du Maryland, n'est pas d'accord.

Dans deux nouveaux articles, Jose soutient que l'ADN n'est que la liste des ingrédients, pas l'ensemble d'instructions utilisées pour construire et maintenir un organisme vivant. Les instructions, dit-il, sont beaucoup plus compliquées et elles sont stockées dans les molécules qui régulent l'ADN d'une cellule et d'autres systèmes fonctionnels.

Jose a décrit un nouveau cadre théorique pour l'hérédité, qui a été développé au cours de 20 années de recherche sur la génétique et l'épigénétique, dans des articles évalués par des pairs dans le Journal de la Royal Society Interface et la revue BioEssais. Les deux articles ont été publiés le 22 avril 2020.

L'argument de Jose suggère que les scientifiques négligent peut-être des voies importantes pour l'étude et le traitement des maladies héréditaires, et les croyances actuelles sur l'évolution peuvent être trop axées sur le rôle du génome, qui contient tout l'ADN d'un organisme.

"L'ADN ne peut pas être considéré comme le" modèle "de la vie", a déclaré Jose. "Il s'agit au mieux d'une liste d'ingrédients qui se chevauchent et potentiellement brouillés qui sont utilisés différemment par différentes cellules à différents moments."

Par exemple, le gène de la couleur des yeux existe dans chaque cellule du corps, mais le processus qui produit la protéine de la couleur des yeux ne se produit qu'à un stade spécifique du développement et uniquement dans les cellules qui constituent la partie colorée des yeux. Cette information n'est pas stockée dans l'ADN.

De plus, les scientifiques sont incapables de déterminer la forme complexe d'un organe tel qu'un œil, ou qu'une créature aura des yeux, en lisant l'ADN de la créature. Ces aspects fondamentaux de l'anatomie sont dictés par quelque chose en dehors de l'ADN.

Jose soutient que ces aspects du développement, qui permettent à un œuf fécondé de passer d'une seule cellule à un organisme complexe, doivent être considérés comme faisant partie intégrante de l'hérédité. Le nouveau cadre de Jose redéfinit l'hérédité comme un système d'information complexe et en réseau dans lequel toutes les molécules régulatrices qui aident la cellule à fonctionner peuvent constituer une réserve d'informations héréditaires.

Michael Levin, professeur de biologie et directeur du Tufts Center for Regenerative and Developmental Biology et du Allen Discovery Center de l'Université Tufts, pense que l'approche de Jose pourrait aider à répondre à de nombreuses questions non abordées par la vision actuelle de la biologie centrée sur le génome. Levin n'était impliqué dans aucun des articles publiés.

« Comprendre la transmission, le stockage et l'encodage de l'information biologique est un objectif essentiel, non seulement pour la science fondamentale, mais aussi pour les avancées transformatrices de la médecine régénérative », a déclaré Levin. "Dans ces deux articles, Antony Jose applique magistralement une approche informatique pour fournir une vue d'ensemble et une analyse quantitative des dynamiques moléculaires possibles qui pourraient servir de support à des informations héréditaires."

Jose propose que les instructions non codées dans l'ADN soient contenues dans l'arrangement des molécules à l'intérieur des cellules et leurs interactions les unes avec les autres. Cet arrangement de molécules est conservé et transmis de génération en génération.

Dans ses articles, le cadre de Jose redéfinit l'héritage comme les effets combinés de trois composants : les entités, les capteurs et les propriétés.

Les entités comprennent le génome et toutes les autres molécules d'une cellule nécessaires à la construction d'un organisme. Les entités peuvent changer au fil du temps, mais elles sont recréées avec leur structure, leur disposition et leurs interactions d'origine au début de chaque génération.

"Cet aspect de l'hérédité, à savoir que l'arrangement des molécules est similaire d'une génération à l'autre, est profondément sous-estimé et conduit à toutes sortes de malentendus sur le fonctionnement de l'hérédité", a déclaré Jose.

Les capteurs sont des entités spécifiques qui interagissent et répondent à d'autres entités ou à leur environnement. Les capteurs répondent à certaines propriétés, telles que la disposition d'une molécule, sa concentration dans la cellule ou sa proximité avec une autre molécule.

Ensemble, les entités, les capteurs et les propriétés permettent à un organisme vivant de ressentir ou de « connaître » des choses sur lui-même et son environnement. Une partie de ces connaissances est utilisée avec le génome à chaque génération pour construire un organisme.

"Ce cadre est construit sur des années de recherche expérimentale dans de nombreux laboratoires, dont le nôtre, sur l'épigénétique et le silençage génique multigénérationnel combinés à notre intérêt croissant pour la biologie théorique", a déclaré Jose. « Étant donné que deux personnes qui contractent la même maladie ne présentent pas nécessairement les mêmes symptômes, nous devons vraiment comprendre tous les endroits où deux personnes peuvent être différentes – pas seulement leurs génomes. »

La folie de maintenir une vision de l'hérédité centrée sur le génome, selon Jose, est que les scientifiques peuvent manquer des occasions de lutter contre les maladies héréditaires et de comprendre les secrets de l'évolution.

En médecine, par exemple, la recherche sur les raisons pour lesquelles les maladies héréditaires affectent différemment les individus se concentre sur les différences génétiques et sur les différences chimiques ou physiques des entités. Mais ce nouveau cadre suggère que les chercheurs devraient rechercher des différences non génétiques dans les cellules des individus atteints de maladies héréditaires, telles que l'arrangement des molécules et leurs interactions. Les scientifiques ne disposent pas actuellement de méthodes pour mesurer certaines de ces choses, donc ce travail pointe vers de nouvelles voies de recherche potentiellement importantes.

Dans l'évolution, le cadre de Jose suggère que les organismes pourraient évoluer par des changements dans l'arrangement des molécules sans changements dans leur séquence d'ADN. Et dans le domaine de la science de la conservation, ce travail suggère que les tentatives de préservation des espèces menacées par le biais des seules banques d'ADN manquent d'informations critiques stockées dans des molécules non-ADN.

José a reconnu qu'il y aura beaucoup de débats sur ces idées et que des expériences sont nécessaires pour tester ses hypothèses. Mais, a-t-il dit, les commentaires préliminaires de scientifiques comme Levin et d'autres collègues ont été positifs.

"La généralisation de la mémoire et de l'encodage par Antony Jose via le cadre entité-capteur-propriété apporte de nouvelles informations sur l'évolution et la complexité biologique et suggère des révisions importantes des paradigmes existants en génétique, épigénétique et développement", a déclaré Levin.


Déchiffrer le code génétique

Consacrée le 12 novembre 2009 aux National Institutes of Health de Bethesda, Maryland.

L'ADN se compose d'un langage codé composé de quatre lettres qui constituent ce que l'on appelle des codons, ou mots, de trois lettres chacun. L'interprétation du langage du code génétique a été l'œuvre de Marshall Nirenberg et de ses collègues des National Institutes of Health. Leur travail minutieux, mené dans les années 1960, a ouvert la voie à l'interprétation des séquences de l'ensemble du génome humain.

Contenu

Génétique moderne : un moine et une double hélice

La génétique moderne commence avec un obscur moine augustinien étudiant l'hérédité de divers traits chez les plants de pois. Les lois de l'hérédité de Gregor Mendel ont révélé les probabilités que les traits dominants et récessifs soient transmis de génération en génération. Les recherches de Mendel ont reçu peu de reconnaissance de son vivant. L'importance des lois de Mendel n'a été reconnue qu'au début du 20e siècle.

Avec cette redécouverte est venu l'intérêt pour la façon dont l'information génétique est transmise. Oswald Avery, bactériologiste au Rockefeller Institute de New York, a démontré que l'acide désoxyribonucléique, l'ADN, produisait des changements héréditaires. Cette découverte n'a pas été bien accueillie : comment l'ADN, une substance ne contenant que quatre blocs de construction nucléotidiques différents, a-t-il pu stocker des informations génétiques ? D'autres ont découvert que l'ADN varie d'une espèce à l'autre. Puis, en 1953, James Watson et Francis Crick de l'université de Cambridge ont électrisé le monde scientifique avec leur modèle d'ADN, la double hélice. Watson et Crick ont ​​reconnu que le double brin pourrait permettre la réplication.

Comment l'ADN, double hélice composée de seulement quatre nucléotides différents, pourrait-il déterminer la composition d'enzymes (protéines), de longues chaînes peptidiques composées de vingt acides aminés différents ? La course pour découvrir le code génétique qui traduit les informations de l'ADN en protéines était en cours. Pour stimuler la chasse, George Gamow, un physicien théoricien, a organisé le « RNA Tie Club » de vingt membres : les membres portaient des cravates avec le symbole de l'un des 20 acides aminés. Les membres ont partagé des idées sur la façon dont l'ADN transmettait l'information.

Le scientifique qui a remporté la course n'était pas membre du «club».

Je pensais que si je devais travailler aussi dur, je pourrais aussi bien m'amuser et par plaisir, je veux dire que je voulais explorer un problème important et que je voulais découvrir des choses.
— Entretien avec Marshall Nirenberg, 15 juillet 2009.

Début de carrière de Marshall Nirenberg

Marshall Nirenberg a obtenu un doctorat. en chimie biologique de l'Université du Michigan avec une thèse sur le mécanisme d'absorption du sucre dans les cellules tumorales. Il a poursuivi cette recherche en tant que boursier postdoctoral aux National Institutes of Health. En 1959, il a rejoint le personnel du NIH en tant que biochimiste de recherche.

Nirenberg a réfléchi à ce qu'il voulait étudier en tant que chercheur indépendant. « À cette époque », a-t-il déclaré en 2009, « le mécanisme de synthèse des protéines était très incomplètement connu et l'ARN messager n'avait pas été découvert. »*

L'objectif initial de Nirenberg était de déterminer si l'ADN ou l'ARN (acide ribonucléique), copié à partir de l'ADN, était le modèle pour la synthèse des protéines. Mais Nirenberg n'avait aucune formation formelle en génétique moléculaire, et il savait « qu'il s'agissait d'un projet incroyablement risqué, car lorsque vous prenez votre premier poste, vous voulez vous lancer et montrer que vous êtes un scientifique productif ». Sans expérience sur le terrain, sans personnel au départ et dans une course contre les meilleurs scientifiques, Nirenberg savait qu'il "pourrait échouer facilement".

*Cette citation et les suivantes, sauf indication contraire dans le texte, proviennent d'une interview de Judah Ginsberg et Marshall Nirenberg, menée dans son laboratoire sur le campus du NIH le 15 juillet 2009.

Expériences avec l'ARN synthétique

Nirenberg et Heinrich Matthaei, un boursier postdoctoral allemand, ont commencé leurs expériences en étudiant la longue molécule linéaire d'ADN et d'ARN. Dans l'ADN, les nucléotides sont l'adénine (A), la guanine (G), la cytosine (C) et la thymine (T) dans l'ARN, l'uracile (U), remplace la thymine.

Ils ont choisi un environnement sans cellules, créé lorsque les parois cellulaires sont brisées, libérant le contenu de la cellule. Le cytoplasme restant peut encore synthétiser des protéines lorsque l'ARN est ajouté, ce qui permet aux chercheurs de concevoir des expériences pour déterminer comment l'ARN fonctionne sans les processus biologiques complexes qui pourraient envelopper l'activité moléculaire.

Nirenberg et Matthaei sélectionnés E. coli les cellules bactériennes comme source de cytoplasme. Ils ont ajouté le E. coli extrait dans 20 tubes à essai, chacun contenant un mélange des 20 acides aminés. Dans chaque tube à essai, un acide aminé a été marqué radioactivement, un autre dans chaque tube à essai. La réaction pourrait être suivie d'un contrôle de la radioactivité : l'incorporation d'un acide aminé « chaud » formerait une protéine « chaude ».

Briser le code génétique : l'expérience du « poly-U »

3h00 du matin, le 27 mai 1961, un samedi : Matthaei ajoute de l'ARN synthétique composé uniquement d'unités d'uracile à chacun des 20 tubes à essai, trouvant une activité inhabituelle dans l'un des tubes, contenant de la phénylalanine. Le résultat spectaculaire démontre qu'une chaîne d'unités d'uracile dans le tube "chaud" a ordonné l'ajout de l'acide aminé "chaud".

Nirenberg et Matthaei ont compris ce qui s'était passé : un ARN synthétique constitué d'une chaîne d'unités multiples d'uracile a demandé à une chaîne d'acides aminés d'ajouter de la phénylalanine. La chaîne d'uracile (poly-U) a servi de messager dirigeant la synthèse des protéines. Bien que la question du nombre d'unités d'U nécessaires soit encore sans réponse, l'expérience a prouvé que l'ARN messager transcrit l'information génétique de l'ADN, dirigeant l'assemblage des acides aminés en protéines complexes. La clé pour briser le code génétique – la pierre de Rosette de la biologie moléculaire – avait été découverte.

Nirenberg a présenté son expérience poly-U réussie lors d'un congrès international de biochimie tenu à Moscou en août, quelques mois plus tard. Il était parfaitement conscient de son statut d'outsider : « Je ne connaissais pas les gens en biologie moléculaire… Je ne connaissais personne dans la synthèse des protéines… Je travaillais seul. Cela peut expliquer pourquoi seulement 35 personnes ont assisté à son discours et pourquoi le public « était absolument mort ».

Mais dans l'un de ces événements fortuits qui changent tout, Nirenberg avait rencontré Watson la veille et avait informé le co-découvreur de la double hélice de ses résultats. Watson était sceptique quant aux affirmations de Nirenberg, mais il a convaincu un collègue d'assister à l'article lorsque celui-ci a rapporté que les découvertes de Nirenberg étaient réelles. même congrès. « La réaction a été incroyable », se souvient Nirenberg. "C'était une ovation debout... Je ne le savais pas à l'époque, mais pendant les cinq années suivantes, je suis devenu comme une rock star scientifique."

Après que Nirenberg et Matthaei ont « déchiffré » le premier « mot » du code génétique, les scientifiques se sont précipités pour traduire les mots de code uniques pour chaque acide aminé dans l'espoir de lire un jour l'intégralité du code génétique des organismes vivants. Nirenberg a réuni une équipe d'une vingtaine de chercheurs et techniciens.

En utilisant l'expérience poly-U comme modèle, Nirenberg et ses collègues ont identifié des combinaisons de nucléotides pour l'incorporation d'autres acides aminés. Les chercheurs ont découvert que les unités codantes pour les acides aminés contiennent trois nucléotides (un triplet). La combinaison de quatre nucléotides dans des codes à trois lettres a donné 64 combinaisons possibles (4 x 4 x 4), suffisantes pour décrire 20 acides aminés.

Ils ont découvert les codes d'autres acides aminés : par exemple, AAA pour la lysine et CCC pour la proline. Le remplacement d'une unité d'un code triplet par un autre nucléotide a donné un acide aminé différent, par exemple, un ARN synthétique contenant une unité de guanine et deux d'uracile (mot de code : GUU) a provoqué l'incorporation de valine.

En 1964, Nirenberg et Philip Leder, un boursier postdoctoral au NIH, ont découvert un moyen de déterminer la séquence des lettres dans chaque mot triplet pour les acides aminés. En 1966, Nirenberg avait déchiffré les 64 mots de code à trois lettres de l'ARN (codons) pour les 20 acides aminés. Le langage de l'ADN était désormais compris et le code pouvait être exprimé dans un tableau.

Le prix Nobel et les réactions

En 1968, Nirenberg a remporté le prix Nobel de physiologie ou médecine pour ses travaux fondateurs sur le code génétique. Il a partagé le prix avec Har Gobind Khorana (Université du Wisconsin), qui maîtrisait la synthèse des acides nucléiques, et Robert Holley (Université Cornell), qui a découvert la structure chimique de l'ARN de transfert. Collectivement, les trois ont été reconnus "pour leur interprétation du code génétique et de sa fonction dans la synthèse des protéines".

Nirenberg décrit les cérémonies entourant le Nobel comme « une semaine de fêtes ». Pas tout à fait cependant, puisque les règles du Nobel obligent les récipiendaires à rédiger un article de synthèse. Cela s'est avéré un défi pour Nirenberg, qui avait tourné ses recherches vers la neurobiologie. « J'ai trouvé très difficile », a-t-il admis plus tard, « de rompre avec la neurobiologie et de revenir aux acides nucléiques ».

En tant que lauréat du prix Nobel, Nirenberg a reçu de nombreuses offres universitaires comprenant un salaire plus élevé, plus d'espace de laboratoire et un personnel plus important. Il les a tous refusés, préférant passer le reste de sa carrière au NIH. « La raison pour laquelle je suis resté », dit-il, « était parce que la chose que j'avais le moins était le temps. Je pensais que si j'allais dans une université, j'utiliserais un tiers de mon temps pour rédiger des subventions… Je pensais que je pourrais utiliser ce temps de manière plus productive en faisant des expériences.

En 1961 Le New York Times, faisant écho au président Kennedy, a rapporté que les recherches de Nirenberg ont montré que la biologie "a atteint une nouvelle frontière". One journalist suggested the biggest news story of the year was not Russian cosmonaut Yuri Gagarin orbiting the earth but the cracking of the genetic code.

Deciphering the genetic code raised ethical concerns about the potential for genetic engineering. Nirenberg addressed these concerns in a famous editorial in Science in August 1967, noting “that man may be able to program his own cells” before “he has sufficient wisdom to use this knowledge for the benefit of mankind… [D]ecisions concerning the application of this knowledge must be made by society, and only an informed society can make such decisions wisely.” When asked several decades later if society has acted “wisely” regarding genetic engineering, Nirenberg answered, “Absolutely!”


Decoding machines: Brains and ribosomes

The next step, then, would be to turn the transcribed information into the structure it specifies–a protein (in our cells) or an idea (in our minds)–using some kind of decoding machine.

In our analogy, the machine is your brain, which turns linguistic information into conceptual information (ideas).

In the case of genetic information, this machine is called a “ribosome”. RNA transcripts are fed into ribosomes which pump out proteins, but this raises two questions:

  1. Why are proteins the endpoint? The short answer is that proteins (e.g. enzymes and protein-based structural components of the cell) do nearly everything that needs to be done in a cell.
  2. How do ribosomes work?

We will answer both questions in the next installment of this series.


Genetic Information

The genetic information of an organism is stored in DNA molecules. How can one kind of molecule contain all the instructions for making complicated living beings like ourselves? What component or feature of DNA can contain this information? It has to come from the nitrogen bases, because, as you already know, the backbone of all DNA molecules is the same. But there are only four bases found in DNA: G, A, C, and T. The sequence of these four bases can provide all the instructions needed to build any living organism. It might be hard to imagine that 4 different “letters” can communicate so much information. But think about the English language, which can represent a huge amount of information using just 26 letters. Even more profound is the binary code used to write computer programs. This code contains only ones and zeros, and think of all the things your computer can do. The DNA alphabet can encode very complex instructions using just four letters, though the messages end up being really long. Par exemple, le E. coli bacterium carries its genetic instructions in a DNA molecule that contains more than five million nucleotides. The human genome (all the DNA of an organism) consists of around three billion nucléotides divided up between 23 paired DNA molecules, or chromosomes.

The information stored in the order of bases is organized into genes: each gene contains information for making a functional product. The genetic information is first copied to another nucleic acid polymer, ARN (ribonucleic acid), preserving the order of the nucleotide bases. Genes that contain instructions for making proteins are converted to messenger RNA (mRNA). Some specialized genes contain instructions for making functional RNA molecules that don’t make protéines. These RNA molecules function by affecting cellular processes directly for example some of these RNA molecules regulate the expression of mRNA. Other genes produce RNA molecules that are required for protein synthesis, transférer l'ARN (ARNt), et ARN ribosomique (ARNr).

In order for DNA to function effectively at storing information, two key processes are required. First, information stored in the DNA molecule must be copied, with minimal errors, every time a cell divides. This ensures that both daughter cells inherit the complete set of genetic information from the parent cell. Second, the information stored in the DNA molecule must be translated, or expressed. In order for the stored information to be useful, cells must be able to access the instructions for making specific proteins, so the correct proteins are made in the right place at the right time.

Figure 4. DNA’s double helix. Graphic modified from “DNA chemical structure,” by Madeleine Price Ball, CC-BY-SA-2.0

Both copying and reading the information stored in DNA relies on base pairing between two acide nucléique polymer strands. Recall that DNA structure is a double helix (see Figure 4).

The sugar deoxyribose with the phosphate group forms the scaffold or backbone of the molecule (highlighted in yellow in Figure 4). Bases point inward. Complementary bases form hydrogen bonds with each other within the double helix. See how the bigger bases (purines) pair with the smaller ones (pyrimidines). This keeps the width of the double helix constant. More specifically, A pairs with T and C pairs with G. As we discuss the function of DNA in subsequent sections, keep in mind that there is a chemical reason for specific pairing of bases.

To illustrate the connection between information in DNA and an observable characteristic of an organism, let’s consider a gene that provides the instructions for building the hormone insulin. Insulin is responsible for regulating blood sugar levels. The insulin gene contains instructions for assembling the protein insulin from individual amino acids. Changing the sequence of nucleotides in the DNA molecule can change the amino acids in the final protein, leading to protein malfunction. If insulin does not function correctly, it might be unable to bind to another protein (insulin receptor). On the organismal level of organization, this molecular event (change of DNA sequence) can lead to a disease state—in this case, diabetes.

Questions pratiques

The order of nucleotides in a gene (in DNA) is the key to how information is stored. For example, consider these two words: stable and tables. Both words are built from the same letters (subunits), but the different order of these subunits results in very different meanings. In DNA, the information is stored in units of 3 letters. Use the following key to decode the encrypted message. This should help you to see how information can be stored in the linear order of nucleotides in DNA.

ABC = a DEF = d GHI = e JKL = f
MNO = h PQR = i STU = m VWX = n
YZA = o BCD = r EFG = s HIJ = t
KLM = w NOP = j QRS = p TUV = y

Encrypted Message: HIJMNOPQREFG – PQREFG – MNOYZAKLM – DEFVWXABC – EFGHIJYZABCDGHIEFG – PQRVWXJKLYZABCDSTUABCHIJPQRYZAVWX

Where in the DNA is information stored?

  1. The shape of the DNA
  2. The sugar-phosphate backbone
  3. The sequence of bases
  4. The presence of two strands.

Which statement is correct?

  1. The sequence of DNA bases is arranged into chromosomes, most of which contain the instructions to build an amino acid.
  2. The sequence of DNA strands is arranged into chromosomes, most of which contain the instructions to build a protein.
  3. The sequence of DNA bases is arranged into genes, most of which contain the instructions to build a protein.
  4. The sequence of DNA phosphates is arranged into genes, most of which contain the instructions to build a cell.

Genomics: Decoding the Universal Language of Life

What is a genome? A genome contains all of the information that a cell needs to develop, function, and reproduce itself, and all the information needed for those cells to come together to form a person, plant, or animal. Genomes contain an organism’s complete set of genes, and also the even tinier genetic structures that help regulate when and how those genes are used.

The ability to regrow a torn ligament, the clues that might predict the onset of mental illness, the nutritional potential of crops, and even the history of life itself, are all encoded in genomes. By taking this course, you will discover how scientists are deciphering the language of genomes to learn how to develop sustainable food and fuel supplies, improve disease treatment and prevention, and protect our environment. Professor Robinson is the main instructor for this course. In addition, each module features several guest instructors. These guest instructors come from diverse fields of study—biology, physics, computer science, and many others—and pursue diverse research goals, yet they share a common interest in genomic approaches and technologies. The guest instructors include: - Elizabeth (Lisa) Ainsworth, Associate Professor of Plant Biology - Mark Band, Director of the Functional Genomics Facility - Alison Bell, Associate Professor of Animal Biology - Jenny Drnevich, Functional Genomics Bioinformatics Specialist with High-Performance Biological Computing - Christopher Fields, Associate Director of High-Performance Biological Computing - Bruce Fouke, Director of the Roy J. Carver Biotechnology Center - Glenn Fried, Director of the Carl R. Woese Institute for Genomic Biology Core Facilities - Nigel Goldenfeld, Professor of Physics - Brendan Harley, Assistant Professor of Chemical and Biomolecular Engineering - Alvaro Hernandez, Director of the High-Throughput Sequencing and Genotyping Facility - Victor Jongeneel, former NCSA Director of Bioinformatics and former Director of High-Performance Biological Computing - Kingsley Boateng, Senior Research Specialist with the Carl R. Woese Institute for Genomic Biology Core Facilities - Stephen Long, Professor of Plant Biology and Crop Sciences - Ruby Mendenhall, Associate Professor of African American Studies - William Metcalf, Professor of Microbiology - Karen Sears, Assistant Professor of Animal Biology - Saurabh Sinha, Associate Professor of Computer Science - Lisa Stubbs, Professor of Cell and Developmental Biology - Rachel Whitaker, Associate Professor of Microbiology - Derek Wildman, Professor of Molecular and Integrative Physiology - Peter Yau, Director of the Protein Sciences Facility


What is the instructional language of DNA? - La biologie

Your browser does not support inline frames or is currently configured not to display inline frames.

To understand the significance and applications of biotechnology, one needs a basic understanding of rDNA (recombinant DNA) genetically engineered DNA made by recombining fragments of DNA that's been obtained from other organisms.

We have told you about DNA and genetic engineering in several Instructions now, but it's such an important subject that we think that it's important to review it again.

One way to think about it is to use the analogy of language. The Language of Recombinant DNA.

We've told you about nucleotide bases (A, T, G and C), about codons and about genes. Using the analogy of language, here's what each would be:

  • The nucleotide bases would be letters,
  • The codons would be words,
  • The genes would be sentences,
  • DNA would be a book (the instruction book of life).

As you know, nucleotide bases by themselves convey no message. Instead, they act in strings of three called codons.

The function of the codons on the DNA molecule is to give instructions for specifying and ordering amino acids. And amino acids, of course, are the structural elements of proteins, which in turn are the basic biochemical units that drive all biological processes.

There are only twenty amino acids found in proteins - and the codes for ordering them are universal. This means that the sequence of nucleotide letters to specify amino acid words is the same for everything that has ever lived - from tree sloths to Tyrannosaurus Rex (and us). But these amino acid words can be combined in many different ways to make thousands of different protein sentences.

Certain proteins, called enzymes, are catalysts (agents that cause change but aren't themselves changed during a chemical process). Others, called structural proteins, help build cells and tissues.

As you know, one codon contains the instructions for one amino acid and sequences of codons specify the production of proteins.

Groups of codons that have been arranged in sentences to form specific proteins are called "genes".

And finally, it's in the genes (the blueprints for making proteins) that DNA actually does something -it writes a book.

Through a complicated series of biochemical processes, the instructions contained in the genes are translated into the actual stuff that organisms are made of - which is where rDNA technology comes in.

Returning to our analogy of DNA as a language with letters, words and sentences, one can think of genetic engineering as editing the DNA book to produce a desired result.

The actual editing - which is called the "insertion process" - involves manipulating incredibly tiny pieces of incredibly tiny organisms.

Basically, however, it is still "cutting and pasting" - using restriction enzymes as the scissors and DNA ligase as the paste.

There are over a hundred different restriction enzymes (also called restriction endonucleases) - each of which cuts a specific base sequence of the DNA molecule. When these "scissors" are used singly or in the right combination, the correct segment of the DNA molecule can be isolated.

Once isolated, the segment is "cut" and "pasted" into plasmid DNA, a special kind of circular DNA that is frequently used as a vehicle for editing (and which we'll tell you more about in our next Instruction).

Fragments of bacterial DNA exist that may be integrated into the plasmid chromosome, but only at specific locations.

Let's take a look at the production of genetically engineered insulin as an example of how it all works.


To create genetically engineered insulin for human use, scientists cut the "sentence" (the gene for insulin production in humans) and paste it into the DNA of Escherichia coli (E. coli), a bacterium that inhabits the human digestive tract.

E. coli cells divide very rapidly making billions of copies of themselves, with each bacterium carrying in its DNA a faithful replica of the gene for insulin production. Even more importantly, each new E. coli cell will inherit the human insulin gene "sentence."

The genetic engineering of insulin has been a great success - saving the lives of countless diabetics.

There are also many other explorations under way concerning the diagnosis, treatment and possible cure for other genetically related diseases.

One promising area of exploration is called Cytogenics.

Cytogenetics is the study of chromosomes and of conditions caused by an abnormal number of chromosomes or an altered chromosome structure.

As you know, in humans, diploid somatic (non-sex) cells normally contain 46 chromosomes.

A chromosome number which is an exact multiple of the haploid number (23 in gametes) and exceeds the diploid number (46) is called a polyploidy. This is a condition that results when an individual gains a full set of extra chromosomes. Another name for this condition is N4.

A chromosome number that is not an exact multiple of the haploid number is called an aneuploïdie.


Polyploidy and Aneuploidy

Polyploidy can arise either when an egg is fertilized by two sperm (dispermy) or from the failure of one of the maturation divisions of the egg or the sperm, which produces a diploid gamete.

A triploid fetus would be 69,XXY (the most common), 69,XXX or 69,XYY depending on the origin of the extra set of chromosomes.

Four times the haploid number is called tetraploidy and is usually due to the failure of the completion of the first zygotic division.

Aneuploidy arises from failure of paired chromosomes or sister chromatids to disjoin at anaphase (non-disjunction). It may also be due to delayed movement of a chromosome at anaphase (anaphase lag). This produces two cells with the following aberrations -- one with an extra copy of a chromosome (trisomy) and one with a missing copy of that chromosome (monosomy).

Structural Aberrations

Structural aberrations come about as a result of chromosome breakage.

When a chromosome breaks, two unstable sticky ends are produced. Generally, repair mechanisms rejoin these two ends without delay. However, if more than one break has occurred, repair mechanisms may not be able to distinguish one sticky end from another and may rejoin the wrong ends.

Here are the most common chromosomal structural aberrations:

  • Suppressions - these involve the loss of material from a single chromosome. The effects are typically severe since there is a loss of genetic material.
  • jenversions- these occur when there are two breaks within a single chromosome and the broken segment slips 180 (inverts) and reattaches to form a chromosome that is structurally out-of-sequence.
  • Déplacements - these involve the exchange of material between two or more chromosomes. Gene expression is
    usually unaffected by translocation. However, unequal crossing-over in reciprocal recombination can occur as a result of mispairing the identical duplicated gene sequences.

Numerical and structural abnormalities can be further divided into two main categories.

  • Constitutionnel - those an organism is born with
  • Acquis - those that arise as secondary changes to other diseases such as cancer

Sometimes individuals are found who have both normal and abnormal cell lines. These people are called mosaics and in the vast majority of these cases the abnormal cell line has a numerical chromosome abnormality.

Structural mosaics are extremely rare and the degree to which an individual is clinically affected usually depends on the percentage of abnormal cells involved.

Video Instruction
*Availability of You Tube video links may vary. eTAP has no control of these materials.


Voir la vidéo: Lévolution des méthodologies de lenseignement des langues et du français langue étrangère FLE (Décembre 2022).