Informations

Comment le nombre de gènes peut-il augmenter au cours de l'évolution ?


Je connais les bases de la théorie de l'évolution, mais je ne comprends pas comment les mutations peuvent ajouter des gènes au fil du temps.

Ai-je raison de penser que les créatures de la même espèce qui mutent pour avoir un gène supplémentaire dans leur génome seraient normalement infertiles ? Ou est-ce que je comprends mal?

Quelqu'un peut-il expliquer le processus de création de matériel génétique à travers l'évolution ? La citation d'un article ou d'un livre académique décent sur le sujet serait également appréciée.


Les mutations peuvent avoir toutes sortes d'impacts sur l'architecture génétique. Une mutation peut avoir un petit impact sur une architecture génétique telle que

  • Substitution
  • Insertion
  • Effacement

ou peut avoir un impact beaucoup plus important sur une architecture génétique telle que

  • Amplification (y compris la duplication de gènes)
  • Suppressions
  • Translocations chromosomiques
  • Suppressions interstitielles
  • Inversions chromosomiques
  • Duplication chromosomique
  • Changement de numéro de ploïdie

Certaines de ces mutations (duplication de gènes, duplication de chromosomes, changement du nombre de ploïdie) permettent typiquement de dupliquer des segments d'ADN. Après duplication, les deux copies d'un gène peuvent diverger par néofonctionnalisation ou sous-fonctionnalisation. Jetez un œil à wikipedia > duplication de gènes pour comprendre quels processus biochimiques peuvent provoquer de telles mutations (par exemple, recombinaison ectopique, événement de rétrotransposition, glissement de réplication).

Ai-je raison de penser que les créatures de la même espèce qui mutent pour avoir un gène supplémentaire dans leur génome seraient normalement infertiles ?

Vous vous trompez. Je comprends l'intuition naïve selon laquelle un changement du nombre de copies d'un gène donné serait extrêmement délétère, mais en réalité, les organismes vivants semblent beaucoup plus résistants à une telle variation du nombre de copies (CNV) que vous ne le pensez. Bien sûr, certaines NVC sont associées à des maladies mais ce n'est pas le cas de tous (McCarroll et Altshuler 2007).

Les duplications de gènes sont en fait assez fréquentes, que ce soit dans C. elegans (Lipinski et al. 2011) ou chez l'homme (Cotton et Page 2005). Les duplications chromosomiques sont également courantes (Bowers et al. 2002). Même les duplications du génome entier (voir un exemple classique dans Wolfe 2015) ont joué un rôle majeur dans l'évolution de nombreuses lignées (Whitton et Otto 2010), y compris les vertébrés (Dehal et Boore 2005).

Vous trouverez ci-dessous un arbre phylogénétique de génomes de plantes vertes séquencés mettant en évidence certains des principaux événements de la duplication du génome entier.

Pour mémoire, certaines espèces de fraisiers sont décaploïdes (10 exemplaires) (Hummer 2012). Ensuite, il y a les extrêmes. Dans les populations d'Entamoeba, il peut y avoir une variation du niveau de ploïdie parmi les individus allant de diploïde (2 copies) à tétracontaploïde (40 copies) (Mukherjee et al. 2008) !


  • Les populations végétales subissent un flux de gènes en diffusant leur pollen sur de longues distances.
  • Les animaux subissent un flux génétique lorsque des individus quittent un groupe familial ou un troupeau pour rejoindre d'autres populations.
  • Le flux d'individus entrant et sortant d'une population introduit de nouveaux allèles et augmente la variation génétique au sein de cette population.
  • Les mutations sont des changements dans l'ADN d'un organisme qui créent de la diversité au sein d'une population en introduisant de nouveaux allèles.
  • Certaines mutations sont nocives et sont rapidement éliminées de la population par sélection naturelle. Des mutations nocives empêchent les organismes d'atteindre la maturité sexuelle et de se reproduire.
  • D'autres mutations sont bénéfiques et peuvent augmenter dans une population si elles aident les organismes à atteindre la maturité sexuelle et à se reproduire.
  • flux de gènes: le transfert d'allèles ou de gènes d'une population à une autre
  • mutation: tout changement héréditaire de la séquence de paires de bases du matériel génétique

Évolution

En biologie, l'évolution est le changement des traits hérités d'une population de génération en génération.

Ces traits sont l'expression de gènes qui sont copiés et transmis à la progéniture pendant la reproduction.

Des mutations dans ces gènes peuvent produire des traits nouveaux ou modifiés, entraînant des différences héréditaires (variation génétique) entre les organismes.

De nouveaux traits peuvent également provenir du transfert de gènes entre populations, comme lors de la migration, ou entre espèces, lors d'un transfert horizontal de gènes.

L'évolution se produit lorsque ces différences héréditaires deviennent plus courantes ou plus rares dans une population, soit de manière non aléatoire par sélection naturelle, soit de manière aléatoire par dérive génétique.

La sélection naturelle est un processus qui fait que les traits héréditaires utiles à la survie et à la reproduction deviennent plus courants et que les traits nuisibles deviennent plus rares.

Cela se produit parce que les organismes dotés de traits avantageux transmettent davantage de copies de ces traits héréditaires à la génération suivante.

Au cours de nombreuses générations, les adaptations se produisent grâce à une combinaison de petits changements aléatoires successifs de traits et à la sélection naturelle des variantes les mieux adaptées à leur environnement.

En revanche, la dérive génétique produit des changements aléatoires dans la fréquence des traits dans une population.

La dérive génétique résulte du rôle que joue le hasard dans la survie et la reproduction d'un individu donné.

Une définition d'une espèce est un groupe d'organismes qui peuvent se reproduire les uns avec les autres et produire une progéniture fertile.

Cependant, lorsqu'une espèce est séparée en populations qui sont empêchées de se reproduire, les mutations, la dérive génétique et la sélection de caractères nouveaux provoquent l'accumulation de différences au fil des générations et l'émergence de nouvelles espèces.

Les similitudes entre les organismes suggèrent que toutes les espèces connues descendent d'un ancêtre commun (ou pool génétique ancestral) à travers ce processus de divergence progressive.

La théorie de l'évolution par sélection naturelle a été proposée à peu près simultanément par Charles Darwin et Alfred Russel Wallace, et exposée en détail dans le livre de 1859 de Darwin sur l'origine des espèces.

Dans les années 1930, la sélection naturelle darwinienne a été combinée à l'hérédité mendélienne pour former la synthèse évolutive moderne, dans laquelle la connexion entre les unités d'évolution (gènes) et le mécanisme d'évolution (sélection naturelle) a été établie.

Cette puissante théorie explicative et prédictive est devenue le principe organisateur central de la biologie moderne, fournissant une explication unificatrice de la diversité de la vie sur Terre.


Science et créationnisme : une vue de l'Académie nationale des sciences, deuxième édition (1999)

Le long du chemin mène des origines de la « vie » primitive, qui existait il y a au moins 3,5 milliards d'années, à la profusion et à la diversité de la vie qui existe aujourd'hui. Ce chemin est mieux compris comme un produit de l'évolution.

Contrairement à l'opinion populaire, ni le terme ni l'idée d'évolution biologique n'ont commencé avec Charles Darwin et son principal ouvrage, De l'origine des espèces au moyen de la sélection naturelle (1859). De nombreux érudits des anciens philosophes grecs avaient déduit que des espèces similaires descendaient d'un ancêtre commun. Le mot "évolution" est apparu pour la première fois dans la langue anglaise en 1647 dans un lien non biologique, et il est devenu largement utilisé en anglais pour toutes sortes de progressions à partir de débuts plus simples. Le terme Darwin le plus souvent utilisé pour désigner l'évolution biologique était « descendance avec modification », ce qui reste une bonne brève définition du processus aujourd'hui.

Darwin a proposé que l'évolution puisse s'expliquer par la survie différentielle des organismes suivant leur variation naturelle et un processus mdasha qu'il a appelé « sélection naturelle ». Selon ce point de vue, les descendants des organismes diffèrent les uns des autres et de leurs parents de manière héréditaire, c'est-à-dire qu'ils peuvent transmettre les différences génétiquement à leur propre progéniture. De plus, les organismes dans la nature produisent généralement plus de descendants qu'ils ne peuvent survivre et se reproduire compte tenu des contraintes de nourriture, d'espace et d'autres ressources environnementales. Si un arrêt particulier

Charles Darwin est arrivé à bon nombre de ses idées sur l'évolution en étudiant les variations entre les espèces sur les îles Galáacutepagos au large des côtes de l'Équateur.

le printemps a des traits qui lui donnent un avantage dans un environnement particulier, cet organisme aura plus de chances de survivre et de transmettre ces traits. Au fur et à mesure que les différences s'accumulent au fil des générations, les populations d'organismes divergent de leurs ancêtres.

L'hypothèse originale de Darwin a subi d'importantes modifications et expansions, mais les concepts centraux restent fermes. Des études de génétique et de biologie moléculaire&mdashfields inconnus à l'époque de Darwin&mdash ont expliqué l'occurrence des variations héréditaires qui sont essentielles à la sélection naturelle. Les variations génétiques résultent de changements ou de mutations dans la séquence nucléotidique de l'ADN, la molécule à partir de laquelle les gènes sont fabriqués. De tels changements dans l'ADN peuvent maintenant être détectés et décrits avec une grande précision.

Les mutations génétiques surviennent par hasard. Ils peuvent ou non doter l'organisme de meilleurs moyens de survie dans son environnement. Mais si une variante de gène améliore l'adaptation à l'environnement (par exemple, en permettant à un organisme de mieux utiliser un nutriment disponible, ou d'échapper plus efficacement aux prédateurs, par exemple grâce à des pattes plus fortes ou à une coloration déguisée), les organismes porteurs de ce gène sont plus susceptibles survivre et se reproduire que ceux qui n'en ont pas. Au fil du temps, leur descendance aura tendance à augmenter, modifiant les caractéristiques moyennes de la population. Bien que la variation génétique sur laquelle fonctionne la sélection naturelle soit basée sur des éléments aléatoires ou aléatoires, la sélection naturelle elle-même produit un changement « adaptatif » et c'est tout le contraire du hasard.

Les scientifiques ont également acquis une compréhension des processus par lesquels les nouvelles espèces naissent. Une nouvelle espèce est une espèce dans laquelle les individus ne peuvent pas s'accoupler et produire des descendants viables avec des individus d'une espèce préexistante. La scission d'une espèce en deux commence souvent parce qu'un groupe d'individus est géographiquement séparé du reste. Cela est particulièrement évident dans les îles éloignées et éloignées, telles que les Galáacutepagos et l'archipel d'Hawaï, dont la grande distance des Amériques et de l'Asie signifie que les colonisateurs arrivants auront peu ou pas de possibilité de s'accoupler avec des individus restant sur ces continents. Les montagnes, les rivières, les lacs et autres barrières naturelles expliquent également la séparation géographique entre les populations qui appartenaient autrefois à la même espèce.

Une fois isolés, des groupes d'individus séparés géographiquement se différencient génétiquement à la suite de mutations et d'autres processus, y compris la sélection naturelle. L'origine d'une espèce est souvent un processus graduel, de sorte qu'au début l'isolement reproductif entre des groupes séparés d'organismes n'est que partiel, mais il finit par devenir complet. Les scientifiques accordent une attention particulière à ces situations intermédiaires, car elles aident à reconstituer les détails du processus et à identifier des gènes particuliers ou des ensembles de gènes qui expliquent l'isolement reproductif entre les espèces.

Un exemple particulièrement convaincant de spéciation concerne les 13 espèces de pinsons étudiées par Darwin sur les îles Galáacutepagos, maintenant connues sous le nom de pinsons de Darwin. Les ancêtres de ces pinsons semblent avoir immigré du continent sud-américain vers les Galáacutepagos. Aujourd'hui, les différentes espèces de pinsons de l'île ont des habitats, des régimes alimentaires et des comportements distincts, mais les mécanismes impliqués dans la spéciation continuent de fonctionner. Un groupe de recherche dirigé par Peter et Rosemary Grant de l'Université de Princeton a montré qu'une seule année de sécheresse sur les îles peut entraîner des changements évolutifs chez les pinsons. La sécheresse diminue facilement les approvisionnements

Les différentes espèces de pinsons des îles Galáacutepagos, maintenant connues sous le nom de pinsons de Darwin, ont des becs de tailles différentes qui ont évolué pour tirer parti de sources de nourriture distinctes.

noix concassées mais permet la survie des plantes qui produisent des noix plus grosses et plus dures. Les sécheresses favorisent donc les oiseaux au bec fort et large qui peuvent casser ces graines plus dures, produisant des populations d'oiseaux avec ces traits. Les subventions ont estimé que si des sécheresses se produisent environ une fois tous les 10 ans sur les îles, une nouvelle espèce de pinson pourrait apparaître dans seulement 200 ans environ.

Les sections suivantes examinent plus en détail plusieurs aspects de l'évolution biologique, en examinant la paléontologie, l'anatomie comparée, la biogéographie, l'embryologie et la biologie moléculaire pour obtenir des preuves supplémentaires à l'appui de l'évolution.

Le record des fossiles

Bien que ce soit Darwin, par-dessus tout, qui ait rassemblé le premier des preuves convaincantes de l'évolution biologique, les premiers chercheurs avaient reconnu que les organismes sur Terre avaient systématiquement changé sur de longues périodes de temps. Par exemple, en 1799, un ingénieur du nom de William Smith rapporta que, dans les couches rocheuses non perturbées, les fossiles se trouvaient dans un ordre séquentiel défini, avec des fossiles d'apparence plus moderne plus près du sommet. Parce que les couches inférieures de la roche ont logiquement été déposées plus tôt et sont donc plus anciennes que les couches supérieures, la séquence de fossiles pourrait également recevoir une chronologie du plus ancien au plus jeune. Ses découvertes ont été confirmées et étendues dans les années 1830 par le paléontologue William Lonsdale, qui a reconnu que les restes fossiles d'organismes des couches inférieures étaient plus primitifs que ceux ci-dessus. Aujourd'hui, plusieurs milliers d'anciens gisements de roche ont été identifiés qui montrent des successions correspondantes d'organismes fossiles.

Ainsi, la séquence générale des fossiles avait déjà été reconnue avant que Darwin ne conçoive la descendance avec modification. Mais les paléontologues et les géologues d'avant Darwin utilisaient la séquence de fossiles dans les roches non pas comme preuve de l'évolution biologique, mais comme base pour établir la séquence originale des strates rocheuses qui avaient été structurellement perturbées par des tremblements de terre et d'autres forces.

A l'époque de Darwin, la paléontologie était encore une science rudimentaire. De grandes parties de la succession géologique des roches stratifiées étaient inconnues ou insuffisamment étudiées.


Dans les plantes

Le fait que la plupart des cellules végétales subissent une augmentation de taille importante non accompagnée de division cellulaire est une distinction importante entre la croissance des plantes et celle des animaux. Les cellules filles résultant de la division cellulaire derrière l'extrémité de la racine ou de la pousse de la plante peuvent subir de grandes augmentations de volume. Ceci est accompli grâce à l'absorption d'eau par les cellules, l'eau est stockée dans une cavité centrale appelée vacuole. L'apport d'eau produit une pression qui, combinée à d'autres facteurs, exerce une pression sur les parois cellulosiques des cellules végétales, augmentant ainsi la longueur, la circonférence et la rigidité (turgescence) des cellules et de la plante. Chez les plantes, une grande partie de l'augmentation de la taille se produit après la division cellulaire et résulte principalement d'une augmentation de la teneur en eau des cellules sans augmentation importante du poids sec.

Le très jeune embryon végétal en développement a de nombreuses cellules réparties dans toute sa masse qui subissent le cycle de croissance et de division cellulaire. Dès que les positions de l'extrémité de la racine, de l'extrémité de la pousse et des feuilles embryonnaires sont établies, le potentiel de division cellulaire se limite aux cellules de certaines régions appelées méristèmes. Un centre méristématique se trouve juste en dessous de la surface de la racine en croissance, toutes les augmentations du nombre de cellules de la racine primaire se produisent à ce stade. Certaines des cellules filles restent à la pointe allongée et continuent à se diviser. D'autres cellules filles, qui restent dans la racine, subissent l'augmentation de longueur qui permet à la nouvelle racine de s'enfoncer plus profondément dans le sol. Le même plan général est évident dans la pousse en croissance des plantes supérieures, dans laquelle une région méristématique restreinte à l'extrémité est responsable de la formation des cellules des feuilles et l'élongation des cellules souches se produit derrière ce centre méristématique. Le jeune plant développe secondairement des cellules associées aux brins vasculaires du phloème et du xylème, des tissus qui transportent l'eau vers les feuilles du sol et le sucre des feuilles vers le reste de la plante. Ces cellules peuvent se diviser à nouveau, fournissant un nouveau matériau cellulaire pour le développement d'une couverture ligneuse et pour des brins vasculaires plus élaborés. Par conséquent, la croissance des plantes supérieures—c'est à dire., ces aspects impliquant à la fois le motif des tiges, des feuilles et des racines et l'augmentation du volume résultent principalement de la division cellulaire au niveau du méristème suivie d'une augmentation secondaire de la taille en raison de l'absorption d'eau. Ces activités se produisent tout au long de la période de croissance des plantes.


Comment l'édition de gènes pourrait ruiner l'évolution humaine

D ans les années 1960, Thomas Kuhn a suggéré que les idées scientifiques subissent des crises de révolution, remettant en cause les fondements de la science de l'establishment. Mais c'est Peter Galison qui a souligné l'impact d'un outil ou d'une méthode et a encouragé l'idée que la technologie crée la brèche ou la perturbation tangible d'un domaine. Alfred Hersey, dans le même esprit, a dit un jour à un collègue : « les idées vont et viennent, mais une méthode dure. »

CRISPR-Cas9, le nouvel outil de modification génétique, qui a été présenté comme un moyen de nous insérer dans l'évolution, évolue lui-même en tant que technologie, alors même que vous lisez ceci. Cette technologie elle-même peut évoluer signifie qu'il est plus urgent de penser à notre biologie : soit en tant que machine (qui peut tomber en panne et obtenir de nouvelles pièces de rechange), soit en tant que partie de l'écologie (où la panne n'est pas nécessairement mauvaise et peut faire partie de croissance, renouvellement ou réorganisation). CRISPR peut être utilisé pour réparer un gène qui a un produit déficient, tel qu'une enzyme ou un récepteur, ou modifier un code qui suggère simplement un risque. Les idées sur la façon de l'utiliser changent toutes les heures. La méthode est là pour durer. L'éthique n'en sera que plus lourde. Mais il y a un plus grand obstacle à l'émergence de &ldquodesigner baby&rdquo et Gattaca-futurs dystopiques de type : les principes de l'évolution.

Avant cela, cependant, un peu de contexte : CRISPR est une molécule qui peut être programmée pour cibler une séquence spécifique dans un génome. Il guide une enzyme, telle que Cas9, pour découper le code comme de minuscules ciseaux moléculaires. Les scientifiques ont commencé à utiliser Cas9 pour provoquer des cassures & ldquoblunt end&rdquo dans l'ADN. Cela a tendance à initier une réparation truquée, la rupture est reconstituée, incorporant de petits morceaux d'ADN disponible ou un modèle de réparation d'un autre matériel génétique que les scientifiques pourraient ajouter. Une réparation Cas9 n'est pas toujours précise, mais comme le dit le vieil adage, « ldquoa charpentier ne blâme pas ses outils ». cassure qui laisse un brin pendre à l'extrémité. Ce modèle permet des modifications génétiques plus précises. Et en décembre, U.C. Les scientifiques de Berkeley ont rapporté avoir découvert encore plus d'enzymes & mdashCasX et CasY & mdash qui promettent de rendre la technologie encore plus polyvalente et exigeante. Bref, les limitations techniques s'évaporent.

À l'horizon immédiat, nous commençons à voir la silhouette de ce que Marcy Darnovsky, directrice du Center for Genetics and Society, appelle &ldquomarket-based eugenics.&rdquo Peter Marks, directeur adjoint du Center for Biologics Evaluation and Research et de l'US Food and Drug Administration, m'a dit dans un e-mail qu'aux États-Unis, la FDA a choisi de réglementer CRISPR-Cas9 en tant que médicament, car cela entraîne la modification chimique d'une cellule (comme le font les médicaments). Cela signifie que l'agence peut utiliser les canaux normaux pour réglementer toute application spécifique chez l'homme. En effet, les législateurs ont ajouté un avenant à un projet de loi de dépenses omnibus qui empêche l'agence d'examiner les demandes liées au code héréditaire d'un embryon humain. Mais quelque chose se passe aussi en arrière-plan. Nous savons que, par exemple, de nombreuses mères potentielles de nouveau-nés trisomiques choisissent d'avorter, et il n'est pas difficile d'envisager une pente glissante de in vitro techniques, peut-être des modifications génétiques, appliquées à des conditions telles que l'autisme ou le risque psychiatrique. La volonté du consommateur est là.

La volonté industrielle est là aussi. Alors que l'EPA et la FDA travaillent dans l'intérêt public, de nombreux scientifiques soutenus par les NIH ont des intérêts cachés, principalement à utiliser le financement fédéral (contribuable) comme eau pour démarrer leur propre entreprise, breveter des techniques et engager des poursuites. Mark Zuckerberg et Priscilla Chan ont créé un nouveau &ldquoBiohub&rdquo qui conserve les droits exclusifs sur les brevets, un scénario similaire conçu par la Fondation Sean Parker. Le Broad Institute est armé de 650 millions de dollars du philanthrope Ted Stanley pour enquêter sur les troubles psychiatriques, ainsi que de la revendication d'un solide portefeuille de brevets de systèmes CRISPR pour lesquels il a une forte incitation financière à commercialiser et à vendre autant que possible. En effet, le directeur de Broad&rsquos, Eric Lander, a évoqué une "révolution des maladies psychiatriques" et le chef du NIH, Francis Collins, a déclaré que la génomique psychiatrique était "prête à des progrès rapides". pourquoi l'altération de notre biologie évoque l'orgueil, et nos applications et intentions peuvent mal tourner.

Premièrement, de nombreuses études récentes ont démontré que des milliers de variantes génétiques à cheval sur l'ensemble du génome contribuent à l'autisme et au risque psychiatrique, ainsi qu'aux traits de personnalité et même à l'intelligence. TIGE3, DIXDC1, DISC1 et C4, certains de nos gènes candidats les plus prometteurs pour l'autisme ou la schizophrénie, contiennent des variantes qui n'augmentent en fait le risque que d'une fraction de point de pourcentage. Pour un autre, appelé GRIN1, le stress de l'enfance peut diminuer l'expression de ses gènes et nuire à l'apprentissage. Bien que les affections neuropsychiatriques soient hautement héréditaires, aucune variante génétique unique ne contribue beaucoup au risque de les hériter, et il n'est donc pas particulièrement possible de les corriger par modification génétique. Le journaliste David Dobbs les a ailleurs appelés « Many Assorted Genes of Tiny Significance », ou MAGOTS.

La biologie est robuste contre la panne. Il chevauche le risque comme un gestionnaire de fonds, et ce chevauchement du risque sur l'ensemble du génome est l'une des raisons pour lesquelles il y a si peu de « ldquotargets » uniques pour bon nombre de ces traits psychologiques et cognitifs. En effet, bon nombre de ces variantes génétiques peuvent être pléiotropes, ce qui signifie qu'elles ont des effets différents, souvent sans rapport, dans différentes cellules ou tissus. La gravité de leurs effets d'amélioration ou de diminution peut également varier, en fonction de leur patrimoine génétique, des autres variantes génétiques dont ils ont hérité.

Deuxièmement, les scientifiques ont tendance à considérer les hommes comme des machines, les gènes comme leurs parties brisées et les variations de la vie comme des problèmes à résoudre et des errements en dehors de la courbe normale. Cela suppose qu'il existe une bonne façon pour les gènes d'être. En réalité, Darwin nous a montré que l'évolution ne progresse pas vers un modèle idéal ou une forme plus parfaite, mais est plutôt un travail de bricolage vers l'adaptation dans des niches locales. Nulle part dans la nature il n'est dit comment un gène devrait fonctionner.

De plus, les variantes génétiques qui nous prédisposent à des risques ou à des faiblesses supposées sont précisément les mêmes qui s'avèrent avoir de petits avantages en termes de fitness (elles nous rendent meilleurs en chiffres, plus sensibles, altèrent la concentration). C'est l'une des raisons pour lesquelles je suis un &ldquoneurodiversité.&rdquo L'évolution fonctionne à la marge, et elle le fait par le biais de compromis : souvent, vous n'obtenez pas d'avantage sans risquer d'être désavantagé. Ce n'est pas anodin.

En 1966, Richard Lewontin et John Hubby ont proposé l'idée de « sélection d'équilibrage », qui suggère que des versions nuisibles de gènes, appelées allèles, peuvent rester dans la population pour contribuer à la diversité génétique. Ces versions peuvent être utiles dans le cas où les individus ont une copie de la version rare du gène et une copie d'une forme plus courante et infaillible (cela rend l'individu « ldquohétérozygote »). La tristement célèbre variante APOE4, la variante à risque unique la plus forte pour la maladie d'Alzheimer à début tardif, reste à une fréquence de 15 % dans la population et la raison principale est qu'elle peut également augmenter la vitamine D. Une variation d'un gène appelé COMT peut multiplier par quatre les niveaux de dopamine dans le cortex frontal, ce qui peut augmenter la concentration et peut-être utile si vous en avez une copie, bien que cela vous rende plus enclin à être nerveux si vous en avez deux copies (ce que 5% d'entre nous font).

Même certaines variantes très compromettantes persistent en s'appuyant sur d'autres gènes utiles soumis à la sélection naturelle. L'année dernière, Tobias Lenz, un scientifique de l'Institut Max-Planck de biologie évolutive en Allemagne, a rapporté qu'une région du génome appelée le complexe majeur d'histocompatibilité, qui crée un composant du système immunitaire qui détecte un éventail d'infections, est jonchée de mutations. . Beaucoup de ces mutations s'associent également aux maladies humaines, au cancer, aux maladies auto-immunes et à la schizophrénie. L'avantage d'altérer les gènes du système immunitaire peut donc s'accompagner d'un compromis consistant à éliminer les gènes qui se déplacent à proximité et présentent un risque associé de cancer ou de troubles neuropsychiatriques. Perdre le mauvais peut aussi signifier perdre le bon.

Il n'y a pas de gènes supérieurs. Les gènes ont une histoire longue et stratifiée, et ils ont souvent trois ou quatre fonctions indépendantes, qui s'équilibrent les unes par rapport aux autres lors de la sélection. Ces variantes risquées qui peuvent, dans le bon scénario, par exemple, nous rendre meilleurs en chiffres sont en fait utile rester dans la population dans les basses fréquences. En effet, des versions de centaines de gènes qui nous prédisposent à des risques psychiatriques restent dans la population à des taux stables, tandis que les troubles du spectre autistique et la schizophrénie surviennent chacun à environ un pour cent, ce qui suggère un compromis entre le risque et l'avantage.

Dans son livre de 2015 NeuroTribes, Steve Silberman s'est opposé à « l'autisme présenté comme une aberration contemporaine », suggérant plutôt qu'il avait ses racines dans « d'anciens gènes largement partagés dans la population générale tout en étant plus concentrés dans certaines familles que dans d'autres. Quel que soit l'autisme, ce n'est pas un produit unique de la civilisation moderne. C'est un cadeau étrange de notre passé profond, transmis à travers des millions d'années d'évolution.&rdquo

En 1995, Arnold Ludwig a signalé un taux de 77% de troubles psychiatriques chez d'éminents écrivains de fiction. Le lien entre créativité et folie est un vieux débat, mais il existe des théories plausibles sur la façon dont cela fonctionne. Un dans la littérature scientifique est que les traits subcliniques & mdash que nous caractérisons souvent comme schizotypiques ou psychotiques & mdashor même des traits psychologiques comme & lqu'ouverture à l'expérience & raquo permettent aux gens de mieux performer sur les mesures de créativité. Cependant, si ces tendances deviennent trop prononcées dans les cas de maladie mentale grave, l'aptitude à la productivité et à la créativité s'effondrent. - la pensée en boîte, mais une spirale complète dans un épisode psychotique entraîne un déclin rapide de la perspicacité.

Comme me l'a dit Steven Pinker, &ldquoIl y a plusieurs explications possibles pour lesquelles le trait d'ouverture à l'expérience pourrait être une adaptation individuelle. Comme pour tout trait qui varie d'un individu à l'autre, il est difficile d'expliquer pourquoi il ne prend pas une valeur unique et optimale chez tous les membres de l'espèce. Parmi les possibilités, il y a le fait que c'est le résultat de mutations qui n'ont pas encore été éliminées que différentes valeurs sont adaptatives dans différents types d'environnements et que cela dépend de la fréquence : il n'est adaptatif que lorsque ce n'est pas trop courant.

Mais des milliers de variantes génétiques s'additionnent effectivement pour influencer le risque psychiatrique. Le fait que ces variantes restent dans la population humaine à de petites fréquences suggère également qu'elles peuvent dissimuler un avantage pour la condition physique dans certains antécédents génétiques. Pour certaines personnes, nous ne devrions pas être si rapides à extraire des extraits de code de nos génomes. Certains de ceux qui présentent un risque psychiatrique&mdashCarrie Fisher, David Foster Wallace, Kurt Cobain&mdash s'avèrent éclairer la réalité d'une manière que ceux à l'intérieur de la courbe normale ne peuvent pas. Ils montrent les limites de la condition humaine, l'échec ultime à toute sécurité et l'impossibilité de tout contrôle. Que nous puissions faire mieux que cela grâce à la biotechnologie est peu probable que nous voudrions le faire est au mieux douteux et, au pire, moralement discutable. “Bénis soient les doux, car ils hériteront la terre.”

Nous connaissons depuis longtemps la folie du déterminisme génétique : 30 000 gènes ne peuvent modéliser 100 000 000 000 000 (cent trillions) de connexions synaptiques dans le cerveau. Nous savons également que le stress chronique et les facteurs sociaux et économiques limitants sont d'une importance cruciale pour la santé, notamment les taux de cancer, la santé cardiovasculaire et mentale, tels qu'ils sont articulés à travers des phénomènes bien connus tels que "l'effet Glasgow". Pourtant, le NIMH a pris la position de ne financer des recherches qui impliquent une &ldquoneuro-signature&rdquo, qui soutient commodément un modèle de fabricant de médicaments et ignore le contexte des conditions. Nous investissons des milliards dans les données, et pourtant, chaque jour, je me rendais au travail à Cambridge, je passais devant un « milehadone mile », où de nombreux sans-abri souffrent de panique et de schizophrénie, sans ressources adéquates et économisent pour un demi-million de dollars de toilettes. La promesse que nous pouvons utiliser la modification génétique, ou même les données, pour éliminer les troubles psychiatriques est une course folle. Le stress chronique est important. Et les variantes génétiques à risque restent dans la population car elles sont avantageuses pour certaines personnes, étant donné le bon bagage génétique ou les bonnes conditions. Ces variantes de risque spéculent et mdashvolution, toujours et pour toujours, prend des risques.


Des cellules eucaryotes

Comme les cellules procaryotes, toutes les cellules eucaryotes sont entourées de membranes plasmiques et contiennent des ribosomes. Cependant, les cellules eucaryotes sont beaucoup plus complexes et contiennent un noyau, une variété d'organites cytoplasmiques et un cytosquelette (figure 1.7). L'organite le plus grand et le plus important des cellules eucaryotes est le noyau, avec un diamètre d'environ 5 μm. Le noyau contient l'information génétique de la cellule, qui chez les eucaryotes est organisée en molécules d'ADN linéaires plutôt que circulaires. Le noyau est le site de la réplication de l'ADN et de la synthèse de l'ARN. La traduction de l'ARN en protéines a lieu sur les ribosomes du cytoplasme.

Graphique 1.7

Structures des cellules animales et végétales. Les cellules animales et végétales sont entourées d'une membrane plasmique et contiennent en commun un noyau, un cytosquelette et de nombreux organites cytoplasmiques. Les cellules végétales sont également entourées d'une paroi cellulaire et contiennent des chloroplastes (plus.)

En plus d'un noyau, les cellules eucaryotes contiennent une variété d'organites membranaires dans leur cytoplasme. Ces organites fournissent des compartiments dans lesquels différentes activités métaboliques sont localisées. Les cellules eucaryotes sont généralement beaucoup plus grandes que les cellules procaryotes, ayant fréquemment un volume cellulaire au moins mille fois supérieur. La compartimentation fournie par les organites cytoplasmiques est ce qui permet aux cellules eucaryotes de fonctionner efficacement. Deux de ces organites, les mitochondries et les chloroplastes, jouent un rôle essentiel dans le métabolisme énergétique. Mitochondria, which are found in almost all eukaryotic cells, are the sites of oxidative metabolism and are thus responsible for generating most of the ATP derived from the breakdown of organic molecules. Chloroplasts are the sites of photosynthesis and are found only in the cells of plants and green algae. Lysosomes and peroxisomes also provide specialized metabolic compartments for the digestion of macromolecules and for various oxidative reactions, respectively. In addition, most plant cells contain large vacuoles that perform a variety of functions, including the digestion of macromolecules and the storage of both waste products and nutrients.

Because of the size and complexity of eukaryotic cells, the transport of proteins to their correct destinations within the cell is a formidable task. Two cytoplasmic organelles, the endoplasmic reticulum and the Golgi apparatus, are specifically devoted to the sorting and transport of proteins destined for secretion, incorporation into the plasma membrane, and incorporation into lysosomes. The endoplasmic reticulum is an extensive network of intracellular membranes, extending from the nuclear membrane throughout the cytoplasm. It functions not only in the processing and transport of proteins, but also in the synthesis of lipids. From the endoplasmic reticulum, proteins are transported within small membrane vesicles to the Golgi apparatus, where they are further processed and sorted for transport to their final destinations. In addition to this role in protein transport, the Golgi apparatus serves as a site of lipid synthesis and (in plant cells) as the site of synthesis of some of the polysaccharides that compose the cell wall.

Eukaryotic cells have another level of internal organization: the cytoskeleton, a network of protein filaments extending throughout the cytoplasm. The cytoskeleton provides the structural framework of the cell, determining cell shape and the general organization of the cytoplasm. In addition, the cytoskeleton is responsible for the movements of entire cells (e.g., the contraction of muscle cells) and for the intracellular transport and positioning of organelles and other structures, including the movements of chromosomes during cell division.

The eukaryotes developed at least 2.7 billion years ago, following some 1 to 1.5 billion years of prokaryotic evolution. Studies of their DNA sequences indicate that the archaebacteria and eubacteria are as different from each other as either is from present-day eukaryotes. Therefore, a very early event in evolution appears to have been the divergence of three lines of descent from a common ancestor, giving rise to present-day archaebacteria, eubacteria, and eukaryotes. Interestingly, many archaebacterial genes are more similar to those of eukaryotes than to those of eubacteria, indicating that the archaebacteria and eukaryotes share a common line of evolutionary descent and are more closely related to each other than either is to the eubacteria (Figure 1.8).

Figure 1.8

Evolution of cells. Present-day cells evolved from a common prokaryotic ancestor along three lines of descent, giving rise to archaebacteria, eubacteria, and eukaryotes. Mitochondria and chloroplasts originated from the endosymbiotic association of aerobic (more. )

A critical step in the evolution of eukaryotic cells was the acquisition of membrane-enclosed subcellular organelles, allowing the development of the complexity characteristic of these cells. The organelles are thought to have been acquired as a result of the association of prokaryotic cells with the ancestor of eukaryotes.

The hypothesis that eukaryotic cells evolved from a symbiotic association of prokaryotes𠅎ndosymbiosis—is particularly well supported by studies of mitochondria and chloroplasts, which are thought to have evolved from bacteria living in large cells. Both mitochondria and chloroplasts are similar to bacteria in size, and like bacteria, they reproduce by dividing in two. Most important, both mitochondria and chloroplasts contain their own DNA, which encodes some of their components. The mitochondrial and chloroplast DNAs are replicated each time the organelle divides, and the genes they encode are transcribed within the organelle and translated on organelle ribosomes. Mitochondria and chloroplasts thus contain their own genetic systems, which are distinct from the nuclear genome of the cell. Furthermore, the ribosomes and ribosomal RNAs of these organelles are more closely related to those of bacteria than to those encoded by the nuclear genomes of eukaryotes.

An endosymbiotic origin for these organelles is now generally accepted, with mitochondria thought to have evolved from aerobic bacteria and chloroplasts from photosynthetic bacteria, such as the cyanobacteria. The acquisition of aerobic bacteria would have provided an anaerobic cell with the ability to carry out oxidative metabolism. The acquisition of photosynthetic bacteria would have provided the nutritional independence afforded by the ability to perform photosynthesis. Thus, these endosymbiotic associations were highly advantageous to their partners and were selected for in the course of evolution. Through time, most of the genes originally present in these bacteria apparently became incorporated into the nuclear genome of the cell, so only a few components of mitochondria and chloroplasts are still encoded by the organelle genomes.


Transcription Start and Stop Signals Are Heterogeneous in Nucleotide Sequence

As we have just seen, the processes of transcription initiation and termination involve a complicated series of structural transitions in protein, DNA, and RNA molecules. It is perhaps not surprising that the signals encoded in DNA that specify these transitions are difficult for researchers to recognize. Indeed, a comparison of many different bacterial promoters reveals that they are heterogeneous in DNA sequence. Nevertheless, they all contain related sequences, reflecting in part aspects of the DNA that are recognized directly by the σ factor. These common features are often summarized in the form of a consensus sequence (Figure 6-12). In general, a consensus nucleotide sequence is derived by comparing many sequences with the same basic function and tallying up the most common nucleotide found at each position. It therefore serves as a summary or 𠇊verage” of a large number of individual nucleotide sequences.

Figure 6-12

Consensus sequence for the major class of E. coli promoters. (A) The promoters are characterized by two hexameric DNA sequences, the -35 sequence and the -10 sequence named for their approximate location relative to the start point of transcription (designated (more. )

One reason that individual bacterial promoters differ in DNA sequence is that the precise sequence determines the strength (or number of initiation events per unit time) of the promoter. Evolutionary processes have thus fine-tuned each promoter to initiate as often as necessary and have created a wide spectrum of promoters. Promoters for genes that code for abundant proteins are much stronger than those associated with genes that encode rare proteins, and their nucleotide sequences are responsible for these differences.

Like bacterial promoters, transcription terminators also include a wide range of sequences, with the potential to form a simple RNA structure being the most important common feature. Since an almost unlimited number of nucleotide sequences have this potential, terminator sequences are much more heterogeneous than those of promoters.

We have discussed bacterial promoters and terminators in some detail to illustrate an important point regarding the analysis of genome sequences. Although we know a great deal about bacterial promoters and terminators and can develop consensus sequences that summarize their most salient features, their variation in nucleotide sequence makes it difficult for researchers (even when aided by powerful computers) to definitively locate them simply by inspection of the nucleotide sequence of a genome. When we encounter analogous types of sequences in eucaryotes, the problem of locating them is even more difficult. Often, additional information, some of it from direct experimentation, is needed to accurately locate the short DNA signals contained in genomes.

Promoter sequences are asymmetric (see Figure 6-12), and this feature has important consequences for their arrangement in genomes. Since DNA is double-stranded, two different RNA molecules could in principle be transcribed from any gene, using each of the two DNA strands as a template. However a gene typically has only a single promoter, and because the nucleotide sequences of bacterial (as well as eucaryotic) promoters are asymmetric the polymerase can bind in only one orientation. The polymerase thus has no option but to transcribe the one DNA strand, since it can synthesize RNA only in the 5′ to 3′ direction (Figure 6-13). The choice of template strand for each gene is therefore determined by the location and orientation of the promoter. Genome sequences reveal that the DNA strand used as the template for RNA synthesis varies from gene to gene (Figure 6-14 see also Figure 1-31).

Figure 6-13

The importance of RNA polymerase orientation. The DNA strand serving as template must be traversed in a 3′ to 5′ direction, as illustrated in Figure 6-9. Thus, the direction of RNA polymerase movement determines which of the two DNA strands (more. )

Figure 6-14

Directions of transcription along a short portion of a bacterial chromosome. Some genes are transcribed using one DNA strand as a template, while others are transcribed using the other DNA strand. The direction of transcription is determined by the promoter (more. )

Having considered transcription in bacteria, we now turn to the situation in eucaryotes, where the synthesis of RNA molecules is a much more elaborate affair.


L'évolution d'organismes plus gros et se reproduisant sexuellement se produit-elle à des échelles de temps plus rapides que le temps géologique ?

Oui! Il existe de nombreux exemples d'évolution, même chez les espèces à reproduction sexuée, qui se produisent assez rapidement, de l'ordre d'années ou de décennies. En fait, l'unité de temps pertinente est la génération. Les souris Rock Pocket dans le sud-ouest du désert en sont un exemple étudié depuis longtemps. Ces petites souris beiges sont chassées par les hiboux, des prédateurs visuels qui repèrent les souris par leur couleur contrastante avec le sable. La plupart des souris sont exactement de la même couleur que le sable. Cette courte vidéo explique ce qui arrive à une population de souris de poche qui migre sur la roche volcanique noire, avec des taux de mutation et le nombre de générations jusqu'à ce que la population passe de tout bronzage à toute couleur de pelage noir.


4. Reciprocal Altruism

The theory of reciprocal altruism was originally developed by Trivers (1971), as an attempt to explain cases of (apparent) altruism among unrelated organisms, including members of different species. (Clearly, kin selection cannot help explain altruism among non-relatives.) Trivers' basic idea was straightforward: it may pay an organism to help another, if there is an expectation of the favour being returned in the future. (&lsquoIf you scratch my back, I'll scratch yours&rsquo.) The cost of helping is offset by the likelihood of the return benefit, permitting the behaviour to evolve by natural selection. Trivers termed with evolutionary mechanism &lsquoreciprocal altruism&rsquo.

For reciprocal altruism to work, there is no need for the two individuals to be relatives, nor even to be members of the same species. However, it is necessary that individuals should interact with each more than once, and have the ability to recognize other individuals with whom they have interacted in the past. [1] If individuals interact only once in their lifetimes and never meet again, there is obviously no possibility of return benefit, so there is nothing to be gained by helping another. However, if individuals encounter each other frequently, and are capable of identifying and punishing &lsquocheaters&rsquo who have refused to help in the past, then the helping behaviour can evolve. A &lsquocheat&rsquo who refuses to help will ultimately sabotage his own interests, for although he does not incur the cost of helping others, he forfeits the return benefits too&mdashothers will not help him in the future. This evolutionary mechanism is most likely to work where animals live in relatively small groups, increasing the likelihood of multiple encounters.

As West et al. (2007) and Bowles and Gintis (2011) note, if altruism is defined by reference to lifetime fitness, then Trivers' theory is not really about the evolution of altruism at all for behaviours that evolve via reciprocation of benefits, as described by Trivers, are ultimately of direct benefit to the individuals performing them, so do not reduce lifetime fitness. Despite this consideration, the label &lsquoreciprocal altruism&rsquo is well-entrenched in the literature, and the evolutionary mechanism that it describes is of some importance, whatever it is called. Where reciprocal altruism is referred to below, it should be remembered that the behaviours in question are only altruistic in the short-term.

The concept of reciprocal altruism is closely related to the Tit-for-Tat strategy in the iterated Prisoner's Dilemma (IPD) from game theory. In the IPD, players interact on multiple occasions, and are able to adjust their behaviour depending on what their opponent has done in previous rounds. There are two possible strategies, co-operate and defect the payoff matrix (per interaction) is as in section 2.1 above. The fact that the game is iterated rather than one-shot obviously changes the optimal course of action defecting is no longer necessarily the best option, so long as the probability of subsequent encounters is sufficiently high. In their famous computer tournament in which a large number of strategies were pitted against each other in the IPD, Axelrod and Hamilton (1981) found that the Tit-for-Tat strategy yielded the highest payoff. In Tit-For-Tat, a player follows two basic rules: (i) on the first encounter, cooperate (ii) on subsequent encounters, do what your opponent did on the previous encounter. The success of Tit-for-Tat was widely taken to confirm the idea that with multiple encounters, natural selection could favour social behaviours that entail a short-term fitness cost. Subsequent work in evolutionary game theory, much of it inspired by Axelrod and Hamilton's ideas, has confirmed that repeated games permit the evolution of social behaviours that cannot evolve in one-shot situations (cf. Nowak 2006) this is closely related to the so-called 'folk theorem' of repeated game theory in economics (cf. Bowles and Gintis 2011). For a useful discussion of social behaviour that evolves via reciprocation of benefits, see Sachs et al. 2004.

Despite the attention paid to reciprocal altruism by theoreticians, clear-cut empirical examples in non-human animals are relatively few (Hammerstein 2003, Sachs et al. 2004, Taborsky 2013). This is probably because the pre-conditions for reciprocal altruism to evolve- multiple encounters and individual recognition&mdashare not especially common. However, one possible example is provided by blood-sharing in vampire bats (Wilkinson 1984, 1990, Carter & Wilkinson 2013). It is quite common for a vampire bat to fail to feed on a given night. This is potentially fatal, for bats die if they go without food for more than a couple of days. On any given night, bats donate blood (by regurgitation) to other members of their group who have failed to feed, thus saving them from starvation. Since vampire bats live in small groups and associate with each other over long periods of time, the preconditions for reciprocal altruism are likely to be met. Wilkinson and his colleagues' studies showed that bats tended to share food with their close associates, and were more likely to share with others that had recently shared with them. These findings appear to accord with reciprocal altruism theory.

Trivers (1985) describes an apparent case of reciprocal altruism between non con-specifics. On tropical coral reefs, various species of small fish act as &lsquocleaners&rsquo for large fish, removing parasites from their mouths and gills. The interaction is mutually beneficial&mdashthe large fish gets cleaned and the cleaner gets fed. However, Trivers notes that the large fish sometimes appear to behave altruistically towards the cleaners. If a large fish is attacked by a predator while it has a cleaner in its mouth, then it waits for the cleaner to leave before fleeing the predator, rather than swallowing the cleaner and fleeing immediately. Trivers explains the larger fish's behaviour in terms of reciprocal altruism. Since the large fish often returns to the same cleaner many times over, it pays to look after the cleaner's welfare, i.e., not to swallow it, even if this increases the chance of being wounded by a predator. So the larger fish allows the cleaner to escape, because there is an expectation of return benefit&mdashgetting cleaned again in the future. As in the case of the vampire bats, it is because the large fish and the cleaner interact more than once that the behaviour can evolve.


Discussion

Inferred Order of Entry of Amino Acids into the Genetic Code

On the basis of the change in frequency of amino acids between the LUA and today, we may make inferences regarding the establishment of the genetic code ( Brooks and Fresco 2002 ). It is reasonable to assume that as the genetic code evolved, newly assigned amino acids adopted codons used infrequently in coding sequences to minimize the structural disruption of the encoded protein ( Osawa et al. 1992 ). Consequently, new amino acids would have been introduced gradually into existing primitive proteins. Thus, at the time the genetic code became fully established, those amino acids which had been added relatively early would have been overrepresented and those which had been added relatively late would have been underrepresented, relative to the composition of modern proteins. Starting from such early biased amino acid composition, primitive proteins would have proceeded to evolve toward their modern-day compositions. In such a scenario, the amino acids that were introduced into the genetic code relatively early should have decreased in frequency over the course of evolution, whereas those amino acids added relatively late should have increased in frequency (i.e., between the establishment of the genetic code, the LUA, and today).

The nine amino acids which have decreased in frequency between the LUA and today ( fig. 3UNE ) may thus be inferred to have been introduced into the code early. Most of these amino acids are among those presumed to have been most abundant in the prebiotic environment, as inferred through spark tube simulations ( Miller 1953 , 1987 ) and analysis of the Murchison meteorite ( Kvenvolden et al. 1970 ). In contrast, the eight amino acids which have increased in frequency between the LUA and today ( fig. 3B ), and which are thus inferred to have been late additions to the code, include several of the most biosynthetically complex amino acids (for example, all three aromatic amino acids, which share a common, complex metabolic intermediate, are inferred to have been late additions) most of these are presumed either to have been nonexistent or of very low abundance in the prebiotic environment. Two of these, cysteine and tryptophan, are both conservatively estimated to have been less than half as frequent within this protein set in the LUA than today.

We emphasize that the validity of the inferences drawn in this study depend upon the reliability of the Jones, Taylor, and Thornton (1992) substitution probabilities for modeling evolution over very long time periods and along all lineages. With the development of lineage-specific models of evolution, estimates of ancestral amino acid composition can be expected to improve. In the meantime, although there are undoubtedly limitations to using the matrices of Jones, Taylor, and Thornton (1992) to model evolution since the LUA, we feel they provide the best available estimates of these substitution probabilities. It is noteworthy that previously, on the basis of an independent approach, cysteine, tyrosine, and phenylalanine were inferred to have been used less frequently in proteins of the LUA than today ( Brooks and Fresco 2002 ).

The inferences drawn here regarding the relatively early or late introduction of amino acids into the genetic code are generally consistent with earlier proposals which were based on the presumed presence or absence of various amino acids in the primordial environment (see for example Wong 1975 ). However, for a few amino acids our assignment as early or late is not in keeping with earlier ideas. For example, histidine and asparagine, believed to have been absent in the prebiotic environment, are both inferred through the present work to have been added to the code relatively early, whereas glutamate, believed to have been present in the prebiotic environment, is inferred to have been added late ( figs. 3 and 4 ). Interestingly, each of these three amino acids share a block of four codons with a second amino acid: histidine with glutamine, asparagine with lysine, and glutamate with aspartate ( fig. 4 ). Codon capture, in which one amino acid loses some of its codons to another, is commonly proposed as a mechanism for introducing amino acids, especially later arriving ones, into the code ( Crick 1968 Wong 1975 ). Consistent with codon capture, it is plausible that one amino acid was added to the four-codon block first and that this amino acid later gave up two of its codons to the second amino acid which now shares the block.

Accordingly, those amino acids which were originally assigned to the codon block (i.e., aspartate, asparagine, and histidine) would have the appearance of being added to the code early, whereas those which were added to the block later through codon capture (i.e., glutamate, lysine, and glutamine) would have the appearance of being added late. Therefore, early and late amino acids do not correspond to a strict chronological order of introduction into the code. Instead, as defined here on the basis of the changing amino acid frequencies, early amino acids are probably those which at some point lost some of their codons through codon capture and consequently became less frequent over time within proteins, whereas late amino acids are those which entered the code through codon capture, did not subsequently lose any of their codons, and therefore became more frequent over time ( fig. 4 ). Finally, it is worth noting that the distinction between amino acids inferred here to have been added to the genetic code early or late does not at all correlate with the two main structural classes of the aminoacyl-tRNA synthetases. This is consistent with the earlier suggestion that these enzymes probably had no specific role in the evolution of the genetic code ( Woese 2000 ).

Existing ideas regarding the origin and evolution of the genetic code have been based largely on theoretical investigations and experiments involving oligonucleotide aptamer binding of amino acids (reviewed in Knight, Freeland, and Landweber 1999 ). The present findings suggest that notwithstanding the impact of mutation over the long course of molecular evolution, with the aid of the appropriate analytical tools and insights, the sequences of contemporary proteins also provide an important avenue for exploring these early evolutionary events.