Informations

Différentes protéines peuvent-elles être produites lors de la traduction d'un même ARNm chez les eucaryotes ?


Existe-t-il un mécanisme de traduction que les eucaryotes peuvent utiliser pour produire différentes protéines à partir d'un seul ARNm transcrit ?


Il existe de multiples mécanismes connus pour conduire à la traduction de protéines sensiblement (ou entièrement) différentes à partir d'un seul ARNm. Bien que ces mécanismes soient plus généralement observés dans les virus, je me concentre sur des exemples documentés dans le transcriptome endogène des eucaryotes.

Initiation à la traduction alternative

Un processus qui peut conduire à la traduction de différentes protéines à partir du même ARNm chez les eucaryotes est l'utilisation de sites alternatifs d'initiation de la traduction.1,2 La traduction commence généralement par un complexe de pré-initiation reconnaissant la coiffe 5' et se chargeant sur l'ARNm. Ce complexe analyse jusqu'à ce qu'il trouve un site de démarrage approprié. Le choix du site de départ dépend de la manière dont la séquence ribonucléotidique correspond à la séquence consensus de Kozak.3 Si la région autour du premier AUG ne correspond pas à ce consensus, un processus connu sous le nom de balayage à fuite se produit et le complexe de pré-initiation peut continuer le long de l'ARNm jusqu'à ce qu'un "bon" site de départ soit trouvé.

Bien que cela puisse donner lieu à des protéines ayant des fonctions différentes, elles auront généralement encore de grandes régions de séquence d'acides aminés en commun. Un exemple en est une kinase connue sous le nom de MK2, qui est « un régulateur clé de la transcription, de la migration, de la signalisation de la mort et de la régulation des gènes post-transcriptionnels ».4

ARNm polycistroniques

Bien que plus fréquent chez les procaryotes, dans certains cas, les eucaryotes ont également des transcrits polycistroniques5,6. Ces transcrits codent pour plusieurs protéines séparées (c'est-à-dire à partir de cadres de lecture ouverts indépendants). Les exemples que j'ai trouvés pour les mammifères sont tous bicistroniques (opérons à deux gènes) : LASS1-GDF1, SNRPN-SNURF, MTPN-LUZP6 et MFRP-C1QTNF5. Vous pouvez rechercher ces paires de gènes, mais il ne semble pas y avoir une énorme quantité d'informations disponibles et dans de nombreux cas, l'un des gènes est presque complètement non caractérisé. Les opérons eucaryotes (alias ARNm polycistroniques) sont omniprésents dans les trypanosomes, semblent être très fréquents chez les nématodes (vers ronds) et sont également fréquemment observés chez la drosophile (une mouche).6

Lecture traductionnelle

Lecture traductionnelle aka. La suppression du codon d'arrêt se produit lorsqu'un codon d'arrêt dans le cadre est ignoré de manière stochastique ou dans des conditions spécifiques et que la traduction se poursuit au-delà de ce point. Cela conduit à une extension C-terminale de la protéine qui, dans certains cas, s'est avérée avoir des implications fonctionnelles7,8. Un exemple de ceci est le prion [PSI+] dans la levure, qui favorise la lecture de la traduction dans tout le transcriptome de la levure en inactivant un facteur impliqué dans la terminaison de la traduction.7

Décalages de trame translationnels

Ceci est bien couvert dans la réponse de @Dirigible.

Les références:

1 : Kochetov, A.V. (2008). Sites de démarrage de traduction alternatifs et potentiel de codage caché des ARNm eucaryotes. Bioessays, 30 (7), 683-691.

2 : Wan, J., & Qian, S. B. (2013). TISdb : une base de données pour l'initiation de la traduction alternative dans les cellules de mammifères. Recherche sur les acides nucléiques, 42(D1), D845-D850.

3: Acevedo, J. M., Hoermann, B., Schlimbach, T., & Teleman, A. A. (2018). Les changements dans l'allongement global de la traduction ou les taux d'initiation façonnent le protéome via la séquence de Kozak. Rapports scientifiques, 8(1), 4018. 4: Trulley, P., Snieckute, G., Bekker-Jensen, D., Menon, MB, Freund, R., Kotlyarov, A.,… & Gaestel, M. ( 2019). L'initiation de la traduction alternative génère une isoforme fonctionnellement distincte de la protéine kinase MK2 activée par le stress. Rapports cellulaires, 27(10), 2859-2870.

5 : Tautz, D. (2008). Gènes codant pour les peptides polycistroniques chez les eucaryotes - à quel point sont-ils répandus ?. Briefings en génomique fonctionnelle et protéomique, 8 (1), 68-74.

6 : Blumenthal, T. (2004). Opéron chez les eucaryotes. Briefings in Functional Genomics, 3(3), 199-211.

7 : Schueren, F., & Thoms, S. (2016). Lecture translationnelle fonctionnelle : une perspective de biologie des systèmes. Génétique PLoS, 12(8), e1006196.

8 : Loughran, G., Jungreis, I., Tzani, I., Power, M., Dmitriev, R. I., Ivanov, I. P.,… & Atkins, J. F. (2018). La lecture du codon d'arrêt génère une variante C-terminale étendue du récepteur humain de la vitamine D avec une réponse réduite au calcitriol. Journal de chimie biologique, 293 (12), 4434-4444.


Séparé du mécanisme de site de début de traduction alternatif décrit par tyersome, il y a le décalage de trame de traduction programmé. Ceci est indépendant de l'épissage alternatif ou des modifications post-traductionnelles, et se produit lorsqu'un ribosome change de cadre de lecture alors qu'une protéine est déjà en cours de traduction. Typiquement, ce phénomène est associé à la traduction virale et permet aux virus de coder de nombreuses protéines sur des génomes relativement courts. Prenons l'exemple du VIH : la polyprotéine gag-pol nécessite un décalage de trame -1 efficace pour l'expression des produits des gènes gag et pol individuels.

Chez les eucaryotes, les exemples sont plus rares. Découvrez cette critique de 2012 --

… des exemples de gènes de mammifères qui utilisent le décalage du cadre de lecture -1 sont le gène régulé par la différenciation du carcinome embryonnaire de la souris (EDR) et son orthologue humain PEG10. Une séquence glissante de G GGA AAC, en combinaison avec un pseudo-nœud, médie un décalage de trame -1 hautement efficace, similaire aux motifs viraux de décalage de trame (Clark et al., 2007). Récemment, un décalage du cadre de lecture ribosomique -1 programmé a été identifié dans l'ARNm de la polypose adénomateuse (APC) chez Caenorhabditis elegans qui est médié par une séquence glissante A AAA AAA ou A AAA AAC (Baranov et al., 2011). La pertinence fonctionnelle de ce frameshift est incertaine.

Les événements de décalage du cadre de lecture sont souvent médiés par des structures secondaires d'ARN conservées, comme des pseudo-nœuds et des tiges-boucles. Pour quelques exemples spécifiques des types de structures impliquées dans le frameshifting, voir les publications suivantes :

Identification d'un nouvel antizyme ARNm +1 pseudo-nœud stimulant de décalage de cadre dans un sous-ensemble de divers invertébrés et son absence apparente chez les espèces intermédiaires

Sondage structural et analyse mutagène de la tige-boucle requise pour le décalage de cadre ribosomique d'Escherichia coli dnaX : efficacité programmée de 50 %

-1 Frameshifting sur un site d'hexanucléotide CGA AAG est requis pour la transposition de la séquence d'insertion IS1222


Quelques exemples plus récents de (potentiels) décalages de trames translationnels programmés chez les eucaryotes :

Recherche de décalages potentiels de lecture dans les CD d'Arabidopsis thaliana et d'autres génomes

Préimpression: Décalage du cadre ribosomique programmé étendu chez l'homme, révélé par un essai de rapporteur massivement parallèle


COUPLAGE DE LA TRANSCRIPTION ET DE LA TRADUCTION DANS LES EUCARYOTES [O’SHEA LAB]

Le dogme central de la biologie moléculaire propose que l'information circule de l'ADN à l'ARN par le processus de transcription et de l'ARN à la protéine par la traduction. Chez les eucaryotes, ces deux processus sont considérés comme déconnectés : les facteurs nucléaires contrôlent la transcription et un ensemble différent de facteurs contrôle la traduction dans le cytoplasme. Pendant les périodes de stress, les cellules présentent d'importants changements transcriptionnels, y compris la régulation à la hausse de nombreux gènes importants pour la survie. Parallèlement à ces grands changements transcriptionnels, les cellules diminuent considérablement la synthèse globale des protéines, amortissant ainsi la réponse au stress au niveau de l'expression des protéines. Brian Zid et Erin O'Shea se sont demandé s'il pouvait y avoir une traduction préférentielle des transcriptions en cas de stress. Pour le savoir, ils ont étudié la privation de glucose chez la levure, une condition dans laquelle la traduction est rapidement réprimée alors que d'importants changements transcriptionnels ont lieu.

En utilisant le profilage des ribosomes, une technique qui mesure le nombre de ribosomes sur les ARNm à l'aide d'un séquençage de nouvelle génération, les auteurs ont découvert qu'un sous-ensemble d'ARNm régulés à la hausse par transcription était préférentiellement traduit pendant la privation de glucose. Un phénomène conservé lors du stress est la formation d'agrégats ARNm-protéine, appelés granules de stress. En utilisant la microscopie à fluorescence, ils ont découvert que les ARNm qui étaient traduits de manière préférentielle restaient diffus dans tout le cytoplasme, tandis que les ARNm régulés à la hausse mais mal traduits se sont agrégés en granules de stress.

Étonnamment, les informations spécifiant la localisation différentielle et la production de protéines de ces deux classes d'ARNm ne se trouvent pas directement dans la séquence d'ARNm, mais sont plutôt codées dans la séquence de promoteur conduisant la production d'ARNm. Les auteurs ont découvert que la réactivité du promoteur au facteur de choc thermique du facteur de transcription (Hsf1) spécifie une localisation cytoplasmique diffuse et une production de protéines plus élevée en cas de privation de glucose, tandis que les éléments promoteurs en amont des ARNm mal traduits dirigent ces ARNm vers les granules de stress en cas de privation de glucose.

Cela modifie le paradigme actuel selon lequel la transcription et la traduction sont déconnectées chez les eucaryotes, les auteurs constatent que ces processus spatialement distincts sont couplés lors de la limitation des nutriments. Un lien entre la régulation transcriptionnelle et la localisation cytoplasmique peut être une adaptation générale pendant les périodes de stress, permettant à la cellule de réguler de manière coordonnée la production de classes entières de protéines. Dans des conditions de non-stress, la régulation à la hausse d'une classe de transcrits par un facteur de transcription produirait des quantités similaires de protéines à partir de chacun des ARNm, car la traduction se déroulerait à une vitesse généralement élevée. Dans des conditions stressantes, lorsque la traduction globale est réduite, une traduction sélective peut être nécessaire pour produire les protéines nécessaires à l'adaptation à la nouvelle condition. Cela suggère que la traduction des ensembles de gènes peut être coordonnée à l'aide d'un seul facteur nucléaire, sans qu'il soit nécessaire de moduler la séquence de chaque ARNm.

Ce travail, qui paraîtra dans le numéro du 7 août de Nature, offre une nouvelle direction pour étudier si la localisation de l'ARNm dépendant du promoteur régule l'expression des protéines dans une variété d'états cellulaires. Le laboratoire O'Shea travaille actuellement à identifier les facteurs qui peuvent être chargés de manière co-transcriptionnelle sur les ARNm afin de déterminer le devenir d'un ARNm.


Biochimie. 5e édition.

Le plan de base de la synthèse des protéines chez les eucaryotes et les archées est similaire à celui des bactéries. Les grands thèmes structurels et mécanistes reviennent dans tous les domaines de la vie. Cependant, la synthèse des protéines eucaryotes implique plus de composants protéiques que la synthèse des protéines procaryotes, et certaines étapes sont plus complexes. Certaines similitudes et différences notables sont les suivantes :

Ribosomes. Les ribosomes eucaryotes sont plus gros. Ils se composent d'une grande sous-unité 60S et d'une petite sous-unité 40S, qui se réunissent pour former une particule 80S ayant une masse de 4200 kd, contre 2700 kd pour le ribosome procaryote 70S. La sous-unité 40S contient un ARN 18S homologue à l'ARN procaryote 16S. La sous-unité 60S contient trois ARN : les ARN 5S et 28S sont les homologues des molécules procaryotes 5S et 23S, son ARN 5.8S est unique aux eucaryotes.

ARNt initiateur. Chez les eucaryotes, l'acide aminé initiateur est la méthionine plutôt que N-formylméthionine. Cependant, comme chez les procaryotes, un ARNt spécial participe à l'initiation. Cet aminoacyl-ARNt est appelé Met-ARNtje ou Met-ARNtF (l'indice “i” représente l'initiation, et 𠇏” indique qu'il peut être formylé in vitro).

Initiation. Le codon initiateur chez les eucaryotes est toujours AUG. Les eucaryotes, contrairement aux procaryotes, n'utilisent pas de séquence spécifique riche en purines du côté 5 & 02032 pour distinguer les AUG initiateurs des AUG internes. Au lieu de cela, l'AUG le plus proche de l'extrémité 5′ de l'ARNm est généralement sélectionné comme site de départ. Un ribosome 40S se fixe au capuchon à l'extrémité 5&# de l'ARNm eucaryote (section 28.3.1) et recherche un codon AUG en se déplaçant pas à pas dans la direction 3&# (figure 29.33). Ce processus de balayage dans la synthèse des protéines eucaryotes est alimenté par des hélicases qui hydrolysent l'ATP. Appariement de l'anticodon du Met-ARNtje avec le codon AUG de l'ARNm signale que la cible a été trouvée. Dans presque tous les cas, l'ARNm eucaryote n'a qu'un seul site de départ et est donc la matrice d'une seule protéine. En revanche, un ARNm procaryote peut avoir plusieurs séquences Shine-Dalgarno et, par conséquent, des sites de départ, et il peut servir de matrice pour la synthèse de plusieurs protéines. Les eucaryotes utilisent beaucoup plus de facteurs d'initiation que les procaryotes, et leur interaction est beaucoup plus complexe. Le préfixe eIF désigne un facteur d'initiation eucaryote. Par exemple, eIF-4E est une protéine qui se lie directement à la coiffe 7-méthylguanosine (section 28.3.1), tandis que eIF-4A est une hélicase. La différence de mécanisme d'initiation entre les procaryotes et les eucaryotes est, en partie, une conséquence de la différence de traitement de l'ARN. L'extrémité 5&# de l'ARNm est facilement disponible pour les ribosomes immédiatement après la transcription chez les procaryotes. En revanche, le pré-ARNm doit être traité et transporté vers le cytoplasme chez les eucaryotes avant que la traduction ne soit initiée. Ainsi, il existe de nombreuses opportunités pour la formation de structures secondaires complexes qui doivent être éliminées pour exposer les signaux dans l'ARNm mature. Le capuchon 5′ fournit un point de départ facilement reconnaissable. De plus, la complexité de l'initiation de la traduction eucaryote fournit un autre mécanisme d'expression génique que nous explorerons plus en détail au chapitre 31.

Allongement et terminaison. Les facteurs d'élongation eucaryotes EF1α et EF1βγ sont les homologues des EF-Tu et EF-T procaryotes. La forme GTP de EF1α fournit l'aminoacyl-ARNt au site A du ribosome, et EF1βγ catalyse l'échange de GTP contre le GDP lié. L'EF2 eucaryote médie la translocation induite par le GTP de la même manière que l'EF-G procaryote. La terminaison chez les eucaryotes est réalisée par un seul facteur de libération, eRF1, contre deux chez les procaryotes. Enfin, eIF3, comme son homologue procaryote IF3, empêche la réassociation des sous-unités ribosomiques en l'absence d'un complexe d'initiation.

Figure 29.33

Initiation à la traduction eucaryote. Chez les eucaryotes, l'initiation de la traduction commence par l'assemblage d'un complexe sur le capuchon 5′ qui comprend la sous-unité 40S et Met-ARNtje. Poussé par l'hydrolyse de l'ATP, ce complexe scanne l'ARNm jusqu'au premier AUG (suite.)


Modifications de l'ARN messager

La traduction se produit dans le cytoplasme. Après avoir quitté le noyau, l'ARNm doit subir plusieurs modifications avant d'être traduit. Les sections de l'ARNm qui ne codent pas pour les acides aminés, appelées introns, sont supprimées. Une queue poly-A, constituée de plusieurs bases d'adénine, est ajoutée à une extrémité de l'ARNm, tandis qu'une coiffe de guanosine triphosphate est ajoutée à l'autre extrémité. Ces modifications suppriment les sections inutiles et protègent les extrémités de la molécule d'ARNm. Une fois toutes les modifications terminées, l'ARNm est prêt pour la traduction.


Caractéristiques de l'ARNm des procaryotes et des eucaryotes

L'ARNm produit par le processus de transcription est également connu sous le nom de transcrits d'ARNm. Bien qu'ils présentent un certain nombre de caractéristiques similaires, ils présentent également plusieurs différences. Le transcrit d'ARNm procaryote peut être divisé en un certain nombre de parties/sections qui incluent : la région non codante (située à l'extrémité 5' du transcrit), la séquence Shine-Dalgarno, une deuxième région non codante, le codon de départ , la région codante, le codon stop et une autre région non codante à l'extrémité 3'.

L'ARNm eucaryote, d'autre part, commence par une coiffe 5' et se compose d'un nucléotide guanine. Ce nucléotide est attaché à un groupe méthyle et lié au nucléotide voisin. Le nucléotide guanine est attaché à la région non codante, similaire à celle de l'ARNm procaryote. La section suivante est le codon de départ à partir duquel s'étend la région codante.

La région codante se termine au codon d'arrêt. Ceci est suivi d'une région non codante et enfin de la queue poly-A (constituée d'adénines et pouvant comprendre jusqu'à 2 200 nucléotides) à l'extrémité 3'. Chez les eucaryotes, la coiffe 5' et la queue poly-A empêchent la dégradation de l'ARNm.

Ici, il est important de se rappeler que chez les eucaryotes, l'ARNm doit être libéré dans le cytoplasme où la traduction a lieu. Par conséquent, les deux sections jouent un rôle important dans le maintien de l'intégrité de l'ARNm. Chez les procaryotes, la transcription et la traduction peuvent se produire en même temps et ces sections ne sont donc pas nécessaires.

Contrairement au transcrit eucaryote, cet ARNm n'a pas besoin d'être transporté sur une longue distance et ne rencontre donc pas diverses enzymes susceptibles de le dégrader. En conséquence, l'ARNm des procaryotes ne nécessite pas de protection supplémentaire pour éviter les dommages.

Comme mentionné, Traduction est le processus par lequel les éléments constitutifs des protéines (polypeptides/chaînes d'acides aminés) sont construits à l'aide des informations contenues dans l'ARNm. C'est un processus important étant donné qu'il produit des protéines nécessaires à diverses fonctions cellulaires.

Afin de comprendre le processus, il est important de connaître certains des composants et des terminologies utilisés dans la traduction.

Outre l'ARNm (ARN messager), ils comprennent :

· Polypeptides - Les chaînes d'acides aminés et sont les molécules qui composent les protéines.

· Nucléotides - Composants structurels de l'ADN et de l'ARN. Ils sont eux-mêmes constitués de nucléoside et de phosphate et comprennent l'adénine, la thymine, la cytosine et la guanine (ainsi que l'uracile).

· Codon - Un groupe composé de trois nucléotides - Par exemple, AUG est un bon exemple de codon - Alors que les codons servent de blocs de construction d'acides aminés, d'autres arrêtent le processus une fois le polypeptide terminé.

· ARNt (ARN de transfert) - Agir comme le pont entre les codons d'ARNm et les acides aminés.

· Ribosome - Les ribosomes sont constitués d'ARNr et de protéines et sont les structures dans lesquelles les polypeptides sont fabriqués.


Le début de l'ARNm n'est pas traduit

Fait intéressant, toutes les régions d'une molécule d'ARNm ne correspondent pas à des acides aminés particuliers. En particulier, il existe une zone près de l'extrémité 5' de la molécule qui est connue sous le nom de région non traduite (UTR) ou séquence leader. Cette portion d'ARNm est située entre le premier nucléotide qui est transcrit et le codon d'initiation (AUG) de la région codante, et elle n'affecte pas la séquence d'acides aminés dans une protéine (Figure 3).

Alors, quel est le but de l'UTR ? Il s'avère que la séquence leader est importante car elle contient un site de liaison au ribosome. Chez les bactéries, ce site est connu sous le nom de boîte Shine-Dalgarno (AGGAGG), d'après les scientifiques John Shine et Lynn Dalgarno, qui l'ont d'abord caractérisé. Un site similaire chez les vertébrés a été caractérisé par Marilyn Kozak et est donc connu sous le nom de boîte de Kozak. Dans l'ARNm bactérien, l'UTR 5' est normalement court dans l'ARNm humain, la longueur médiane de l'UTR 5' est d'environ 170 nucléotides. Si le leader est long, il peut contenir des séquences régulatrices, y compris des sites de liaison pour les protéines, qui peuvent affecter la stabilité de l'ARNm ou l'efficacité de sa traduction.



Traitement supplémentaire

Avant que l'ARNm ne quitte le noyau, il reçoit deux « coiffes » protectrices qui empêchent les extrémités du brin de se dégrader au cours de son voyage. Les deux extrémités d'un brin d'ADN sont appelées 3' et 5', ce qui fait référence à la position des molécules de sucre dans l'ADN. Le capuchon 5' est placé sur l'extrémité 5' de l'ARNm. La queue poly-A, qui est attachée à l'extrémité 3', est généralement composée d'une longue chaîne de nucléotides d'adénine (A). Ces changements protègent les deux extrémités de l'ARN contre la dégradation par d'autres enzymes de la cellule.

Un sucre nucléotidique est composé de 5 carbones chacun est numéroté (l'apostrophe « » est appelée « premier »). Les phosphates se lient au carbone 3′ et au carbone 5′ de chaque sucre. Une extrémité d'une molécule d'ADN ou d'ARN se termine par le carbone 3' exposé et l'autre côté se termine par un phosphate attaché à l'extrémité 5' du dernier sucre. C'est pourquoi une extrémité est appelée 3' et l'autre extrémité est appelée 5'.


Différentes protéines peuvent-elles être produites lors de la traduction d'un même ARNm chez les eucaryotes ? - La biologie

Le dogme central repose sur l'existence et les propriétés d'une armée de molécules d'ARNm qui sont transitoirement créées au cours du processus de transcription et souvent, peu de temps après, dégradées. Pendant le peu de temps qu'ils se trouvent dans une cellule, ces ARNm servent de matrice pour la création d'une nouvelle génération de protéines. La question posée dans cette vignette est la suivante : en moyenne, quel est le rapport entre le message traduit et le message lui-même ?

Bien qu'il existe de nombreux facteurs qui contrôlent le rapport protéine-ARNm, le modèle le plus simple indique une estimation en termes de quelques taux clés. Pour voir cela, nous devons écrire une simple « équation de taux » qui nous indique comment la teneur en protéines changera dans un très petit incrément de temps. Plus précisément, nous recherchons la dépendance fonctionnelle entre le nombre de copies protéiques d'un gène (p) et le nombre de molécules d'ARNm (m) qui l'engendrent. Le taux de formation de p est égal au taux de traduction multiplié par le nombre de messages, m, puisque chaque molécule d'ARNm peut elle-même être considérée comme une source de protéines. Cependant, en même temps que de nouvelles protéines sont synthétisées, la dégradation des protéines retire progressivement les protéines de la circulation. De plus, le nombre de protéines dégradées est égal au taux de dégradation multiplié par le nombre total de protéines. Ces mots encombrants peuvent être beaucoup plus élégamment encapsulés dans une équation qui nous dit comment en un petit instant le nombre de protéines change, à savoir,

où est le taux de dégradation et est le taux de traduction (bien que la littérature soit malheureusement tiraillée entre ceux qui définissent la notation de cette manière et ceux qui utilisent les lettres avec exactement le sens inverse).

Figure 1 : Ribosomes sur ARNm sous forme de billes sur une ficelle (de : http://bass.bio.uci.edu/

Nous nous intéressons à la solution en régime permanent, c'est-à-dire ce qui se passe après qu'un temps suffisamment long s'est écoulé et que le système ne change plus. Dans ce cas dp/dt=0=βm-αp. Cela nous indique à son tour que le rapport protéine/ARNm est donné par p/m = /α. On remarque que ce n'est pas le même que le nombre de protéines produites à partir de chaque ARNm, cette valeur nous oblige à connaître également le taux de renouvellement des ARNm que nous relevons à la fin de la vignette. Quelle est la valeur de b ? Un ARNm rapidement traduit aura des ribosomes le décorant comme des perles sur une ficelle comme capturé dans la micrographie électronique classique illustrée à la figure 1. Leur distance les uns des autres le long de l'ARNm est au moins la taille de l'empreinte physique d'un ribosome (≈20 nm , BNID 102320, 105000) qui est la longueur d'environ 60 paires de bases (longueur du nucléotide 0,3 nm, BNID 103777), équivalent à ≈ 20 aa. Le taux de traduction est d'environ 20 aa/sec. Il faut donc au moins une seconde à un ribosome pour se déplacer le long de sa propre empreinte de taille physique sur l'ARNm, ce qui implique un taux de traduction global maximal de b=1 s -1 par transcrit.

Le taux de dégradation effectif provient non seulement de la dégradation des protéines mais également d'un effet de dilution au fur et à mesure que la cellule se développe. En effet, des deux effets, souvent l'effet de dilution de division cellulaire est dominant et donc le temps de dégradation effectif global, qui prend en compte la dilution, est de l'ordre de l'intervalle de temps d'un cycle cellulaire, . On a donc α = 1/τ.

Au vu de ces chiffres, le rapport p/m est donc de 1 s -1 /(1/??)=. Pour E. coli, ?? est d'environ 1000 s et donc p/m

1000. Bien sûr, si les ARNm ne sont pas transcrits à la vitesse maximale, le rapport sera plus petit. Effectuons un contrôle de cohérence sur ce résultat. Sous croissance exponentielle à taux de croissance moyen E. coli est connu pour contenir environ 3 millions de protéines et 3000 ARNm (BNID 100088, 100064). Ces constantes impliquent que le rapport protéine/ARNm est 1000, précisément en ligne avec l'estimation donnée ci-dessus. Nous pouvons effectuer un deuxième contrôle de cohérence basé sur les informations des vignettes précédentes. Dans la vignette « Qu'est-ce qu'un ARNm plus lourd ou la protéine qu'il code ? nous avons dérivé un rapport de masse d'environ 10:1 pour l'ARNm aux protéines pour lesquelles ils codent. Dans la vignette « Quelle est la composition macromoléculaire de la cellule ? nous avons mentionné que la protéine est d'environ 50% de la masse sèche dans E. coli cellules tandis que l'ARNm ne représente qu'environ 5% de l'ARN total dans la cellule, qui représente elle-même environ 20% de la masse sèche. Cela implique que l'ARNm représente donc environ 1% de la masse sèche globale. Ainsi, le rapport ARNm/protéine devrait être d'environ 50 fois 10, ou 500 à 1. De notre point de vue, tous ces contrôles de santé mentale se tiennent très bien ensemble.

Figure 2 : Mesure simultanée de l'ARNm et de la protéine dans E. coli. (A) Images de microscopie du niveau d'ARNm dans les cellules d'E. coli. (B) Images de microscopie de protéines dans des cellules d'E. coli. (C) Nombre de copies de protéines par rapport aux niveaux d'ARNm obtenus en utilisant les deux méthodes de microscopie comme celles présentées dans la partie (A) et en utilisant des méthodes basées sur le séquençage. De Taniguchi et al. Science. 329, 533 (2010).

Expérimentalement, comment ces chiffres sur les rapports protéine/ARNm sont-ils déterminés ? Une méthode élégante consiste à utiliser la microscopie à fluorescence pour observer simultanément les ARNm en utilisant l'hybridation in situ en fluorescence (FISH) et leurs produits protéiques qui ont été fusionnés à une protéine fluorescente. La figure 2 montre des images de microscopie de l'ARNm et de la protéine de fusion traduite correspondante pour un gène particulier dans E. coli. La figure 2C montre les résultats utilisant ces méthodes pour plusieurs gènes et confirme un excès de 100 à 1000 fois du nombre de copies de protéines par rapport à leurs ARNm correspondants. Comme le montre cette figure, non seulement la visualisation directe par microscopie est utile, mais des méthodes basées sur des séquences ont également été invoquées.

Pour les organismes à croissance plus lente tels que les levures ou les cellules de mammifères, nous nous attendons à un rapport plus important avec la mise en garde que nos hypothèses sur le taux de traduction maximal deviennent de plus en plus ténues et avec cela notre confiance dans l'estimation. Pour les levures à des taux de croissance moyens à rapides, le nombre d'ARNm se situait dans la plage de 10 000 à 60 000 par cellule (BNID 104312, 102988, 103023, 106226, 106763). Comme les cellules de levure ont un volume ≈50 fois plus grand que E. coli, le nombre de protéines peut être estimé comme étant plus grand par cette proportion, soit 200 millions. Le rapport p/m est alors ≈2吆 8 /2吆 4 ≈10 4 , en ligne avec la valeur expérimentale d'environ 5 000 (BNID 104185, 104745). Pour la levure qui se divise toutes les 100 minutes, c'est de l'ordre du nombre de secondes de son temps de génération, en accord avec notre estimation brute ci-dessus.

Figure 3 : Ratio protéine/ARNm dans la levure à fission. (A) Histogramme illustrant le nombre de copies d'ARNm et de protéines telles que déterminées à l'aide de méthodes de séquençage et de spectrométrie de masse, respectivement. (B) Graphique de l'abondance des protéines et de l'abondance de l'ARNm sur une base gène par gène. Adapté de S. Marguerat et al., Cell, 151:671, 2012. Une analyse récente (R. Milo, Bioessays, 35:1050, 2014) suggère que les niveaux de protéines ont été sous-estimés et un facteur de correction d'environ 5 fois doit être appliqué, rendant ainsi le rapport protéine/ARNm plus proche de 104.

Comme pour la plupart des quantités décrites tout au long du livre, l'engouement pour le haut débit à l'échelle du génome a également touché le sujet de cette vignette. Plus précisément, en utilisant une combinaison d'ARN-Seq pour déterminer le nombre de copies d'ARNm et des méthodes de spectrométrie de masse et de profilage ribosomique pour déduire la teneur en protéines des cellules, il est possible d'aller au-delà des estimations et des mesures spécifiques gène par gène décrites ci-dessus. Comme le montre la figure 3 pour la levure à fission, la distribution à l'échelle du génome de l'ARNm et des protéines confirme les estimations fournies ci-dessus, montrant un excès de plus de mille fois de protéines par rapport à l'ARNm dans la plupart des cas. De même, dans les lignées cellulaires de mammifères, un rapport protéine/ARNm d'environ 104 est déduit (BNID 110236).

Figure 4 : Dynamique de la production de protéines. (A) Explosions de production de protéines résultant de plusieurs cycles de traduction sur la même molécule d'ARNm avant qu'elle ne se désintègre. (B) Distribution des tailles d'éclatement pour la protéine bêta-galactosidase dans E. coli. (Adapté de L. Cai et al., Nature, 440 : 358, 2006.)

Jusqu'à présent, nous nous sommes concentrés sur le nombre total de copies de protéines par ARNm et non sur le nombre de protéines produites par rafale de production se produisant à partir d'un ARNm donné. Cette mesure de la taille d'éclatement est représentée sur la figure 4, montrant pour la protéine bêta-galactosidase dans E. coli la distribution des tailles de rafales observées, diminuant rapidement de la poignée commune à beaucoup moins de cas de plus de 10.

Enfin, nous notons qu'il existe un troisième sens à la question qui intitule cette vignette, où nous pourrions demander combien de protéines sont fabriquées à partir de chaque ARNm individuel avant qu'il ne soit dégradé. Par exemple, en croissance rapide E. coli, les ARNm sont dégradés environ toutes les 3 minutes, comme indiqué dans la vignette « Quels sont les taux de dégradation des ARNm et des protéines ? ». Cette échelle de temps est environ 10 à 100 fois plus courte que le temps de cycle cellulaire. En conséquence, pour passer de l'affirmation selon laquelle le rapport protéine/ARNm est généralement de 1000 au nombre de protéines produites à partir d'un ARNm avant qu'il ne soit dégradé, nous devons diviser le nombre de vies d'ARNm par cycle cellulaire. Nous constatons que dans cette division rapide E. coli scénario, chaque ARNm donne naissance à environ 10 à 100 protéines avant d'être dégradé.

Une étude récente (G. Csardi et al., PLOS Genetics, 2015) propose de revisiter la question fondamentale de cette vignette. Une analyse minutieuse de dizaines d'études sur les niveaux d'ARNm et de protéines chez la levure bourgeonnante, l'organisme modèle le plus courant pour de telles études, suggère une relation non linéaire où les gènes avec des niveaux d'ARNm élevés auront un rapport protéine/ARNm plus élevé que les ARNm faiblement exprimés. Cela suggère que la corrélation entre l'ARNm et la protéine n'a pas une pente de 1 sur l'échelle log-log mais plutôt une pente d'environ 1,6, ce qui explique également pourquoi la plage dynamique des protéines est significativement plus grande que celle de l'ARNm.


Les spliceosomes, assemblés à partir de snRNP et d'un pré-ARNm, réalisent l'épissage

Avant même que l'épissage ne soit réalisé in vitro, plusieurs observations ont conduit à suggérer que petits ARN nucléaires (snRNA) aider à la réaction d'épissage. Tout d'abord, la courte séquence consensus à l'extrémité 5′ des introns s'est avérée complémentaire d'une séquence près de l'extrémité 5′ du snRNA appelée U1. Deuxièmement, les snRNA ont été trouvés associés aux hnRNP dans les extraits nucléaires. Cinq ARNsn riches en U (U1, U2, U4, U5 et U6), dont la longueur varie de 107 à 210 nucléotides, participent à l'épissage de l'ARN.

Dans le noyau des cellules eucaryotes, les ARNsn sont associés à six à dix protéines dans petites particules nucléaires de ribonucléoprotéine (snRNP). Certaines de ces protéines sont communes à tous les snRNP et d'autres sont spécifiques à des snRNP individuels. Des expériences avec un oligonucléotide synthétique qui s'hybride avec la région d'extrémité 5 de l'ARNsn U1 et des études ultérieures avec des pré-ARNm qui ont été mutés dans la séquence consensus du site d'épissage 5' ont fourni des preuves solides que l'appariement des bases entre l'épissure 5' Le site d'un pré-ARNm et la région 5′ du snRNA U1 sont requis pour l'épissage de l'ARN.

L'implication du snRNA U2 dans l'épissage a été initialement suspectée lorsqu'il s'est avéré avoir une séquence interne largement complémentaire à la séquence consensus flanquant le point de ramification dans les pré-ARNm (voir Figure 11-14). Mutation experiments, similar to those conducted with U1 snRNA and 5′ splice sites, demonstrated that base pairing between U2 snRNA and the branch-point sequence in pre-mRNA is critical to splicing. These studies with U1 and U2 snRNAs indicate that during splicing they base-pair with pre-mRNA as shown in Figure 11-17. Significantly, the branch- point A itself, which is not base-paired to U2 snRNA, 𠇋ulges out,” allowing its 2′ hydroxyl to participate in the first transesterification reaction of RNA splicing (see Figure 11-16).

Figure 11-17

Diagram of interactions between pre-mRNA, U1 snRNA, and U2 snRNA early in the splicing process. The 5′ region of U1 snRNA initially base-pairs with nucleotides at the 5′ end of the intron (blue) and 3′ end of the 5′ exon (more. )

Similar studies with other snRNAs demonstrated that RNA-RNA interactions involving them also occur during splicing. For example, an internal region of U6 snRNA initially base-pairs with the 5′ end of U4 snRNA. Rearrangements later in the splicing process result in U6 snRNA base pairing with the 5′ end of U2 snRNA, which remains base-paired to the branch-point sequence in the intron. Later in the splicing process, base pairing of U5 snRNA with four exon nucleotides adjacent to the splice sites displaces U1 snRNA from the pre-mRNA.

Based on the results of these experiments, identification of reaction intermediates, and other biochemical analyses, the five splicing snRNPs are thought to sequentially assemble on the pre-mRNA forming a large ribonucleoprotein complex called a spliceosome, which is roughly the size of a ribosome (Figure 11-18). According to the model depicted in Figure 11-19, assembly of a spliceosome begins with the base pairing of U1 and U2 snRNAs, as part of the U1 and U2 snRNPs, to the pre-mRNA (see Figure 11-17). Extensive base pairing between the snRNAs in the U4 and U6 snRNPs forms a complex that associates with U5 snRNP. The U4/U6/U5 complex then associates, presumably via protein-protein interactions, with the previously formed complex consisting of a pre-mRNA base-paired to U1 and U2 snRNPs to yield a spliceosome.

Figure 11-18

Electron micrograph of a spliceosome. Extracts of HeLa cells were mixed with a β-globin pre-mRNA the reaction was interrupted before splicing was completed, so that the spliceosomes, containing snRNPs and the pre-mRNA substrate, could be purified. (Suite. )

Figure 11-19

The spliceosomal splicing cycle. The splicing snRNPs (U1, U2, U4, U5, and U6) associate with the pre-mRNA and with each other in an ordered sequence to form the spliceosome. This large ribonucleoprotein complex then catalyzes the two transesterification (more. )

After formation of the spliceosome, extensive rearrangements occur in the pairing of snRNAs and the pre-mRNA, as noted previously. The rearranged spliceosome then catalyzes the two transesterification reactions that result in RNA splicing. After the second transesterification reaction, the ligated exons are released from the spliceosome while the lariat intron remains associated with the snRNPs. This final intron-snRNP complex is unstable and dissociates. The individual snRNPs released participate in a new cycle of splicing. The excised intron is rapidly degraded by a �ranching enzyme,” which hydrolyzes the 5′,2′-phosphodiester bond at the branch point, and other nuclear RNases.

It is estimated that at least one hundred proteins are involved in RNA splicing, making this process comparable in complexity to protein synthesis and initiation of transcription. Some of these splicing factors are associated with snRNPs, but others are not. Sequencing of yeast genes encoding splicing factors has revealed that they contain domains with the RNP motif, which interacts with RNA, and the SR motif, which interacts with other proteins and may contribute to RNA binding. Some splicing factors also exhibit sequence homologies to known RNA helicases these may be necessary for the base-pairing rearrangements that occur in snRNAs during the spliceosomal splicing cycle.

Introns whose splice sites do not conform to the standard consensus sequence recently were identified in some pre-mRNAs. This class of introns begins with AU and ends with AC rather than following the usual “GU –𠁚G rule” (see Figure 11-14). Research on the biochemistry of splicing for this special class of introns soon identified four novel snRNPs. Together with the standard U5 snRNP, these snRNPs appear to participate in a splicing cycle analogous to that discussed above.


Recent advances in mRNA vaccine technology

Various mRNA vaccine platforms have been developed in recent years and validated in studies of immunogenicity and efficacy 18,19,20 . Engineering of the RNA sequence has rendered synthetic mRNA more translatable than ever before. Highly efficient and non-toxic RNA carriers have been developed that in some cases 21,22 allow prolonged antigen expression in vivo (Tableau 1). Some vaccine formulations contain novel adjuvants, while others elicit potent responses in the absence of known adjuvants. The following section summarizes the key advances in these areas of mRNA engineering and their impact on vaccine efficacy.

Optimization of mRNA translation and stability

This topic has been extensively discussed in previous reviews 14,15 thus, we briefly summarize the key findings (Box 1). The 5′ and 3′ UTR elements flanking the coding sequence profoundly influence the stability and translation of mRNA, both of which are critical concerns for vaccines. These regulatory sequences can be derived from viral or eukaryotic genes and greatly increase the half-life and expression of therapeutic mRNAs 23,24 . A 5′ cap structure is required for efficient protein production from mRNA 25 . Various versions of 5′ caps can be added during or after the transcription reaction using a vaccinia virus capping enzyme 26 or by incorporating synthetic cap or anti-reverse cap analogues 27,28 . The poly(A) tail also plays an important regulatory role in mRNA translation and stability 25 thus, an optimal length of poly(A) 24 must be added to mRNA either directly from the encoding DNA template or by using poly(A) polymerase. The codon usage additionally has an impact on protein translation. Replacing rare codons with frequently used synonymous codons that have abundant cognate tRNA in the cytosol is a common practice to increase protein production from mRNA 29 , although the accuracy of this model has been questioned 30 . Enrichment of G:C content constitutes another form of sequence optimization that has been shown to increase steady-state mRNA levels in vitro 31 and protein expression in vivo 12 .

Although protein expression may be positively modulated by altering the codon composition or by introducing modified nucleosides (discussed below), it is also possible that these forms of sequence engineering could affect mRNA secondary structure 32 , the kinetics and accuracy of translation and simultaneous protein folding 33,34 , and the expression of cryptic T cell epitopes present in alternative reading frames 30 . All these factors could potentially influence the magnitude or specificity of the immune response.

Box 1: Strategies for optimizing mRNA pharmacology

A number of technologies are currently used to improve the pharmacological aspects of mRNA. The various mRNA modifications used and their impact are summarized below.

• Synthetic cap analogues and capping enzymes 26,27 stabilize mRNA and increase protein translation via binding to eukaryotic translation initiation factor 4E (EIF4E)

• Regulatory elements in the 5′-untranslated region (UTR) and the 3′-UTR 23 stabilize mRNA and increase protein translation

• Poly(A) tail 25 stabilizes mRNA and increases protein translation

• Modified nucleosides 9,48 decrease innate immune activation and increase translation

• Separation and/or purification techniques: RNase III treatment (N.P. and D.W., unpublished observations) and fast protein liquid chromatography (FPLC) purification 13 decrease immune activation and increase translation

• Sequence and/or codon optimization 29 increase translation

• Modulation of target cells: co-delivery of translation initiation factors and other methods alters translation and immunogenicity

Modulation of immunogenicity

Exogenous mRNA is inherently immunostimulatory, as it is recognized by a variety of cell surface, endosomal and cytosolic innate immune receptors (Fig. 1) (reviewed in Ref. 35). Depending on the therapeutic application, this feature of mRNA could be beneficial or detrimental. It is potentially advantageous for vaccination because in some cases it may provide adjuvant activity to drive dendritic cell (DC) maturation and thus elicit robust T and B cell immune responses. However, innate immune sensing of mRNA has also been associated with the inhibition of antigen expression and may negatively affect the immune response 9,13 . Although the paradoxical effects of innate immune sensing on different formats of mRNA vaccines are incompletely understood, some progress has been made in recent years in elucidating these phenomena.

Innate immune sensing of two types of mRNA vaccine by a dendritic cell (DC), with RNA sensors shown in yellow, antigen in red, DC maturation factors in green, and peptide−major histocompatibility complex (MHC) complexes in light blue and red an example lipid nanoparticle carrier is shown at the top right. A non-exhaustive list of the major known RNA sensors that contribute to the recognition of double-stranded and unmodified single-stranded RNAs is shown. Unmodified, unpurified (part une) and nucleoside-modified, fast protein liquid chromatography (FPLC)-purified (part b) mRNAs were selected for illustration of two formats of mRNA vaccines where known forms of mRNA sensing are present and absent, respectively. The dashed arrow represents reduced antigen expression. Ag, antigen PKR, interferon-induced, double-stranded RNA-activated protein kinase MDA5, interferon-induced helicase C domain-containing protein 1 (also known as IFIH1) IFN, interferon m1Ψ, 1-methylpseudouridine OAS, 2′-5′-oligoadenylate synthetase TLR, Toll-like receptor.

Studies over the past decade have shown that the immunostimulatory profile of mRNA can be shaped by the purification of IVT mRNA and the introduction of modified nucleosides as well as by complexing the mRNA with various carrier molecules 9,13,36,37 . Enzymatically synthesized mRNA preparations contain double-stranded RNA (dsRNA) contaminants as aberrant products of the IVT reaction 13 . As a mimic of viral genomes and replication intermediates, dsRNA is a potent pathogen-associated molecular pattern (PAMP) that is sensed by pattern recognition receptors in multiple cellular compartments (Fig. 1). Recognition of IVT mRNA contaminated with dsRNA results in robust type I interferon production 13 , which upregulates the expression and activation of protein kinase R (PKR also known as EIF2AK2) and 2′-5′-oligoadenylate synthetase (OAS), leading to the inhibition of translation 38 and the degradation of cellular mRNA and ribosomal RNA 39 , respectively. Karikó and colleagues 13 have demonstrated that contaminating dsRNA can be efficiently removed from IVT mRNA by chromatographic methods such as reverse-phase fast protein liquid chromatography (FPLC) or high-performance liquid chromatography (HPLC). Strikingly, purification by FPLC has been shown to increase protein production from IVT mRNA by up to 1,000-fold in primary human DCs 13 . Thus, appropriate purification of IVT mRNA seems to be critical for maximizing protein (immunogen) production in DCs and for avoiding unwanted innate immune activation.

Besides dsRNA contaminants, single-stranded mRNA molecules are themselves a PAMP when delivered to cells exogenously. Single-stranded oligoribonucleotides and their degradative products are detected by the endosomal sensors Toll-like receptor 7 (TLR7) and TLR8 (Refs 40,41), resulting in type I interferon production 42 . Crucially, it was discovered that the incorporation of naturally occurring chemically modified nucleosides, including but not limited to pseudouridine 9,43,44 and 1-methylpseudouridine 45 , prevents activation of TLR7, TLR8 and other innate immune sensors 46,47 , thus reducing type I interferon signalling 48 . Nucleoside modification also partially suppresses the recognition of dsRNA species 46,47,48 . As a result, Karikó and others have shown that nucleoside-modified mRNA is translated more efficiently than unmodified mRNA in vitro 9 , particularly in primary DCs, and in vivo in mice 45 . Notably, the highest level of protein production in DCs was observed when mRNA was both FPLC-purified and nucleoside-modified 13 . These advances in understanding the sources of innate immune sensing and how to avoid their adverse effects have substantially contributed to the current interest in mRNA-based vaccines and protein replacement therapies.

In contrast to the findings described above, a study by Thess and colleagues found that sequence-optimized, HPLC-purified, unmodified mRNA produced higher levels of protein in HeLa cells and in mice than its nucleoside-modified counterpart 12 . Additionally, Kauffman and co-workers demonstrated that unmodified, non-HPLC-purified mRNA yielded more robust protein production in HeLa cells than nucleoside-modified mRNA, and resulted in similar levels of protein production in mice 49 . Although not fully clear, the discrepancies between the findings of Karikó 9,13 and these authors 12,49 may have arisen from variations in RNA sequence optimization, the stringency of mRNA purification to remove dsRNA contaminants and the level of innate immune sensing in the targeted cell types.

The immunostimulatory properties of mRNA can conversely be increased by the inclusion of an adjuvant to increase the potency of some mRNA vaccine formats. These include traditional adjuvants as well as novel approaches that take advantage of the intrinsic immunogenicity of mRNA or its ability to encode immune-modulatory proteins. Self-replicating RNA vaccines have displayed increased immunogenicity and effectiveness after formulating the RNA in a cationic nanoemulsion based on the licensed MF59 (Novartis) adjuvant 50 . Another effective adjuvant strategy is TriMix, a combination of mRNAs encoding three immune activator proteins: CD70, CD40 ligand (CD40L) and constitutively active TLR4. TriMix mRNA augmented the immunogenicity of naked, unmodified, unpurified mRNA in multiple cancer vaccine studies and was particularly associated with increased DC maturation and cytotoxic T lymphocyte (CTL) responses (reviewed in Ref. 51). The type of mRNA carrier and the size of the mRNA–carrier complex have also been shown to modulate the cytokine profile induced by mRNA delivery. For example, the RNActive (CureVac AG) vaccine platform 52,53 depends on its carrier to provide adjuvant activity. In this case, the antigen is expressed from a naked, unmodified, sequence-optimized mRNA, while the adjuvant activity is provided by co-delivered RNA complexed with protamine (a polycationic peptide), which acts via TLR7 signalling 52,54 . This vaccine format has elicited favourable immune responses in multiple preclinical animal studies for vaccination against cancer and infectious diseases 18,36,55,56 . A recent study provided mechanistic information on the adjuvanticity of RNActive vaccines in mice in vivo and human cells in vitro 54 . Potent activation of TLR7 (mouse and human) and TLR8 (human) and production of type I interferon, pro-inflammatory cytokines and chemokines after intradermal immunization was shown 54 . A similar adjuvant activity was also demonstrated in the context of non-mRNA-based vaccines using RNAdjuvant (CureVac AG), an unmodified, single-stranded RNA stabilized by a cationic carrier peptide 57 .

Progress in mRNA vaccine delivery

Efficient in vivo mRNA delivery is critical to achieving therapeutic relevance. Exogenous mRNA must penetrate the barrier of the lipid membrane in order to reach the cytoplasm to be translated to functional protein. mRNA uptake mechanisms seem to be cell type dependent, and the physicochemical properties of the mRNA complexes can profoundly influence cellular delivery and organ distribution. There are two basic approaches for the delivery of mRNA vaccines that have been described to date. First, loading of mRNA into DCs ex vivo, followed by re-infusion of the transfected cells 58 and second, direct parenteral injection of mRNA with or without a carrier. Ex vivo DC loading allows precise control of the cellular target, transfection efficiency and other cellular conditions, but as a form of cell therapy, it is an expensive and labour-intensive approach to vaccination. Direct injection of mRNA is comparatively rapid and cost-effective, but it does not yet allow precise and efficient cell-type-specific delivery, although there has been recent progress in this regard 59 . Both of these approaches have been explored in a variety of forms (Fig. 2 Table 1).

Commonly used delivery methods and carrier molecules for mRNA vaccines along with typical diameters for particulate complexes are shown: naked mRNA (part une) naked mRNA with in vivo electroporation (part b) protamine (cationic peptide)-complexed mRNA (part c) mRNA associated with a positively charged oil-in-water cationic nanoemulsion (part ) mRNA associated with a chemically modified dendrimer and complexed with polyethylene glycol (PEG)-lipid (part e) protamine-complexed mRNA in a PEG-lipid nanoparticle (part F) mRNA associated with a cationic polymer such as polyethylenimine (PEI) (part g) mRNA associated with a cationic polymer such as PEI and a lipid component (part h) mRNA associated with a polysaccharide (for example, chitosan) particle or gel (part je) mRNA in a cationic lipid nanoparticle (for example, 1,2-dioleoyloxy-3-trimethylammoniumpropane (DOTAP) or dioleoylphosphatidylethanolamine (DOPE) lipids) (part j) mRNA complexed with cationic lipids and cholesterol (part k) and mRNA complexed with cationic lipids, cholesterol and PEG-lipid (part je).

Ex vivo loading of DCs. DCs are the most potent antigen-presenting cells of the immune system. They initiate the adaptive immune response by internalizing and proteolytically processing antigens and presenting them to CD8 + and CD4 + T cells on major histocompatibility complexes (MHCs), namely, MHC class I and MHC class II, respectively. Additionally, DCs may present intact antigen to B cells to provoke an antibody response 60 . DCs are also highly amenable to mRNA transfection. For these reasons, DCs represent an attractive target for transfection by mRNA vaccines, both in vivo et ex vivo.

Although DCs have been shown to internalize naked mRNA through a variety of endocytic pathways 61,62,63 , ex vivo transfection efficiency is commonly increased using electroporation in this case, mRNA molecules pass through membrane pores formed by a high-voltage pulse and directly enter the cytoplasm (reviewed in Ref. 64). This mRNA delivery approach has been favoured for its ability to generate high transfection efficiency without the need for a carrier molecule. DCs that are loaded with mRNA ex vivo are then re-infused into the autologous vaccine recipient to initiate the immune response. Plus ex vivo-loaded DC vaccines elicit a predominantly cell-mediated immune response thus, they have been used primarily to treat cancer (reviewed in Ref. 58).

Injection of naked mRNA in vivo. Naked mRNA has been used successfully for in vivo immunizations, particularly in formats that preferentially target antigen-presenting cells, as in intradermal 61,65 and intranodal injections 66,67,68 . Notably, a recent report showed that repeated intranodal immunizations with naked, unmodified mRNA encoding tumour-associated neoantigens generated robust T cell responses and increased progression-free survival 68 (discussed further in Box 2).

Physical delivery methods in vivo. To increase the efficiency of mRNA uptake in vivo, physical methods have occasionally been used to penetrate the cell membrane. An early report showed that mRNA complexed with gold particles could be expressed in tissues using a gene gun, a microprojectile method 69 . The gene gun was shown to be an efficient RNA delivery and vaccination method in mouse models 70,71,72,73 , but no efficacy data in large animals or humans are available. In vivo electroporation has also been used to increase uptake of therapeutic RNA 74,75,76 however, in one study, electroporation increased the immunogenicity of only a self-amplifying RNA and not a non-replicating mRNA-based vaccine 74 . Physical methods can be limited by increased cell death and restricted access to target cells or tissues. Recently, the field has instead favoured the use of lipid or polymer-based nanoparticles as potent and versatile delivery vehicles.

Protamine. The cationic peptide protamine has been shown to protect mRNA from degradation by serum RNases 77 however, protamine-complexed mRNA alone demonstrated limited protein expression and efficacy in a cancer vaccine model, possibly owing to an overly tight association between protamine and mRNA 36,78 . This issue was resolved by developing the RNActive vaccine platform, in which protamine-formulated RNA serves only as an immune activator and not as an expression vector 52 .

Cationic lipid and polymer-based delivery. Highly efficient mRNA transfection reagents based on cationic lipids or polymers, such as TransIT-mRNA (Mirus Bio LLC) or Lipofectamine (Invitrogen), are commercially available and work well in many primary cells and cancer cell lines 9,13 , but they often show limited in vivo efficacy or a high level of toxicity (N.P. and D.W., unpublished observations). Great progress has been made in developing similarly designed complexing reagents for safe and effective in vivo use, and these are discussed in detail in several recent reviews 10,11,79,80 . Cationic lipids and polymers, including dendrimers, have become widely used tools for mRNA administration in the past few years. The mRNA field has clearly benefited from the substantial investment in in vivo small interfering RNA (siRNA) administration, where these delivery vehicles have been used for over a decade. Lipid nanoparticles (LNPs) have become one of the most appealing and commonly used mRNA delivery tools. LNPs often consist of four components: an ionizable cationic lipid, which promotes self-assembly into virus-sized (

100 nm) particles and allows endosomal release of mRNA to the cytoplasm lipid-linked polyethylene glycol (PEG), which increases the half-life of formulations cholesterol, a stabilizing agent and naturally occurring phospholipids, which support lipid bilayer structure. Numerous studies have demonstrated efficient in vivo siRNA delivery by LNPs (reviewed in Ref. 81), but it has only recently been shown that LNPs are potent tools for in vivo delivery of self-amplifying RNA 19 and conventional, non-replicating mRNA 21 . Systemically delivered mRNA–LNP complexes mainly target the liver owing to binding of apolipoprotein E and subsequent receptor-mediated uptake by hepatocytes 82 , and intradermal, intramuscular and subcutaneous administration have been shown to produce prolonged protein expression at the site of the injection 21,22 . The mechanisms of mRNA escape into the cytoplasm are incompletely understood, not only for artificial liposomes but also for naturally occurring exosomes 83 . Further research into this area will likely be of great benefit to the field of therapeutic RNA delivery.

The magnitude and duration of in vivo protein production from mRNA–LNP vaccines can be controlled in part by varying the route of administration. Intramuscular and intradermal delivery of mRNA–LNPs has been shown to result in more persistent protein expression than systemic delivery routes: in one experiment, the half-life of mRNA-encoded firefly luciferase was roughly threefold longer after intradermal injection than after intravenous delivery 21 . These kinetics of mRNA–LNP expression may be favourable for inducing immune responses. A recent study demonstrated that sustained antigen availability during vaccination was a driver of high antibody titres and germinal centre (GC) B cell and T follicular helper (TFH) cell responses 84 . This process was potentially a contributing factor to the potency of recently described nucleoside-modified mRNA–LNP vaccines delivered by the intramuscular and intradermal routes 20,22,85 . Indeed, TFH cells have been identified as a critical population of immune cells that vaccines must activate in order to generate potent and long-lived neutralizing antibody responses, particularly against viruses that evade humoral immunity 86 . The dynamics of the GC reaction and the differentiation of TFH cells are incompletely understood, and progress in these areas would undoubtedly be fruitful for future vaccine design (Box 3).

Box 2: Personalized neoepitope cancer vaccines

Sahin and colleagues have pioneered the use of individualized neoepitope mRNA cancer vaccines 121 . They use high-throughput sequencing to identify every unique somatic mutation of an individual patient's tumour sample, termed the mutanome. This enables the rational design of neoepitope cancer vaccines in a patient-specific manner, and has the advantage of targeting non-self antigen specificities that should not be eliminated by central tolerance mechanisms. Proof of concept has been recently provided: Kreiter and colleagues found that a substantial portion of non-synonymous cancer mutations were immunogenic when delivered by mRNA and were mainly recognized by CD4 + T cells 176 . On the basis of these data, they generated a computational method to predict major histocompatibility complex (MHC) class II-restricted neoepitopes that can be used as vaccine immunogens. mRNA vaccines encoding such neoepitopes have controlled tumour growth in B16-F10 melanoma and CT26 colon cancer mouse models. In a recent clinical trial, Sahin and colleagues developed personalized neoepitope-based mRNA vaccines for 13 patients with metastatic melanoma, a cancer known for its high frequency of somatic mutations and thus neoepitopes. They immunized against ten neoepitopes per individual by injecting naked mRNA intranodally. CD4 + T cell responses were detected against the majority of the neoepitopes, and a low frequency of metastatic disease was observed after several months of follow-up 68 . Interestingly, similar results were also obtained in a study of analogous design that used synthetic peptides as immunogens rather than mRNA 177 . Together, these recent trials suggest the potential utility of the personalized vaccine methodology.

Box 3: The germinal centre and T follicular helper cells

The vast majority of potent antimicrobial vaccines elicit long-lived, protective antibody responses against the target pathogen. High-affinity antibodies are produced in specialized microanatomical sites within the B cell follicles of secondary lymphoid organs called germinal centres (GCs). B cell proliferation, somatic hypermutation and selection for high-affinity mutants occur in the GCs, and efficient T cell help is required for these processes 178 . Characterization of the relationship between GC B and T cells has been actively studied in recent years. The follicular homing receptor CXC-chemokine receptor 5 (CXCR5) was identified on GC B and T cells in the 1990s 179,180 , but the concept of a specific lineage of T follicular helper (TFH) cells was not proposed until 2000 (Refs 181, 182). The existence of the TFH lineage was confirmed in 2009 when the transcription factor specific for TFH cells, B cell lymphoma 6 protein (BCL-6), was identified 183,184,185 . TFH cells represent a specialized subset of CD4 + T cells that produce critical signals for B cell survival, proliferation and differentiation in addition to signals for isotype switching of antibodies and for the introduction of diversifying mutations into the immunoglobulin genes. The major cytokines produced by TFH cells are interleukin-4 (IL-4) and IL-21, which play a key role in driving the GC reaction. Other important markers and functional ligands expressed by TFH cells include CD40 ligand (CD40L), Src homology domain 2 (SH2) domain-containing protein 1A (SH2D1A), programmed cell death protein 1 (PD1) and inducible T cell co-stimulator (ICOS) 186 . The characterization of rare, broadly neutralizing antibodies to HIV-1 has revealed that unusually high rates of somatic hypermutation are a hallmark of protective antibody responses against HIV-1 (Ref. 187). As TFH cells play a key role in driving this process in GC reactions, the development of new adjuvants or vaccine platforms that can potently activate this cell type is urgently needed.


MRNA Splicing


Transcription and processing (which includes splicing) of the newly made mRNA occurs in the nucleus of the cell.
Once a mature mRNA transcript is made it is transported to the cytoplasm for translation into protein.

Figure (PageIndex<1>). (CC BY-NC-SA)

Most eukaryotic genes and their pre-mRNA transcripts contain noncoding stretches of nucleotides or regions that are not meant to be made into protein. These noncoding segments are called intronsand must be removed before the mature mRNA can be transported to the cytoplasm and translated into protein. The stretches of DNA that do code for amino acids in the protein are called exons. During the process of splicing, introns are removed from the pre-mRNA by the spliceosome and exons are spliced back together. If the introns are not removed, the RNA would be translated into a nonfunctional protein. Splicing occurs in the nucleus before the RNA migrates to the cytoplasm. Once splicing is complete, the mature mRNA (containing uninterrupted coding information), is transported to the cytoplasm where ribosomes translate the mRNA into protein.

A Detailed Look at mRNA Splicing

The pre-mRNA Transcript
The pre-mRNA transcript contains both introns and exons. The introns are removed during the process of splicing. In this example, the pre-mRNA contains two exons and one intron.

Introns contain several important and conserved sequences that guide the splicing process: a 5&rsquo GU sequence (the 5&rsquo splice site), an A branch site located near a pyrimidine-rich region (a region with many cytosine and uracil bases) and a 3&rsquo AG sequence (the 3&rsquo splice site).

The Spliceosome
A large protein complex known as the spliceosome controls mRNA splicing. The spliceosome is composed of particles made up of both RNA and protein. These particles are called small nuclear ribonucleoprotein ou snRNPs (pronounced &ldquosnurps&rdquo) for short. The snRNPs recognize the conserved sequences within introns and quickly bind these sequences once the pre-mRNA is made and initiate splicing.

The spliceosome is built in distinct steps. Premièrement le U1 snRNP binds the 5&rsquo splice site and the U2 snRNP binds the branch site.

A number of other snRNPs (U4, U6 et U5) bind the pre-mRNA transcript forming the mature spliceosome complex. This causes the intron to form a loop and brings the 5&rsquo splice site and 3&rsquo splice site together.

Now that the spliceosome is assembled, splicing can begin. First the 5&rsquo end of the intron is cut. The 5&rsquo GU end of the intron is then connected to the A branch site, which creates a lariat structure.

At this stage the U1 and U4 snRNPs are released and the 3&rsquo splice site is cleaved. Once the intron has been fully cleaved, the two exons are attached to each other. The intron in the form of a lariat is released along with U2, U5 and U6 snRNPs.

The intron will be degraded and the snRNPs are used again to splice other pre-mRNAs. The mature mRNA transcript is now ready to be exported to the cytoplasm for translation.

Épissage alternatif

The example of a gene with a single intron and two exons used above is a very simple model of RNA splicing. Many genes contain multiple exons as well as multiple introns. A process known asalternative épissure allows for different combinations of exons to be included in the final mature mRNA, making different versions of proteins (called isoformes) that are all encoded by the same gene. Alternative splicing of mRNA allows for many proteins to be made, with different functions, all produced from a single gene. One of the most dramatic examples of alternative splicing is the Dscam gene in Drosophila melanogaster (a fruit fly). This single gene contains 116 exons! Some exons are always included, others may or may not be included. Over 18,000 different proteins from this single gene have been found in Drosophile! Theoretically, this system is capable of producing 38,016 different proteins all from a single gene!

Below is an example of alternative splicing of a pre-mRNA transcript. In this case, there are two different, alternatively spliced mRNAs that can be made from this pre-mRNA. The two mature mRNAs can contain either the yellow or the green exon. This produces two distinct protein isoforms when the mRNAs are translated into protein.

/>
mRNA Splicing Tutorial by Dr. Katherine Harris is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 3.0 Unported License.


Voir la vidéo: LA TRADUCTION de lARN messager en protéines. Biochimie Facile (Janvier 2022).