Informations

Quelles sont les utilisations des projections de roues hélicoïdales en biologie structurale?

Quelles sont les utilisations des projections de roues hélicoïdales en biologie structurale?


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

J'ai vu des projections de roues hélicoïdales utilisées pour illustrer des hélices amphipathiques dans des protéines. Y a-t-il d'autres utilisations pour ces modèles?


Les projections de roue hélicoïdale peuvent être utiles chaque fois que vous avez une protéine ou un peptide avec une ou plusieurs régions -hélicoïdales. Ils vous permettent de voir si une "propriété" est présente le long d'un côté d'un peptide. Cela peut être utile pour reconnaître des motifs potentiels d'interaction protéine-protéine tels que les fermetures à glissière leucine.

L'article de wikipedia sur les « roues hélicoïdales » semble également être un bon endroit pour commencer à en savoir plus à ce sujet.


Le domaine C-terminal de l'apolipoprotéine A-I contient un déclencheur conformationnel sensible aux lipides

Les apolipoprotéines échangeables peuvent passer d'un état sans lipide à un état associé à un lipide. Le domaine C-terminal de l'apolipoprotéine humaine A-I (apoA-I) joue un rôle à la fois dans la liaison aux lipides et dans l'auto-association. La spectroscopie de résonance paramagnétique électronique dirigée par marqueur de spin a été utilisée pour examiner la structure de l'extrémité apoA-I C dans les états sans lipides et associés aux lipides. Des marqueurs de spin au nitroxyde positionnés à des emplacements définis tout au long de l'extrémité C ont été utilisés pour définir des éléments structuraux secondaires discrets. Les interactions magnétiques entre les sondes localisées aux positions 163, 217 et 226 dans l'apoA-I simplement et doublement marquée ont donné des informations sur la distance inter- et intramoléculaire, fournissant une base pour cartographier la structure tertiaire et quaternaire de l'apoA-I. Les spectres de l'apoA-I dans les HDL reconstituées ont révélé une transition induite par les lipides de bobines aléatoires définies et de brins en hélices . Ce changement de conformation est analogue aux événements déclenchés dans les protéines de fusion virales et peut servir de moyen pour surmonter les barrières énergétiques de la séquestration des lipides, une étape critique dans l'efflux de cholestérol et l'assemblage des HDL.


Protéines membranaires : le « Far West » de la biologie structurale

Historiquement, la tâche de déterminer la structure des protéines membranaires a été entravée par des difficultés expérimentales associées à leurs domaines lipidiques. Ici, nous donnons un aperçu des outils expérimentaux et prédictifs récemment développés qui changent notre vision de ce territoire largement inexploré - le « Wild West » de la biologie structurelle. La cristallographie, les méthodes à particule unique et la microscopie à force atomique sont utilisées pour étudier d'énormes protéines membranaires avec de plus en plus de détails. Les stratégies de résonance magnétique nucléaire à l'état solide fournissent des contraintes d'orientation pour la détermination de la structure des hélices transmembranaires (TM) et des mesures précises des distances intramoléculaires, même dans des systèmes très complexes. Les contraintes à plus longue distance sont déterminées par la résonance paramagnétique électronique à marquage de spin dirigé, mais les stratégies de marquage actuelles constituent toujours une limitation. D'autres méthodes, telles que le dichroïsme infrarouge spécifique au site, permettent une analyse orientationnelle des hélices de TM dans des bicouches alignées et, combinées à de nouveaux outils informatiques et prédictifs qui utilisent des données de conservation évolutives, sont utilisées pour analyser les faisceaux d'hélices de TM.


Structure de la porte intracellulaire du canal KcsA à l'état ouvert

Les canaux ioniques catalysent le transfert sélectif d'ions à travers la membrane en réponse à une variété de stimuli. Ces canaux se ferment en contrôlant l'accès des ions à un pore rempli d'eau situé au centre. La structure cristalline du Streptomyces lividans le canal potassique (KcsA) a permis une exploration moléculaire de ce mécanisme. Des études de résonance paramagnétique électronique (RPE) ont découvert des changements conformationnels significatifs à l'extrémité intracellulaire de la deuxième hélice transmembranaire (TM2) lors de la synchronisation. Nous avons utilisé le marquage de spin dirigé vers le site (SDSL) et la spectroscopie EPR pour tenter de quantifier les réarrangements structurels du faisceau KcsA TM2 sous-jacents à la transition de l'état fermé à l'état ouvert. Dans des conditions favorisant les conformations fermées et ouvertes, 10 distances intersous-unités ont été obtenues à travers les segments TM2 à partir de constructions dimères en tandem. L'analyse de ces données indique un mécanisme dans lequel chaque hélice TM2 s'incline de la voie de perméation vers le plan de la membrane et tourne autour de son axe hélicoïdal, supportant un mouvement de type ciseaux avec un point de pivot près des résidus 107 à 108. Ces mouvements s'accompagnent d'une forte augmentation du diamètre du vestibule sous la cavité centrale remplie d'eau.


Résultats

Le segment S2 en Mixeur couvre les résidus 278-300 (Fig. 1 B). Dans les protéines membranaires intégrales de structure connue, les résidus exposés aux lipides dans les hélices transmembranaires ont tendance à être plus hydrophobes et moins bien conservés que les résidus faisant face à l'intérieur de la protéine (Rees et al., 1989 Taylor et al., 1994 Wallin et al., 1997). La comparaison des séquences S2 dans les canaux K + met en évidence les résidus variables (Fig. 1 B), qui, lorsqu'ils sont cartographiés sur une projection hélicoïdale, se trouvent principalement sur une face (Fig. 1 C). Les présentes expériences cherchent à tester cette suggestion basée sur la séquence pour une disposition -hélicoïdale de S2. Nous partons de l'idée qu'une substitution de tryptophane hydrophobe volumineuse est plus susceptible de perturber la structure du canal (et donc la fonction d'ablation) lorsqu'elle est placée à des positions emballées contre d'autres parties de la protéine que lorsqu'elle est introduite dans des zones exposées aux lipides. Nous avons donc muté chaque résidu S2 individuellement en tryptophane (ou le tryptophane unique en alanine), en anticipant que les positions fonctionnellement pardonnant la mutation seraient entrecoupées, éventuellement en périodicité hélicoïdale, avec des positions marquées par l'incapacité à exprimer le courant K +. Bien qu'elle ne soit pas rigoureusement justifiée, cette attente est plausible puisque de tels schémas de tolérance de substitution ont été observés avec plusieurs protéines membranaires, à l'origine avec des résidus choisis au hasard (Hinkle et al., 1990), et plus récemment avec des tryptophanes spécifiquement insérés (Choe et al., 1995 Sharp et coll., 1995 Collins et coll., 1997).

Nos résultats contredisent cette attente. Sur les 23 substitutions effectuées, une seule (R297W) n'a pas réussi à exprimer le courant dans Xénope ovocytes. Des courants représentatifs en réponse à des impulsions de tension dépolarisantes sont montrés sur la figure 2 pour le canal de type sauvage et deux mutants. Ces canaux mutants particuliers affichent des dépendances de tension modifiées, la courbe d'activation pour I287W est décalée vers la droite de 27 mV, tandis que celle pour E293W est décalée vers la gauche de 22 mV. Ces deux mutants sont modifiés d'autres manières, la pente de la courbe d'activation est diminuée dans I287W, et les cinétiques d'activation et de désactivation de E293W sont considérablement ralenties. Des enregistrements similaires ont été collectés pour les canaux substitués par Trp restants. Les effets des substitutions ont été analysés à l'aide de plusieurs paramètres empiriques : Δgo (l'énergie libre de tension nulle d'ouverture), to (le mi-temps d'activation mesuré au demi-point sur la courbe d'activation), et (la constante de temps de désactivation à -70 mV). Ces paramètres sont indiqués dans le tableau I pour tous les canaux mutants. Fig. 3 A trace l'énergie de stabilisation à l'état ouvert ΔΔgo c'est-à-dire la différence dego entre le type mutant et le type sauvage. Au total, 13 canaux mutants ont des propriétés électrophysiologiques similaires au type sauvage, nous définissons ces résidus comme « à faible impact » ou « tolérants », avec |ΔΔgo| < 1 kcal/mol. Les 9 positions « à fort impact » restantes (E283, T284, C286, I287, W289, F290, E293, L294 et A300) ont des propriétés sensiblement différentes du type sauvage. Cette coupure binaire entre les deux types de résidus est bien sûr arbitraire, mais elle ressort naturellement des résultats. Nos conclusions globales ne changent pas si nous doublons ou réduisons de moitié cette valeur de coupure. Dans la plupart des canaux avec des propriétés d'activation à l'équilibre modifiées, les paramètres cinétiques ont également été modifiés plus de deux fois (Fig. 3, B et C). Nous soulignons que l'intention de cette analyse de gating est empirique, et non mécaniste : identifier les positions auxquelles les mutations produisent des changements évidents et brutaux dans la gating, pas comprendre les étapes de la voie d'activation qui sont altérées par les mutations.

La plupart des positions tolérantes portent de gros résidus hydrophobes (Fig. 1), et donc leur mutation en Trp ne provoque que des changements modérés du volume de la chaîne latérale. Nous avons donc contesté ces positions avec des changements plus radicaux de la chimie des chaînes latérales. Nous avons construit un ensemble de substitutions Asn simples qui modifieraient à la fois le volume de la chaîne latérale et la polarité des positions tolérantes à Trp : L285N, I288N, F292N, V296N, F298N et L299N. Remarquablement, les six mutants ont exprimé des canaux présentant des propriétés électrophysiologiques similaires à celles du canal de type sauvage (figure 4 et tableau II).


MATÉRIAUX ET MÉTHODES

P. tetraurelia préparation de l'unité corticale

Deux P. tetraurelia souches ont été utilisées : la d4-2 souche de référence de type sauvage et Δ-CenBP1. Les cellules ont été cultivées de manière exponentielle à 27°C dans une infusion d'herbe de blé (milieu BHB), Klebsiella pneumoniae, et supplémenté en -sitostérol (0,4 µg/ml). Les cellules ont été centrifugées pendant 2 min à 137g à l'aide d'une centrifugeuse Sigma 6-15 et lavé deux fois dans du tampon Dryl pour éliminer la plupart des bactéries. Les trychocystes ont été éliminés par tris CaCl2 tampon [10 mM (pH 7,4) et CaCl2 1 mM] additionné de 0,025 % d'amino-éthyldextrane. Les cellules ont été récupérées par centrifugation et P. tetraurelia cortex a été préparé selon (24) avec les modifications suivantes : les cellules ont été remises en suspension dans un volume égal de tampon de lyse contenant 0,25 M de saccharose, 1 mM d'Hepes (pH 7,2), 5 mM d'EGTA et 2 × inhibiteurs de protéase (Roche cOmplete) et transférées dans un homogénéisateur Potter-Elvehiem puis laissé 15 min sur glace. Environ 400 coups de main ont été nécessaires pour ouvrir >95% des cellules. Après la lyse, 1 M de K-PIPES (pH 7,2) a été ajouté pour obtenir une concentration finale de 10 mM de K-PIPES. Le cortex cellulaire a été lavé deux fois dans un tampon de remise en suspension contenant du tampon de lyse avec 10 mM de K-PIPES et récupéré par centrifugation à 410g dans une centrifugeuse Eppendorf réfrigérée. Le cortex cellulaire a été remis en suspension dans 500 µl du même tampon. Pour obtenir des unités corticales, le cortex a été soniqué pendant 5 s sur de la glace avec une impulsion effective de 1 s et une pause de 1 s à 30 % de l'amplitude à l'aide d'un processeur Vibra-Cell. Les unités corticales ont été stockées dans 10 mM de K-PIPES à 60 % de saccharose (p/p) à -80°C.

La qualité du cortex et des unités corticales a été vérifiée par immunofluorescence après sédimentation à 10 000g pendant 15 min dans un rotor oscillant (Beckman JS-13.1) sur des lamelles en verre dans des tubes Corex de 15 ml équipés d'adaptateurs comme décrit précédemment (25). Les unités corticales ont été colorées à l'aide d'un anti-épiplasmine et les centrioles ont été colorées à l'aide d'un anticorps ID5. Étant donné que les deux anticorps ont été produits chez des souris et reconnaissent tous deux des structures distinctes, les anticorps ont été ajoutés séquentiellement.

P. tetraurelia centriole cryo-ET

P. tetraurelia les centrioles ont été dilués à 1:5 dans 10 mM de K-PIPES additionnés de billes d'or colloïdal de 10 nm (Aurion). Les centrioles ont été déposés sur des grilles de carbone en dentelle de 300 mesh (Electron Microscopy Sciences), tamponnés par l'arrière et vitrifiés dans de l'éthane liquide par congélation manuelle par plongée. Les grilles ont été transférées dans un microscope électronique à transmission 300 kV FEI Titan Krios (Center for Cellular Imaging and NanoAnalytics, Biozentrum, Université de Bâle) équipé d'un détecteur d'électrons direct Gatan K2 Summit. Les séries d'inclinaison à un axe ont été acquises à l'aide de SerialEM (26), avec des incréments de 2° d'environ -60° à +60° (bidirectionnel, séparés à 0°). Le grossissement était de ×29 000 avec une taille de pixel d'objet de 3,45 Å et une dose cumulée de 70 à 120 électrons/Å 2 .

C. reinhardtii culture de cellules

Cryo-ET in situ de C. reinhardtii centrioles a été réalisée dans le tapis3-4 souche (CC-3994) (27) acquis du Chlamydomonas Resource Center, University Minnesota, MN. Cette souche a des cellules plus petites (

5 µm de diamètre), ce qui améliore la vitrification et augmente la probabilité de toucher un centriole par broyage par faisceau d'ions focalisé (FIB). Les cellules ont été cultivées dans un milieu tris-acétate-phosphate, barbotées avec une atmosphère normale et exposées à une lumière constante (

C. reinhardtii vitrification cellulaire et broyage cryo-FIB

Lorsque les cultures cellulaires ont atteint la phase logarithmique médiane, elles ont été vitrifiées avec un Vitrobot Mark 4 (FEI Thermo Fisher Scientific). La culture cellulaire (4 l de

1000 cellules/μl) ont été transférés de l'arrière sur des grilles EM en cuivre de 200 mesh recouvertes de carbone troué (R2/1, Quantifoil Micro Tools) et congelés par plongée dans un mélange éthane/propane liquide. La préparation des échantillons cryo-FIB a été effectuée comme décrit précédemment (13) à l'aide d'un instrument FEI Scios ou FEI Quanta à double faisceau FIB/Scanning EM. Les grilles EM ont été montées dans des anneaux de support AutoGrid (FEI Thermo Fisher Scientific), chargées dans le FIB à l'aide d'une cryo-navette, puis recouvertes d'une couche de platine organométallique à l'aide d'un système d'injection de gaz (FEI Thermo Fisher Scientific). Les cellules ont été éclaircies en plusieurs étapes avec un faisceau d'ions gallium pour produire

Coupes cellulaires de 100 à 200 nm d'épaisseur (lamelles).

C. reinhardtii cryo-ET

Les grilles EM ont été transférées dans un microscope électronique à transmission 300 kV FEI Titan Krios (Department of Molecular Structural Biology, Max Planck Institute of Biochemistry), équipé d'un filtre énergétique post-colonne (Quantum, Gatan) et d'une caméra à détecteur direct (K2 Summit , Gatan). Utilisation du logiciel SerialEM (26), les séries d'inclinaison ont été acquises avec des pas de 2° entre -60° et + 60° (bidirectionnel, séparés à -0° ou -20°). De plus, un schéma d'inclinaison dose-symétrique a été mis en œuvre pour un sous-ensemble de centrioles acquis (28). Des inclinaisons individuelles ont été enregistrées en mode vidéo à 12 images/s, à une taille de pixel d'objet de 3,42 et une défocalisation de -5 à -6 m. La dose totale accumulée pour chaque série d'inclinaison variait entre 80 et 130 électrons/Å 2 selon l'épaisseur de l'échantillon. Plusieurs cultures cellulaires et sessions d'imagerie différentes ont été utilisées pour produire l'ensemble de données. Chaque tomographie in situ a été acquise à partir d'un C. reinhardtii cellulaire et est donc à la fois une réplique biologique et technique.

N. gruberi culture cellulaire et différenciation

N. gruberi (souche NEG fournie par C. Fulton, Brandeis University) ont été différenciées des amibes en flagellés en utilisant un protocole standard (29). Les amibes ont été cultivées sur des milieux solides avec Klebsiella bactéries comme source de nourriture pendant la nuit à 30°C jusqu'à ce que les assiettes soient

80% exempt de bactéries. Un tampon de différenciation glacé [2 mM de tris (pH 7,2) et 10 mM de NaCl] a été ajouté aux plaques, et les cellules ont été grattées avec un étaleur de verre et versées dans des tubes coniques en plastique de 50 ml. À l'aide d'une centrifugeuse CLINICAL (IEC modèle CL) d'International Equipment Company modifiée avec un frein à main, les amibes ont été sédimentées pendant 1 min, puis lavées rapidement deux fois avec un tampon de différenciation glacé (remis en suspension par vortex et sédimenté pendant 45 s) pour éliminer les bactéries. Les amibes ont ensuite été remises en suspension dans un tampon de différenciation à 25°C, qui a été placé dans un flacon Erlenmeyer de 1 litre et agité à 100 Hz dans un bain-marie à 25°C. Pour assurer une différenciation synchrone (ce qui a été confirmé par microscopie à contraste de phase des cellules colorées à l'iode de Lugol), le temps entre le grattage des cellules et leur agitation dans le bain-marie a été maintenu inférieur à 10 min.

Isolement et vitrification de N. gruberi centrioles

Les centrioles ont été isolés entre 50 et 100 min après le début de la différenciation pour acquérir des centrioles dans différents états d'assemblage (30). Des paires de centrioles s'assemblent en tandem, le premier centriole terminant l'assemblage 5 à 10 min avant le deuxième centriole (31). Entre 60 et 70 min après le début de la différenciation, les centrioles s'arriment à la membrane plasmique et initient la ciliogenèse. Pour cette étude de l'architecture des MTT, nous n'avons analysé que les centrioles matures qui avaient commencé à développer les MTD de l'axonème ciliaire.

Le protocole d'isolement des centrioles a été adapté de plusieurs études antérieures (14, 32, 33). Les cellules ont été remises en suspension dans du tampon de lyse [15 mM de tris (pH 7,5), 10 mM de KCl, 2 mM de MgSO4, 1,5 mM d'EGTA, 1 mM de dithiothréitol, un cocktail d'inhibiteurs de protéase complet sans EDTA de Roche et 0,1 % de Triton X-100] et lysé avec 5 à 10 coups dans un homogénéisateur Dounce (la lyse cellulaire complète a été confirmée avec un microscope à contraste de phase avant en cours). Les noyaux et les gros débris cellulaires ont été éliminés en faisant tourner le lysat sur un coussin de saccharose à 25 % à 1000g pendant 15 minutes. Le surnageant et l'interface ont été dilués dans du tampon de lavage (tampon de lyse sans détergent) dans un tube Oak Ridge à fond rond et agglomérés dans un rotor à godets oscillants Sorvall HB-4 à 10 000g pendant 30 minutes. Le culot a été remis en suspension dans 10 ml de tampon de lavage et chargé au-dessus d'un gradient discontinu de saccharose 40 %/50 % dans un tube Oak Ridge, qui a été centrifugé dans le rotor HB-4 à 16 000g pendant 90 min (pas de frein). En utilisant l'éclairage du fond du tube et une seringue avec une longue aiguille,

5 ml ont été extraits de l'interface 40 %/50 % et remis en suspension dans un tampon de lavage, puis sédimentés à nouveau dans un tube Oak Ridge filé à 10 000g pendant 30 minutes. Le culot a été remis en suspension dans un petit volume (

30 µl) de tampon de lavage additionné d'or colloïdal 10 nm [suspension d'albumine de sérum bovin (BSA), Aurion]. À l'aide d'un Vitrobot Mark 4 (FEI Thermo Fisher Scientific), 5 l de cet échantillon ont été transférés sur des grilles EM en cuivre de 200 mesh recouvertes de carbone troué (R3.5/1, Quantifoil Micro Tools) et congelés en plongée dans un éthane liquide/ mélange de propane.

N. gruberi cryo-ET

Les grilles EM ont été transférées comme décrit dans le C. reinhardtii section cryo-ET. Les séries Tilt ont été acquises de la même manière. Des inclinaisons individuelles ont été enregistrées en mode vidéo à 10 images/s, avec une taille de pixel d'objet de 4,21 et une défocalisation de -5 à -8 m. La dose cumulée pour chaque série d'inclinaison était

80 à 120 électrons/Å 2 . Plusieurs cultures cellulaires et sessions d'imagerie différentes ont été utilisées pour produire l'ensemble de données. Chaque paire de centrioles provient d'une cellule distincte et peut donc être considérée comme une réplique biologique.

Isolement du centriole humain

Les centrioles humains ont été isolés de la lignée cellulaire lymphoblastique KE-37 comme décrit précédemment (25) mais modifié comme suit. Après sédimentation des centrioles sur coussin de saccharose à 60 % par centrifugation, le tiers supérieur du volume du flacon de centrifugation a été prélevé par aspiration, laissant 20 à 25 % de saccharose dans un volume d'environ 25 ml. Le coussin de saccharose à 60 % contenant les centrioles isolés a ensuite été remis en suspension jusqu'à ce que le saccharose ne soit plus visible par pipetage doux. La concentration finale en saccharose était de 30 %. Des aliquotes (500 l) ont été congelées rapidement dans de l'azote liquide et stockées à -80°C. L'efficacité d'isolement des centrioles a été vérifiée par immunofluorescence.

Cryo-ET du centriole humain

Comme décrit précédemment (14), une fraction aliquote de 500 l a d'abord été remise en suspension dans 1 ml de K-PIPES 10 mM (4°C, pH 7,2) puis centrifugée à 10 400g pendant 10 min à 4°C.Le culot contenant les centrioles a été remis en suspension dans 20 pi de K-PIPES 10 mM et encore dilué avec 10 pi de billes d'or colloïdal de 10 nm (Aurion). Cinq microlitres de l'échantillon ont ensuite été déposés sur des grilles de carbone en dentelle de 300 mesh (Electron Microscopy Sciences), tamponnés à l'arrière et vitrifiés dans de l'éthane liquide par congélation manuelle par plongée. Les grilles ont été transférées comme décrit ci-dessus. Des séries d'inclinaison à axe unique ont été acquises à l'aide de SerialEM par incréments de 2° avec un schéma bidirectionnel d'environ -60° à +60° séparé en moitiés à -20°. Les inclinaisons individuelles ont été enregistrées en mode vidéo à 10 images/s. Le grossissement était de × 42 000 avec une taille de pixel d'objet de 3,42 et une dose cumulée de

Moyenne du sous-tomogramme

Tous les cadres de la série d'inclinaison ont été alignés à l'aide de MotionCor2 (34) en utilisant soit des patchs 3 × 3, soit un alignement sur l'ensemble de l'image. Par la suite, tous les tomogrammes de toutes les espèces ont été reconstruits à l'aide d'etomo, qui fait partie du package IMOD (35). La fonction de transfert de contraste (CTF) des tomogrammes a été corrigée à l'aide des outils CTFplotter et CTFphaseflip d'IMOD. Pour générer des sous-tomogrammes des MTT, des microtubules A et C ont été prélevés le long de chaque MTT, générant neuf ensembles de coordonnées appariées A-C le long de la région centrale du centriole, toujours du côté proximal au côté distal. Sur la base de la périodicité observée dans le Trichonymphe MTT proximaux et sur notre analyse des périodicités de la région centrale (fig. S1), nous avons décidé d'extraire des sous-tomogrammes tous les 17 nm pour restreindre la redondance structurelle tout en maintenant l'unité périodique complète. À l'aide d'un script Python maison, les positions des microtubules B ont été interpolées selon les périodicités et les orientations MTT définies par l'utilisateur. Les informations de position étaient nécessaires pour connaître les coordonnées d'extraction des sous-tomogrammes (car le microtubule B correspond à peu près au centre des MTT), et les rotations étaient nécessaires pour préaligner tous les sous-tomogrammes dans la même orientation (angles d'Euler de départ pour l'alignement). Ces valeurs de rotations sont appelées plus loin « paramètres de pré-alignement ». Les sous-tomogrammes ont été organisés au format .tbl puis extraits, alignés et moyennés à l'aide de Dynamo (36). Le nombre de sous-tomogrammes, les dimensions et la référence initiale étaient spécifiques à chaque espèce.

Pour le P. tetraurelia MTTs, 1693 sous-tomogrammes de 288 × 288 × 288 voxels ont été extraits de 14 centrioles non compressés. Pour le C. reinhardtii MTT, 1546 sous-tomogrammes de 296 × 296 × 296 voxels ont été extraits de 11 centrioles. Pour le N. gruberi MTT, 1168 sous-tomogrammes de 260 × 260 × 260 voxels ont été extraits de sept centrioles. Ces trois ensembles de données ont été initialement alignés à l'aide de la méthode ex vivo C. reinhardtii noyau central MTTs comme référence de départ (emd-5252, 18). Après quelques itérations, ils ont été alignés sur leurs cartes moyennes respectives générées à chaque tour. Les itérations ont été effectuées sur deux données regroupées, et les valeurs finales de décalages et de rotations obtenues ont été appliquées sur des sous-tomogrammes non regroupées.

Pour assurer l'exactitude de la structure, une reconstruction de novo a été réalisée sur P. tetraurelia et C. reinhadtii MTT. Comme le montre la fig. S7 (I à R), les deux approches (utilisant une moyenne de référence ou de novo) ont abouti à la même reconstruction tridimensionnelle (3D). Pour le moyennage de novo, une translation aléatoire (jusqu'à 6 nm) a été ajoutée au z position de chaque particule de l'alignement initial pour s'assurer que la moyenne finale n'a pas été biaisée par la sélection initiale. En utilisant ces particules traduites, un premier volume moyen a été généré sans aucune périodicité. Ensuite, l'ensemble de données a été divisé en deux demi-ensembles indépendants. Pour les étapes suivantes, les paramètres d'alignement étaient les mêmes pour les deux moitiés. Les particules ont été alignées sur la première moyenne jusqu'à ce que leurs vues de dessus soient bien alignées (trois itérations requises). Comme la vue latérale était mal résolue, un masque a été appliqué sur la structure interne et les particules ont été alignées pour un autre tour. Après avoir vérifié que la périodicité était mieux reconstituée, une itération a été réalisée avec un masque couvrant l'ensemble du triplet. Notez que pour l'approche de novo, les particules ont été alignées en utilisant les dimensions bin2 pour P. tetraurelia et bin4 dimensions pour C. reinhardtii. Selon le critère de corrélation de Fourier (FSC) = 0,143, la résolution du P. tetraurelia la reconstruction de novo est de 33 Å, et la résolution du C. reinhardtii la reconstruction de novo est de 47 Å. Notez que nous nous concentrons sur l'échafaudage interne et que d'autres caractéristiques telles que les périodicités de la protéine interne des microtubules (MIP) pourraient avoir été imposées par la périodicité de l'échafaudage interne. Par conséquent, nous ne concluons rien sur ces autres caractéristiques structurelles.

Pour les MTT humains, 398 sous-tomogrammes de 296 × 296 × 296 voxels ont été extraits de 12 centrioles et alignés à l'aide de la méthode ex vivo. Cricetulus griseus Structure des MTT comme référence de départ (emd-7777, 15). Le petit nombre de sous-tomogrammes était dû à la compression élevée de l'ensemble de données, ce qui a entraîné moins de microtubules intacts. Notez que cet ensemble de données était composé d'un mélange de doublets et de triplets de microtubules. Nous avons choisi d'utiliser également des sous-tomogrammes contenant des MTD sachant que la structure interne chez l'homme y est toujours attachée (fig. S2A). Cette hétérogénéité du jeu de données explique la mauvaise reconstruction des microtubules C (fig. S6, I et J).

Pour les jonctions entre les MTT en non compressé P. tetraurelia et C. reinhardtii centrioles, les sous-tomogrammes ont été générés comme auparavant, mais l'ordre de sélection des points était d'abord les microtubules C puis les microtubules A. Ceci a été fait pour interpoler les points situés entre deux MTT au lieu des points positionnés au milieu du MTT comme fait précédemment. Pour P. tetraurelia, 2413 sous-tomogrammes ont été extraits tous les 8,5 nm des neuf centrioles considérés comme les moins comprimés (circonférence la plus ronde). Pour vérifier s'il y avait une périodicité de 17 nm à la jonction, la moitié de l'ensemble de données a été utilisée, simulant une particule tous les 17 nm. Une moyenne préliminaire a été générée à partir des paramètres de pré-alignement et utilisée comme référence initiale. Après cinq itérations, la moyenne générée ne présentait aucune structure périodique de 17 nm, nous avons donc décidé d'utiliser l'ensemble de données complet avec une périodicité de 8,5 nm. Pour C. reinhardtii, 682 sous-tomogrammes ont été extraits tous les 17 nm à partir de cinq centrioles. Dans ce cas, des observations préliminaires révélaient déjà une périodicité autour de 16,2 nm (fig. S1T). En suivant la même procédure que pour P. tetraurelia, la référence initiale a été générée en faisant la moyenne des sous-tomogrammes avec leurs paramètres de pré-alignement.

Combinaison de cartes

Pour générer une carte montrant deux MTT voisins reliés entre eux, nous avons utilisé deux cartes MTT et une carte de jonction générées par la moyenne des sous-tomogrammes comme décrit ci-dessus. Les intensités de pixels des trois cartes ont d'abord été normalisées à la même plage de valeurs. Les trois cartes ont été grossièrement réorientées dans des volumes suffisamment grands pour contenir deux MTT [fig. S4M, a]. Ensuite, le volume de jonction a été aligné sur le premier MTT [fig. S4M, b] en utilisant SPIDER (37). De même, le deuxième MTT a été aligné sur le nouveau volume de jonction [fig. S4M, ch]. À partir de chaque volume, une région d'intérêt a été sélectionnée dans ImageJ, et soit le MTT, soit la jonction a été segmenté [fig. S4M, d]. Enfin, les trois volumes segmentés ont été réunis à l'aide de l'outil « Image Calculator -> Add » dans ImageJ [fig. S4M, e]. Les fichiers de données S1 et S2 sont les fichiers .tiff finaux des volumes fusionnés pour P. tetraurelia (fichier de données S1) et C. reinhardtii (fichier de données S2).

Analyse de la distribution des caractéristiques structurelles

Pour comprendre comment l'échafaudage interne et le linker A-C étaient distribués le long de la longueur du centriole, nous avons utilisé ImageJ pour sélectionner manuellement les positions où les structures suivantes commencent à être visibles et où elles disparaissent : échafaudage interne, linker A-C, MTT et MTD.

Analyse géométrique

De P. tetraurelia, nous avons sélectionné 10 centrioles aussi intacts (ronds) que possible. Pour éviter le problème de la variabilité de la longueur des centrioles, les centrioles ont été subdivisés en 10 parties. Pour ce faire, l'outil "Group Z Projection" d'ImageJ a été utilisé pour générer 10 tranches le long du centriole. À chaque coupe, les coordonnées des microtubules A, B et C ont été sélectionnées. Le long de la longueur centriolaire, nous avons défini le centre des centrioles (O) comme le barycentre de toutes les coordonnées A-microtubules. Ensuite, pour chaque MTT, l'angle de torsion a été calculé comme l'angle entre le vecteur O-A et le vecteur A-B (A et B sont les centres des microtubules A et B, respectivement). De plus, le rayon du centriole a été mesuré comme la distance O-A. À partir de 10 centrioles, 9 MTT et 10 sous-sections, nous avions deux valeurs manquantes, résultant en 898 mesures pour chaque paramètre.

De C. reinhardtii, la même information a été extraite de six centrioles. Comme ces centrioles étaient incomplets en raison du broyage FIB, il n'a pas été possible de calculer le barycentre des microtubules A pour chaque sous-section. Par conséquent, nous avons également choisi la position hypothétique du centre du centriole. Au total, 377 mesures ont été obtenues.

Analyse rotationnelle et translationnelle

Dans un tomogramme brut, une section transversale d'une épaisseur de 100 nm a été extraite d'un centriole de P. tetraurelia. Pour augmenter son contraste, le volume a été divisé par un facteur 2. Ensuite, le bruit a été supprimé par diffusion anisotrope non linéaire à l'aide de bsoft et en appliquant un filtre gaussien 3D avec Fidji. En utilisant SPIDER, le volume a été déplacé le long de la z axe chaque pixel de -58 à +58 (respectivement, -41 à 41 nm). Simultanément, le volume tournait autour du z de 5° de 0 à 360. Chaque volume traduit (avec décalages et rotations couplés) a été comparé au volume initial. Notez que la corrélation croisée a été calculée sur la structure du noyau interne uniquement. Les mêmes opérations ont été réalisées en utilisant une coupe transversale de la dernière reconstruction P. tetraurelia échafaudage intérieur.

De la même manière, une coupe transversale de C. reinhardtii centriole a été extrait et préparé. Comme les centrioles obtenus en fraisage FIB ne sont pas complets, l'analyse rotationnelle n'a pas pu être effectuée de manière fiable. Cependant, nous pourrions effectuer une analyse translationnelle comme expliqué ci-dessus pour le tomogramme brut et le dernier reconstruit C. reinhardtii échafaudage intérieur.

Culture de cellules de mammifères

Les cellules ont été cultivées soit dans RPMI-1640 et GlutaMAX (Life Technologies) (KE-37) soit dans le milieu Eagle modifié de Dulbecco et GlutaMAX [U2OS et HEK293 (rein embryonnaire humain–293)], complétés avec 10 % de sérum de veau foetal (Life Technologies) et pénicilline et streptomycine (100 ug/ml).

Clonage

La construction pEGFP-C1-Centrin-2 exprimant la Centrine-2 humaine (NM_004344.1) a été décrit ailleurs (38). Pour la construction pEGFP-C2-POC5, la séquence codante complète de hPOC5 obtenue par amplification en chaîne par polymérase de transcription inverse (RT-PCR) comme décrit dans (21) a été cloné dans pEGFP-C2 (Clontech Laboratories). La construction pmCherry-hPOC5 a été obtenue en remplaçant la séquence codante de la protéine fluorescente verte (GFP) dans la construction précédente par mCherry. Pour générer la construction GFP-FAM161A, FAM161A humain (NM_001201543.2) a été amplifié par PCR à partir du clone d'ADN complémentaire (ADNc) DKFZp686O21143Q et cloné dans pEGFP-C2. La construction pEGFP-POC1B a été générée en transférant la séquence codante de POC1B humain (NM_172240) à partir d'un vecteur donneur Gateway (ORFeome Collaboration Clones, disponible auprès de Dharmacon, ID : 100070629) dans pEGFPC-attR, un vecteur pEGFP-C2 modifié contenant une cassette de clonage Gateway. Le pmCherry-POC1B a été obtenu de la même manière en utilisant pmCherryC-attR, un vecteur dérivé de pEGPC-attR en remplaçant la séquence codante GFP par mCherry.

Expériences de co-immunoprécipitation

Les constructions suivantes ont été cotransfectées dans une boîte de 10 cm contenant 30 à 40 % de cellules HEK293 confluentes en utilisant soit la Lipofectamine (Life Technologies) soit le réactif jetPRIME (Polyplus-transfection) en suivant les instructions du fabricant : GFP-FAM161A avec mCherry-POC5, mCherry-POC5 seul, GFP-Centrin-2 avec mCherry-FAM161A et GFP-POC5 avec mcherry-POC1B. Après 24 heures d'expression, les cellules ont été traitées selon les instructions du kit GFP-Trap (Chromotek) en utilisant un tampon de dosage de radio-immunoprécipitation (RIPA) pour la lyse et en incubant le lysat avec des billes magnétiques GFP-Trap pendant 2 heures à 4°C sur un roue. Les échantillons ont été analysés sur un gel à gradient de 4 à 20 % (Bio-Rad) avant transfert sur membrane de difluorure de polyvinylidène (PVDF) en utilisant le système iBlot (Invitrogen/Thermo Fisher Scientific). Les membranes ont été soit incubées avec des anticorps primaires contre la GFP de souris (1:700 Abcam, ab1218) ou mCherry de lapin (1:500 Abcam, ab167453), suivies de peroxydase de raifort de chèvre anti-souris (HRP) (1:1000 à partir d'un glycérol à 50 % stock Thermo Fisher Scientific, 31431) ou des anticorps secondaires de chèvre anti-HRP de lapin (1:1000 à partir d'un stock de 50 % de glycérol Thermo Fisher Scientific, 31468). Les transferts ont été développés en utilisant des films Amersham (GE Healthcare, 28906836).

Production et purification d'anticorps FAM161A

Pour générer l'anticorps anti-FAM161A, un fragment codant pour les acides aminés 1 à 160 (basé sur la séquence NP_001188472) a été inséré dans pGST-Parallel1 et exprimé en Escherichia coli. La protéine de fusion GST-FAM161A a été purifiée dans des conditions natives à l'aide de Glutathione Sepharose 4 Fast Flow (GE Healthcare), collectée à partir des billes par clivage de la protéase TEV (Tobacco Etch Virus) et utilisée pour l'immunisation du lapin (Agro-Bio). Les anticorps ont ensuite été purifiés par affinité sur une colonne de GST-FAM161A immobilisée sur Affi-Gel 10 (Bio-Rad Laboratories).

Réactifs et protocole U-ExM

Les réactifs U-ExM sont décrits dans (16) à l'exception de la poly-d-lysine, qui a été achetée auprès de Thermo Fisher Fisher (A3890401). Les solutions de monomères U-ExM (U-ExM-MS) ont été préparées comme suit : d'acrylamide (AA) à partir d'une solution mère à 40 %, 2,5 l de bis-acrylamide (BIS) à partir d'une solution mère à 2 % et 5 l de solution saline tamponnée au phosphate 10× (PBS) ont été prémélangés et maintenus à -20°C . Initiateur de radicaux libres ammonium per sulfate (APS) et catalyseur de polymérisation tétraméthyléthylènediamine (TEMED) ont été préparés sous forme de solutions mères à 10 % dans de l'eau sans nucléase et conservés sous forme d'aliquotes à -20°C pendant 1 mois.

Les anticorps primaires suivants ont été utilisés dans cette étude : anti-tubuline de lapin (1:500, Abcam, ab18251), chaîne polyclonale anti-polyglutamate de lapin (PolyE, IN105) (1:500 AG-25B-0030-C050, AdipoGen), anti-tubuline AA344 (1:250 : scFv-S11B, -tubuline) et AA345 (1:250 scFv-F2C, α-tubuline), lapin polyclonal anti-POC1B (1:250 PA5-24495, Thermo Fisher Scientific), lapin anti-POC5 polyclonal (1:250 A303-341A, Bethyl Laboratories), anti-FAM161A polyclonal de lapin (1:250 anticorps maison, cette étude) et anti-Centrin-2 monoclonal de souris (1:250 clone 20H5, 04-1624 , Merck Millipore). Nous avons utilisé les anticorps secondaires suivants : chèvre anti-lapin Alexa Fluor 488 immunoglobuline G (IgG) lourde + légère (H+L) (1:400 A11008), chèvre anti-souris Alexa Fluor 488 IgG H+L (1:400 A11029 ), chèvre anti-souris Alexa Fluor 568 IgG H + L (1:400 A11004) (1:400 Invitrogen, Thermo Fisher Scientific) et chèvre anti-lapin Alexa Fluor 568 (1:400 Thermo Fisher Scientific).

Le protocole U-ExM a été réalisé comme décrit (16). Brièvement, des lamelles de 12 mm avec des cellules U2OS non fixées ont été incubées dans une solution de formaldéhyde (FA) et d'AA (voir Matériels et méthodes pour la concentration) dans du PBS pendant 5 heures à 37°C. TEMED (2,5 ul) et APS (2,5 ul) (à partir de solutions mères à 10 %) ont été ajoutés à l'U-ExM-MS et rapidement mélangés avant l'ajout aux lamelles. La gélification a été laissée se dérouler pendant 5 minutes sur de la glace, puis déplacée à 37°C dans l'obscurité pendant 1 heure. Les lamelles avec des gels ont ensuite été incubées dans un tampon de dénaturation (200 mM de SDS, 200 mM de NaCl et 50 mM de tris dans ddH2O eau bidistillée) pendant 15 min à température ambiante (TA) sous agitation douce. Successivement, les gels ont été retirés des lamelles et encore incubés avec du tampon de dénaturation frais à 95°C pendant 90 min (sauf indication contraire, voir fig. S8). Après dénaturation, les gels ont été immergés dans ddH2O à RT. Ensuite, les gels ont été incubés dans ddH2O pendant la nuit pour une expansion complète. Le jour suivant, les gels ont été lavés dans du PBS deux fois pendant 15 min pour éliminer l'excès d'eau avant incubation avec une solution d'anticorps primaire. L'incubation avec l'anticorps primaire dilué dans 2% PBS/BSA a été réalisée à 37°C pendant

3 heures, en secouant doucement. Les gels ont ensuite été lavés dans du PBS et du Tween 20 à 0,1 % (PBST), trois fois pendant 10 min sous agitation, et incubés avec une solution d'anticorps secondaire diluée dans du PBS/BSA à 2 % pendant

3 heures à 37°C, sous agitation douce. Les gels ont ensuite été lavés dans du PBST, trois fois pendant 10 min sous agitation, et enfin placés dans des béchers remplis de ddH2O pour l'expansion finale d'abord pendant 30 min, puis pendant la nuit pour une expansion complète. L'expansion attendue variait de 4 à 4,2×. Le montage a été effectué comme décrit (16).

Optimisation du protocole U-ExM et acquisition d'images

Nous avons optimisé notre protocole U-ExM décrit précédemment (16) pour obtenir une meilleure expansion des centrioles au sein des cellules humaines. Deux étapes ont été modifiées comme suit : la solution de FA/AA [FA 0,7 et 1% AA = 1X (16) FA 1,4 et 2 % AA = 2X et FA 2,1 et 3 % AA = 3X) et le temps de dénaturation (30, 60 et 90 min). Les résultats de l'optimisation sont présentés dans la fig. S8 (A et B). Le protocole 2X combiné à une dénaturation de 90 minutes à 95°C a donné la meilleure expansion et a été utilisé pour une analyse plus approfondie.

La microscopie confocale a été réalisée sur un Leica TCS SP8 à l'aide d'un objectif à huile à ouverture numérique (NA) 63 × 1,4, avec le mode éclair à la résolution maximale pour générer des images déconvoluées, avec les paramètres suivants : Foudre à la résolution maximale, adaptative en tant que « Stratégie » et l'eau comme « milieu de montage ». 3D z les piles ont été acquises avec 0,12-μm z intervalles et un X,oui taille de pixel de 35 nm. Pour la fig. S8 (A et B), les centrioles ont été imagés avec un objectif à huile 100 × 1,25 NA N PLAN sur un microscope à grand champ Leica DM6B, équipé d'une caméra Leica DFC9000 monochrome scientifique à semi-conducteur à oxyde métallique complémentaire (sCMOS). Les images déconvoluées ont été générées avec le mode Thunder "Small volume computational clearing".

Mesures du diamètre et de la longueur du centriole

Le diamètre et la longueur de la tubuline et des protéines d'échafaudage interne ont toujours été mesurés à partir d'expériences de double coloration pour obtenir des valeurs relatives. Centrioles avec leurs extrémités distale et proximale alignées verticalement le long de la z ont été sélectionnés pour l'analyse du diamètre. Les diamètres de la tubuline et des différentes protéines d'échafaudage internes ont été mesurés au milieu z plan en utilisant les outils de balayage linéaire et de profil de tracé de Fidji (39) pour mesurer la distance entre les deux pics d'intensité. Pour chaque centriole, les diamètres de localisation des protéines ont été obtenus à partir de la moyenne de deux mesures perpendiculaires.Pour l'analyse de longueur, seuls les centrioles se trouvant presque parallèles à la X,oui ont été choisis pour mesurer la longueur de la tubuline et des différentes protéines du noyau interne. Pour chaque centriole, un balayage linéaire couvrant toute la largeur du centriole a été tracé le long d'une image de projection maximale générée à partir de quelques plans médians du centriole. L'outil de profil de tracé de Fidji a ensuite été utilisé pour obtenir le profil d'intensité de fluorescence de la tubuline et de la protéine du noyau interne à partir du même balayage linéaire, et la longueur a été mesurée comme la distance entre l'intensité de 50 % du pic le plus proximal et l'intensité de 50 % de le pic le plus distal.

Pour générer les graphiques de la fig. S8 (C, E, G et I), les deux X et oui les axes ont été redimensionnés en unités relatives. Pour chaque profil d'intensité de fluorescence de la tubuline, la valeur de fluorescence maximale la plus élevée (X axe) a été remis à l'échelle à 1, et toutes les autres valeurs ont été normalisées par rapport à celui-ci. De plus, les longueurs de chaque profil d'intensité de fluorescence (oui axe) ont été rééchelonnés entre 0 et 1 en attribuant 0 à 5 % de l'intensité de fluorescence du pic le plus proximal et 1 à 5 % de l'intensité de fluorescence du pic le plus distal. Ensuite, redimensionné les profils d'intensité de fluorescence de la tubuline à partir de

60 centrioles de trois gels indépendants ont été alignés et moyennés ensemble pour générer une courbe moyenne. Le profil d'intensité de fluorescence de chaque protéine d'échafaudage interne a été normalisé de la même manière et redimensionné par sa propre intensité maximale sur le X axe et par la longueur du profil de tubuline correspondant à partir du même centriole sur le oui axe. Par la suite, les profils d'intensité alignés des protéines d'échafaudage internes ont été moyennés ensemble pour générer des courbes moyennes. Les profils d'intensité de fluorescence ont été redimensionnés en utilisant le langage R et tracés dans GraphPad Prism7.

Pour obtenir la figure 4 (K et L), les diamètres des protéines d'échafaudage internes et de la tubuline de chaque centriole individuel ont été normalisés par rapport aux mesures moyennes de tubuline obtenues à partir de tous les centrioles. Les valeurs individuelles ont été tracées sous forme de cercle du diamètre correspondant et alignées au centre.

Symétrisation

Des images symétrisées (Fig. 4J) ont été obtenues à partir des images de fusion confocale déconvoluées présentées sur la Fig. 4I (images brutes). Chaque image a été dupliquée neuf fois et tournée séquentiellement avec un angle de 40° aux Fidji (39). En utilisant le plugin Fidji StackReg, les images pivotées ont été réalignées par des traductions uniquement sur l'image d'origine. Une projection d'intensité moyenne des neuf images a ensuite été générée.

Échafaudage intérieur à la résolution U-ExM

Comme décrit dans la fig. S9 (F à K), la projection 2D (moyenne) (fig. S9F) à partir de la carte cryo-EM 3D reconstruite a été générée à l'aide de Fidji (39). Ensuite, l'image a été redimensionnée quatre fois plus grande pour atteindre la taille d'un centriole en U-ExM (environ 800 nm de diamètre à partir du milieu des MTT). Par la suite, deux images ont été générées en supprimant soit la densité de l'échafaudage interne (fig. S9G) soit les MTT (fig. S9H). Chaque image a ensuite été traitée avec une bande passante dans l'espace de Fourier en filtrant les petites structures jusqu'à 140 nm, ce qui correspond à la résolution confocale après déconvolution (fig. S9, I et J). L'image finale a été créée en fusionnant les deux images filtrées (fig. S9K).

Test de recrutement de microtubules

Soixante à 80% de cellules U2OS confluentes ont été transfectées dans une plaque à six puits en utilisant le réactif jetPRIME (Polyplus-transfection) en suivant les instructions du fabricant, avec 2,5 µg d'ADN total des combinaisons suivantes : mCherry-FAM161A seul, GFP-POC5 seul, GFP -POC1B seul, GFP–Centrin-2 seul, mCherry-FAM161A avec GFP-POC5, mCherry-FAM161A avec GFP-POC1B, mCherry-FAM161A avec GFP–Centrin-2, mcherry-POC5 avec GFP–Centrin-2 ou mCherry- FAM161A avec mCherry-POC5 et GFP-Centrin-2. Le milieu a été changé 4 à 6 heures après la transfection pour éviter la mort cellulaire, et l'expression des protéines de fusion fluorescentes a été autorisée pendant 24 heures. Les cellules cultivées sur des lamelles ont ensuite été fixées pendant 3 min dans du MeOH froid à -20°C et lavées une fois dans du PBS avant la coloration pour les - et -tubulines (voir la section « Réactifs U-ExM » dans le matériel supplémentaire) dans PBS/BSA 2 % suivi d'anticorps secondaire anti-souris STAR RED (1:400 Abberior), lavé trois fois dans du PBS Tween 0,1%. Les lamelles ont ensuite été montées en utilisant un milieu de montage au glycérol avec du 4′,6-diamidino-2-phénylindole et du DABCO 1, 4-diazabicyclo (2.2.2) octane (Abcam, ab188804).


Discussion

Il a été démontré que les peptides synthétiques dérivés des domaines fonctionnels des produits de gènes viraux inhibent les virus correspondants (19-21). Par exemple, un peptide 36-aa, correspondant à une séquence répétée heptad dans la glycoprotéine transmembranaire du VIH-1 (gp41), est un puissant inhibiteur de la fusion membranaire du VIH-1 et de l'entrée du virus (20, 22, 23) et est maintenant en utilisation clinique chez les patients infectés par le VIH-1 (24). Fait intéressant, le produit de clivage protéolytique N-terminal d'un peptide qui s'étend sur le site de clivage NS5A-NS5B dans le VHC inhibe la protéase du VHC NS3/4A, et un composé macrocyclique peptidomimentique basé sur cette structure a une puissante activité antivirale in vitro et chez l'homme (19). Ces résultats et des résultats similaires dans d'autres systèmes viraux (21,25) ont servi d'impulsion aux études rapportées ici.

À l'aide d'un test de réduction de foyer infectieux pour cribler une bibliothèque de peptides synthétiques de 441 membres couvrant la polyprotéine du VHC, nous avons identifié 13 peptides qui ont inhibé l'infection par le VHC au moins 10 fois, dont le plus puissant a bloqué l'infection > 100 000 fois. Plusieurs de ces peptides ont des mécanismes d'action potentiellement divers, en fonction de leur localisation dans la protéine correspondante (Fig. 1, SI Tableau 3). Le plus puissant de ces peptides, C5A, un 18-mère dérivé du domaine d'ancrage membranaire de la protéine HCV NS5A dont l'IC50 est de l'ordre du nanomolaire, ce qui est au moins 100 fois inférieur à la dose toxique observée in vitro et in vivo chez la souris (SI Tableau 4), a été sélectionné pour une analyse plus approfondie. Il est important de noter que l'isomère d de C5A est au moins aussi puissant que l'isomère l (Fig. 2), est moins cytotoxique in vitro (Fig. 2), est stable dans un milieu contenant du sérum (SI Fig. 5), et est non immunogène in vivo (données non présentées). De plus, le C5A présente un mécanisme d'action antiviral tout à fait unique : il déstabilise l'intégrité structurelle virale et possède une activité membranolytique virale, c'est-à-dire qu'il est virocide. Ainsi, il n'est pas surprenant que le C5A empêche complètement et définitivement de novo L'infection par le VHC et supprime l'infection par le VHC en cours dans les cellules en division et non en division. Collectivement, ces résultats suggèrent que le C5A inhibe l'infection par le VHC en déstabilisant les virions du VHC de manière extracellulaire et dans les cellules infectées.

C5A est composé d'acides aminés 3 à 20 à l'extrémité N de la NS5A, une métalloprotéine de zinc phosphorylée qui est un composant essentiel du complexe de réplication du VHC (26, 27). Les 30 acides aminés N-terminaux de NS5A servent d'ancrage membranaire et ciblent la protéine vers le réticulum endoplasmique (RE) (28). L'analyse structurale indique que cette région forme une hélice amphipathique qui est intégrée dans le plan dans le feuillet cytosolique de la bicouche membranaire (13, 31). Comme prévu, l'analyse CD révèle que C5A affiche une structure -hélicoïdale en solution aqueuse. De même, des projections de roues hélicoïdales ont montré que les résidus C5A sont distribués selon un motif amphipathique parfait (SI Fig. 6). Néanmoins, l'activité antivirale de C5A n'est pas une propriété générale de tous les domaines d'association membranaire, car les peptides des domaines d'ancrage membranaire d'autres protéines non structurelles du VHC [par exemple, NS4A, NS4B et NS5B (29)] présents dans notre panel de dépistage de peptides n'inhibent pas infection par le VHC.

L'analyse structure-activité a révélé que la spécificité antivirale de C5A est en corrélation avec sa structure en hélice et sa capacité à perméabiliser les membranes des liposomes. Ces résultats suggèrent que C5A interagit avec la membrane virale pour perturber son intégrité, libérer des capsides virales et exposer le génome viral aux exonucléases pour la dégradation. De plus, l'analyse mutationnelle a révélé que l'amphipathie est nécessaire pour l'activité antivirale de C5A. Ce mécanisme d'action unique distingue le C5A des peptides qui interfèrent avec l'interaction ligand viral-récepteur hôte [p. , HNP1 et HD5 pour les papillomavirus humains) (32). Bien que l'amphipathie et l'hélicité soient toutes deux nécessaires à l'activité antivirale de C5A, elles ne sont pas suffisantes, car plusieurs autres peptides -hélicoïdaux amphipathiques qui ont une activité antimicrobienne dans d'autres systèmes (33, 34) ne sont pas actifs contre le VHC.

L'analyse structure-activité a également révélé que l'activité antivirale de C5A est indépendante de la séquence, car les rétropeptides ou les peptides avec des acides aminés hydrophobes ou hydrophiles brouillés étaient pleinement actifs, suggérant que son activité virocide est indépendante des interactions spécifiques peptide-protéine membranaire. Ceci est soutenu par la pleine activité antivirale de l'isomère d de C5A, qui n'est pas susceptible de participer aux mêmes interactions spécifiques peptide-protéine membranaire que son homologue l'isomère. En revanche, l'analyse de substitution d'acides aminés a révélé que l'activité antivirale de C5A dépend de sa composition en acides aminés, que son résidu cystéine interne semble être essentiel et que ses congénères chargés positivement sont également actifs. Les analogues synthétiques de C5A dérivés de la séquence prototype de six génotypes indépendants du VHC ont affiché une activité antivirale variable contre le VHC malgré la rétention de la structure amphipathique en hélice , reflétant vraisemblablement leur composition différente en acides aminés.

Il est intéressant de noter que l'activité antivirale du C5A ne se limite pas au VHC, car il affiche une puissante activité antivirale contre d'autres membres de la Flaviviridae (virus du Nil occidental et virus de la dengue), les paramyxovirus (rougeole et virus respiratoire syncytial) et le VIH, dont les détails seront rapportés séparément. Il est important de noter que l'analyse préliminaire suggère que le C5A est virocide pour la dengue et le VIH, similaire au VHC. Ces résultats appuient l'idée que C5A cible les composants cellulaires des membranes virales plutôt que les protéines codées par le virus. Sur la base de son orientation dans le plan dans le feuillet cytosolique de la membrane du RE (13), nous suggérons que C5A reconnaît les composants cellulaires des membranes virales, très probablement leur composition lipidique, qui refléterait celle du compartiment cellulaire dans lequel se produit leur morphogenèse. Étant donné que le VHC, le virus du Nil occidental et le virus de la dengue poussent dans le RE, leurs membranes peuvent refléter la composition lipidique requise pour l'insertion de l'ancrage membranaire du VHC NS5A. En revanche, la rougeole, le VRS et le VIH bourgeonnant à la surface des cellules infectées, la base de leur inactivation par C5A reste donc à déterminer. Théoriquement, ils pourraient bourgeonner à travers des radeaux lipidiques, qui sont riches en cholestérol et en sphingolipides (35), et pourraient donc contenir une composition lipidique membranaire similaire à celle du VHC, dont il a également été démontré qu'il s'associe aux membranes résistantes aux détergents dans la cellule (36, 37 ). D'autres études sont nécessaires pour aborder ces possibilités, ainsi que la base de la résistance C5A des autres virus testés dans cette étude.

En conclusion, ces études ont défini la membrane virale comme cible d'intervention dans certaines infections virales. En outre, ils établissent le C5A comme le prototype d'une classe d'agents antiviraux qui se concentrent spécifiquement sur cette cible. En tant que tels, les agents ciblant les membranes comme le C5A pourraient être combinés avec des agents ciblant les aspects intracellulaires du cycle de vie viral. Il est important de noter que ces agents ne devraient pas sélectionner les variantes d'échappement et, s'ils sont combinés avec des médicaments qui sélectionnent des mutations de résistance, leur mode d'action virocide extracellulaire devrait également empêcher la propagation de ces variantes.


Contenu

Les protéines sont des chaînes d'acides aminés reliées entre elles par des liaisons peptidiques. De nombreuses conformations de cette chaîne sont possibles en raison de la rotation de la chaîne autour de chaque atome d'alpha-carbone (atome Cα). Ce sont ces changements de conformation qui sont responsables des différences dans la structure tridimensionnelle des protéines. Chaque acide aminé de la chaîne est polaire, c'est-à-dire qu'il a séparé des régions chargées positives et négatives avec un groupe carbonyle libre, qui peut agir comme accepteur de liaison hydrogène et un groupe NH, qui peut agir comme donneur de liaison hydrogène. Ces groupes peuvent donc interagir dans la structure de la protéine. Les [ lequel? ] 20 acides aminés peuvent être classés selon la chimie de la chaîne latérale qui joue également un rôle structurel important. La glycine occupe une position particulière, car elle possède la plus petite chaîne latérale, un seul atome d'hydrogène, et peut donc augmenter la flexibilité locale dans la structure de la protéine. D'autre part, la cystéine peut réagir avec un autre résidu de cystéine et former ainsi une liaison croisée stabilisant l'ensemble de la structure. [ citation requise ]

La structure protéique peut être considérée comme une séquence d'éléments de structure secondaires, tels que les hélices et les feuillets , qui constituent ensemble la configuration tridimensionnelle globale de la chaîne protéique. Dans ces structures secondaires, des motifs réguliers de liaisons H se forment entre les acides aminés voisins, et les acides aminés ont des angles Φ et similaires. [ citation requise ]

La formation de ces structures neutralise les groupes polaires sur chaque acide aminé. Les structures secondaires sont étroitement emballées dans le noyau protéique dans un environnement hydrophobe. Chaque groupe latéral d'acides aminés a un volume limité à occuper et un nombre limité d'interactions possibles avec d'autres chaînes latérales voisines, une situation qui doit être prise en compte dans la modélisation et les alignements moléculaires. [1]

Hélice Modifier

L'hélice est le type de structure secondaire le plus abondant dans les protéines. L'hélice a 3,6 acides aminés par tour avec une liaison H formée entre chaque quatrième résidu la longueur moyenne est de 10 acides aminés (3 tours) ou 10 mais varie de 5 à 40 (1,5 à 11 tours). L'alignement des liaisons H crée un moment dipolaire pour l'hélice avec une charge positive partielle résultante à l'extrémité amino de l'hélice. Parce que cette région a NH gratuit2 groupes, il interagira avec des groupes chargés négativement tels que les phosphates. L'emplacement le plus courant des hélices est à la surface des noyaux protéiques, où ils fournissent une interface avec l'environnement aqueux. Le côté intérieur de l'hélice a tendance à avoir des acides aminés hydrophobes et le côté extérieur des acides aminés hydrophiles. Ainsi, chaque tiers des quatre acides aminés le long de la chaîne aura tendance à être hydrophobe, un motif qui peut être assez facilement détecté. Dans le motif de fermeture à glissière leucine, un motif répétitif de leucines sur les côtés opposés de deux hélices adjacentes est hautement prédictif du motif. Un tracé de roue hélicoïdale peut être utilisé pour montrer ce motif répété. D'autres hélices α enfouies dans le noyau protéique ou dans les membranes cellulaires ont une distribution plus élevée et plus régulière d'acides aminés hydrophobes, et sont très prédictives de telles structures. Les hélices exposées à la surface ont une proportion plus faible d'acides aminés hydrophobes. La teneur en acides aminés peut être prédictive d'une région -hélicoïdale. Des régions plus riches en alanine (A), acide glutamique (E), leucine (L) et méthionine (M) et plus pauvres en proline (P), glycine (G), tyrosine (Y) et sérine (S) ont tendance à se former une hélice . La proline déstabilise ou casse une hélice α mais peut être présente dans des hélices plus longues, formant un coude.

Feuille Modifier

Les feuillets β sont formés par des liaisons H entre 5 à 10 acides aminés consécutifs en moyenne dans une partie de la chaîne et 5 à 10 autres plus loin dans la chaîne. Les régions d'interaction peuvent être adjacentes, avec une courte boucle entre les deux, ou éloignées l'une de l'autre, avec d'autres structures entre les deux. Chaque chaîne peut s'étendre dans la même direction pour former une feuille parallèle, chaque autre chaîne peut s'exécuter dans le sens chimique inverse pour former une feuille antiparallèle, ou les chaînes peuvent être parallèles et antiparallèles pour former une feuille mixte. Le modèle de liaison H est différent dans les configurations parallèles et antiparallèles. Chaque acide aminé des brins intérieurs de la feuille forme deux liaisons H avec les acides aminés voisins, tandis que chaque acide aminé des brins extérieurs forme une seule liaison avec un brin intérieur. En regardant à travers la feuille à angle droit par rapport aux brins, les brins plus éloignés sont légèrement tournés dans le sens inverse des aiguilles d'une montre pour former une torsion à gauche. Les atomes Cα alternent au-dessus et au-dessous de la feuille dans une structure plissée, et les groupes latéraux R des acides aminés alternent au-dessus et au-dessous des plis. Les angles Φ et des acides aminés dans les feuillets varient considérablement dans une région du tracé de Ramachandran. Il est plus difficile de prédire l'emplacement des feuillets que des hélices . La situation s'améliore quelque peu lorsque la variation des acides aminés dans les alignements de séquences multiples est prise en compte.

Boucles Modifier

Certaines parties de la protéine ont une structure tridimensionnelle fixe, mais ne forment pas de structures régulières. Ils ne doivent pas être confondus avec des segments de protéines désordonnés ou dépliés ou une bobine aléatoire, une chaîne polypeptidique dépliée dépourvue de toute structure tridimensionnelle fixe. Ces parties sont fréquemment appelées « boucles » car elles relient les feuilles et les hélices . Les boucles sont généralement situées à la surface des protéines et, par conséquent, les mutations de leurs résidus sont plus facilement tolérées. Avoir plus de substitutions, d'insertions et de délétions dans une certaine région d'un alignement de séquence peut être une indication d'une boucle. Les positions des introns dans l'ADN génomique peuvent être en corrélation avec les emplacements des boucles dans la protéine codée [ citation requise ] . Les boucles ont également tendance à avoir des acides aminés chargés et polaires et sont fréquemment un composant de sites actifs.

Les protéines peuvent être classées en fonction à la fois de la similarité structurelle et de la similarité de séquence. Pour la classification structurelle, les tailles et les dispositions spatiales des structures secondaires décrites dans le paragraphe ci-dessus sont comparées dans des structures tridimensionnelles connues. La classification basée sur la similarité des séquences a été historiquement la première à être utilisée. Initialement, une similarité basée sur des alignements de séquences entières a été réalisée. Plus tard, les protéines ont été classées sur la base de l'apparition de motifs d'acides aminés conservés. Des bases de données qui classent les protéines selon un ou plusieurs de ces schémas sont disponibles. Lors de l'examen des schémas de classification des protéines, il est important de garder à l'esprit plusieurs observations. Premièrement, deux séquences protéiques entièrement différentes d'origines évolutives différentes peuvent se replier dans une structure similaire. Inversement, la séquence d'un gène ancien pour une structure donnée peut avoir divergé considérablement dans différentes espèces tout en conservant les mêmes caractéristiques structurelles de base. Reconnaître toute similitude de séquence restante dans de tels cas peut être une tâche très difficile. Deuxièmement, deux protéines qui partagent un degré significatif de similarité de séquence soit entre elles soit avec une troisième séquence partagent également une origine évolutive et devraient également partager certaines caractéristiques structurelles.Cependant, la duplication de gènes et les réarrangements génétiques au cours de l'évolution peuvent donner lieu à de nouvelles copies de gènes, qui peuvent ensuite évoluer en protéines dotées de nouvelles fonctions et structures. [1]

Termes utilisés pour classer les structures et séquences de protéines Modifier

Les termes les plus couramment utilisés pour les relations évolutives et structurelles entre les protéines sont énumérés ci-dessous. De nombreux termes supplémentaires sont utilisés pour divers types de caractéristiques structurelles trouvées dans les protéines. Des descriptions de ces termes peuvent être trouvées sur le site Web de CATH, le site Web de classification structurelle des protéines (SCOP) et un didacticiel Glaxo Wellcome sur le site Web suisse de bioinformatique Expasy.

Site actif une combinaison localisée de groupes latéraux d'acides aminés au sein de la structure tertiaire (tridimensionnelle) ou quaternaire (sous-unité protéique) qui peut interagir avec un substrat chimiquement spécifique et qui confère à la protéine une activité biologique. Des protéines de séquences d'acides aminés très différentes peuvent se replier en une structure qui produit le même site actif. L'architecture est l'orientation relative des structures secondaires dans une structure tridimensionnelle sans tenir compte du fait qu'elles partagent ou non une structure en boucle similaire. Pli (topologie) un type d'architecture qui a également une structure de boucle conservée. Blocks est un modèle de séquence d'acides aminés conservé dans une famille de protéines. Le motif comprend une série de correspondances possibles à chaque position dans les séquences représentées, mais il n'y a aucune position insérée ou supprimée dans le motif ou dans les séquences. En revanche, les profils de séquence sont un type de matrice de notation qui représente un ensemble similaire de modèles qui inclut des insertions et des suppressions. Classer un terme utilisé pour classer les domaines protéiques en fonction de leur contenu structurel secondaire et de leur organisation. Quatre classes ont été initialement reconnues par Levitt et Chothia (1976), et plusieurs autres ont été ajoutées dans la base de données SCOP. Trois classes sont données dans la base de données CATH : principalement-α, principalement-β et α–β, la classe α–β comprenant à la fois des structures alternées α/β et α+β. Noyau la partie d'une molécule de protéine repliée qui comprend l'intérieur hydrophobe des hélices et des feuillets . La structure compacte rassemble des groupes latéraux d'acides aminés suffisamment proches pour qu'ils puissent interagir. Lorsque l'on compare les structures des protéines, comme dans la base de données SCOP, le noyau est la région commune à la plupart des structures qui partagent un pli commun ou qui appartiennent à la même superfamille. Dans la prédiction de structure, le noyau est parfois défini comme l'arrangement des structures secondaires qui est susceptible d'être conservé au cours du changement évolutif. Domaine (contexte de séquence) un segment d'une chaîne polypeptidique qui peut se replier en une structure tridimensionnelle indépendamment de la présence d'autres segments de la chaîne. Les domaines séparés d'une protéine donnée peuvent interagir de manière extensive ou peuvent être joints uniquement par une longueur de chaîne polypeptidique. Une protéine avec plusieurs domaines peut utiliser ces domaines pour des interactions fonctionnelles avec différentes molécules. Famille (contexte de séquence) un groupe de protéines de fonction biochimique similaire qui sont identiques à plus de 50 % lorsqu'elles sont alignées. Ce même seuil est toujours utilisé par la Protein Information Resource (PIR). Une famille de protéines comprend des protéines ayant la même fonction dans différents organismes (séquences orthologues) mais peut également inclure des protéines dans le même organisme (séquences paralogues) dérivées de la duplication et des réarrangements de gènes. Si un alignement de séquences multiples d'une famille de protéines révèle un niveau commun de similitude sur toutes les longueurs des protéines, PIR se réfère à la famille comme une famille homéomorphe. La région alignée est appelée domaine homéomorphe, et cette région peut comprendre plusieurs domaines d'homologie plus petits qui sont partagés avec d'autres familles. Les familles peuvent être encore subdivisées en sous-familles ou regroupées en superfamilles sur la base de niveaux respectifs plus élevés ou plus bas de similarité de séquence. La base de données SCOP rapporte 1296 familles et la base de données CATH (version 1.7 beta), rapporte 1846 familles. Lorsque les séquences de protéines ayant la même fonction sont examinées plus en détail, certaines s'avèrent partager une similitude de séquence élevée. Ils sont évidemment membres de la même famille selon les critères ci-dessus. Cependant, on en trouve d'autres qui ont une similitude de séquence très faible, voire insignifiante, avec d'autres membres de la famille. Dans de tels cas, la relation familiale entre deux membres éloignés de la famille A et C peut souvent être démontrée en trouvant un autre membre de la famille B qui partage une similitude significative avec A et C. Ainsi, B fournit un lien de connexion entre A et C. Une autre approche est d'examiner les alignements distants pour les correspondances hautement conservées. À un niveau d'identité de 50 %, les protéines sont susceptibles d'avoir la même structure tridimensionnelle, et les atomes identiques dans l'alignement des séquences se superposeront également à environ 1 dans le modèle structurel. Ainsi, si la structure d'un membre d'une famille est connue, une prédiction fiable peut être faite pour un deuxième membre de la famille, et plus le niveau d'identité est élevé, plus la prédiction est fiable. La modélisation structurelle des protéines peut être réalisée en examinant dans quelle mesure les substitutions d'acides aminés s'intègrent au cœur de la structure tridimensionnelle. Famille (contexte structurel) telle qu'utilisée dans la base de données FSSP (Familles de protéines structurellement similaires) et le site Web DALI/FSSP, deux structures qui ont un niveau significatif de similitude structurelle mais pas nécessairement une similitude de séquence significative. Pli similaire au motif structurel, comprend une plus grande combinaison d'unités structurelles secondaires dans la même configuration. Ainsi, les protéines partageant le même repli ont la même combinaison de structures secondaires reliées par des boucles similaires. Un exemple est le pli Rossman comprenant plusieurs hélices α alternées et des brins β parallèles. Dans les bases de données SCOP, CATH et FSSP, les structures protéiques connues ont été classées en niveaux hiérarchiques de complexité structurelle avec le pli comme niveau de base de classification. Domaine homologue (contexte de séquence) un modèle de séquence étendu, généralement trouvé par des méthodes d'alignement de séquences, qui indique une origine évolutive commune parmi les séquences alignées. Un domaine d'homologie est généralement plus long que les motifs. Le domaine peut comprendre la totalité d'une séquence protéique donnée ou seulement une partie de la séquence. Certains domaines sont complexes et constitués de plusieurs domaines d'homologie plus petits qui se sont joints pour en former un plus grand au cours de l'évolution. Un domaine qui couvre une séquence entière est appelé domaine homéomorphe par PIR (Protein Information Resource). Module une région de motifs d'acides aminés conservés comprenant un ou plusieurs motifs et considérée comme une unité fondamentale de structure ou de fonction. La présence d'un module a également été utilisée pour classer les protéines en familles. Motif (contexte de séquence) un modèle conservé d'acides aminés qui se trouve dans deux protéines ou plus. Dans le catalogue Prosite, un motif est un motif d'acides aminés qui se trouve dans un groupe de protéines qui ont une activité biochimique similaire, et qui se trouve souvent à proximité du site actif de la protéine. Des exemples de bases de données de motifs de séquences sont le catalogue Prosite et la base de données de motifs de Stanford. [2] Motif (contexte structurel) une combinaison de plusieurs éléments structurels secondaires produits par le repliement de sections adjacentes de la chaîne polypeptidique en une configuration tridimensionnelle spécifique. Un exemple est le motif hélice-boucle-hélice. Les motifs structurels sont également appelés structures et plis supersecondaires. La matrice de notation spécifique à la position (contexte de séquence, également connu sous le nom de matrice de poids ou de notation) représente une région conservée dans un alignement de séquences multiples sans lacunes. Chaque colonne de la matrice représente la variation trouvée dans une colonne de l'alignement de séquences multiples. Matrice de notation spécifique à la position - 3D (contexte structurel) représente la variation d'acides aminés trouvée dans un alignement de protéines qui appartiennent à la même classe structurelle. Les colonnes de matrice représentent la variation d'acides aminés trouvée à une position d'acide aminé dans les structures alignées. Structure primaire la séquence linéaire d'acides aminés d'une protéine, qui est chimiquement une chaîne polypeptidique composée d'acides aminés reliés par des liaisons peptidiques. Profil (contexte de séquence) une matrice de notation qui représente un alignement de séquences multiples d'une famille de protéines. Le profil est généralement obtenu à partir d'une région bien conservée dans un alignement de séquences multiples. Le profil se présente sous la forme d'une matrice avec chaque colonne représentant une position dans l'alignement et chaque ligne un des acides aminés. Les valeurs de la matrice donnent la probabilité de chaque acide aminé à la position correspondante dans l'alignement. Le profil est déplacé le long de la séquence cible pour localiser les meilleures régions de notation par un algorithme de programmation dynamique. Des lacunes sont autorisées lors de la correspondance et une pénalité pour lacunes est incluse dans ce cas en tant que score négatif lorsqu'aucun acide aminé n'est mis en correspondance. Un profil de séquence peut également être représenté par un modèle de Markov caché, appelé profil HMM. Profil (contexte structurel) une matrice de notation qui représente quels acides aminés devraient bien s'adapter et lesquels devraient s'adapter mal à des positions séquentielles dans une structure protéique connue. Les colonnes de profil représentent des positions séquentielles dans la structure et les lignes de profil représentent les 20 acides aminés. Comme avec un profil de séquence, le profil structurel est déplacé le long d'une séquence cible pour trouver le score d'alignement le plus élevé possible par un algorithme de programmation dynamique. Des écarts peuvent être inclus et recevoir une pénalité. Le score obtenu fournit une indication quant à savoir si la protéine cible pourrait adopter ou non une telle structure. Structure quaternaire la configuration tridimensionnelle d'une molécule de protéine comprenant plusieurs chaînes polypeptidiques indépendantes. Structure secondaire les interactions qui se produisent entre les groupes C, O et NH sur les acides aminés dans une chaîne polypeptidique pour former des hélices α, des feuillets , des spires, des boucles et d'autres formes, et qui facilitent le repliement en trois dimensions structure. Superfamille un groupe de familles de protéines de longueurs identiques ou différentes qui sont liées par une similitude de séquence distante mais détectable. Les membres d'une superfamille donnée ont donc une origine évolutive commune. À l'origine, Dayhoff définissait le seuil du statut de superfamille comme étant la probabilité que les séquences ne soient pas liées de 10 6, sur la base d'un score d'alignement (Dayhoff et al. 1978). Les protéines avec peu d'identités dans un alignement des séquences mais avec un nombre convaincant de caractéristiques structurelles et fonctionnelles communes sont placées dans la même superfamille. Au niveau de la structure tridimensionnelle, les protéines de la superfamille partageront des caractéristiques structurelles communes telles qu'un pli commun, mais il peut également y avoir des différences dans le nombre et l'agencement des structures secondaires. La ressource PIR utilise le terme superfamilles homéomorphes pour désigner des superfamilles composées de séquences pouvant être alignées de bout en bout, représentant un partage d'un domaine d'homologie de séquence unique, une région de similitude qui s'étend tout au long de l'alignement. Ce domaine peut également comprendre des domaines d'homologie plus petits qui sont partagés avec d'autres familles et superfamilles de protéines. Bien qu'une séquence protéique donnée puisse contenir des domaines trouvés dans plusieurs superfamilles, indiquant ainsi une histoire évolutive complexe, les séquences seront attribuées à une seule superfamille homéomorphe sur la base de la présence de similitude tout au long d'un alignement de séquences multiples. L'alignement de superfamille peut également inclure des régions qui ne s'alignent ni à l'intérieur ni aux extrémités de l'alignement. En revanche, les séquences de la même famille s'alignent bien tout au long de l'alignement. Structure supersecondaire un terme ayant une signification similaire à un motif structurel. La structure tertiaire est la structure tridimensionnelle ou globulaire formée par le tassement ou le repliement de structures secondaires d'une chaîne polypeptidique. [1]

Prédiction de structure secondaire est un ensemble de techniques en bioinformatique qui visent à prédire les structures secondaires locales des protéines en se basant uniquement sur la connaissance de leur séquence d'acides aminés. Pour les protéines, une prédiction consiste à attribuer des régions de la séquence d'acides aminés comme des hélices alpha probables, des brins bêta (souvent notés comme des conformations « étendues ») ou des virages. Le succès d'une prédiction est déterminé en la comparant aux résultats de l'algorithme DSSP (ou similaire, par exemple STRIDE) appliqué à la structure cristalline de la protéine. Des algorithmes spécialisés ont été développés pour la détection de motifs spécifiques bien définis tels que les hélices transmembranaires et les spirales enroulées dans les protéines. [1]

Les meilleures méthodes modernes de prédiction de structure secondaire dans les protéines ont atteint une précision de 80 % après l'utilisation de l'apprentissage automatique et des alignements de séquences [3]. motifs structuraux et raffinement des alignements de séquences. La précision des méthodes actuelles de prédiction de la structure secondaire des protéines est évaluée dans des benchmarks hebdomadaires tels que LiveBench et EVA.

Modifier l'arrière-plan

Les premières méthodes de prédiction de structure secondaire, introduites dans les années 1960 et au début des années 1970, [4] [5] [6] [7] [8] se concentraient sur l'identification des hélices alpha probables et étaient principalement basées sur des modèles de transition hélice-bobine. [9] Des prédictions significativement plus précises qui comprenaient des feuilles bêta ont été introduites dans les années 1970 et reposaient sur des évaluations statistiques basées sur des paramètres de probabilité dérivés de structures résolues connues. Ces méthodes, appliquées à une seule séquence, sont généralement précises à 60-65% au maximum et sous-estiment souvent les feuilles bêta. [1] La conservation évolutive des structures secondaires peut être exploitée en évaluant simultanément de nombreuses séquences homologues dans un alignement de séquences multiples, en calculant la propension nette à la structure secondaire d'une colonne alignée d'acides aminés. De concert avec de plus grandes bases de données de structures protéiques connues et des méthodes modernes d'apprentissage automatique telles que les réseaux neuronaux et les machines à vecteurs de support, ces méthodes peuvent atteindre jusqu'à 80 % de précision globale dans les protéines globulaires. [10] La limite supérieure théorique de précision est d'environ 90 %, [10] en partie en raison d'idiosyncrasies dans l'affectation DSSP près des extrémités des structures secondaires, où les conformations locales varient dans les conditions natives mais peuvent être forcées d'assumer une seule conformation dans les cristaux en raison aux contraintes d'emballage. De plus, les méthodes typiques de prédiction de structure secondaire ne tiennent pas compte de l'influence de la structure tertiaire sur la formation de la structure secondaire, par exemple, une séquence prédite comme une hélice probable peut toujours être capable d'adopter une conformation de brin bêta si elle est située dans un bêta -la région en feuillet de la protéine et ses chaînes latérales s'intègrent bien avec leurs voisins. Des changements conformationnels spectaculaires liés à la fonction ou à l'environnement de la protéine peuvent également altérer la structure secondaire locale.

Perspective historique Modifier

À ce jour, plus de 20 méthodes différentes de prédiction de structure secondaire ont été développées. L'un des premiers algorithmes était la méthode de Chou-Fasman, qui repose principalement sur des paramètres de probabilité déterminés à partir des fréquences relatives d'apparition de chaque acide aminé dans chaque type de structure secondaire. [11] Les paramètres originaux de Chou-Fasman, déterminés à partir du petit échantillon de structures résolues au milieu des années 1970, produisent des résultats médiocres par rapport aux méthodes modernes, bien que la paramétrisation ait été mise à jour depuis sa première publication. La méthode de Chou-Fasman est précise à environ 50-60% dans la prédiction des structures secondaires. [1]

Le prochain programme notable était la méthode GOR est une méthode basée sur la théorie de l'information. Il utilise la technique probabiliste la plus puissante de l'inférence bayésienne. [12] La méthode GOR prend en compte non seulement la probabilité que chaque acide aminé ait une structure secondaire particulière, mais aussi la probabilité conditionnelle que l'acide aminé assume chaque structure compte tenu des contributions de ses voisins (elle ne suppose pas que les voisins aient cette même structure). L'approche est à la fois plus sensible et plus précise que celle de Chou et Fasman car les propensions structurelles des acides aminés ne sont fortes que pour un petit nombre d'acides aminés tels que la proline et la glycine. De faibles contributions de chacun des nombreux voisins peuvent s'ajouter à des effets forts dans l'ensemble. La méthode GOR originale était précise à environ 65 % et est considérablement plus efficace pour prédire les hélices alpha que les feuilles bêta, qu'elle considérait fréquemment à tort comme des boucles ou des régions désorganisées. [1]

Un autre grand pas en avant a été l'utilisation de méthodes d'apprentissage automatique. Les premières méthodes de réseaux de neurones artificiels ont été utilisées. En tant qu'ensembles d'apprentissage, ils utilisent des structures résolues pour identifier des motifs de séquence communs associés à des arrangements particuliers de structures secondaires. Ces méthodes sont précises à plus de 70 % dans leurs prédictions, bien que les brins bêta soient encore souvent sous-estimés en raison du manque d'informations structurelles tridimensionnelles qui permettraient d'évaluer les modèles de liaison hydrogène pouvant favoriser la formation de la conformation étendue requise pour la présence d'un fiche bêta complète. [1] PSIPRED et JPRED sont parmi les programmes les plus connus basés sur les réseaux neuronaux pour la prédiction de la structure secondaire des protéines. Ensuite, les machines à vecteurs de support se sont avérées particulièrement utiles pour prédire les emplacements des virages, qui sont difficiles à identifier avec des méthodes statistiques. [13] [14]

Les extensions des techniques d'apprentissage automatique tentent de prédire des propriétés locales plus fines des protéines, telles que les angles dièdres du squelette dans les régions non attribuées. Les SVM [15] et les réseaux de neurones [16] ont été appliqués à ce problème. [13] Plus récemment, les angles de torsion en valeur réelle peuvent être prédits avec précision par SPINE-X et utilisés avec succès pour la prédiction de structure ab initio. [17]

Autres améliorations Modifier

Il est rapporté qu'en plus de la séquence protéique, la formation de la structure secondaire dépend d'autres facteurs. Par exemple, il est rapporté que les tendances de la structure secondaire dépendent également de l'environnement local, [18] l'accessibilité aux solvants des résidus, [19] la classe structurelle des protéines, [20] et même de l'organisme à partir duquel les protéines sont obtenues. [21] Sur la base de telles observations, certaines études ont montré que la prédiction de la structure secondaire peut être améliorée en ajoutant des informations sur la classe structurelle de la protéine, [22] la surface accessible aux résidus [23] [24] et également des informations sur le numéro de contact. [25]

Le rôle pratique de la prédiction de la structure des protéines est maintenant plus important que jamais. [26] Des quantités massives de données de séquences protéiques sont produites par des efforts modernes de séquençage d'ADN à grande échelle tels que le projet du génome humain.Malgré les efforts de la communauté en génomique structurelle, la production de structures protéiques déterminées expérimentalement - généralement par cristallographie aux rayons X ou spectroscopie RMN longue et relativement coûteuse - est loin derrière la production de séquences protéiques.

La prédiction de la structure des protéines reste une entreprise extrêmement difficile et non résolue. Les deux problèmes principaux sont le calcul de l'énergie libre de protéines et la recherche du minimum global de cette énergie. Une méthode de prédiction de la structure des protéines doit explorer l'espace des structures protéiques possibles qui est astronomiquement grand. Ces problèmes peuvent être partiellement contournés dans les méthodes de modélisation "comparative" ou d'homologie et de reconnaissance de plis, dans lesquelles l'espace de recherche est élagué en supposant que la protéine en question adopte une structure proche de la structure déterminée expérimentalement d'une autre protéine homologue. D'autre part, les méthodes de prédiction de la structure des protéines de novo doivent résoudre explicitement ces problèmes. Les progrès et les défis de la prédiction de la structure des protéines ont été examinés par Zhang. [27]

Avant la modélisation Modifier

La plupart des méthodes de modélisation de structure tertiaire, telles que Rosetta, sont optimisées pour modéliser la structure tertiaire de domaines protéiques uniques. Une étape appelée analyse de domaine, ou prédiction de limite de domaine, est généralement effectué en premier pour diviser une protéine en domaines structurels potentiels. Comme pour le reste de la prédiction de structure tertiaire, cela peut être fait comparativement à partir de structures connues [28] ou ab initio avec la séquence uniquement (généralement par apprentissage automatique, assisté par covariation). [29] Les structures des domaines individuels sont ancrées ensemble dans un processus appelé assemblage de domaine pour former la structure tertiaire finale. [30] [31]

Ab initio modélisation des protéines Modifier

Méthodes basées sur l'énergie et les fragments Modifier

Ab initio- ou de novo- les méthodes de modélisation des protéines cherchent à construire des modèles de protéines tridimensionnels "from scratch", c'est-à-dire basés sur des principes physiques plutôt que (directement) sur des structures précédemment résolues. Il existe de nombreuses procédures possibles qui tentent soit d'imiter le repliement des protéines, soit d'appliquer une méthode stochastique pour rechercher des solutions possibles (c'est-à-dire l'optimisation globale d'une fonction énergétique appropriée). Ces procédures ont tendance à nécessiter de vastes ressources de calcul et n'ont donc été effectuées que pour de minuscules protéines. Pour prédire la structure des protéines de novo pour des protéines plus grosses, il faudra de meilleurs algorithmes et des ressources de calcul plus importantes comme celles offertes par les superordinateurs puissants (tels que Blue Gene ou MDGRAPE-3) ou l'informatique distribuée (tels que [email protected], le Human Proteome Folding Project et [email protected]). Bien que ces barrières informatiques soient vastes, les avantages potentiels de la génomique structurale (par des méthodes prédites ou expérimentales) rendent ab initio prédiction de structure un domaine de recherche actif. [27]

En 2009, une protéine de 50 résidus pouvait être simulée atome par atome sur un superordinateur pendant 1 milliseconde. [32] À partir de 2012, un échantillonnage comparable à l'état stable pourrait être effectué sur un ordinateur de bureau standard avec une nouvelle carte graphique et des algorithmes plus sophistiqués. [33] Des échelles de temps de simulation beaucoup plus grandes peuvent être obtenues en utilisant une modélisation à gros grains. [34] [35]

Covariation évolutive pour prédire les contacts 3D Modifier

Comme le séquençage est devenu plus courant dans les années 1990, plusieurs groupes ont utilisé des alignements de séquences de protéines pour prédire des mutations corrélées et on espérait que ces résidus coévolués pourraient être utilisés pour prédire la structure tertiaire (en utilisant l'analogie pour éloigner les contraintes des procédures expérimentales telles que la RMN). L'hypothèse est que lorsque les mutations d'un seul résidu sont légèrement délétères, des mutations compensatoires peuvent se produire pour stabiliser les interactions résidu-résidus. Ces premiers travaux utilisaient ce qu'on appelle local méthodes pour calculer les mutations corrélées à partir de séquences protéiques, mais souffraient de fausses corrélations indirectes qui résultent du traitement de chaque paire de résidus comme indépendante de toutes les autres paires. [36] [37] [38]

En 2011, un autre, et cette fois global approche statistique, a démontré que les résidus coévolués prédits étaient suffisants pour prédire le pli 3D d'une protéine, à condition qu'il y ait suffisamment de séquences disponibles (plus de 1 000 séquences homologues sont nécessaires). [39] La méthode, EVfold, n'utilise pas de modélisation d'homologie, de filetage ou de fragments de structure 3D et peut être exécutée sur un ordinateur personnel standard même pour des protéines avec des centaines de résidus. La précision des contacts prédits à l'aide de cette approche et des approches connexes a maintenant été démontrée sur de nombreuses structures et cartes de contact connues, [40] [41] [42], y compris la prédiction de protéines transmembranaires non résolues expérimentalement. [43]

Modélisation comparative des protéines Modifier

La modélisation comparative des protéines utilise des structures précédemment résolues comme points de départ ou modèles. Ceci est efficace car il semble que bien que le nombre de protéines réelles soit vaste, il existe un ensemble limité de motifs structurels tertiaires auxquels la plupart des protéines appartiennent. Il a été suggéré qu'il n'y a qu'environ 2 000 replis protéiques distincts dans la nature, bien qu'il existe plusieurs millions de protéines différentes. La modélisation comparative des protéines peut se combiner avec la covariation évolutive dans la prédiction de la structure. [44]

Ces méthodes peuvent également être divisées en deux groupes : [27]

    est basé sur l'hypothèse raisonnable que deux protéines homologues partageront des structures très similaires. Étant donné que le repliement d'une protéine est plus évolutif que sa séquence d'acides aminés, une séquence cible peut être modélisée avec une précision raisonnable sur une matrice très éloignée, à condition que la relation entre la cible et la matrice puisse être discernée par l'alignement des séquences. Il a été suggéré que le principal goulot d'étranglement dans la modélisation comparative provient des difficultés d'alignement plutôt que d'erreurs dans la prédiction de la structure compte tenu d'un bon alignement connu. [45] Sans surprise, la modélisation d'homologie est plus précise lorsque la cible et le modèle ont des séquences similaires. [46] analyse la séquence d'acides aminés d'une structure inconnue par rapport à une base de données de structures résolues. Dans chaque cas, une fonction de notation est utilisée pour évaluer la compatibilité de la séquence avec la structure, produisant ainsi des modèles tridimensionnels possibles. Ce type de méthode est également appelé Reconnaissance des plis 3D-1D en raison de son analyse de compatibilité entre les structures tridimensionnelles et les séquences protéiques linéaires. Cette méthode a également donné lieu à des méthodes réalisant une recherche de pliage inversé en évaluant la compatibilité d'une structure donnée avec une grande base de données de séquences, prédisant ainsi quelles séquences ont le potentiel de produire un pli donné.

Modélisation des conformations des chaînes latérales Modifier

L'emballage précis des chaînes latérales d'acides aminés représente un problème distinct dans la prédiction de la structure des protéines. Les méthodes qui traitent spécifiquement le problème de la prédiction de la géométrie de la chaîne latérale comprennent l'élimination des impasses et les méthodes de champ moyen auto-cohérent. Les conformations de chaînes latérales à faible énergie sont habituellement déterminées sur le squelette polypeptidique rigide et en utilisant un ensemble de conformations de chaînes latérales discrètes connues sous le nom de « rotamères ». Les méthodes tentent d'identifier l'ensemble des rotamères qui minimisent l'énergie globale du modèle.

Ces méthodes utilisent des bibliothèques de rotamères, qui sont des collections de conformations favorables pour chaque type de résidu dans les protéines. Les bibliothèques Rotamer peuvent contenir des informations sur la conformation, sa fréquence et les écarts types sur les angles dièdres moyens, qui peuvent être utilisées dans l'échantillonnage. [47] Les bibliothèques de rotamères sont dérivées de la bioinformatique structurelle ou d'autres analyses statistiques des conformations des chaînes latérales dans des structures expérimentales connues de protéines, par exemple en regroupant les conformations observées pour les carbones tétraédriques près du décalage (60°, 180°, -60°) valeurs.

Les bibliothèques de rotamères peuvent être indépendantes du squelette, dépendantes de la structure secondaire ou dépendantes du squelette. Les bibliothèques de rotamères indépendantes du squelette ne font aucune référence à la conformation du squelette et sont calculées à partir de toutes les chaînes latérales disponibles d'un certain type (par exemple, le premier exemple d'une bibliothèque de rotamères, réalisé par Ponder et Richards à Yale en 1987). [48] ​​Les bibliothèques dépendantes de la structure secondaire présentent différents angles dièdres et/ou fréquences rotamères pour α -helix, β -sheet, ou structures secondaires de bobine. [49] Les bibliothèques rotamères dépendantes du squelette présentent des conformations et/ou des fréquences dépendantes de la conformation du squelette local tel que défini par les angles dièdres du squelette ϕ et ψ , quelle que soit la structure secondaire. [50]

Les versions modernes de ces bibliothèques utilisées dans la plupart des logiciels sont présentées sous forme de distributions multidimensionnelles de probabilité ou de fréquence, où les pics correspondent aux conformations d'angle dièdre considérées comme des rotamères individuels dans les listes. Certaines versions sont basées sur des données très soigneusement conservées et sont principalement utilisées pour la validation de la structure, [51] tandis que d'autres mettent l'accent sur les fréquences relatives dans des ensembles de données beaucoup plus volumineux et sont la forme principalement utilisée pour la prédiction de la structure, comme les bibliothèques rotamères Dunbrack. [52]

Les méthodes d'emballage des chaînes latérales sont les plus utiles pour analyser le noyau hydrophobe de la protéine, où les chaînes latérales sont plus étroitement emballées, elles ont plus de difficulté à répondre aux contraintes plus lâches et à la plus grande flexibilité des résidus de surface, qui occupent souvent plusieurs conformations de rotamères plutôt qu'une seule. [53] [54]

Dans le cas de complexes de deux protéines ou plus, où les structures des protéines sont connues ou peuvent être prédites avec une grande précision, des méthodes d'amarrage protéine-protéine peuvent être utilisées pour prédire la structure du complexe. L'information sur l'effet des mutations sur des sites spécifiques sur l'affinité du complexe aide à comprendre la structure du complexe et à guider les méthodes d'amarrage.

Il existe un grand nombre d'outils logiciels pour la prédiction de la structure des protéines. Les approches comprennent la modélisation d'homologie, l'enfilage de protéines, ab initio méthodes, prédiction de structure secondaire et prédiction d'hélice transmembranaire et de peptide signal. Certaines méthodes récentes réussies basées sur les expériences CASP incluent I-TASSER, HHpred et AlphaFold. Pour la liste complète, voir l'article principal.

Évaluation des serveurs de prédiction de structure automatique Modifier

CASP, qui signifie Critical Assessment of Techniques for Protein Structure Prediction, est une expérience à l'échelle de la communauté pour la prédiction de la structure des protéines qui a lieu tous les deux ans depuis 1994. CASP offre la possibilité d'évaluer la qualité de la méthodologie humaine non automatisée disponible ( catégorie humaine) et des serveurs automatiques pour la prédiction de la structure des protéines (catégorie serveur, introduite dans le CASP7). [55]

Le serveur d'évaluation de modèle automatisé en continu CAMEO3D évalue les serveurs automatisés de prédiction de structure de protéine sur une base hebdomadaire en utilisant des prédictions aveugles pour les structures de protéine nouvellement libérées. CAMEO publie les résultats sur son site Internet.


Protéines métamorphiques : les protéines Janus de la biologie structurale

Le paradigme structurel que la séquence d'une protéine code pour un pli natif tridimensionnel unique ne reconnaît pas la plasticité intrinsèque encapsulée dans les paysages d'énergie libre conformationnels. Les protéines métamorphiques sont une classe récemment découverte de biomolécules qui illustrent cette plasticité en se repliant en au moins deux structures d'état natives distinctes de stabilité comparable en l'absence de ligands ou de cofacteurs pour faciliter la commutation de repliement. La liste croissante des protéines métamorphiques montre clairement que ces protéines ne sont pas de simples aberrations dans l'évolution des protéines, mais peuvent en fait avoir été une conséquence de modèles distinctifs de pression de sélection tels que ceux trouvés dans la co-évolution virus-hôte. Dans cette revue, nous décrivons les relations structure-fonction observées dans des systèmes protéiques métamorphiques bien étudiés, en mettant l'accent sur la façon dont les résidus fonctionnels sont séquestrés ou exposés dans les deux plis de la protéine. Nous discutons également des implications de la métamorphose pour l'évolution des protéines et des efforts en cours pour prédire les systèmes métamorphiques à partir des seules propriétés des séquences.

1. Introduction

L'hypothèse structure-fonction à séquence unique est le pivot qui a fait tourner les roues de la biologie structurale pendant des décennies après que la première structure cristalline de la myoglobine a été résolue par John Kendrew et ses collègues en 1958 [1]. Cette hypothèse stipule que la séquence d'acides aminés d'une protéine code pour une structure d'état native unique, qui remplit alors une fonction distincte. Au cours des deux dernières décennies, de nombreuses découvertes ont remis en cause cette hypothèse, au point de la rendre obsolète. Par exemple, nous connaissons maintenant l'existence de protéines intrinsèquement désordonnées [2-5], qui sont des chaînes polypeptidiques sans structure secondaire ou tertiaire stable, mais qui remplissent néanmoins des fonctions vitales à travers une variété de mécanismes tels que le repliement lors de la liaison [6] ou acquérir la structure suite à des modifications post-traductionnelles [7]. Nous sommes tombés sur des protéines de clair de lune [8,9] qui sont capables d'effectuer plus d'une fonction en utilisant la même séquence polypeptidique. Nous comprenons également maintenant que la fonction biomoléculaire est dictée non seulement par la structure, comme supposé à l'origine, mais aussi par la dynamique biomoléculaire se produisant sur plusieurs échelles de temps [10,11]. Enfin, nous avons vu l'émergence de protéines métamorphiques, qui sont capables de se replier dans plus d'une topologie structurelle unique [12]. Dans la mythologie romaine antique, Janus était le dieu des transitions et de la dualité, du début et de la fin, de la guerre et de la paix, et de l'arrivée et du départ. Sa double nature était incarnée dans sa représentation comme un dieu avec deux têtes tournées dans des directions opposées. Compte tenu de leur capacité à adopter deux ou plusieurs structures d'état natives distinctes, les protéines métamorphiques sont les protéines Janus de la biologie structurale.

Les protéines métamorphiques existent dans deux ou plusieurs structures bien définies en l'absence de ligands ou de cofacteurs (figure 1) [13-15]. Cela les distingue des protéines qui subissent un réarrangement conformationnel à la suite d'événements de liaison. Alors que l'hétérogénéité structurelle est une caractéristique des protéines métamorphiques, nous ne considérons pas une protéine comme métamorphique simplement parce qu'elle adopte un ensemble hétérogène. Par exemple, les protéines intrinsèquement désordonnées, qui s'interconvertissent rapidement entre un certain nombre de conformations similaires, ne sont pas considérées comme des protéines métamorphiques car elles manquent de structures tridimensionnelles stables. Dans le cadre de cette définition, cependant, il existe une variabilité considérable dans les caractéristiques des protéines métamorphiques actuellement connues. Par exemple, dans le cas de la lymphotactine [16] et de l'IscU [17], les deux structures peuvent s'interconvertir de manière réversible en environ 1 s et ont également des partenaires de liaison distincts au sein de la cellule. Dans d'autres cas tels que KaiB [18] et Mad2 [19], il faut des heures pour que les deux conformations s'interconvertissent, et une seule des structures a un composant de liaison en aval. Les protéines métamorphiques illustrent la malléabilité inhérente aux paysages énergétiques sans protéines et sont des exemples de manuels expliquant pourquoi nous devons regarder au-delà des structures biomoléculaires statiques simples si nous voulons comprendre la fonction et le dysfonctionnement dans leur intégralité.

Figure 1. Paysages d'énergie libre conformationnels représentatifs d'une protéine qui se replie en une structure unique (monomorphe, une) et une protéine métamorphique qui se replie en deux structures distinctes (b). La protéine monomorphe dans ce cas a une seule fonction biologique, tandis que la protéine métamorphique peut utiliser son hétérogénéité conformationnelle pour effectuer plus d'une fonction biologique.

Dans cette revue, nous décrivons d'abord les principales caractéristiques de cinq systèmes de protéines métamorphiques qui ont été structurellement caractérisés jusqu'à présent : lymphotactine, KaiB, IscU, Mad2 et RfaH. Nous nous concentrons sur les structures des deux conformations et comment une seule séquence est capable d'accueillir deux états natifs. Nous décrivons également comment la structure est capable d'informer la fonction. Cet ensemble de protéines métamorphiques n'est pas exhaustif et d'autres protéines qui ont été décrites comme métamorphiques incluent la sélécase [20], MinE [21], CLIC [22] et la transcriptase inverse du VIH-1 [23]. Après cette description de cinq protéines métamorphiques, nous détaillons le lien passionnant entre les protéines métamorphiques et l'évolution des protéines, ainsi que les efforts qui ont été déployés pour prédire les protéines métamorphiques en utilisant uniquement les informations de séquence. Enfin, nous soulignons la combinaison synergique de méthodes qui ont favorisé notre compréhension actuelle des protéines métamorphiques.

2. Fold-switching et ses conséquences dans d'importants systèmes de protéines métamorphiques

2.1. Lymphotactine

L'une des premières protéines reconnues métamorphiques était la lymphotactine humaine à 93 résidus [16] (figure 2) (Ltn, également connue sous le nom de XCL1). Ltn est un membre de la famille des chimiokines XC et a la particularité de n'avoir qu'un seul résidu Cys N-terminal et une seule liaison disulfure intramoléculaire, contrairement aux membres des familles CC, CXC et CX3C, qui ont quatre Cys hautement conservés et deux liaisons disulfure chacune [24,25].

Figure 2. (une) La lymphotactine (Ltn) existe en équilibre entre un pli + β de chimiokine (Ltn10, PDB ID : 1J8I) et un nouveau pli tout-β dimère (Ltn40, PDB ID : 2JP1). (b) Les éléments structuraux secondaires des plis Ltn10 et Ltn40 représentés en fonction de la séquence. (c) L'interface dimère Ltn40 (en bas) est stabilisée par trois rangées de résidus hydrophobes (représentés dans des sphères bleues, rouges et vertes) perpendiculaires au plan des monomères. Ces résidus sont principalement exposés aux solvants dans Ltn10 (en haut), tandis que les résidus au cœur de Ltn10 (par exemple Phe39, Val59 et Val60, représentés par des bâtonnets jaunes) sont exposés aux solvants dans Ltn40. () (Haut) Spectres de corrélation quantique simple hétéronucléaire 1 H– 15 N (HSQC) de Ltn à 10°C/200 mM NaCl (gauche), 37°C/150 mM NaCl (milieu) et 40°C/pas de sel (droite) ), où Ltn existe en tant que Ltn10, un mélange de Ltn10 et Ltn40, et Ltn40, respectivement. Les résonances du squelette Phe39 et Cys48 et Ala49 provenant à la fois de Ltn10 et de Ltn40 peuvent être observées dans le spectre moyen, confirmant la coexistence des deux conformations à cette température. (En bas) Spectre d'échange de magnétisation 15 N de Ltn à 37°C/150 mM NaCl, montrant des pics croisés (noir) reliant les résonances NH de la chaîne latérale Ltn10 (orange) et Ltn40 (cyan) Trp55. La présence de ces pics croisés démontre que Ltn10 et Ltn40 s'interconvertissent sur l'échelle de temps ms–s. Panneau () est modifié avec la permission de Tuinstra et al. [16].

Le changement de pli de Ltn s'accompagne d'un réarrangement conformationnel spectaculaire du pli canonique α + β chimiokine (Ltn10) [26], où Ltn existe en tant que monomère, au nouveau pli dimère tout-β (Ltn40) (figure 2une,b) [16,27]. La structure de Ltn10 se compose de trois brins β, Ile24-Thr30, Ala36-Thr41 et Lys46-Asp50, ainsi que d'une hélice C-terminale de Thr54-Lys66 et d'un 310 hélice (Val21-Arg23), alors que les 23 premiers résidus N-terminaux et la queue C-terminale (Ser67--Gly93) sont désordonnés. Au cours de la transformation en Ltn40, l'hélice se déplie, tandis qu'un nouveau brin se forme à l'extrémité N-terminale entre les résidus 11-14, résultant en un pli clé grec à 4 brins (figure 2une,b). Pratiquement toutes les liaisons hydrogène interbrins entre β2–β3 et β3–β4 se réorganisent pour accueillir le nouveau β1, provoquant un décalage dans le registre des brins β2–β3 et β3–β4 [16]. L'interface dimère de Ltn40 est stabilisée par trois imposantes couches de résidus hydrophobes (Val12, Ile38, Val47), (Leu14, Ile40, Leu45) et (Ile29, Ala36, Ala49) disposés orthogonalement au plan des monomères, dont la plupart sont des solvants. exposé en Ltn10 (figure 2c). En revanche, le noyau hydrophobe de Ltn10 comprend les résidus Tyr27, Phe39, Val59 et Val60 qui finissent par être exposés au solvant dans Ltn40. Cette inversion du degré d'exposition aux solvants des résidus Ltn donne l'impression que la protéine a été retournée pendant le fold-switching.

Le pli chimiokine est peuplé à 10°C et 200 mM de NaCl, tandis que la structure tout-β est préférée à 40°C en l'absence de sel (figure 2). Curieusement, dans des conditions physiologiques (37°C et 150 mM de NaCl), Ltn10 et Ltn40 sont également peuplés et s'interconvertissent rapidement et de manière réversible entre eux avec une constante de vitesse d'environ 1 s -1 . On pense que l'augmentation de la force ionique favorise la conversion de Ltn40 en Ltn10 en brisant un pont salin clé entre Lys25 et Glu31 qui stabilise l'état dimère. L'échange entre Ltn10 et Ltn40 est visible dans des expériences de transfert d'aimantation 15 N (figure 2, bas) [16] et confirme que les deux formes ne sont pas des conséquences de l'hétérogénéité statique dans l'échantillon.

Ltn est un candidat hautement improbable pour une protéine métamorphique car il possède une liaison disulfure intramoléculaire entre Cys11 et Cys48 qui restreint la liberté conformationnelle. En effet, cette liaison disulfure crée un polypeptide circulaire couvrant les résidus 11 à 47, dans le contexte duquel se produit la commutation de plis. Le mécanisme par lequel se produit la commutation de repli Ltn est toujours un domaine de recherche active. Le remodelage étendu des liaisons hydrogène et des interactions hydrophobes qui se produit lors de la commutation de pli suggère qu'un «état déplié» lié au disulfure doit être un intermédiaire entre les deux états. Les mesures de cinétique détectée par fluorescence à flux arrêté de la dépendance à la température du dépliement et de l'interconversion révèlent des valeurs très similaires pour l'enthalpie et l'entropie d'activation pour les deux processus, confirmant l'idée que l'interconversion doit passer par un «état déplié» [28]. Les auteurs ont également mesuré des constantes de vitesse de dépliement comprises entre 0,5 et 5 s -1 pour Ltn 40 et Ltn10. Cependant, pourquoi les constantes de vitesse de déploiement sont si rapides lorsque kvous les valeurs pour d'autres protéines de taille similaire sont généralement inférieures d'un à deux ordres de grandeur [29], ou même à quoi ressemble structurellement «l'état déplié» lié au disulfure sur la voie, reste incertain. Contrairement aux expériences, les modèles Go centrés natifs [30] ainsi que les simulations d'échange de répliques [31] ont suggéré que le dépliage peut ne pas être nécessaire pour la commutation de pli, et que l'interconversion entre Ltn10 et Ltn40 peut se produire via des intermédiaires partiellement dépliés qui diffèrent dans les motifs de liaison hydrogène de la feuille β.

Les états Ltn10 et Ltn40 de la lymphotactine ont des fonctions biologiques distinctes dans son rôle de chimiokine, faisant de Ltn une protéine véritablement métamorphique [16,32]. Les chimiokines sont des molécules de signalisation sécrétées qui régulent la migration des leucocytes dans le cadre de la réponse immunitaire à l'inflammation. Pour atteindre cet objectif, les chimiokines se lient non seulement aux récepteurs couplés aux protéines G (RCPG) à la surface des leucocytes et stimulent la migration, mais aussi aux glycosaminoglycanes (GAG) afin d'établir un gradient de concentration pour que la chimiotaxie se produise [24]. Cependant, les corrélations structure-fonction sont difficiles à établir dans Ltn en raison de la coexistence et de l'interconversion réversible des deux structures. En utilisant des approches élégantes d'ingénierie des protéines, Volkman et ses collègues ont généré des mutants avec une liaison disulfure supplémentaire qui sont verrouillés dans la conformation Ltn10 (V21C/V59C, CC3-Ltn) [33] ou Ltn40 (A36C/A49C, CC5-Ltn) [32 ]. Alors que CC3-Ltn est incapable de se lier étroitement aux GAG, c'est un agoniste efficace pour XCR1 d'autre part, CC5-Ltn se lie aux GAG avec une affinité élevée.

Placé dans le contexte des membres de sa famille, les caractéristiques structurelles et fonctionnelles de Ltn semblent déroutantes. Les chimiokines se dimérisent régulièrement tout en conservant leur pli de chimiokine [25], mais Ltn passe à une nouvelle structure tout-β lors de la formation d'homodimères. De plus, les chimiokines se lient à la fois aux GAG et aux GPCR en utilisant le même pli de chimiokine, mais la forme Ltn10 de la lymphotactine seule semble avoir perdu la capacité de se lier aux GAG, et la forme Ltn40 n'est plus un agoniste fonctionnel de XCR1. On ne sait pas exactement pourquoi la lymphotactine a développé un tel comportement métamorphique pour séparer les fonctionnalités de liaison GAG et d'activation GPCR en deux conformations interconverties. Cependant, certains indices ont émergé d'études sur le rôle des chimiokines en tant que défenses contre les virus, qui montrent que la lymphotactine est au centre d'un champ de bataille féroce et en évolution rapide entre les virus et leurs hôtes. Par exemple, le génome du cytomégalovirus de rat a développé la capacité de coder pour une chimiokine de type Ltn qui est également capable d'induire la chimiotaxie des leucocytes de rat [34,35]. De plus, Ltn est un inhibiteur à large spectre du VIH-1 et bloque l'entrée virale dans les cellules par un mécanisme qui nécessite le nouveau pli tout [36,37]. Un cluster chargé positivement dans le pli tout-β comprenant les résidus Lys42, Arg43, Arg18, Arg35 et Lys46 est nécessaire pour lier la glycoprotéine d'enveloppe du VIH-1 gp120, soulevant la possibilité intrigante que les caractéristiques métamorphiques de Ltn aient évolué en tant que défenses dans les bras course contre l'infection virale.

2.2. KaiB

La protéine cyanobactérienne KaiB est la seule protéine métamorphique qui a jusqu'à présent été identifiée dans les rythmes circadiens. L'oscillateur circadien chez les cyanobactéries est composé de trois protéines, KaiA, KaiB et KaiC, qui génèrent des rythmes de 24 h dans la phosphorylation de KaiC grâce à leurs interactions dépendantes du temps les unes avec les autres (figure 3une) [38-40]. KaiC est un hexamère à double cycle, constitué de deux domaines homologues AAA+ ATPase, CI et CII [41]. En début de journée, Thr432 et Ser431 du domaine CII de KaiC ne sont pas modifiés. Vers midi, Thr432 est phosphorylé (S/pT) dans cet état, KaiA se lie à KaiC via des boucles A présentes à l'extrémité C-terminale de KaiC pour stimuler l'autophosphorylation [42]. Une fois que Ser431 est également phosphorylé (pS/pT), les anneaux CI et CII s'empilent pour exposer un site de liaison pour KaiB (appelé boucle B) sur le domaine KaiC CI [43-45]. KaiB se lie alors non seulement à KaiC mais aussi à KaiA pour former un complexe ternaire (figure 3une), séquestrant KaiA de KaiC et initiant le bras de déphosphorylation de l'oscillation circadienne [46-48].

Figure 3. (une) Le cycle circadien des cyanobactéries. KaiC (gris) est une protéine à deux domaines (CI et CII) qui s'organise en un hexamère. La phosphorylation dans le domaine CII de KaiC (montré en aqua) à Thr432 et Ser431 aide à établir la période de 24 h du cycle. A midi, KaiA (orange) se lie aux boucles A et stimule l'autophosphorylation de KaiC. KaiB, qui existe en tant qu'équilibre entre les conformations tétramères (vert), dimères (vert) et monomères à commutation de plis (violet), se lie aux boucles B du domaine CI de KaiC via le pli KaiBfs de type thiorédoxine, déclenchant déphosphorylation dans le même ordre au crépuscule. Une fois que Thr432 et Ser431 ont été déphosphorylés séquentiellement, le cycle se répète. (b) A l'état fondamental, le KaiB libre est un tétramère de dimères asymétriques (colorés en jaune et bleu, PDB ID : 2QKE). (c) L'interface dimère asymétrique est stabilisée principalement par des résidus hydrophobes tels que Ala15, Val47, Ile59 et Ile88 (représentés sous forme de sphères et colorés en vert et rose). () La commutation de pli de KaiB entraîne la conversion de KaiBgs (monomère illustré à gauche, arc-en-ciel coloré) en KaiBfs (PDB ID : 5JYT, à droite, de la même couleur que KaiBgs), qui adopte un pli de thiorédoxine. Alors que le segment N-terminal de KaiB conserve toujours la structure secondaire dans les deux plis, la région C-terminale se réarrange de dans KaiBgs à dans KaiBfs. (e) La structure cristalline du complexe fonctionnel KaiC (domaine CI)-KaiBfs (PDB ID : 5JWO). Le domaine CI de KaiC est coloré en gris, tandis que la région constante de KaiB est représentée en rose et la région de commutation de plis en cyan. L'interface KaiC-KaiB est principalement composée de la région C-terminale de KaiB qui subit une commutation de pli. (F) Évolution dans le temps de la liaison de KaiB marqué par fluorescence et de ses variantes avec KaiC, suivie d'une anisotropie de fluorescence. Thermosynechococcus elongatus (te) protéines ont été utilisées dans cette étude. S431E est une mutation phosphomimétique dans KaiC qui facilite la liaison à KaiB. La liaison de wt KaiBgs est monophasique et se produit sur une échelle de temps de 24 h. Au fur et à mesure que la fraction de KaiBfs à l'équilibre est augmentée par des mutations, la liaison devient biphasique. La phase rapide correspond à la liaison rapide de KaiBfs préexistants à KaiC, tandis que la phase lente correspond au réarrangement de KaiBgs à KaiBfs, suivi d'une liaison. Ces expériences indiquent que le fold-switching de KaiB détermine la vitesse de liaison à KaiC. Panneau (F) est reproduit avec la permission de Chang et al. [18].

Sous sa forme libre (appelée état fondamental, gs), KaiBgs existe sous la forme d'un tétramère constitué de deux dimères asymétriques (figure 3b, dimère de dimères) [49]. Chacun des monomères du tétramère adopte un nouveau pli comprenant quatre brins et trois hélices disposées dans l'ordre βαββααβ. β1 et β2 sont parallèles l'un à l'autre, tandis que β4 est à liaison hydrogène et antiparallèle à β1. β3 est un brin court qui fait partie de l'interface dimère avec la boucle reliant β2 et 3, le segment N-terminal de β4 et le segment C-terminal de β1. L'interface est principalement de nature hydrophobe comprenant des résidus tels que Ala15, Val47, Ile59 et Ile88 (figure 3c) en supprimant les résidus 95–108 et en mutant simultanément Tyr8 en Ala et Tyr94 en Ala dans le tétramère KaiB génère un dimère où les monomères ont le même pli KaiBgs. Dans son homologue métamorphique, KaiB existe sous forme de monomère organisé dans le pli thiorédoxine avec un arrangement structurel secondaire βαβαββα (figure 3) [18]. β1, α1 et β2 dans la moitié N-terminale de KaiB ne changent pas significativement de conformation par rapport à l'état fondamental (déviation quadratique moyenne par paire (RMSD) de Cα entre les deux structures de 1,3 Å), tandis que le C-terminal la moitié subit un remodelage considérable pendant l'événement de basculement. Fait intéressant, la plupart des résidus interfaciaux du dimère asymétrique se trouvent dans la région C-terminale de KaiB, qui subit les plus grands changements de conformation lors de la commutation de pli, suggérant que le tétramère asymétrique de KaiBgs doit se désagréger avant que la commutation de pli puisse se produire.

La structure cristalline de KaiC (domaine CI) en complexe avec KaiB (figure 3e) [50] révèle que l'interface entre KaiBfs et KaiC est composée de plusieurs résidus clés tels que Ala15, Val47, Ile59 et Leu60 qui sont séquestrés dans l'interface dimère asymétrique de KaiBgs. Ces résidus sont exposés dans les KaiBf de type thiorédoxine et sont donc disponibles pour se lier à KaiC, donnant à nouveau l'impression que la protéine a été retournée. Le système métamorphique KaiB est un autre exemple incisif de la façon dont l'accessibilité aux solvants des résidus fonctionnels est modulée en tirant parti de la frustration codée dans les paysages d'énergie libre conformationnels afin de modifier la fonction dans différentes conformations de la même protéine.

On sait très peu de choses sur le mécanisme d'interconversion entre KaiBfs et KaiBgs. Le réarrangement conformationnel entre les deux états se produit extrêmement lentement et le temps d'attente prolongé nécessaire à la conversion de KaiBgs en KaiBfs contribue au délai nécessaire au maintien de la période circadienne de 24 h [18]. La cinétique du fold-switching n'a été estimée qu'indirectement en sondant la liaison de KaiB et de ses variantes à KaiC. On sait que seul KaiBfs lie KaiC. KaiB de type sauvage marqué par fluorescence existe principalement sous forme de KaiBgs (Kéq(gs–fs) = 0,08) et sa liaison au KaiC peut être décrite par une seule phase cinétique avec une constante de temps d'environ 12 h [18]. En revanche, G89A/D91R KaiB existe principalement sous forme de KaiBfs (Kéq(gs-fs) = 6,7) et montre une phase de rafale ainsi qu'une phase lente lors de la liaison KaiC. La phase rapide est interprétée comme l'association de KaiC avec des molécules KaiBfs compétentes pour la liaison présentes à l'équilibre, tandis que la phase lente correspond à l'interconversion de KaiBgs préexistants en KaiBfs et à sa liaison ultérieure à KaiB. Étant donné que la phase de salve est nettement plus rapide que la phase lente, l'approximation de l'étape de détermination de la vitesse à la commutation KaiBgs-KaiBfs fournit une estimation de la constante de vitesse d'interconversion de l'ordre de 12 h. Trois liaisons Xaa-Pro conservées, Thr62-Pro63, Leu69-Pro70 et Pro71-Pro72 passent d'une conformation trans dans KaiBgs à cis dans KaiBfs, et cette isomérisation obligatoire pourrait être l'une des raisons pour lesquelles la commutation de plis est si lente dans KaiB.

2.3. IscU

Escherichia coli IscU présente encore une autre variation sur le thème des protéines métamorphiques, où l'un des conformères est structuré et l'autre est partiellement désordonné, mais les deux remplissent des fonctions distinctes. IscU est un membre de la voie de biogenèse des clusters fer-soufre ATP-dépendants (Isc) qui opère dans les bactéries et dans les mitochondries [17]. IscU est la protéine d'échafaudage sur laquelle les clusters Fe-S sont assemblés avant le transfert via un système spécialisé Hsp70/Hsp40 vers les apoprotéines réceptrices.

L'existence de deux conformations IscU en équilibre thermique est clairement visible à partir du spectre de corrélation quantique simple hétéronucléaire 1 H-15 N (HSQC) de IscU (figure 4une, à gauche), qui affiche deux ensembles de résonances en échange lent sur l'échelle de temps de déplacement chimique RMN pour plusieurs résidus, y compris la chaîne latérale NH du seul Trp dans IscU [51]. Les expériences d'échange de magnétisation 15 N démontrent sans équivoque que les deux formes s'interconvertissent de manière réversible avec des constantes de vitesse kDakota du Sud = 0,8 s -1 et kDS = 2,0 s −1 à 25°C (figure 4une, en bas) [52]. Les stabilités des formes structurées et désordonnées sont approximativement égales à 37°C (pS = 0.4, p = 0,6, 150 mM NaCl, pH 8), tandis que IscU-S est stable au maximum à 25°C [53]. La forme structurée d'IscU (IscU-S) est constituée d'un feuillet à trois brins à l'extrémité N-terminale et d'un faisceau à quatre hélices en aval qui s'amarre sur le feuillet (figure 4b) [54]. Trois des quatre hélices sont courtes (deux tours), tandis que l'hélice C-terminale est longue avec sept tours. Le noyau hydrophobe de la protéine est formé principalement de résidus Ile, Leu et Val avec quelques Ala interdigités. Fait intéressant, les six acides aminés aromatiques dans IscU sont significativement exposés aux solvants et aucun d'entre eux ne participe au noyau (figure 4b, à gauche) de l'IscU-S. Alors que le spectre RMN d'IscU-S est bien dispersé, une grande partie des pics appartenant à IscU-D résonnent au niveau du déplacement chimique de la bobine aléatoire, indiquant que IscU-D a à la fois des régions désordonnées et ordonnées (figure 4une, la gauche). Cette observation est corroborée par les valeurs de rehaussement d'Overhauser nucléaire hétéronucléaire 1 H-15 N (NOE), qui sont négatives pour les résidus tombant dans la région de la bobine aléatoire et positives dans le cas contraire [53].

Figure 4. (une) (Haut) Spectres HSQC 1 H– 15 N d'IscU (à gauche) montrant des pics dupliqués pour la chaîne latérale Trp76 isolée (boîte en pointillés) qui indiquent la coexistence de deux conformations dans l'échantillon. Les superpositions de spectres (milieu) d'IscU en présence de 3 mM Zn 2+ (rouge) ou D39A IscU (vert) avec apo wt IscU (noir) montrent que la résonance mineure de la chaîne latérale Trp disparaît dans les deux cas. Ceci indique que Zn 2+ et la mutation D39A stabilisent la même conformation (IscU-S). (En bas) Spectre d'échange de magnétisation 15 N d'apo wt IscU qui montre des pics croisés (rouge) entre les résonances de la chaîne latérale diagonale provenant de Trp76 dans les deux conformations coexistantes d'IscU. L'apparition de ces cross-peaks démontre que IscU-S et IscU-D s'interconvertissent de manière réversible sur l'échelle de temps ms–s. (b) Représentation de bande dessinée de la structure RMN de IscU-S (ID PDB : 2L4X). Les quatre résidus Pro dans IscU-S sont représentés par des bâtonnets rouges, tandis que les résidus aromatiques sont de couleur magenta. Curieusement, la plupart des résidus aromatiques sont exposés au solvant et ne contribuent pas au noyau hydrophobe d'IscU-S. L'IscU-S structuré est en équilibre sur l'échelle de temps ms–s avec une forme partiellement désordonnée, IscU-D. Deux des liaisons Xaa-Pro dans IscU-D, Asn13-Pro14 et Pro100-Pro101 sont en conformation cis, tandis que les quatre liaisons Xaa-Pro dans IscU-S sont sous forme trans. (c) Le rôle de la protéine d'échafaudage IscU dans le cycle fonctionnel de biogenèse des clusters Fe-S. (1) IscU existe sous deux conformations, IscU-S et IscU-D. (2) L'enzyme dépendante du phosphate de pyridoxal (PLP) IscS catalyse la conversion de Cys en Ala et génère à son tour des persulfures sur IscU-D en s'y liant préférentiellement. Une fois que Fe est introduit dans ce complexe (3), un basculement se produit et l'état IscU est stabilisé par le cluster Fe-S. Le co-chaperon du domaine J, HscB, reconnaît IscU-S et facilite l'assemblage et le transfert du cluster Fe-S vers la protéine acceptrice en aval (5-9). Au cours de ce processus, IscU est transféré à la HscA de type Hsp70, qui stabilise la forme IscU-D partiellement désordonnée d'IscU. Lors de la libération de HscA, l'IscU libre s'équilibre à nouveau en formes ordonnées et partiellement dépliées pour réinitialiser le cycle. Panneaux (une) et (c) sont reproduits avec la permission de Markley et al. [17].

En dehors de la transition ordre-désordre partiel, le changement structurel le plus important qui se produit lors de la commutation de plis d'IscU est le changement de la stéréochimie des liaisons Xaa-Pro de deux résidus Pro conservés Pro14 et Pro101 de trans (IscU-S) à cis (IscU-D) (figure 4b) [53]. Étant donné que Pro14 est dans l'extrémité N-terminale désordonnée de IscU-S, nous ne comprenons pas encore la nature des interactions qui la stabilisent sous la forme cis dans IscU-D.Il est possible que la liaison cis Asn13-Pro14 rapproche l'extrémité N-terminale du reste de la protéine et enterre la surface hydrophobe pour stabiliser la conformation cis Pro14. Contrairement à KaiB, où l'isomérisation Pro cis-trans de trois liaisons Xaa-Pro ralentit probablement le basculement vers l'échelle de temps, l'isomérisation de deux de ces liaisons dans IscU se produit en une seconde. Considérant que la constante de vitesse d'une seule isomérisation Pro cis-trans se produit généralement 1 à 2 ordres de grandeur plus lentement dans les peptides modèles [55] que dans IscU, la raison de cette accélération dans IscU reste incertaine.

Les deux états métamorphiques de l'IscU ont des fonctions distinctes tout comme dans le cas de la lymphotactine (figure 4c). IscU-D se lie sélectivement à la cystéine désulfurase [52], IscS, qui est une enzyme dépendante du phosphate de pyridoxal qui génère et transfère un soufre aux résidus Cys dans IscU pour former des persulfures. La formation subséquente du cluster Fe-S induit une commutation de plis en stabilisant la forme ordonnée de IscU, qui migre de IscS à HscB (DnaJ-like Hsp40) dans la même conformation. IscU reste dans l'état structuré jusqu'à ce que le cluster Fe-S soit relayé à la protéine acceptrice et IscU-S soit retransféré à HscA/ATP via HscB. L'échafaudage structuré est nécessaire pour stabiliser le cluster Fe-S naissant avant le transfert à l'apoprotéine [17]. D'autre part, puisque HscA (DnaK-like Hsp70) se lie aux espèces désordonnées et partiellement ordonnées, IscU bascule les plis d'IscU-S à IscU-D et est libéré dans la voie de biogenèse Fe-S dans la conformation désordonnée. Ainsi, alors que IscU-S lie IscS et HscB en vertu de sa structure, IscU interagit avec HscA sous la forme IscU-D partiellement ordonnée en raison des contraintes imposées par la poche de liaison de HscA, fournissant un contexte fonctionnel pour le comportement métamorphique.

2.4. Mad2

La métamorphose de Mad2 joue un rôle essentiel dans l'établissement des interactions protéine-protéine qui font partie du mécanisme de surveillance du cycle cellulaire appelé complexe de point de contrôle du fuseau [56,57]. Au cours de la division cellulaire mitotique, l'alignement des chromosomes au niveau de la plaque métaphasique se produit via la fixation du kinétochore dans chaque chromatide sœur à des microtubules provenant de pôles de fuseau opposés. L'attachement incomplet des chromatides sœurs aux fuseaux mitotiques pendant la métaphase peut entraîner une aneuploïdie dans les cellules filles, ce qui est empêché par le point de contrôle d'assemblage du fuseau (SAC). La transition de la métaphase à l'anaphase est médiée par le complexe APC/C favorisant l'anaphase, qui est une ubiquitine ligase qui polyubiquitine la sécurine et la cycline B. La dégradation ultérieure de la sécurine active la séparase, qui clive le complexe de cohésine qui maintient les chromatides sœurs ensemble. À leur tour, les kinétochores non attachés au niveau de la plaque métaphasique activent le SAC, ce qui inhibe l'APC/C et retarde le début de l'anaphase.

Sans doute la première protéine métamorphique à être découverte, la Mad2 de 25 kDa, est un composant central du SAC qui se replie en un domaine HORMA (du nom du Hop1p, Rev7 et Mamanprotéines d2) [58]. La structure centrale de Mad2 a trois hélices α et une épingle à cheveux entre les hélices A et B, ainsi qu'une feuille β antiparallèle à trois brins (figure 5une). Ce noyau est conservé lors de la transition métamorphique entre C-Mad2 [59] et O-Mad2 [60], au cours de laquelle une seconde épingle à cheveux β se déplace d'un côté à l'autre du feuillet β. Cette épingle à cheveux C-terminale, comprenant les brins 7 et 8, des liaisons hydrogène avec le brin 6 dans O-Mad2 (figure 5une, à gauche), tandis que l'extrémité N-terminale de la protéine forme un court brin qui s'aligne avec le brin 5. Lors de l'interconversion conformationnelle, l'épingle à cheveux C-terminale (étiquetée brins 8′ et 8″) déplace le N-terminal β- brin à liaison hydrogène avec le brin 5, tandis que le brin N-terminal se réarrange en deux tours supplémentaires d'hélice A (figure 5une, droit). Il y a donc une altération dramatique du réseau de liaisons hydrogène à la périphérie de la protéine, similaire à ce qui est observé dans Ltn.

Figure 5. (une) Vues orthogonales (haut et bas) de la représentation cartoon de O-Mad2 (gauche, PDB ID : 1DUJ), I-Mad2 (milieu, PDB ID : 3GMH) et C-Mad2 (droite, PDB ID : 1S2H). Les régions N-terminales et C-terminales subissant une commutation de plis sont indiquées en bleu et vert, respectivement, tandis que le noyau qui reste inchangé est indiqué en jaune pâle. Les brins et les hélices sont désignés par des chiffres et des lettres majuscules, respectivement. La vue de dessous montre que l'orientation de l'hélice de I-Mad2 ressemble à celle de C-Mad2, bien que le pli global soit similaire à celui de O-Mad2. (b) Le cycle fonctionnel de Mad2 au sein du complexe de points de contrôle de la broche. Le Mad2 synthétisé de novo libre existe principalement sous forme d'O-Mad2, tandis que le C-Mad2 dans les cellules existe sous la forme d'un complexe étroit avec Mad1. Le complexe Mad1-C-Mad2 est recruté dans les kinétochores non attachés et le C-Mad2 forme un homodimère asymétrique avec O-Mad2. Cette interaction C-Mad2-O-Mad2 convertit O-Mad2 en I-Mad2 et l'active ensuite pour reconnaître le partenaire de liaison apparenté, Cdc20. La séquestration de Cdc20 inhibe l'ubiquitine ligase APC/C et empêche la séparation prématurée des chromatides sœurs.

Alors qu'une grande partie de la base structurelle sous-jacente au pliage et à l'interconversion dans la métamorphose Mad2 reste à élucider, des aperçus de la complexité du processus de pliage ont commencé à émerger. Comme pour KaiB, le réarrangement O-Mad2–C-Mad2 se produit extrêmement lentement, sur une échelle de temps de plusieurs heures, la réaction avant prenant 9 h, et la réaction arrière 6 fois plus longue [59] ! C-Mad2 est environ 10 fois plus stable que O-Mad2 [59], bien que le nombre exact varie en fonction de la source et ait été difficile à établir en partie à cause de l'irréversibilité des expériences de dénaturation thermique, et en partie à cause des longs délais nécessaire pour que le bras O-Mad2–C-Mad2 atteigne l'équilibre [61]. Contrairement à la cinétique d'interconversion lente, les mesures de flux arrêté détectées par fluorescence ont montré que le pliage et le dépliement de O-Mad2 et C-Mad2 se produisent sur une échelle de temps de quelques secondes (kF(C-Mad2) = 11 s -1 , kF(O-Mad2) = 6 s -1 , kvous(C-Mad2) = 0,046 s -1 , kvous(O-Mad2) = 0,086 s -1 ) [61]. Ces expériences soutiennent l'idée que l'interconversion entre O- et C-Mad2 se produit via un dépliement local ou global vers une conformation à haute énergie, suivi d'une partition cinétique et d'un repliement vers les formes O- ou C-Mad2 [62].

Mad2 illustre la sophistication qui peut être observée dans la cinétique, la thermodynamique et les voies de repliement des protéines, et comment les cellules peuvent utiliser ces complexités. Par exemple, l'une des questions les plus fascinantes sur les protéines métamorphiques est le triage entre les conformations protéiques alternatives qui accompagne le repliement des protéines de novo. Pratiquement tous les Mad2 libres à l'intérieur des cellules sont présents sous forme d'O-Mad2 inactif piégé cinétiquement généré à la suite d'un repliement de novo de la protéine et incapable de se convertir en C-Mad2 en raison de la lente interconversion entre les deux formes [19,59]. Par conséquent, le système C-Mad2/O-Mad2 à l'intérieur des cellules semble exister dans un état de non-équilibre (figure 5b). En revanche, le C-Mad2 cellulaire se trouve étroitement lié à Mad1 au niveau des kinétochores lors de l'activation du point de contrôle et la récupération de la fluorescence après photoblanchiment (FRAP) a démontré qu'il y a peu ou pas de renouvellement de ce complexe [63-66]. Étant donné que la cible aval de Mad2, Cdc20, se lie au même endroit que l'activateur amont, Mad1 [67,68], les modèles décrivant la reconnaissance de Cdc20 par Mad2 font face à une énigme : d'une part, le Cdc20-binding-competent la conformation ressemble à C-Mad2, et toutes les molécules C-Mad2 sont séquestrées par Mad1 d'autre part, tout le Mad2 libre est piégé dans la conformation O-Mad2 inactive qui ne se convertit pas en C-Mad2 sur l'échelle de temps de l'activation du point de contrôle. Des travaux élégants de plusieurs laboratoires ont démontré que cette énigme est résolue par la capacité du complexe Mad1-C-Mad2 à catalyser la conversion de O-Mad2 latent en C-Mad2 et ainsi activer Mad2 pour lier Cdc20 [60,66,68– 73]. Récemment, les caractéristiques structurelles d'un complexe intermédiaire C-Mad2-I-Mad2 ont été résolues en utilisant une combinaison de cristallographie aux rayons X et de spectroscopie RMN [74] qui révèlent comment I-Mad2 conserve le pli O-Mad2 mais a un noyau et orientation du faisceau hélicoïdal qui ressemble à C-Mad2 (figure 5une, milieu), soulevant la possibilité intrigante que I-Mad2 puisse être un intermédiaire sur la voie reliant O- et C-Mad2.

Les modifications post-traductionnelles au sein du milieu cellulaire offrent une autre façon de moduler les équilibres conformationnels dans les protéines métamorphiques, comme on le voit dans le cas de Mad2. La phosphorylation de Mad2 à Ser195, ainsi que la mutation phosphomimétique S195D, inhibe la transition conformationnelle de O-Mad2 à C-Mad2 comme observé à partir des spectres RMN 1D dépendant du temps de la protéine wt et de ses variantes [75]. La conséquence fonctionnelle de cette inhibition est que S195D Mad2 ne se lie pas à son ligand apparenté Cdc20, et l'expression de ce variant à l'intérieur des cellules entraîne des déficiences dans la régulation du point de contrôle du fuseau.

2.5. RfaH

Les E. coli le facteur de virulence RfaH est un exemple classique de la façon dont les interactions interdomaines peuvent moduler la conformation des protéines (figure 6une,b). RfaH est un paralogue de NusG et les deux protéines ont des domaines N-terminaux (NTD) structurellement similaires qui se lient à l'ARN polymérase (RNAP) et la font passer en mode processif résistant à la pause [76, 77]. Le domaine C-terminal (CTD) de NusG est un tonneau qui reste indépendant de la NTD et interagit avec le facteur de terminaison de transcription Rho [78-80]. En revanche, le CTD de la RfaH libre (RfaHC) se replie en épingle à cheveux -hélicoïdale (figure 6une) qui se lie à la NTD et séquestre le motif de reconnaissance RNAP (figure 6c) [81]. Lorsque RfaH se lie à l'ADN, la NTD et la CTD se dissocient, permettant à la NTD de s'associer à la RNAP [81,82]. Simultanément, le CTD se réarrange spontanément d'une épingle à cheveux -hélicoïdale en un -baril à cinq brins (figure 6b) qui ressemble beaucoup au CTD de NusG [83]. Le CTD remodelé de RfaH interagit alors avec le ribosome pour activer la traduction (figure 6), générant un pont qui couple transcription et traduction. Le basculement qui se produit lorsque RfaHC dissocie de la NTD démontre l'importance des interactions interdomaines dans la stabilisation du pli -hélicoïdal de la CTD [82].

Figure 6. (une) Représentation de bande dessinée de la structure aux rayons X de la RfaH wt pleine longueur (ID PDB : 2OUG). Le domaine N-terminal (NTD) est représenté en gris, tandis que le domaine C-terminal à commutation de pli (CTD) est de couleur arc-en-ciel. Dans RfaH pleine longueur libre, le CTD est hélicoïdal. (b) La structure en feuillets all-β du CTD de RfaH obtenu par spectroscopie RMN (PDB ID : 2LCL). Le schéma de couleurs est identique au CTD dans (une). (c) Les résidus dans la NTD (rose pâle) importants pour la liaison de l'ARN polymérase sont représentés sous forme de bâtonnets sur la structure de RfaH et colorés en jaune. La plupart de ces résidus sont séquestrés par le CTD hélicoïdal (cyan) sous la forme libre de RfaH, mais deviennent exposés lors de la commutation de pli et du détachement du CTD du NTD. () Les résidus dans le CTD (cyan) importants pour la liaison de la protéine ribosomique S10 sont représentés par des sphères vertes dans les conformations hélicoïdales (en haut) et en feuille du CTD. La plupart de ces résidus sont également enfouis à l'interface NTD-CTD mais deviennent disponibles pour la liaison de S10 lorsque la NTD interagit avec l'ARN polymérase.

Le système RfaH offre encore une autre variation au thème des protéines métamorphiques car il implique une protéine multidomaine où l'un des domaines agit comme un échafaudage pour la métamorphose de l'autre domaine [83]. Semblable à Ltn, il y a un changement de conformation global dans RfaHC lorsqu'il passe de la conformation auto-inhibitrice en hélice à la forme en feuillet fonctionnellement active. La conformation de feuille β contient cinq brins disposés dans l'ordre β5(F158–K160)–β1(K115–I118)–β2(Q127–F130)–β3(R138–N144)–β4(E149–K155). RfaHC par lui-même existe dans la conformation de feuille β. Afin de démontrer que la commutation de repli se produit également dans le contexte de la RfaH pleine longueur, Rösch et ses collègues ont créé une variante E47S, dans laquelle une liaison électrostatique clé entre Glu47 et Arg138 attachant la NTD et la CTD est perturbée [83]. Des pics résultant à la fois des conformations -hélicoïdale et -feuillet avec un rapport d'intensité d'environ 1 : 1 peuvent être observés dans le spectre HSQC 1 H-15 N de E47S RfaH, montrant que les structures hélicoïdales et feuilletées peuvent coexister.

Alors que les études expérimentales sondant l'interconversion des formes hélicoïdales et feuilletées de RfaH font défaut, il existe un certain nombre d'études computationnelles abordant cette question en utilisant des méthodes telles que la dynamique moléculaire ciblée [84], la modélisation de l'état de Markov [85], l'échange de répliques [86– 88] et interpolation quasi-continue [89], simulations à gros grains [90], modèles à base de structure à double bassin [91] et simulations de tirage [92]. Il est généralement admis que l'interconversion est déclenchée par l'effilochage de l'hélice N-terminale. Certaines études ont suggéré que le remodelage ultérieur se produit à travers un ensemble à haute énergie de conformations désordonnées [85-87,89] qui forment le feuillet à cinq brins en temps voulu à travers une série d'états avec une ou plusieurs épingles à cheveux . Cependant, le modèle basé sur la structure à gros grains prédit qu'il existe deux intermédiaires sur la voie facilitant le basculement des plis, l'un ressemblant à la conformation hélicoïdale et l'autre à la conformation en feuille [91].

3. Importance évolutive des systèmes protéiques métamorphiques

L'étude des protéines métamorphiques est pertinente non seulement parce que ces protéines exploitent des paysages d'énergie libre conformationnels complexes pour la fonction, mais aussi en raison des informations qu'elles promettent d'offrir sur l'évolution des protéines. Vu de cet oculaire évolutif, les protéines métamorphiques sont importantes de trois manières. Premièrement, les protéines métamorphiques fournissent des preuves au niveau moléculaire du modèle d'évolution des protéines pour échapper au conflit adaptatif (EAC) [93] [94-96]. Le conflit adaptatif est une énigme fondamentale dans l'évolution moléculaire qui décrit la difficulté rencontrée par une protéine à s'adapter à une nouvelle fonction tout en conservant sa fonction ancestrale. Dans des modèles tels que la néofonctionnalisation, l'adaptation se produit après un événement de duplication de gène, une copie du gène conservant la fonction ancestrale et la deuxième copie évoluant pour remplir la nouvelle fonction [97]. D'autre part, l'EAC est un modèle où les protéines multifonctionnelles (ou au noir) facilitent les processus adaptatifs avant et après la duplication des gènes [98]. Avec la découverte des protéines métamorphiques, nous savons maintenant que les protéines peuvent adopter des plis structurellement distincts mais s'interconvertissant de manière réversible qui entraînent directement une multifonctionnalité. Une telle hétérogénéité conformationnelle peut donc permettre l'évolution des protéines en élargissant le répertoire fonctionnel d'un ensemble limité de séquences protéiques [99-103].

Deuxièmement, les protéines métamorphiques sont des ponts entre deux replis protéiques distincts et représentent des états intermédiaires dans les chemins mutationnels reliant les deux topologies structurelles. Dans ce contexte, ils occupent une place unique en tant que systèmes modèles pour les études computationnelles [104] et expérimentales [105] des mécanismes sous-jacents à la dynamique évolutive, au rôle de la pression de sélection et à l'impact des mutations.

Enfin, comment les protéines métamorphiques ont évolué et à quoi ressemblaient leurs ancêtres est, en soi, une question fascinante. Dans une étude récente élégante [106], Volkman et ses collègues ont abordé certaines de ces questions en utilisant des méthodes de reconstruction ancestrale phylogénétique pour générer des séquences d'ancêtres de Ltn et en les caractérisant à l'aide de la spectroscopie RMN. Ltn a évolué à partir d'un ancêtre qui avait le pli chimiokine. La perte de la seconde liaison disulfure conservée présente dans les chimiokines a été l'un des premiers événements de son évolution, bien que cela n'ait pas été suffisant pour l'émergence de la métamorphose. Les ancêtres ultérieurs étaient métamorphiques, mais la population symétrique des deux plis était l'un des derniers événements à se produire dans l'évolution de Ltn. L'une des conclusions les plus frappantes de ce rapport est que Ltn ne semble pas être un intermédiaire évolutif passant du pli chimiokine au nouveau pli dimère Ltn40, mais semble plutôt avoir évolué pour rester métamorphique. Cela suggère que les protéines métamorphiques ne doivent pas nécessairement être des chaînons manquants dans l'évolution des protéines, mais peuvent également représenter des points terminaux dans l'évolution.

4. Prédiction basée sur la séquence des protéines métamorphiques

Les défis inhérents à l'identification systématique des protéines métamorphiques à l'aide d'approches expérimentales, par opposition à leur découverte fortuite, ont soulevé la question intrigante de savoir si la métamorphose peut être prédite en se basant uniquement sur la séquence protéique. Bien que cette question soit difficile à résoudre car très peu de séquences de protéines véritablement métamorphiques sont disponibles, deux approches distinctes ont été adoptées pour développer de tels algorithmes de calcul.

La première approche utilise un modèle biophysique hydrophobe-polaire pour affiner la séquence protéique [104]. Les séquences protéiques sont traitées comme des chaînes de 18 billes qui peuvent être hydrophobes ou polaires. La conformation de cette corde est décrite comme une marche auto-évitante sur une grille en treillis à deux dimensions. Chaque contact intra-chaîne entre paires de billes hydrophobes se voit attribuer une énergie favorable qui sert à entraîner le repliement de cette chaîne. La dégénérescence à l'état natif d'une séquence est alors définie comme le nombre d'états natifs qui ont le même nombre de contacts hydrophobes. Dans cette définition, les séquences avec une valeur de dégénérescence supérieure à 1 sont classées comme métamorphiques (ou bistables). En utilisant cette définition, Chan et ses collègues [104] ont identifié 181 protéines bistables dans la base de données conformationnelle des protéines [107], qui est une collection de protéines de la PDB pour lesquelles plus d'une structure a été rapportée. Un candidat intéressant parmi cet ensemble prédit est la thiorédoxine de chloroplaste d'épinard (PDB ID : 1FB6 [108], 1GL8 [109]), où le segment N-terminal de la deuxième hélice dans 1FB6 est plié en deux 310 hélices dans 1GL8 qui sont orientées à environ 110° et 90° par rapport à la moitié C-terminale de l'hélice. Le pli thiorédoxine est déjà connu pour être impliqué dans la métamorphose de KaiB [18], bien que la première hélice de KaiB reste inchangée en conformation dans les deux plis de KaiB. En revanche, cette hélice est structurée différemment dans les métamorphes prédits de la thiorédoxine d'épinard, ce qui suggère que l'ancien pli de la thiorédoxine peut avoir subi plus d'une transition métamorphique au cours de l'évolution.

La deuxième classe d'approches est basée sur la prémisse que les protéines métamorphiques devraient confondre les algorithmes de prédiction de structure secondaire [110-112].La sortie des algorithmes de prédiction de structure secondaire basés sur des séquences devrait être ambiguë pour les régions de protéines métamorphiques qui changent de conformation dans les deux plis, et cette ambiguïté a été exploitée pour prédire la métamorphose des protéines. Porter & Looger [110] ont utilisé des prédictions de structure secondaire incohérentes, en conjonction avec l'existence d'unités de repliement indépendantes au sein des protéines (identifiées à l'aide de l'algorithme d'équivalence d'énergie de structure des domaines (SEED)) pour détecter environ 100 protéines à commutation de facteur enregistrées dans la PDB. , ainsi qu'environ 100 autres protéines qui n'ont qu'une seule structure résolue, mais qui sont néanmoins prévues pour changer de pli. De même, Wang et ses collègues [112] ont construit un modèle formé sur 201 structures de protéines métamorphiques et 136 monomorphes de la PDB, et ce modèle classe les protéines comme monomorphes ou métamorphiques en fonction de la séquence. Il faut noter que ces deux études définissent toutes les protéines de commutation de repliement comme métamorphiques, tandis que les protéines métamorphiques décrites dans cet article existent dans de multiples états repliés en l'absence de ligands ou de cofacteurs. Alors que le taux de faux positifs pour la prédiction basée sur la séquence des protéines métamorphiques reste élevé (10 à 30 %), ces algorithmes représentent des premières étapes importantes pour résoudre ce problème difficile. Les candidats intéressants qui émergent de cette deuxième approche sont un certain nombre de protéines virales telles que les glycoprotéines du bactériophage T7 et du SRAS, ainsi que des toxines formant des pores qui s'insèrent dans les membranes, bien qu'il n'y ait pas encore de validation expérimentale de ces prédictions.

5. Méthodes d'étude des protéines métamorphiques

La coexistence de plusieurs conformations en équilibre a posé un défi important dans la détection et la caractérisation des protéines métamorphiques. Les pipelines de détermination de structure cristallographique et RMN sont généralement optimisés pour éliminer ces systèmes hétérogènes, et ce biais implicite dans la préparation des échantillons peut expliquer pourquoi la liste des protéines métamorphiques connues reste si courte. Depuis que l'existence de protéines à conformations repliées multiples a été établie, cependant, un certain nombre d'outils expérimentaux et informatiques se sont réunis pour favoriser notre compréhension des systèmes de protéines métamorphiques. Les principales questions qui ont été abordées comprennent les structures des deux conformations, le mécanisme d'interconversion, l'étude des fonctions des différents conformères et quelques aperçus alléchants de l'évolution des protéines métamorphiques.

La cristallographie aux rayons X et la spectroscopie RMN se sont avérées tout aussi importantes pour élucider les structures des protéines métamorphiques verrouillées dans une conformation particulière. Alors que les structures de Ltn10 [26], Ltn40 [16], KaiBfs [18], O-Mad2 [60], C-Mad2 [59], IscU-S [51], IscU-D [52] et RfaH (tous -β) [83] ont été résolus par spectroscopie RMN, les structures de KaiBgs [49] et RfaH (all-α) [81] ont été déterminées par cristallographie aux rayons X. Les caractéristiques structurelles de ces systèmes ont également été identifiées et validées à l'aide de méthodes complémentaires telles que la spectrométrie de masse [113-115]. La spectroscopie RMN multidimensionnelle a été à la pointe de la recherche dans ce domaine en raison de sa capacité à fournir des informations de résolution atomique sur des systèmes présentant une hétérogénéité statique et dynamique [116-118]. La RMN a été essentielle pour établir la présence de conformations multiples dans toutes les protéines métamorphiques décrites dans cette revue, ainsi que pour démontrer sans équivoque l'interconversion réversible de ces conformations dans Ltn et IscU. De plus, nous prévoyons que la méthodologie RMN nouvellement développée pour caractériser structurellement les conformations biomoléculaires peu peuplées et transitoirement [10], telles que le transfert de saturation d'échange chimique [119,120] et la dispersion de relaxation [121,122], aidera à mieux comprendre les mécanismes sous-jacents à l'interconversion conformationnelle. dans ces systèmes.

Les études mécanistes sondant les détails atomiques de la commutation de plis sont jusqu'à présent principalement restées dans le domaine des méthodes de calcul. La petite taille (environ 100 résidus) de bon nombre de ces protéines les rend aptes à des méthodes sophistiquées de dynamique moléculaire sans imposer une lourde charge aux ressources informatiques. Les simulations de dynamique moléculaire (MD) à grains grossiers et tous atomes ont été utiles pour cartographier le paysage de l'énergie libre et les voies cinétiques de Ltn [114], Mad2 [123] et RfaH (voir ci-dessus). Les prédictions contradictoires des méthodes de calcul dans le cas de RfaH, cependant, ont clairement montré que de telles études mécanistes bénéficieront de mesures expérimentales. Étonnamment, les méthodes à molécule unique n'ont pas été largement utilisées pour sonder les protéines métamorphiques. D'autre part, la spectrométrie de masse à mobilité ionique de Ltn a révélé que Ltn10 est considérablement plus flexible que Ltn40 [114].

Un certain nombre de méthodes innovantes d'ingénierie des protéines ont également été utilisées pour disséquer les fonctions des deux plis des systèmes de protéines métamorphiques. Les études fonctionnelles se heurtent à des difficultés lorsque deux conformations s'interconvertissent rapidement et de manière réversible, car il devient difficile d'attribuer une interaction protéine-protéine ou protéine-ligand à l'un des conformères. Volkman et ses collaborateurs ont construit des versions verrouillées de Ltn10 [33] et Ltn40 [32] en incorporant des liaisons disulfure supplémentaires pour stabiliser l'un ou l'autre conformère, générant ainsi une barrière cinétique artificielle pour l'interconversion. Des mutations guidées par la structure qui stabilisent sélectivement une conformation sont également disponibles pour tous les autres systèmes de protéines métamorphiques discutés ici, fournissant un arsenal de variantes pour comprendre les relations structure-fonction.

6. Conclusion et perspectives

La dynamique des protéines est essentielle à la fonction et a été impliquée dans les dysfonctionnements et les maladies. L'hétérogénéité conformationnelle observée dans les protéines est une conséquence de la frustration inhérente aux paysages d'énergie libre conformationnels des protéines. Aucun autre système n'illustre mieux la malléabilité de ces paysages que les protéines métamorphiques, qui ont évolué pour peupler deux plis tertiaires structuraux distincts capables de gérer différentes fonctions.

Notre compréhension actuelle des protéines métamorphiques découle d'approches structurelles et évolutives complémentaires allant de la spectroscopie RMN et de la cristallographie aux rayons X aux simulations de dynamique moléculaire et à la reconstruction ancestrale. Nous avons pu élucider les structures et fonctions des différents conformères et également établir, dans certains cas, leur interconversion réversible. Il ressort clairement des données disponibles que l'étude des protéines métamorphiques est cruciale non seulement pour comprendre les relations structure-fonction, mais aussi parce que les protéines métamorphiques sont d'excellents systèmes modèles dans des domaines aussi divers que la biologie structurale et évolutive.

Néanmoins, le domaine des protéines métamorphiques reste à ses balbutiements 12 ans après l'article influent de Murzin inventant le terme « protéine métamorphique » [12]. Les protéines métamorphiques typiques caractérisées jusqu'à présent ne présentent que deux états conformationnels en équilibre. Que ce soit une limitation de la méthodologie dont nous disposons pour détecter plusieurs conformations différentes, ou s'il s'agit d'une contrainte inhérente posée par le paysage énergétique sans protéines reste incertain, et le degré de plasticité structurelle qui peut être présenté par un protéine métamorphique est encore une question ouverte. En effet, il existe dans la littérature des suggestions selon lesquelles la transcriptase inverse du VIH-1 peut adopter trois structures différentes [23]. Il existe un besoin urgent de développer des prédictions basées sur des séquences robustes de systèmes de protéines métamorphiques qui peuvent ensuite être caractérisés expérimentalement. Cela ouvrira la voie à l'augmentation de notre liste de protéines métamorphiques et à la réalisation d'études systématiques pour reconnaître les thèmes et les modèles. Nous comprenons également très peu le mécanisme d'interconversion des structures distinctes et comment les conformations pliées compactes s'interconvertissent efficacement et de manière réversible sans agrégation. Enfin, où se situent les protéines métamorphiques dans le vaste tissu de l'évolution des protéines ? Sont-ils des intermédiaires pris en flagrant délit, ou sont-ils des points d'extrémité évolutifs sophistiqués sculptés par la pression de sélection pour favoriser de multiples conformations pliées ? Telles sont quelques-unes des questions passionnantes auxquelles est confronté le domaine des protéines métamorphiques, dont les réponses permettront de poursuivre notre quête d'informations plus approfondies sur la structure, la dynamique et l'évolution biomoléculaires.


Une erreur s'est produite lors de la configuration de votre cookie d'utilisateur

Ce site utilise des cookies pour améliorer les performances. Si votre navigateur n'accepte pas les cookies, vous ne pouvez pas visualiser ce site.

Configurer votre navigateur pour accepter les cookies

Il existe de nombreuses raisons pour lesquelles un cookie n'a pas pu être défini correctement. Voici les raisons les plus courantes :

  • Vous avez désactivé les cookies dans votre navigateur. Vous devez réinitialiser votre navigateur pour accepter les cookies ou vous demander si vous souhaitez accepter les cookies.
  • Votre navigateur vous demande si vous souhaitez accepter les cookies et vous avez refusé. Pour accepter les cookies de ce site, utilisez le bouton Retour et acceptez le cookie.
  • Votre navigateur ne supporte pas les cookies. Essayez un autre navigateur si vous le soupçonnez.
  • La date sur votre ordinateur est dans le passé. Si l'horloge de votre ordinateur affiche une date antérieure au 1er janvier 1970, le navigateur oubliera automatiquement le cookie. Pour résoudre ce problème, réglez l'heure et la date correctes sur votre ordinateur.
  • Vous avez installé une application qui surveille ou bloque la création de cookies. Vous devez désactiver l'application lors de la connexion ou vérifier auprès de votre administrateur système.

Pourquoi ce site nécessite-t-il des cookies ?

Ce site utilise des cookies pour améliorer les performances en se souvenant que vous êtes connecté lorsque vous passez de page en page. Fournir un accès sans cookies nécessiterait que le site crée une nouvelle session pour chaque page que vous visitez, ce qui ralentit le système à un niveau inacceptable.

Qu'est-ce qui est stocké dans un cookie ?

Ce site ne stocke rien d'autre qu'un identifiant de session généré automatiquement dans le cookie, aucune autre information n'est capturée.

En général, seules les informations que vous fournissez, ou les choix que vous faites lors de la visite d'un site Web, peuvent être stockées dans un cookie. Par exemple, le site ne peut pas déterminer votre nom de messagerie à moins que vous ne choisissiez de le saisir. Autoriser un site Web à créer un cookie ne donne pas à ce site ou à tout autre accès au reste de votre ordinateur, et seul le site qui a créé le cookie peut le lire.