En dépit de leurs propriétés pharmacologiques différentes, les LGIC possèdent une structure quaternaire similaire [182,95,230,30]. Le site composite de liaison des ligands apparaît conservé à travers toute la superfamille. En effet, il a été montré que le site de liaison de l'ACh, du GABA, des benzodiazépines et de la glycine sont homologues [294,328], revue dans [122]10.1.
La cryo-microscopie électronique des récepteurs de l'organe électrique de torpille a fourni des images 3D du nAChR avec une résolution de 9 Å [325]. Une telle résolution est trop faible pour résoudre la position spatiale et l'assignation structurale d'aucun acide aminé particulier. Bien que le domaine extracellulaire ai été produit sous une forme soluble [345], les quantités obtenues sont insuffisantes pour permettre la production de cristaux utilisables pour la diffraction des rayons X. L'approche par RMN s'est limitée à de petits fragments [12]. Quelques tentatives ont été faites avec d'autres méthodes comme la microscopie à force atomique [179], mais avec une résolution inférieure à celle de la microscopie électronique sur cristaux 2D.
Il est donc intéressant d'obtenir des informations sur l'organisation du récepteur à partir des données actuellement disponibles, à savoir les séquences des sous-unités. En conséquence, en parallèle aux approches «expérimentales», des efforts ont été faits pour prédire la structure d'une sous-unité par des techniques informatiques. Deux approches ont été utilisées.
Les techniques de modelage comparatif ambitionnent de fournir la description 3D d'une protéine de structure inconnue, sous réserve qu'un modèle plausible puisse être identifié dont on connaisse la structure. Le problème réside dans l'identification, à partir de la séquence seule, d'un gabarit utilisable. Cependant le manque de similarité de séquence entre les sous-unités de nAChR et n'importe quelle protéine de structure connue oblige à utiliser les méthodes de fold recognition. Les tests ont montré que ces méthodes sont faiblement efficaces en l'absence totale de similitude de séquences [277]. Ces approches souffrent également du fait qu'un gabarit 3D plausible pourrait ne pas exister dans les banques de structures actuelles [208]. En fait, les deux modèles proposés jusqu'à maintenant sont totalement différents [140,322].
En parallèle, des prédictions ab initio de structure secondaire ont été réalisées à l'aide d'algorithmes de 1ère génération, c.-à-d. basés sur l'analyse des acides aminés pris isolément, et ayant une exactitude de 50-60 %, [105,243]. Afin de prendre en compte la richesse d'information dérivée du clonage des sous-unités homologues, j'ai réalisé une prédiction de la structure secondaire de la sous-unité de nAChR à l'aide d'algorithmes de 3ème génération, c.-à-d. basés sur des alignements multiples, analysant les interactions locales entre acides aminés, et atteignant une exactitude supérieure à 70 %. Il a été montré, pour les algorithmes de 1ère et 2nde génération, que la combinaison de plusieurs algorithmes indépendants accroissait la justesse des prédictions [235,27,368].
Je décris ici un programme qui intègre les résultats de plusieurs algorithmes de prédiction appliqués à de multiples protéines homologues. J'ai appliqué ce programme aux différents membres de la famille du nAChR et de la superfamille des LGIC, afin d'accroître le rapport signal/bruit. En sus le programme fournit les consensus de la prédiction de l'accessibilité au solvant et de la topologie. Utilisant ces données en combinaison avec les informations en provenance de source expérimentales, je propose une représentation 2D d'une sous-unité typique de nAChR.
Des travaux antérieurs ont montré que l'exactitude des prédictions de structure secondaire augmente quand on combine plusieurs algorithmes indépendants [235,27,368]. Ici j'ai combiné les prédictions fournies par plusieurs algorithmes de 3ème génération, utilisant l'information fournie par un ensemble de séquences homologues alignées afin de prédire la structure secondaire des sous-unités du nAChR. Les programmes ont été choisis selon trois critères:
Toutes les séquences utilisées dans cette étude peuvent être trouvées dans
la Ligand Gated Ion Channel Database à l'URL:
https://lenoverelab.org/LGICdb/LGICdb.php, voir le chapitre
2. Pour les prédictions de structures secondaires, j'ai
réalisé deux alignements multiples avec le programme
CLUSTALX [316] (disponible à l'adresse
ftp-igbmc.u-strasbg.fr) (pairwise gap opening: 10,
pairwise gap extension: 0,1, multiple gap opening: 5,
multiple gap extension: 0,05, série de matrices Blossum). Un des
alignements comporte 18 sous-unités de canaux cationiques (AL1). AL1
contient 5-HT3 de souris, les sous-unitées du nAChR 1
de torpille,
2-6,
9 et
2-4 de rat,
7-8
de poulet,
1,
,
,
,
de souris (un exemplaire
de chaque paralogue) et DEG3 de Cænorhabditis (Qui n'a
toujours pas d'orthologue identifié chez les vertébrés). Un autre
alignement a été construit avec 38 séquences de LGIC (cationique
et anionique) (AL2). AL2 contient les séquences présentes dans AL1 plus
GABA
1-6,
1-3,
1-3,
1-3,
,
glycine
1-3,
de rat. Le but était de déterminer
si l'incorporation d'information venant de séquences plus distantes
améliorerait la prédiction. Une seule séquence par groupe d'orthologie a
été utilisée à cause de la forte similarité entre orthologues (et donc de
l'absence d'information additionnelle résultant de l'utilisation de
plusieurs orthologues). Le programme ASSP [282]
(disponible à l'adresse ftp://geoff.biop.ox.ac.uk/programs/assp/)
nous permet d'attendre dans le cas d'une prédiction parfaite un Q3
(c.-à-d. un pourcentage d'identité à trois états entre la prédiction et la
réalité) compris dans l'intervalle [83,45 %-100 %] pour AL1 et
[82,74 %-100 %] pour AL2. Afin d'étudier la conservation de séquence à
chaque position le long de la séquence, j'ai construit un troisième
alignement multiple à partir des séquences de 152 sous-unités. Toutes ces
séquences correspondent à des sous-unités dont on a montré qu'elles
étaient présentes dans des récepteurs (éliminant par là les membres
putatifs de la superfamille venant des projets génomes à grande échelle).
J'ai écrit un programme en C afin d'intégrer les prédictions de
structure secondaire basées sur différents algorithmes.
SSPCA (pour Secondary Structure Prediction by
Consensus Average) a été conçu pour combiner les prédictions à
trois états et leurs probabilités venant de plusieurs programmes
appliqués à plusieurs séquences [Figure 10.1].
![]() |
Les congruences entre méthodes µi,j
pour chaque paire de
méthodes sont listées dans le tableau 10.1.
PHD | PREDATOR | DSC | |
PREDATOR | 73,58 (±5.85) | ||
69,32 (±6.35) | |||
DSC | 73,20 (±3.69) | 67,14 (±2,39) | |
66,67 (±4.7) | 57,12 (±2,98) | ||
NNSSP | 76,64 (±4.84) | 76,44 (±3,83) | 78,07 (±2,11) |
71,70 (±4.42) | 60,53 (±5,45) | 69,13 (±5,05) |
![]() |
Les prédictions consensus par séquence sont très
similaires. Les positions des structures secondaires sont à peu près
identiques, les assignations montrant peu de variation. Les prédictions
consensus par méthodes sont plus variables, restant toutefois similaires.
L'assignation des structures varie parfois, ainsi que (mais très rarement)
leur existence. La ressemblance des structures 3D est proportionnelle à
l'identité des séquences [50,109]. L'incorporation
d'information venant de séquences distantes (donc ayant une structure
légèrement différente) est supposée accroître la fiabilité des structures
prédites (si elles sont prédites, c'est qu'elles sont conservées), bien
que diminuant l'exactitude de la prédiction globale
[282,278,310]. Les valeurs de
obtenues avec AL2 ont été tracées en fonction des similarités de séquences
globales déterminées par CONSINDEX [figure 10.3].
![]() |
Une corrélation non-ambiguë est mise en évidence (N=703, R=0.882, p<0.001). Deux composantes principales émergent à partir des comparaisons: une population à faible similarité représente les comparaisons anionique/cationique (p. ex. GABAA vs. nAChR), et une à plus forte similarité représente les comparaisons anionique/anionique ou cationique/cationique. Ces données montrent que les variations entre les prédictions de structure secondaire ne sont pas aléatoires, comme attendu en cas d'imperfection des algorithmes de prédiction. Au contraire, elles sont liées à la variation de séquence. Cela reflète le fait que, si les structures formant l'échafaudage des sous-unités sont conservées entre différents membres de la superfamille -- ce qui est soutenu par un corpus de données important [122] --, l'assignation structurale au niveau du résidu individuel peut varier (p. ex. aux extrémités des éléments structuraux). Une autre conclusion peut être dérivée de la figure 10.3: plus les homologues utilisés seront éloignés de la séquence à prédire, moins l'information obtenue sera fiable. Un trade-off est atteint entre l'information gagnée dans l'utilisation d'alignements multiples (fiabilité des positions et des assignations des éléments structuraux) et les mauvaises prédictions au niveau des résidus individuels dues à la divergence de séquence [282,278]. Il n'y pas de méthode connue pour établir le meilleur compromis.
Les résultats finals obtenus avec les deux alignements AL1 et AL2 sont
très semblables, avec quelques résidus seulement prédits dans un état
différent. Toutes les structures sauf une sont prédites également avec les
deux ensembles de séquences, et dans tous ces cas, l'assignation est la
même. En conséquence, excepté quand c'est explicitement dit, les résultats
présentés plus bas sont ceux obtenus avec AL1 (voir figure
10.4).
Les proportions de chacun des trois états dans l'ensemble des prédictions sont présentées pour chaque position sur le graphe supérieur de la figure 10.2. La figure 10.4 présente la prédiction consensus brute, en texte, juste dessous l'alignement. L'indice de conservation déterminé sur l'ensemble de la superfamille des LGIC (152 sous-unités) est tracé sur le graphe inférieur de la figure 10.2. Dessous sont tracés les emplacements des structures secondaires (rectangles noirs sous le graphe). Dans tous les cas sauf trois (E9, HF et HG) les structures prédites sont localisées dans des régions de haute conservation (supérieure à 50 %). La région de E9 est en fait hautement conservée excepté pour la sous-unité unc38 du nAChR de nématode. Les régions de HF et HG sont hautement conservées dans les sous-unités de canaux cationiques. En résumé, au sein de la famille des canaux cationiques de vertébrés, toutes les structures prédites sont localisées dans des régions de haute conservation. Ce fait est important car les variations entre les membres de la superfamille sont probablement localisées dans les régions de séquence variable. Un élément structural prédit dans une région conservée est donc plus fiable.
PHD, DSC, et NNSSP fournissent des probabilités
pour les trois états en sus des états finalement prédis. La combinaison de
ces probabilités permet la correction des décisions seuillées au niveau de
chaque séquence, qui peut entraîner des fausses assignations. Elle offre
la possibilité de résoudre quelques problèmes comme les singletons (résidu
structuré isolé) ou bien les acides aminés situés aux limites des motifs
de structure secondaire. Les changements effectués par cette étape de
filtrage n'affectent que 29 positions (sur 489). La prédiction affinée
résultante contient (sans compter le peptide signal) 9 hélices-
(longueur moyenne 13,9 acides-aminés) désignés de HA
à HH,
et 17 brins-
(longueur moyenne 6,6 acides-aminés) désignés de E1
à E17. Leurs positions et leurs longueurs sont résumés dans le
tableau 10.2.
hélices | position | brins | position |
A | 50-61 (Phe3-Asn14) | 1 | 78-90 (Leu28-Met40) |
B | 97-110 (Gln47-Thr60) | 2 | 113-115 (Tyr63-Gln65) |
C | 295-300 (Leu220-Ala225) | 3 | 125-128 (Lys75-Arg78) |
D | 324-337 (Val245-Glu258) | 4 | 139-142 (Ile89-Tyr92) |
E | 348-355 (Leu269-Ser276) | 5 | 151-161 (Asp100-Asn110) |
F | 385-400 (Pro305-Leu330) | 6 | 173-175 (Cys115-Tyr117) |
G | 609-627 (Pro408-Arg425) | 7 | 186-191 (Tyr128-Trp133) |
H | 637-656 (Ala432-Val451) | 8 | 200-203 (Asn142-Phe145) |
9 | 213-218 (Ser154-Met159) | ||
10 | 245-249 (Trp173-Gly177) | ||
11 | 272-278 (Ile197-Met203) | ||
12 | 284-290 (Tyr209-Leu215) | ||
13 | 301-305 (Leu226-Leu230) | ||
14 | 318-323 (Thr244-Ile243) | ||
15 | 356-373 (Thr277-Tyr294) | ||
16 | 657-662 (Phe452-Ile457) | ||
17 | 677-670 (Gly462-Met465) |
Exceptées deux larges hélices encadrant un grand brin-
à
l'extrémité amino-terminale, la partie extracellulaire des sous-unités est
prédite entièrement en feuillet-
,
formée d'une succession de petit
brins.
La structure de la portion carboxy-terminale de HA
est
cohérente avec le motif d'accessibilité au solvant (décrit par la
suite comme une chaîne de `e' pour exposed et
`b' pour buried) à savoir ``bbeebbee'',
sa portion amino-terminale étant complètement exposée.
La structure au centre de E1 est également en accord avec le motif
d'accessibilité au solvant ``bebebe'', ses deux extrémités étant
prédites comme complètement cachées. La prédiction de sa partie
carboxy-terminale est moins fiable, puisque chacun des consensus de
séquence et trois des consensus de méthodes de AL1 la prédisent en
hélice-
(voir figure 10.2, graphe supérieur). Une structure
en hélice-
pourrait donc être envisagée pour les quatre derniers
résidus. Cependant, dans le cas d'AL2, seul le consensus de
PREDATOR, ainsi que les consensus de
et
8 du
nAChR présentent quelques résidus prédits en hélice-
.
Cet unique
pas d'hélice pourrait donc être une caractéristique spécifique des
sous-unités des familles cationiques.
La région antigénique principale (MIR pour Main Immunogenic Region) est localisée de la fin de HB au début de E3 [323]. Ce segment était déjà connu pour être exposé au solvant, puisqu'il est directement impliqué dans plusieurs formes de la maladie auto-immune myasthenia gravis. Effectivement, sa partie centrale est prédite totalement accessible au solvant.
L'assignation de HB
apparaît consistante dans toutes les
prédictions exceptées celles de DSC pour AL1 et AL2 ainsi
que celle de PHD pour AL2 (cependant seuls quelques
résidus sont prédits en brin-). Le motif d'accessibilité au
solvant est plus en accord avec un brin-
dans la partie
carboxy-terminale.
La structure E2 (longue de 3 résidus) n'est pas prédite par l'analyse de AL2. C'est le seul élément structural qui diffère entre les deux analyses.
L'assignation de E3 est contredite par des expériences de cross-linking [342] montrant que ses deux premiers résidus exposeraient leurs chaînes latérales dans la même direction.
E4 et E7 sont prédits complètement enfouis.
E5 comme E8 sont en accord avec l'accessibilité au solvant ``ebebebeb''.
Les prédictions de E12-15 et HC-E sont probablement moins justes que celles des parties extra-membranaires. En effet, les programmes de prédiction de structure secondaire n'ont pas été écrits pour, ou testés avec, des protéines membranaires (voir le paragraphe 10.4). La longueur des structures prédites varie considérablement selon l'ensemble de séquences utilisé. Avec AL2, HD est plus court (dans MII), HE est plus long et E15 plus court (dans MIII).
Finalement, HF et HG sont pleinement compatibles avec les prédictions d'accessibilité au solvant, ``bbebbbebbbebbbebb'' et ``eebeebbebbebbbeeb'', indiquant l'existence d'une face exposée et d'une autre enfouie.
Les données expérimentales disponibles peuvent être ajoutées aux
prédictions 1D fournies par SSPCA. On définit ainsi une enveloppe
de contraintes structurales, qui permet de proposer un repliement 2D de la
chaîne peptidique [figure 10.5].
![]() |
Premièrement, sur la base d'images de microscopie électronique, on peut
localiser la MIR à l'extrémité distale du récepteur, par rapport
à la membrane [22]. En conséquence, E2 et E3 sont
également placés au sommet du repliement. E11 est probablement proche
de la membrane puisqu'il est adjacent à MI (voir plus bas la définition de
position des segments transmembranaires). Ensuite, on peut faire
l'hypothèse que chaque segment d'au moins 4 résidus totalement prédits
exposés au solvant fait saillie à la surface de la sous-unité. Cette
contrainte implique un coude de la structure 1D entre E5 et E6,
E8 et E9, E9 et E10, E10 et E11. Les débuts de
E7 et de E8 sont liés par un pont di-sulfure, et sont donc très
proches l'un de l'autre. Ce pont di-sulfure force un nouveau coude entre
E7 et E8. Cette «Cys-loop» est la partie la plus
conservée du domaine amino-terminal des sous-unités de LGIC. Bien
que la moitié n'en soit pas prédite dans une structure périodique, on peut
raisonnablement penser que la région entière adopte une conformation
fortement contrainte. Finalement, un coude est introduit entre E3 et
E5 afin de respecter la taille observée de la sous-unité qui saille de
60 Å à partir de la membrane, avec le plus grande axe de la section
transversale d'approximativement 40 Å (voir la figure 10.7).
HA
et HB
sont placées perpendiculairement à la membrane afin
de correspondre aux images de microscopie électronique [325],
mais il y a peu de données permettant de contraindre le domaine
HAE1HB.
Cette représentation est pleinement compatible
avec le corpus de données concernant le site de liaison de l'ACh. En
effet, le marquage par affinité et la mutagénèse dirigée ont permis
l'identification d'acides aminés (voir le tableau 7.1) qui
sont distribués à l'interface des sous-unités sur six éléments différents
connus comme A (7W8510.2 et
7Y92,
1W86 et
1Y93), B (
7W148 et
7Y150,
1W149 et
1Y151), C (
7Y187,
7C189,
7C190 et
7Y194,
1Y190,
1C192,
1C193 et
1Y198) pour le composant
«principal», et D (
7W54), E (
7L108,
7N110 et
7Q116), et F (
7D163 et
7E172) pour le composant «complémentaire». Un autre
résidu a récemment été identifié sur le composant complémentaire
(
K34 de souris) [303,261]. Comme il est
localisé dans E1, sa position n'ajoute pas de contraintes
supplémentaires à la représentation 2D (bien que contraignant
peut-être le repliement tertiaire). Les expériences de marquage
par affinité avec des dérivés de toxine ont assigné les
composantes principale et complémentaire aux deux faces des
sous-unités [206]. Cela permet d'orienter la
sous-unité toute entière.
La partie amino-terminale de chaque sous-unité peut être
artificiellement subdivisée en deux domaines. L'un est formé par
HA,
E1 et HB ; l'autre est formé par E2-11.
Cependant, le repliement relatif de ces deux structures reste
hypothétique. La partie HE1HB
doit se replier
sur les feuillets E2-11 afin de former une structure
compacte, contenue dans une surface de 40x60 Å2,
et afin
de rendre compte de la possible contribution des résidus
homologues au résidu
K34 de souris au site actif.
PHDhtm [272,271] a été utilisé pour
explorer l'organisation des segments transmembranaires.
PHDhtm est le seul programme de son type qui ne prédit
pas le peptide signal comme étant transmembranaire, probablement à
cause de son manque de conservation. De plus, il prédit les quatre
segments transmembranaires pour tous les membres de la superfamille. SSPCA
fournit le consensus de la sortie de PHDhtm appliqué à
chaque séquence d'AL1. Les résultats, présentés dans le tableau
10.3 montre bien quatre segments.
méthode | MI | MII | MIII | MIV | |
Motif original (présenté dans [245] pour ![]() ![]() |
![]() |
283-307 (208-232) | 317-337 (238-258) | 353-374 (274-295) | 651-675 (446-470) |
![]() |
281-308 (210-236) | 310-339 (239-265) | 348-375 (273-300) | 650-677 (407-433) | |
DAS http://www.biokemi.su.se/ server/DAS/ [73] |
![]() |
287-309 (212-234) | 320-340 (241-261) | 352-373 (273-294) | 651-672 (446-467) |
![]() |
281-307 (210-235) | 319-339 (245-265) | 349-372 (274-297) | 647-671 (404-427) | |
TMPRED http://ulrec3.unil.ch/software/TMPRED_form.html [159] |
![]() |
290-309 (215-234) | 321-340 (242-261) | 354-372 (275-293) | 649-673 (448-468) |
![]() |
281-307 (210-235) | 319-338 (245-264) | 353-371 (278-296) | 652-672 (409-428) | |
TOPPRED2 http://www.biokemi.su.se/ server/toppred2/ [333] |
![]() |
289-309 (214-234) | 319-339 (240-260) | 353-373 (274-294) | 649-673 (448-468) |
![]() |
288-309 (217-237) | 317-337 (243-263) | 352-372 (277-297) | 651-672 (408-428) | |
SOSUI http://www.tuat.ac.jp/ mitaku/adv_sosui [158] |
![]() |
286-308 (211-233) | 319-341 (240-262) | 351-372 (272-293) | 650-672 (445-467) |
![]() |
284-307 (213-235) | 319-341 (245-267) | 349-371 (274-296) | 649-672 (406-428) | |
PHDhtm [271] |
![]() |
285-302 (210-227) | 322-339 (243-260) | 351-368 (272-289) | 647-668 (446-463) |
![]() |
284-303 (213-231) | 320-338 (246-264) | 350-368 (275-293) | 650-668 (407-424) | |
SSPCA consensus (on each AL1 member) | ![]() |
285-303 (210-228) | 322-339 (243-260) | 349-368 (270-289) | 651-668 (446-463) |
![]() |
285-303 (214-231) | 322-339 (248-265) | 349-368 (274-393) | 651-668 (408-424) |
Des travaux antérieurs ont montré que la justesse des prédictions de structure secondaire est accrue avec la combinaison de plusieurs algorithmes indépendants [235,27,368]. Afin de réaliser la meilleure prédiction disponible des sous-unités de nAChR, j'ai intégré les résultats de plusieurs programmes de 3ème génération, utilisant l'information venant d'alignements multiples. Ces programmes ont été sélectionnés sur la base de leur efficacité sur des ensembles de protéines tests, aux structures secondaires connues [275] ou durant des prédictions en aveugle [270,171]. De plus, chaque programme à été appliqué à chaque séquence des alignements, afin d'augmenter le rapport signal/bruit.
Deux principales prédictions ab initio du nAChR ont été rapportées durant les deux dernières décades. FINER-MOORE et STROUD [105] utilisaient l'algorithme du GOR [124] pour les régions (supposées) extra-membranaires, et une analyse (par transformée de Fourier) de la périodicité de l'hydrophobie pour les régions transmembranaires putatives. Récemment ORTELLS [243] a présenté une prédiction de structure secondaire basée sur une approche ressemblant à l'algorithme de CHOU et FASMAN [51]. La principale différence entre la méthode initiale et celle utilisée dans [243] réside dans la définition des initiateurs des structures secondaires. Au lieu de les prédire seulement par la séquence (via des tableaux statistiques) comme dans CHOU et FASMAN, les initiateurs étaient déterminés comme suit: Un initiateur est défini comme un résidu constamment prédit dans le même état, à travers plusieurs ensembles de sous-unités de LGIC, analysés par des algorithmes de 1ère et de 2ème génération. Une autre différence réside dans le fait que la propagation à partir des initiateurs est unidirectionnelle dans [243], dans le sens amino-terminal vers carboxy-terminal, alors qu'elle est bi-directionnelle dans [51].
La justesse de prédiction moyenne a déjà été discutée ailleurs (voir [167] et [234] pour des évaluations initiales et [275,277] pour des revues récentes), mais la différence entre ces premiers travaux et la prédiction présentée ici, pourrait atteindre 20 %. En effet sur un ensemble test identique, l'algorithme de CHOU et FASMAN atteignit 49 % alors que PHD atteignait 72,5 % [275].
contenu en hélice | contenu en brin | rapport | |
[360] | 39 % | 33 % | 1,18 |
[41] | 18,7 % | 42 % | 0,45 |
[223] | 39 % | 35 % | 1,11 |
[346] | 48 % | 26 % | 1,85 |
moyenne des valeurs expérimentales | 36,2 % | 34 % | 1,15 |
[105] | 44 % | 27 % | 1,63 |
[243] | 29,7 % | 24,9 % | 1,19 |
consensus SSPCA | 25,8 % | 22,3 % | 1,16 |
consensus affiné | 24,2 % | 22,5 % | 1,07 |
![]() |
Séquence | RIPLYFVVNVIIPCLLFSFLTVLVFYLPTDSGEKMTLSISVLLSLTVFLLVIVELIPSTSSAVPLIGKYMLFTMIFVISSIIVTVVVINTHHR |
[58] | ...TTTTTTTTTTTTTTTTTTTTTTTT.......TTTTTTTTTTTTTTTTTTT................TTTTTTTTTTTTTTTTTTT..... |
[87] | .TTTTTTTTTTTTTTTTTTTTTTTTTTT..TTTTTTTTTTTTTTTTTTTTTTTTTT........TTTTTTTTTTTTTTTTTTTTTTTTTTTT. |
[236] | ..TTTTTTTTTTTTTTTTTTTTTTTTTT......TTTTTTTTTTTTTTTTTTT...............TTTTTTTTTTTTTTTTTTTTTT... |
[231] | .TTTTTTTTTTTTTTTTTTTTTTTTTTTTT...TTTTTTTTTTTTTTTTTTTTTT.............TTTTTTTTTTTTTTTTTTTTTTT.. |
La position des segments transmembranaires est prédite par PHDhtm à 95 % de justesse. Cette précision est supérieure à l'incertitude présentée ci-dessus.
Alors que les prédictions de la position des segments
transmembranaires peut apparaître fiable, l'assignation
structurale doit néanmoins être acceptée avec prudence.
Puisqu'aucun des programmes utilisés dans ce travail n'a été
entraîné sur des protéines membranaires, la justesse espérée dans
les prédictions transmembranaires est probablement plus basse que
celle des régions extramembranaires. En effet, l'environnement
lipidique impose des contraintes sur la structure10.4. Cependant, j'ai mené un test des programmes
utilisés dans la présente étude sur un ensemble test de protéines
de structure connue [Tableau 10.5]. Le groupe test
était composé de 20 chaînes ne comportant pas d'identité par paire
supérieure à 25 % et dont la résolution était supérieure à
3,5 Å.
Identificateur PDB | Fonction | Espèce | Résolution |
1AFO | Glycophorin A | Homo sapiens | RMN |
1AIJ_H | Photosynthetic reaction center | Rhodobacter sphaeroides | 2.2 Å |
1ATY | F1F0 ATP synthase | Escherichia coli | RMN |
1AUW | Delta2 crystallin | Anas platyrhynchos | 2.5 Å |
1CIY | Delta endotoxin cryia(A) | Bacillus thuringiensis | 2.25 Å |
1COL | Colicin A | Escherichia coli | 2.4 Å |
1HTM | Hemagglutinin | virus de Influenza | 2.5 Å |
1KSA | Bacteriochlorophyll A | Chlorobium tepidum | 2.5 Å |
1KZU_A | Light harvesting complex | Rhodopseudomonas acidophila | 2.5 Å |
1KZU_B | idem | idem | idem |
1MAL | Maltoporin | Eschericha coli | 3.1 Å |
1MDT | Monomeric diphteria toxin | Corynebacterium diphteriae | 2.3 Å |
1PRC_C | Photosynthetic reaction center | Rhodopseudomonas viridis | 2.3 Å |
1PRC_M | idem | idem | idem |
1PRN | Porin | Rhodopseudomonas blastica | 1.96 Å |
1VMO | Vitelline membrane protein I | Gallus gallus | 2.2 Å |
2BRD | Bacteriorhodopsin | Halobacterium halobium | 3.5 Å |
2OMF | Ompf porin | Escherichi coli | 2.4 Å |
2POR | Porin | Rhodopseudomonas viridis | 1.8 Å |
7AHL | Alpha hemolysin | Staphylococcus | 1.9 Å |
programme | Q3 |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
PHD | 67,3 | 76,3 | 70,1 | 65,8 | 55,1 | 0,6 | 0,45 |
[275] | 71,6 | 60 | 57 | 63 | 62 | 0,61 | 0,52 |
DSC | 64,6 | 77,6 | 62,5 | 64,1 | 53,9 | 0,57 | 0,43 |
[171] | 70,1 | 73,5 | 64,9 | 0,58 | 0,51 | ||
NNSSP | 61,8 | 78,4 | 68 | 69,1 | 30,7 | 0,58 | 0,34 |
[287] | 72,2 | 76,2 | 72,4 | 67,4 | 52,2 | 0,64 | 0,50 |
PREDATOR | 60,5 | 72,4 | 60,7 | 57,4 | 37,3 | 0,51 | 0,30 |
[114] | 74,8 | 0,61 | 0,44 |
Sur 5321 résidus, 1804 ont été prédits en hélice- et 1584 en
brin-
. La justesse observée était 67,3 % pour PHD,
64,6 % pour DSC, 61,8 % pour NNSSP et 60,5 % pour
PREDATOR. Ces valeurs sont plus basses que celles déterminées
pour les protéines globulaires (de 70 % à 75 %) mais sont bien
meilleures que des valeurs aléatoires et supérieures à celles des
algorithmes de prédiction de 1ère génération dans le cas des
protéines globulaires solubles. Les prédictions des hélice-
sont
meilleures que celles des brin-
, l'erreur la plus commune étant la
sous-prédiction des brin-
.
Des prédictions structurales ont déjà été faites pour le domaine
transmembranaire, basées sur des arguments analogiques. UNWIN
[325] suggéra, sur la base de ses images de microscopie
électronique, que la région transmembranaire du nAChR pourrait avoir un
repliement similaire à celui de certains domaines des entérotoxines.
ORTELLS et LUNT[245] exploitèrent cette
idée pour modéliser une partie de la région transmembranaire des
LGIC en utilisant comme structure de départ la résolution
cristallographique du domaine B de l'entérotoxine thermo-sensible de
Escherichia coli [304]. Le modèle en résultant présente
une structure secondaire mixte /
, où MII est
tout-
, MI est tout-
et MIII est
/
[figure
4.6B], la région
-hélicale de MIII ayant été ajoutée
a posteriori au modèle. Plusieurs remarques peuvent être faites à
propos de cette étude, mis-à-part le fait que le gabarit n'ai jamais été
trouvé jusqu'à maintenant par aucun programme de fold recognition.
Premièrement, l'entérotoxine n'est pas une protéine intégrale de membrane,
et n'est donc pas un gabarit adéquat pour le domaine intramembranaire du
nAChR. ORTELLS et LUNT [245] ont enlevé le
premier brin, qui interagit avec le cinquième. La structure en résultant
pourrait être moins stable, l'un des feuillets n'étant plus composé que de
deux brins anti-parallèles. Comme le précisent les auteurs, l'addition
ultérieure de MIII et MIV, modelés en hélices (partiellement pour MIII)
peut résulter en une ségrégation de la partie «entérotoxine» des
lipides. Les prédictions de structure secondaire présentées ici ne
correspondent pas avec celles proposées par[245] [figure
10.6B). Une comparaison à trois états donne seulement 33 %
de résidus identiquement prédits.
La représentation 2D rend compte de l'information élémentaire concernant le site de liaison des ligands compétitifs. Les prédictions de structure secondaire suggèrent que les éléments B, F et C sont portés par des segments sans structure périodique, alors que les éléments A, E et D sont, au moins en partie, portés par des segments structurés.
Au niveau du composant complémentaire, W57 (AL1104),
marqué par affinité, est localisé au centre de HB. Des
mutations à la position AL1106 modulent à la
fois la pharmacologie des agonistes et celle des antagonistes
[67,150,49]. Cependant, les chaînes
latérales des résidus AL1102 et AL1104 pointent vers
l'extérieur à partir des faces opposées de l'hélice, impliquant
que AL1104 transmet ses effets indirectement, peut-être par
des altérations locales de la structure.
Au niveau de l'élément E, deux brins- successifs sont
prédis, E5 portant les résidus marqués
L109
(AL1160) et
Y111 (AL1162) et E6 portant
Y117 (AL1175) [302,303]. Une
possibilité serait que les brins-
interagissent dans un
feuillet anti-parallèle, qui dirigerait les chaînes latérales des
résidus marqués dans la même direction.
Finalement, le segment portant l'élément F contient le site de liaison du calcium responsable de la potentiation de l'action des agonistes [121].
Au niveau du composant principal, les expériences de mutagénèse ont montré que plusieurs mutations, localisées dans le voisinage des résidus des éléments B et C marqués par affinité, altèrent profondément les propriétés pharmacologiques (région AL1210-AL1214, et AL1256-AL1259) [68]. Comme ces régions sont prédites sans structures secondaires régulières, les mutations pourraient altérer la liaison indirectement, par des réorganisations des boucles.
Chaque segment transmembranaire du récepteur est prédit comme une
structure mixte /
. Cette prédiction doit être prise avec
précaution, comme noté au-dessus. De plus, des expériences de marquage par
affinité avec une sonde hydrophobe radioactive supporte une organisation
en hélice-
des segments MIII et MIV [28]. MIII est
prédit en hélice-
jusqu'à AL1362 (
7F283) alors que
HEatteint seulement AL1355 (
7S276) et MIV est prédit
en hélice-
jusqu'à AL1668 (
7I463), alors que
HH atteint seulement AL1657 (
7F452). En ce qui
concerne MII, connu pour faire face à la lumière du canal ionique, les
présentes prédictions pourraient mener à une re-considération de
l'architecture couramment acceptée du mécanisme de passage des ions. La
prédiction de MII commence au niveau de l'acide aminé AL1323, 4
résidus après la vision du modèle standard. De plus l'hélice MII est
prédite un peu plus courte. La plus grande partie des données de marquage
par affinité et de mutagénèse dirigée est bien représentée par une
structure hélicoïdale [265,3]. D'un autre côté, des
résultats récents [351] supportent une structure allongée pour
le court segment allant du résidu AL1310 (
7S235) au résidu
AL1319 (
7S240). De plus, MI et MII semblent proches l'un de
l'autre [2]. En conséquence, la portion cytoplasmique liant
MI et MII est prédite plus longue, et pourrait former une
-hairpin (E13-E14). La longueur de la boucle
liant les brins est variable selon la sous-unité considérée. Des
expériences récentes de mutagénèse réalisées dans le laboratoire mettent
en évidence une contribution majeure de la portion centrale de cette
boucle cytoplasmique en tant que filtre de sélectivité du canal ionique.
En outre, sa conformation, plus que sa séquence précise, aurait un effet
critique sur les propriétés de sélectivité du canal (Corringer et coll., en
préparation).
HF et HG sont amphipathiques, et prédites avec une face exposée au solvant et une face enfouie. Le moment hydrophobe maximum [96] (déterminé par le programme MOMENT de la suite WISCONSIN du GCG [85] avec une fenêtre de 8 résidus) est 0,19 pour HF (faible) et 0,57 pour HG (fort) . De plus, les deux hélices présentent une signature de leucine-zipper. Sur 79 séquences: AL1393: 61 Leucines AL1400: 62 Leucines, 14 méthionines AL1611: 30 Leucines , 6 méthionines une position hydrophobe conservée en AL1615 AL1618: seulement 2 Leucines mais 21 Isoleucines une position hydrophobe conservée en AL1622 AL1625: 17L, 30M
Ces deux hélices cytoplasmiques pourraient interagir dans un arrangement coiled-coil, à l'intérieur de la sous-unité ou même entre sous-unités (HF d'une sous-unité interagissant avec HG d'une autre). Ce motif pourrait être critique pour le processus d'oligomérisation. En effet Yu et coll. [365] ont montré que deux délétions d'acides aminés appartenant à HF et HG perturbent la formation du pentamère.
Sur la base de la représentation 2D prédite plus haut, on peut proposer un modèle hypothétique pour l'assemblage de cinq sous-unités au sein d'un récepteur oligomérique.
Chaque sous-unité est généralement vue comme un bâtonnet vertical, cinq d'entre eux formant le récepteur [325]. Cependant, dans les reconstructions en volume effectuées à partir des images de diffraction électronique, la molécule de récepteur montre une torsion droite, chaque groupe de densité tournant autour de l'axe de symétrie [319]. On peut spéculer que la portion extracellulaire de chaque sous-unité ne présente pas la forme d'un bâtonnet, mais est plus aplatie [figure 10.7].
![]() |
Son plus grand axe parallèle à la membrane serait de l'ordre de 40 Å et
non de 25 Å. Le site de liaison des ligands compétitifs resterait
localisé entre les trois densités observées par UNWIN
[325]. Mais, alors que dans ce dernier travail elles sont
supposées être des hélices- appartenant à la même sous-unité, ici
les deux hélices restantes sont supposées appartenir à deux sous-unités
différentes. Le site serait situé à l'interface entre deux sous-unités, ce
qui est supporté par de nombreuses données expérimentales. Cette
représentation met l'accent sur l'asymétrie caractéristique de chaque
sous-unité de la super-famille, chaque
«protomère», au sein de l'oligomère symétrique
[217,46].
Next: 11. Théorie et pratique
Up: No Title
Previous: 9. Histoire évolutive des
Nicolas Le Novère
1999-06-19