Campus 92

Dossier/Bio-informatique

De chromosome en chromosome

L’ensemble du code génétique de l’être humain est divisé en 24 morceaux (l’un d’entre eux, le Y, ne se trouve que chez les hommes) et compacté dans des structures appelées chromosomes. Chacun contient un certain nombre de gènes producteurs de protéines

Pour ses 10 ans, l’Institut suisse de bioinformatique a mis sur pied l’exposition Chromosome Walk, au fil du génome humain. Il s’agit d’un balade passant par 23 postes consacrés aux chromosomes humains. Elle permet l’immersion dans le monde des gènes, des protéines et de la bio-informatique. Le texte ci-dessous en est inspiré.

Le chromosome 1 est le plus long des chromosomes humains et le dernier à avoir été totalement séquencé. Déroulé, l’ADN qu’il contient mesure 8 centimètres et compte environ 2200 gènes. Une copie du génome humain entier, soit les 23 chromosomes déroulés et mis bout à bout, mesure 1 mètre. Cela signifie que chaque cellule de notre corps (qui possède deux copies de chaque chromosome) ne contient pas moins de 2 mètres d’ADN. Le nombre total des gènes humains est estimé à 21 000.

Le chromosome 2 contient le gène correspondant à la plus grosse protéine humaine connue, la titine (34 350 acides aminés), qui est un des composants du muscle. Il est admis que le chromosome 2 est le résultat de la fusion de deux plus petits. Chez l’animal le plus proche de l’homme, le chimpanzé, il existe encore en deux parties (2A et 2B), tout comme chez le gorille et l’orang-outang.

Le chromosome 3 contient plus de 1000 gènes. Chez les animaux et les plantes, la majorité des gènes ne sont pas d’un seul tenant. Ils sont éclatés en plusieurs morceaux séparés par des plages qui ne semblent servir à rien. Chacun de ces gènes permet la fabrication de plusieurs protéines différentes, selon que toutes ses parties sont mobilisées ou seulement une combinaison d’entre elles. Chez la mouche, un seul gène (le Dscam) est capable de produire 38 000 protéines différentes par ce mécanisme, c’est-à-dire près de 3 fois plus que le nombre de gènes total de cette espèce d’insecte.

Le chromosome 4 contient plus de 800 gènes. Les scientifiques utilisent des algorithmes pour déterminer quelles portions de l’ADN ont le plus de chances de correspondre à des gènes ou pas. Une approche purement automatique ne peut cependant éviter certaines erreurs comme de confondre certains pseudogènes (des anciens gènes devenus obsolètes et inopérants) avec des gènes. C’est pourquoi il est indispensable de procéder à une vérification «manuelle».

Le chromosome 5 contient plus de 900 gènes dont une partie est encore mal connue. En effet, sur les 21 000 gènes recensés dans le génome humain, un peu plus de la moitié seulement est «bien connue» dans le sens qu’elles correspondent à des protéines caractérisées par les scientifiques. Pour de nombreux autres, seul l’ARN messager a été mesuré. Une troisième catégorie est composée des gènes considérés comme tels car ils ressemblent à des gènes actifs et étudiés chez d’autres animaux (homologues). Cependant, il est possible qu’un gène soit actif chez la souris, par exemple, tandis que son homologue humain soit inopérant. Finalement, les gènes restants ne le sont pour l’instant que par pure prédiction.

Le chromosome 6 contient environ 1150 gènes. Comme tous les gènes, ils présentent ce qu’on appelle des variations de nucléotides ou single nucleotide polymorphism (SNP). Ce sont des petits changements (une lettre du code A, G, T, C qui est remplacée par une autre) qui s’observent entre les individus sans que cela ait des conséquences pathologiques. Un projet est en cours pour séquencer le génome d’un millier de volontaires humains pour pouvoir répertorier précisément toutes ces variations.

Le chromosome 7 contient le gène CFTR qui, s’il subit une mutation, provoque l’apparition de la mucoviscidose. Il existe un certain nombre de maladies génétiques qui sont dues à l’altération d’un seul gène (Maladie de Huntington, Achondroplasie…). En revanche, des affections comme le diabète, la maladie d’Alzheimer ou les maladies cardiovasculaires sont dites multifactorielles. Plusieurs gènes différents peuvent être impliqués ainsi que des facteurs environnementaux.

Le chromosome 8 contient un vestige de gène impliqué dans la fabrication de la vitamine C. L’être humain, au cours de son évolution, a en effet abandonné cette fonction probablement en raison d’un apport suffisant de vitamine C par l’alimentation. Du coup ce gène est devenu superflu et n’a plus été soumis à la pression de la sélection naturelle. Il a commencé à accumuler des mutations jusqu’à devenir inopérant. C’est ce qu’on appelle un pseudogène.

Le chromosome 9 compte environ 140 millions de paires de base, c’est-à-dire les nucléotides qui constituent l’ADN et dont il existe quatre types connus sous les appellations A, G, T et C. Au total, notre génome compte 3 milliards de ces lettres. Seuls 3 à 5% d’entre elles composent des gènes. La grande majorité restante a une fonction inconnue, pour autant qu’elle en ait une.

Le chromosome 10 contient le gène CYP2C19 qui code pour une protéine active dans le foie. Cette dernière contribue à dégrader les médicaments que l’on absorbe. Une petite modification de ce gène peut exercer une influence sur la vitesse de cette «digestion». Connaître les variations individuelles de la séquence de CYP2C19 permettrait de prescrire des doses de médicaments adaptées à chaque patient.

Le chromosome 11 contient environ 1400 gènes. Comme les autres chromosomes, il contient des trous, c’est-à-dire des régions qui n’ont pas pu être séquencées. Ces dernières sont composées de séquences qui se répètent un grand nombre de fois. Cette particularité empêche son décryptage à l’aide des techniques actuelles. Il existe environ 400 de ces trous dans le génome humain, surtout dans les régions appelées centromères, c’est-à-dire celles qui se situent au croisement des deux barres du X que représente chaque chromosome.

Le chromosome 12 contient un des quatre groupes de gènes HOX: les HOXC. Les gènes HOX sont parfois surnommés gènes architectes. Ils contribuent au développement des embryons en faisant en sorte que les cellules se spécialisent de manière correcte en fonction de l’endroit où elles se trouvent dans l’organisme. C’est notamment grâce aux gènes HOX que l’avant-bras précède le bras, que celui-ci se prolonge par la main puis les doigts.

Le chromosome 13 contient plusieurs centaines de gènes. L’étude de l’ADN a révolutionné la classification des espèces. En effet, connaissant le taux de mutation dans les gènes, il est possible d’estimer la distance évolutive qui sépare deux espèces différentes. Ce genre de calculs permet de redessiner l’arbre de l’évolution, parfois avec plus de précision que la paléontologie. C’est ainsi qu’il est apparu que l’hippopotame est plus proche de la baleine que du cochon, contrairement à ce que l’on a déduit de l’analyse du squelette et des dents.

Le chromosome 14 compte un certain nombre de gènes inconnus. Il est possible de se faire une idée de la fonction des protéines qui leur sont associées en étudiant leur séquence. On observe en effet que les protéines sont souvent formées de «domaines» (longs de plusieurs centaines d’acides aminés) bien précis que l’on peut retrouver tels quels dans d’autres protéines. Plusieurs milliers d’entre eux ont été identifiés. En comparant les domaines d’une nouvelle protéine avec ceux des protéines bien connues, il est ainsi possible, dans certains cas, de lui prédire une fonction. C’est ce qui s’appelle dresser un portrait-robot.

Le chromosome 15 contient un des gènes qui déterminent la couleur des yeux. Une étude sur des familles danoises a montré qu’une seule petite mutation dans celui-ci permet de passer des yeux bruns aux yeux bleus.

Le chromosome 16 contient des vestiges de gènes qui ressemblent beaucoup à ceux qui, chez la souris, correspondent à des récepteurs de phéromones. Plusieurs études ont montré que l’être humain est toujours sensible à une forme de communication olfactive inconsciente. Mais on ignore encore comment.

Le chromosome 17 contient un gène correspondant à un type de collagène, c’est-à-dire une protéine fibreuse, très résistante à la traction. C’est une telle protéine qui a été isolée dans les restes d’un tyrannosaure vieux de plus de 68 millions d’années. Bien que cette étude américaine demande encore des confirmations indépendantes, elle confirme sur des bases moléculaires que les dinosaures et les oiseaux sont très proches du point de vue de l’évolution.

Le chromosome 18 contient le gène BCL2 qui correspond à une protéine responsable de la régulation de l’apoptose (mort programmée des cellules). Ce gène, lorsqu’il est muté, est impliqué dans un grand nombre de cancers, notamment la leucémie, le mélanome, le cancer du sein et de la prostate.

Le chromosome 19 contient un peu plus de 2 centimètres d’ADN et environ 1500 gènes. Pour près de la moitié des gènes humains, les chercheurs n’ont pas encore confirmé l’existence d’une protéine correspondante. Un projet international, doté d’un budget de 11 milliards de dollars, est sur le point de démarrer pour tenter de trouver ces molécules et de déterminer à quoi elles pourraient bien servir.

Le chromosome 20 contient le gène de la protéine prion dont une variante est responsable de la maladie de Creutzfeld-Jakob. Des protéines homologues chez d’autres espèces sont également responsables des maladies de la vache folle (l’encéphalopathie spongiforme bovine qui est transmissible à l’homme par l’alimentation) et de la tremblante du mouton.

Le chromosome 21 est le seul à avoir été en partie décrypté par une équipe genevoise, celle de Stylianos Antonarakis, professeur au Département de médecine génétique et développement. Il arrive chez certaines personnes que ce chromosome existe en trois exemplaires au lieu de deux, ce qui provoque la trisomie 21. Il contient également le gène de la protéine précurseur de l’amyloïde (APP), à l’origine de la formation des plaques amyloïdes que l’on retrouve dans le cerveau des patients atteints de la maladie d’Alzheimer.

Le chromosome 22 est, en 1999, le premier à avoir été entièrement décrypté par le Human Genome Project, un consortium public. Dès 1998, une compétition est engagée entre cette dernière et une société privée, Celera Genomics, dont l’objectif est de commercialiser ses découvertes. En 2001, les deux groupes publient en même temps une première ébauche du génome humain. Celera Genomics avouera plus tard avoir utilisé des données du consortium public pour avancer plus vite. Le séquençage total prend officiellement fin en 2003 et les résultats sont depuis gratuitement accessibles sur Internet. Au total, il aura fallu quinze ans, 3000 scientifiques et 2,7 milliards de dollars pour en venir à bout.

Le chromosome X contient environ 900 gènes. Les femmes possèdent, dans chacune de leurs cellules, deux copies de ce chromosome, tandis que les hommes n’en ont qu’une seule. C’est pourquoi il existe des maladies liées à des mutations du chromosome X (hémophilie, daltonisme…) qui sont beaucoup plus fréquentes chez les hommes, ces derniers ne pouvant pas compter sur une copie de secours du gène endommagé.

Le chromosome Y contient environ 70 gènes, dont 21 sont communs au chromosome X. L’un des gènes propres au Y est le SRY. Il détermine la différenciation sexuelle. Certaines mutations dans ce gène peuvent donner naissance à des femmes alors même qu’elles possèdent une paire de chromosomes sexuels XY.

L’exposition «Chromosome Walk, au fil du génome humain» se tient sur la Terre de Pregny, aux Conservatoire et Jardin botaniques de la Ville de Genève, du 1er au 30 septembre et sur la place de Milan à Lausanne du 6 au 19 octobre (Renseignements: 022/379 50 50 ou sp_com(at)isb-sib.ch).