7 avril 2022 - Anton Vos

 

Recherche

L’ADN humain est déchiffré à 100%

Un nouveau génome humain de référence a été publié par un consortium auquel a participé l’Université de Genève. Il comprend les 8% du code génétique qui manquaient aux scientifiques depuis vingt ans.

 

 67 génome humain-1200.jpg

L'ADN est contenu dans les 23 paires de chromosomes contenues dans chacune de nos cellules.
(c) Adobe Stock

Tout le génome humain a été déchiffré. Tout? Oui, tout. Les derniers 8% de l’interminable code génétique qui résistaient encore ont enfin cédé devant la persévérance des scientifiques qui, deux décennies après la première ébauche du Human Genome Project, ont enfin parachevé leur conquête totale de la double hélice d’ADN d’Homo sapiens. Cet ultime effort a été réalisé par le consortium Telomere to Telomere (T2T) piloté par le National Human Genome Research Institute des États-Unis, de l’Université de Washington et de l’Université de Californie. Le résultat fait l’objet d’une publication dans la revue Science du 31 mars à laquelle Stylianos Antonarakis, professeur honoraire à la Faculté de médecine, a contribué.

La première annonce du séquençage complet du génome humain remonte à 2001. Le consortium scientifique international Human Genome Project parvient alors à identifier près de 3 milliards de lettres (A, G, T et C, abréviations des quatre bases nucléiques composant le code génétique du vivant). Cette découverte, révolutionnaire pour la médecine et la biologie, n’est cependant pas tout à fait complète. Une petite partie de la cartographie génétique humaine, entre 5 et 15%, estime-t-on à l’époque, reste encore terra incognita. Il s’agit en grande partie de longues séquences répétitives qui poussent à ses limites la technologie de séquençage.

Cette dernière, dont le coût est passé en vingt ans de 3 milliards à quelques centaines de dollars pour un génome complet, se base sur la lecture de portions courtes du génome (quelques centaines de lettres). L’assemblage de fragments ainsi obtenus laisse alors un certain nombre de lacunes. Durant les années suivantes, des milliers de chercheurs et chercheuses mettent au point des outils de laboratoire, des méthodes de calcul et des approches stratégiques permettant de lire des séquences d’ADN plus longues sans compromettre la précision. Les scientifiques de T2T en retiennent deux, l’une capable de déchiffrer jusqu’à 1 million de lettres en une seule lecture avec une précision modeste et l’autre environ 20 000 lettres avec une précision presque parfaite.

Le consortium a également utilisé une lignée cellulaire spéciale qui possède deux copies identiques de chaque chromosome, contrairement à la plupart des cellules humaines qui portent deux copies légèrement différentes.
Après quatre années de recherches, le consortium T2T parvient finalement à décoder la partie manquante. Celle-ci représente en réalité 8% du génome humain complet. Le travail corrige de nombreuses erreurs dans la séquence et ajoute près de 200 millions de lettres (ou paires de bases) formant des séquences dans lesquelles les scientifiques ont identifié 1956 gènes probables dont 99 pourraient, selon eux, coder pour des protéines. La longueur des nouvelles séquences déchiffrées est comparable à celle d’un chromosome entier. L’ADN humain compte désormais officiellement 3,055 millions de paires de bases.

La majeure partie de ces nouvelles séquences se situe près des télomères (les longues extrémités de chaque chromosome) et des centromères (les sections centrales et denses de chaque chromosome). Elles sont distribuées sur les chromosomes acrocentriques (dont le centromère se situe près d’une extrémité) 13, 14, 15, 21 et 22 et des chromosomes 1, 9, 16 et Y.

La séquence complète du génome humain est particulièrement précieuse pour la détermination de la variation génomique humaine, c’est-à-dire des petites différences qui existent entre les ADN des individus. Ces connaissances sont essentielles pour comprendre les contributions génétiques à certaines maladies.

«Plus de la moitié des informations manquantes se situe sur les bras courts des chromosomes acrocentriques qui contiennent les gènes de l’ADN ribosomal essentiels à la production de toutes nos protéines, explique Stylianos Antonarakis. Il s’agit de gènes clés pour la compréhension des mécanismes qui régissent le vieillissement et certaines maladies.»

Ces chromosomes acrocentriques sont au cœur d’une revue de la littérature scientifique réalisée par le généticien genevois, qui recense l’ensemble des connaissances accumulées jusqu’ici sur le sujet. «Le premier papier date de 1934, précise-t-il. Au total, une centaine d’études ont été passées en revue.»

Avant la découverte du séquençage complet du génome, l’une des grandes questions que se posaient les scientifiques était notamment de savoir si les chromosomes acrocentriques étaient tous porteurs du même bras court en termes de matériel génétique. «La recherche du consortium T2T démontre aujourd’hui que le nombre de ces gènes est en réalité variable d’un être humain à l’autre», indique Stylianos Antonarakis.


 

Recherche