Projets

Learning by doing - d'un code à l'autre

Témoignage et retour d'expérience HPC 

 « Apprendre en exécutant et résoudre un problème réel en génétique médicale » fut la motivation première de ces ateliers pendant lesquels se mêlent codes informatiques et codes génétiques. Les étudiant-es en 3ème année de bachelor des Sciences Biomédicales de la Faculté de médecine avaient pour mission d’identifier la cause génétique d’une maladie (monogénique) rare à partir de données de séquençage. De manière active et autonome, l’étudiant-e exécute les procédures planifiées par l’équipe enseignante et s’initie à la pratique de la programmation informatique.

Ici, l’analyse des variations du génome permet l’identification des causes d’une maladie afin d’établir un diagnostic précis tel que la mucoviscidose, l’hémophilie, les myopathies, le diabète de type monogénique (etc…). Cette connaissance permettra de prédire son évolution, dans certains cas l’efficacité ou la résistance à un traitement et surtout une prise en charge ciblée si un traitement est disponible.

Au commencement, les données ne sont ni classées et ni structurées. Leur quantité est telle qu’il est impossible de les déchiffrer sans aide informatique. L’étudiant-e est guidé-e pour les organiser, les sélectionner et les annoter. Après cette phase, de nouveaux fichiers de données sont produits et permettent à l’étudiant-e d’interpréter les données du génome de la famille en y apportant une solution au problème médical énoncé.

Résoudre cette tâche inédite et complexe fait appel à plusieurs disciplines : informatique et génétique humaine tout en combinant la théorie à la pratique. Une immersion en situation réelle qui permet aux étudiant-es d’appréhender la complexité du métier de biologiste en génétique médicale.

Pour cette mise en situation, les données sont mises à l’échelle pour être contenu dans un workshop pédagogique. Les étudiant-es ont chacun environ 1GB de donnée à traiter puis analyser grâce aux différents logiciels de séquençage génomique, tel que Annovar, Burrows-Wheeler Aligner (BWA) ou Integrative Genomics Viewer (IGV), exécutés au travers des clusters HPC de l’UNIGE (Baobab et Yggdrasil). Grâce à la puissance de calcul dédiée, les résultats des analyses sont disponibles au bout de 4h (sans compter le travail de préparations, de sélections et d’analyses des données). A une échelle réelle, la quantité de donnée serait au moins 60 fois supérieurs et le temps de calcul nécessaire serai d’environ 10 jours consécutifs et sans interruption.

« Une expérience inoubliable pour les étudiant-es et les enseignant-es en génétique humaine. Entendre une étudiante nous dire qu’elle veut postuler pour un stage d’été dans le service de médecine génétique aux HUG, nous a récompensé de nos efforts. Sans l’équipe du service HPC, nous n’aurions pas pu faire cette séance multidisciplinaire et encore merci pour leur aide. » Christelle Borel, responsable de l’enseignement de la génétique et génomique humaine à la Faculté de médecine.

En effet, les activités réalisées pendant ce projet nécessitent, de manière indispensable, des ressources de calcul à hautes performances (HPC) dont dispose l’UNIGE. L’équipe du service HPC de l’UNIGE a permis à l’équipe d’enseignante en génétique médicale (Michel Guipponi, Pauline Sararols et Frédéric Masclaux) de réaliser ces ateliers en créant des comptes d’accès sur Baobab, en s’occupant de l’installation des logiciels et en allouant les nœuds de calcul nécessaires. Une synergie qui ouvre de nouvelles perspectives pédagogiques.


Un texte co-rédigé par :

Dr Christelle Borel, Responsable de l’enseignement de la génétique et génomique humain à la Faculté de Médecine de l'UNIGE (Unité Médicale et pharmaceutique II) et Adrien Albert, Ingénieur HPC à la DiSTIC.

> En savoir plus