• Distinctions

Cinq projets pour favoriser la science ouverte

Prix et distinctions

Call-ORD-2025_laureat-es_X.png

En 2025, l’UNIGE a lancé un fonds d’impulsion exceptionnel afin de soutenir des projets en lien avec l’open science et l’open research data et encourager les équipes à intégrer et à mettre en œuvre les bonnes pratiques en matière de gestion et d’ouverture des données de recherche. Parmi les 11 projets sélectionnés, 5 émanent de la Faculté de médecine. Ils bénéficieront d'un soutien pour développer des idées favorisant la recherche ouverte, notamment l’application des principes FAIR, l’accessibilité, l’interopérabilité et la réutilisabilité des données de recherche.

Par ailleurs, le Décanat de la Faculté de médecine obtient un financement permettant de financer partiellement 2 CAS en Research Data Stewardship. «Grâce au soutien du Rectorat, complété par le Décanat, deux collaborateurs/trices pourront suivre le CAS en Data Stewardship : l’un spécialisé dans les données sur le système complexes, l’autre dans les données cliniques. Cette formation s’inscrit dans la politique institutionnelle de professionnalisation des Data Stewards et accompagne la mise en place de notre Service facultaire, conformément aux recommandations du Projet Data », souligne Camilla Bellone, vice-doyenne de la Faculté de médecine en charge de la recherche fondamentale et des technologies.

«SNOMED-DEX: A Large-Scale Dataset of Annotated Descriptive Explanations for SNOMED CT» - Christophe Gaudet-Blavignac & Jamil Zaghir, Département de radiologie et d'informatique médicale 

SNOMED-DEX vise à lever un des freins au développement de l'IA en médecine clinique : le manque de données d'entraînement.  En utilisant des modèles de langage avancés (LLMs), nous générons et validons un corpus inédit de descriptions textuelles annotées pour l'intégralité des 368 000 concepts de la terminologie internationale SNOMED CT, en français et en anglais.
« L'Open Research Data est essentielle à nos yeux car la recherche en général et la recherche en santé numérique en particulier ne peut progresser en vase clos. En rendant, quand c’est envisageable, nos jeux de données librement accessibles, nous permettons non seulement la reproductibilité de nos travaux, mais nous offrons surtout à la communauté scientifique mondiale les fondations nécessaires pour créer des outils d'analyse clinique plus robustes et interopérables, au bénéfice final des patient-es. »

«MOVE-Share: Movement Data Sharing for Open Science» - Stéphane Armand, Laboratoire de cinésiologie, Département de chirurgie

MOVE-Share vise à nettoyer, structurer et rendre publiques les données collectées au Laboratoire de Cinésiologie (HUG/UNIGE) dans le cadre de plusieurs projets de recherche. Avec l’aide d’un Data Curator, ces données seront harmonisées selon les principes FAIR et les directives MoveD (pour le partage de données dans le domaine de l’analyse du mouvement), puis déposées dans des dépôts ouverts tels que Yareta ou Zenodo. L’objectif est de rendre ces jeux de données accessibles, réutilisables et mieux intégrés dans l’écosystème scientifique.
« L’Open Research Data permet de donner un coup de pouce pour réaliser des tâches essentielles mais longues, peu valorisées, souvent reléguées au second plan, voire ignorées, malgré leur caractère obligatoire par les organismes de financement publics. Pourtant, elles sont cruciales pour faire avancer la recherche : elles maximisent l’impact des données existantes, évitent le gaspillage de ressources et permettent à d’autres équipes d’agréger, comparer et découvrir plus rapidement. La stratégie Open Science de l’UNIGE s’inscrit exactement dans cette vision d’une science plus ouverte, plus efficace et plus collaborative — une vision à laquelle nous adhérons totalement au Laboratoire de Cinésiologie. »

«Amélioration de la qualité et de la fiabilité des données PyRAT & génération automatisée de formulaires réglementaires D et M» - Pierre Bonnaventure, Service de zootechnie 

Ce projet vise à structurer, sécuriser et valoriser les données issues de l’expérimentation animale grâce à une approche moderne de data management. Il permettra d’améliorer la traçabilité, la qualité scientifique et la réutilisation des données tout en renforçant l’application des principes des 3R (Remplacer, Réduire, Raffiner).
« L’Open Research Data est essentiel pour garantir la transparence, la reproductibilité et la robustesse des résultats scientifiques. Dans un domaine aussi sensible que l’expérimentation animale, le partage structuré des données permet non seulement d’améliorer la qualité de la recherche, mais aussi de limiter la duplication inutile des expériences et donc l’utilisation d’animaux. La stratégie Open Science de l’UNIGE soutient pleinement cette vision en favorisant une recherche plus responsable, collaborative et efficientе au bénéfice de la communauté scientifique et de la société. »

«Intégration de Datalad dans l’infrastructure UNIGE: un projet pilote» 
Alexis Hervais-Adelman, Dynamics of Brain and Language Lab, Département des neurosciences fondamentales

Ce projet pilote vise à évaluer les bénéfices de l’outil open source DataLad qui combine gestion de versions, organisation de données, reproductibilité et collaboration. Des tests seront effectués sur des données issues des neurosciences humaines, où les jeux de données sont particulièrement complexes en raison de leur multimodalité, de leur sensibilité et de la multiplicité d’approches analytiques qui y sont apportées. Si les tests s’avèrent concluant, l’ultime objectif est d’implémenter cet outil de gestion distribuée des données au sein de l’infrastructure de recherche de l’UNIGE pour l'ensemble des groupes de recherche intéressés.

 

"L’adhésion aux principes de l’Open Science est devenue un sine qua non des institutions de recherche tournées vers l’avenir. La stratégie Open Research Data de l’UNIGE permet de munir les chercheurs/euses des ressources, des outils et du soutien pratique dont iels ont besoin pour assurer le partage systématique et structuré des données et ainsi d’en maximiser la valeur et l’utilité à d’autres groupes à long terme." 

«Nestor — Neurosyphilis: Extraction via Scanned Texts and OCR for medical Research» -  Myriam Lamrayah, Département de médecine & Simon Gabay, Département des humanités numériques (Faculté des lettres) 

Le projet NESTOR vise à développer des outils d’extraction automatique capables de transcrire des archives médicales scannées issues de la Geneva Brain Bank (Hôpital psychiatrique de Belle-Idée, HUG). Compte tenu de la sensibilité de ces informations, leur traitement reposera sur des infrastructures sécurisées éprouvées, notamment celles co-développées par la chaire des humanités numériques de l'UNIGE. Un effort important sera consacré à l’anonymisation afin de permettre le partage de données rarement disponibles pour la recherche. À partir des données d'entraînement transcrites manuellement, des données synthétiques seront générées pour contribuer à entraîner un méga-modèle générique libre et gratuit, utile aux équipes de toutes les disciplines (médecine, histoire, littérature, droit, etc.).

« La transformation de données analogiques en données numériques est un enjeu majeur pour la préservation et l'analyse computationnelle des archives médicales. Les humanités numériques possèdent une longue expérience en acquisition et restructuration automatique de données patrimoniales mais les modèles créés ne sont pas adaptés aux documents médicaux. La stratégie Open Science de l’UNIGEpermet d'avancer dans la création des outils pour la numérisation des données médicales, exploitables par d’autres entités locales et internationales, et cela grâce à une rare collaboration entre les facultés de médecine et des lettres. »

Dans le même numéro

S'abonner à la newsletter
Sign up to the newsletter

S'abonner