Où partager ?

La préservation et le partage des données de recherche nécessitent l’utilisation de solutions dédiées : ce sont les dépôts de données ou Data Repositories. Ces plateformes permettent de stocker, partager et archiver les jeux de données. Elles attribuent également un DOI ou une adresse pérenne aux données versées, qui pourront ainsi être citées dans plusieurs publications.

Typologie des data repositories

Il existe 3 grandes familles de data repositories:

Disciplinaires

Les dépôts de données disciplinaires, comme leur nom l’indique, sont réservés à une discipline ou un champ de recherche spécifique.

L’avantage de ce type de plateformes est que leur paramétrage sera adapté aux besoins de la discipline et de ses données. De plus, les données seront stockées au sein d’un ensemble de jeux de données de nature similaire. Vos données auront ainsi plus de chance d’être découvertes par les autres chercheurs et chercheuses de votre domaine.

Institutionnels

Les data repositories institutionnels sont gérés par une institution et réservés aux membres de celle-ci. Leur intérêt principal est qu’ils sont en conformité avec les politiques institutionnelles et les lois en vigueur.

Génériques ou multidisciplinaires

Les data repositories de type générique sont ouverts à tous les domaines, disciplines et chercheurs et chercheuses, quelle que soit leur affiliation académique.

L’avantage de ces plateformes est que vos jeux de données pourront être découverts par des chercheurs et chercheuses d’autres disciplines et peut-être s’avérer intéressants pour des projets transdisciplinaires.

Par exemple, depuis le printemps 2019, l’Université de Genève et les hautes écoles genevoises se sont dotée de leur propre data repository institutionnel : Yareta. Développé dans le cadre du projet national DLCM et du projet de loi genevois PL12146, il respecte les principes FAIR et permet le partage en accès libre et la citation correcte du jeu de données grâce à l'attribution d'un DOI.

Quelques dépôts/repositories FAIR

Nom

Type

Facturation

Localisation des serveurs

Yareta

dépôt institutionnel générique

gratuit jusqu’à 50 GB

en Suisse (UNIGE)

ZENODO 

dépôt générique

gratuit

en Suisse au CERN

Dryad 

dépôt générique

frais applicables

 

FORS

SWISSUBase

sciences sociales et politiques

gratuit

en Suisse (UNIL)

OSF – Open Science Framework

dépôt générique

gratuit

aux Etats-Unis,

possibilité de localiser les données en Allemagne

 

Pour une liste plus complète et classée par types de repositories, consultez la liste compilée par le FNS.

Trouver et choisir son data Repository

Le choix d’un repository pour la préservation de ses données de recherche est toujours réalisé au cas par cas. Pour effectuer une sélection, quatre étapes devraient être considérées :

1) Vérifiez si votre financeur ou le journal auquel vous comptez soumettre impose ou recommande un data repository en particulier ou des caractéristiques que celui-ci doit avoir.

Dans certains cas, une institution, un financeur ou un journal peut imposer des directives à leur bénéficiaires pour guider le choix de leur data repository. Par exemple :

Il est donc crucial de se renseigner en amont et de s’assurer que le repository choisi est aligné aux critères imposés.

2) Consultez vos collègues et suivez les habitudes de votre discipline

Lorsqu’il s’agit de choisir un data repository, la première étape est de se renseigner afin de voir si une solution est habituellement utilisée dans votre domaine. Si tel est le cas, il est fortement recommandé de suivre le mouvement et d’opter pour la solution la plus courante. C’est en effet là que vos collègues auront le réflexe d’aller chercher les données.

3) Explorez re3data

S’il n’y a pas de choix par défaut pour votre domaine, vous êtes libre d’explorer les différentes options de dépôts qui s’offrent à vous. Pour ce faire, vous pouvez consulter la plateforme re3data, un registre de data repositories. Celui-ci vous permet de rechercher des dépôts en utilisant une multitude de critères :

  • nom,
  • type de données,
  • discipline ou sujets
  • pays où sont situés les serveurs,
  • etc.

re3data présente un autre avantage : chaque dépôt enregistré sur la plateforme est présenté sous la forme d’une fiche d’identité synthétique composée d'icônes qui permettent en un coup d’œil de connaitre ses caractéristiques. Ainsi, il est possible de savoir rapidement s’il répond aux principes FAIR demandés par l’UNIGE ou le FNS. D’autres informations et caractéristiques techniques sont disponibles sous les différents onglets de la fiche du dépôt sélectionné.

4) Demandez conseil aux membres du Pôle Données de recherche de la Bibliothèque

Si vous n’êtes pas certain-e du repository à choisir ou si vous souhaitez valider votre choix, vous pouvez contacter vos bibliothécaires afin d’obtenir un conseil sur la question.

Critères à considérer pour le choix d’un data repository

D’une manière générale, voici les questions à considérer lors de la sélection d’un data repository :

Y’a t-il un type de repository à privilégier ?

Selon les besoins ou la nature des données à préserver, un repository disciplinaire pourrait par exemple être plus indiqué qu’un repository générique. Un aspect financier pourrait également jouer en faveur d’un repository institutionnel où les coûts seraient peut-être plus favorables.

Les données comportent-elles des données personnelles et/ou sensibles ?

Si oui, les données doivent légalement être conservées en tout temps sur le territoire suisse, et donc, dans le cas de données au format numérique, sur des serveurs basés en Suisse.

Le data repository propose-t-il des identifiants uniques et pérennes (ex : DOI) pour identifier les jeux de données ?

Ces identifiants participent à la conformité aux principes FAIR, et sont également un moyen de valoriser les données et de relier un article aux données dont il tire ses conclusions.

Le data repository permet-il l’apposition d’une licence sur les (jeux de) données ?

Les licences participent à la conformité aux principes FAIR en permettant de stipuler clairement les modalités de réutilisation des données.

Est-il conforme aux principes FAIR ?

Cette information est primordiale car les données issues de recherches menées à l’Université et/ou sponsorisées par un bailleur de fonds, doivent être préservées et diffusées selon les principes FAIR.

Est-il géré par une organisation à but non commercial ?

Cette information est importante dans le cas où le projet est financé par le FNS, car il est possible de demander des fonds supplémentaires pour la préparation, la validation et le versement des données