Cours et séminaires

Biais dans les collections numériques: données et représentation(s)

Cours-séminaire hebdomadaire, chaque mardi de 14h à 16h

Semestre: printemps

Enseignant : Dr. Nicola Carboni

Code: 32M7133

Lieu: B 315

Lien moodle: https://moodle.unige.ch/course/view.php?id=11928

REMARQUE PRÉLIMINAIRE

Ce cours est conçu pour des étudiants en sciences humaines: aucune compétence préalable en informatique n'est requise.

PRÉSENTATION

Les dix dernières années ont vu une augmentation rapide de la publication de grands ensembles de données par les musées et autres instituts de mémoire. La publication de tels ensembles de données ouvre la porte à une nouvelle série d'analyses sur notre histoire, mais surtout, elle nous donne la possibilité d'étudier à l'échelle ces collections en fonction d'une nouvelle série de critères tels que (i) leur représentativité, (ii) la provenance de leurs objets ainsi que (iii) leur importance. De quoi parlent ces collections ? comment en parlent-elles ? qui en fait partie et d'où vient leur collection ? Comment utiliser les outils et pratiques numériques pour créer et analyser un large corpus de (méta)données ?

 

Le séminaire commencera à analyser le problème de la représentation des données, en utilisant des données de référence et leur biais géographique comme étude de cas. À partir d'un ensemble de ressources largement utilisées nous examinerons, en utilisant diverses méthodes et outils numériques leur représentativité géographique, en mettant en évidence l'accent mis sur des pays et des cultures spécifiques.

 

L'atelier aura une composante théorique et pratique. Dans le cadre du volet théorique, l'étudiant se familiarisera avec le concept de collections numériques, la conservation des données, la liaison des données et le biais numérique. L'objectif de cette première introduction est de familiariser l'étudiant avec les techniques, les ressources et les problèmes des méthodes actuelles utilisées pour le traitement des données dans les humanités numériques et les sciences des données. Les réflexions porteront sur une nouvelle étude de la représentation, de la signification des objets de musée et des traces coloniales dans le catalogue des musées.

 

La composante pratique permettra à l'étudiant d'expérimenter avec des ensembles de données et la cartographie numérique. En réutilisant les outils existants (par exemple Openrefine), ils expérimenteront la collecte et l'intégration des données, leur harmonisation, curation automatique et enrichissement avec des graphes de connaissances (wikidata, GND, BNF), et enfin leur visualisation en utilisant des outils web-based. La phase pratique sera extrêmement importante, car elle démontrera comment l'interrogation des données forcera certains choix ainsi que la sélection d'attributs et de dimensions spécifiques.

 

PRÉ-Requis

Ce cours est conçu pour des étudiants en sciences humaines: aucune compétence préalable en informatique n'est requise.

Acquis

Solide notion de gestion, traitement et d'analyse de données, maîtrise des recherches actuelles sur les biais au sein des collections numériques, expertise en intégration de données avec Openrefine, analyse cartographique avec des outils web de science des données (kepler.gl, carto, rawdata, infovis).