Cours et séminaires

Distant Reading I: Visualisation

TP hebdomadaire, chaque mardi de 14h à 16h

Semestre: automne

Enseignant : Dr. Simon Gabay

Lieu : Salle Mirabeau (4, rue de Candolle, rez-de-chaussée)

Code: 32M7129

Lien moodle.

REMARQUE PRÉLIMINAIRE

Ce cours est conçu pour des étudiants en sciences humaines: aucune compétence préalable en informatique n'est requise.

Il fait néanmoins suite à Distant Reading I: hacker les humanités [lien], qu'il est donc recommandé d'avoir suivi.

PRÉSENTATION

Le cycle des données suit trois grandes étapes: l’encodage, l’analyse et la diffusion. Au croisement des deux dernières, la visualisation permet de rendre lisible de grandes masses d’informations, et aussi de donner du sens à ces dernières. Visualiser est donc à la fois une étape du processus de recherche, pour défricher la matière et affiner ses analyses, mais aussi de publication, pour présenter simplement sous forme graphique des informations autrement plus complexes à rendre par la prose. Après avoir introduit la visualisation comme discipline, nous nous attarderons sur trois grands types de visualisation : la stylométrie, l’analyse de réseau et la cartographie numérique.

ORGANISATION

Le cours s’article en quatre grands cycles de trois cours qui visent, à chaque fois, à introduire graduellement un nouveau sujet. En partant de la théorie, nous complexifions lentement l’analyse pour terminer sur du traitement de données à l’aide du langage R (logiciel RStudio). Ce cours sera une occasion de découvrir ce langage.

PRÉ-REQUIS

Une aisance avec l’outil informatique est souhaitable, mais aucune compétence spécifique n’est requise : les débutant-e-s sont les bienvenu-e-s. De bons souvenirs en mathématiques (niveau gymnase) peuvent être un plus.

EVALUATION

Production d’une visualisation de votre choix avec des données de votre choix (idéalement votre travail de bachelor ou de master). La visualisation sera accompagnée d’un commentaire détaillé revenant sur les données utilisées et proposant une interprétation de celles-ci.

ACQUIS

Transformation des données de sciences humaines sous forme visuelle, maîtrise du langage R, Stylométrie, analyse de réseau, cartographie numérique..

PLAN

  1. Introduction
  2. Introduction à R
  3. Graphs, heat maps, etc. avec R
  4. Stylométrie: théorie
  5. Stylométrie simple: R avec package stylo
  6. Stylométrie complexe: Rnpackage factoMinR
  7. Réseau: théorie
  8. Réseau simple: Gephi
  9. Réseau complexe: avec R
  10. Cartographie: théorie (plutôt côté TAL extraction d’entités)
  11. Cartographie simple: carto ou truc de Sciences Po
  12. Cartographie complexe: avec R

BIBLIOGRAPHIE

Drucker, Johanna. “Humanities Approaches to Graphical Display.” Digital Humanities Quarterly 5, no. 1 (2011). http://www.digitalhumanities.org/dhq/vol/5/1/000091/000091.html

Eder, Maciej, Jan Rybicki and Mike Kestemont, “Stylometry with R: A Package for Computational Text Analysis”, R Journal, 8(1): 107-121, https://journal.r-project.org/archive/2016-1/eder-rybicki-kestemont.pdf

Grandjean, Martin, “Introduction à la visualisation de données : l’analyse de réseau en histoire”, Geschichte und Informatik, 18/19, 2015, pp. 109-128. https://halshs.archives-ouvertes.fr/halshs-01525543

Moretti, Franco, Graphes, cartes et arbres, Prairies ordinaires, 2008.

Tufte, Edward R., The visual display of quantitative information, Graphics Press, Michigan, 1983.