Enseignements

Distant Reading II: Stylistique numérique (hacker les humanités)

TP hebdomadaire, chaque mardi de 14h à 16h

Semestre: printemps

Enseignant : Dr. Simon Gabay

Lieu : Salle Mirabeau (4, rue de-Candolle, rez-de-chaussée)

Code: 32M7131

Lien moodle.

REMARQUE PRÉLIMINAIRE

Ce cours est conçu pour des étudiants en sciences humaines: aucune compétence préalable en informatique n'est requise.

PRÉSENTATION

Le développement du numérique s’accompagne d’une multiplication des (re)sources: images, éditions, données en tout genre (tableur, pages web…) et dans une multitude de formats, de manière plus ou moins accessible. Cette formidable opportunité est aussi un problème: avec l’agrandissement des corpus de travail, l’automatisation du traitement des données et leur analyse est devenu un enjeu fort de la recherche pour de nombreuses disciplines.

Dans ce cours, nous apprendrons à tirer partie de la puissance de l’ordinateur pour manipuler simplement les données auxquelles les chercheur.euse.s sont le plus fréquemment confronté.e.s: fichiers XML (utilisé dans l’édition), HTML (récupéré sur internet), images… Ce cours sera l’occasion de découvrir la programmation informatique, et notamment le langage Python, parmi les plus utilisés dans le monde des humanités numériques, mais aussi de l’informatique en général.

PRÉ-REQUIS

Une aisance avec l’outil informatique est souhaitable, mais aucune compétence spécifique n’est requise : les débutant-e-s sont les bienvenu.e.s.

EVALUATION

Analyse d'un texte ou d'un corpus. Rendu sous la forme d'un dossier de 10 pages avec le code et les données.

ACQUIS

Notions de stylométrie, textométrie, lemmatisation, modélisation de sujet, analyse de sentiment.

BIBLIOGRAPHIE