Digital Humanities / Humanités numériques (archive)

Digital Humanities Short Talks

DH Short Talks-01.png 

Les 1ers Digital Humanities Short Talks ont eu lieu le mercredi 25 novembre de 17h à 20h au Bâtiment des Philosophes.
 
Le but de cette rencontre a été de créer un lieu d’échange sur les humanités numériques. De nombreux projets ont été faits ou sont en cours au sein de la Faculté des lettres, mais sont souvent méconnus de la plupart des collègues. Nous avons choisi la formule des « short talks », c’est-à-dire des courtes présentations de 5 minutes pendant lesquelles des chercheurs ont présenté leurs projets en répondant à une ou plusieurs des questions suivantes :

  • en quoi le recours à l’informatique est important pour le projet?
  • dans quelle mesure la méthodologie de recherche est influencée par l’usage des nouvelles technologies?
  • quelle est ou sera la plus-value scientifique obtenue grâce à l’usage d’outils DH ?

Les présentations ont été suivies par des séances de synthèse et de discussion.

 

Vous trouverez ci-après les descriptions des projets présentés lors des DH Short Talks

 

 

Analyser la variation syntaxique : Un corpus annoté du suisse allemand

Prof. Eric Haeberli et Manuela Schönenberger, Département de linguistique

La variation syntaxique parmi les locuteurs d’une même langue (“inter-speaker variation”) et la variation syntaxique à l’intérieur d’un même locuteur (“intra-speaker variation”) sont relativement peu étudiées. Ce projet propose de faire une contribution à ce domaine de recherche par la création d’un corpus électronique syntaxiquement annoté d’un dialecte du suisse allemand. Le corpus permettra l’obtention simple et rapide de données pour l’étude de n’importe quel phénomène syntaxique et notamment pour l’analyse quantitative et qualitative de la variation. Mais le domaine d’application du corpus peut être étendu à toute autre branche de la linguistique.

Cliquez ici pour télécharger la présentation au format PDF

 

Archéologie vs Numérique vraiment?

Aurélie Terrier, Département des sciences de l'antiquité, Unité d'archéologie classique

Autrefois passe-temps des érudits et des collectionneurs, l'archéologie s’est développée au 19ème s. avec  une démarche scientifique fondée sur la notion de stratigraphie, complétant ou contredisant ainsi les sources écrites.
La méthodologie de la recherche en archéologie a considérablement évoluée et a été modifiée par la création, le développement et l’usage des outils numériques qui se présentent sous une multitude de formes. L’usage de ces nouveaux instruments de travail est devenu aujourd’hui une partie fondamentale du quotidien du chercheur.

 

ArchiMob: Un corpus annoté d'histoire orale en suisse allemand

Yves Scherrer, LATL, CUI / Département de linguistique

Au début des années 2000, l'association ArchiMob a invité 555 témoins à parler de leur expérience de la période de la Deuxième Guerre mondiale. Les témoins proviennent de toutes les régions linguistiques de Suisse ainsi que de différents contextes sociaux et courants politiques. En collaboration avec l'Université de Zurich, nous avons sélectionné 45 interviews en différents dialectes suisse allemands et sommes actuellement en train de les transcrire et normaliser, avec une première publication prévue pour début 2016. J'illustrerai comment des méthodes de linguistique informatique peuvent aider les travaux d'annotation et comment la recherche en histoire et en dialectologie peut profiter de ce corpus.

Cliquez ici pour télécharger la présentation au format PDF

 

Belvedere (1600) and Its Literary Contexts

Prof. Lukas Erne, Département d'anglais

Belvedere, or The Garden of the Muses est un recueil imprimé de lieux communs, publié en 1600, avec une deuxième édition en 1610, qui comporte 4'482 citations, regroupées par thèmes, d’un ou de deux vers décasyllabiques, dont au moins 237 de William Shakespeare, 217 d’Edmund Spenser et 50 de Christopher Marlowe. Le recueil n’a jamais été l’objet d’une édition critique. Il est d’une importance exceptionnelle pour l’histoire de la réception de quelques-uns des plus grands auteurs de la période de la renaissance en Angleterre, y compris Shakespeare, Spenser et Marlowe. En même temps, il illustre le statut grandissant de la littérature anglaise (y compris de la littérature dramatique), la formation d’un canon d’œuvres de littérature anglaise ainsi que la pratique de lecture à l’ère élisabéthaine qui consiste à repérer et puis copier des lieux communs. Le but principal de ce projet de recherche est de combler une lacune importante par une édition critique, avec annotation détaillée, de Belvedere. L’introduction à cette édition place le recueil dans son contexte littéraire et évalue son importance pour la réception des textes et des auteurs qu’il contient.

Cliquez ici pour télécharger la présentation au format PDF

 

ChineWeb A • Enseignement mixte: le support numérique pour une exposition efficace à la langue cible

Claudia Berger, chargée d’enseignement, Lettres, ESTAS, Unité des études chinoises

Présentation du projet ChineWeb • Hybridation et typologie didactique du support numérique • Participation des étudiant-e-s • Autres données collectées

Cliquez ici pour télécharger la présentation au format PDF

 

ChineWeb B • Le traitement de corpus oraux et multimodaux pour faire converger les pratiques: l'analyse micro d’échanges en ligne sino-francophones

Jue Wang Szilas, Collaboratrice scientifique, Lettres, ESTAS, Unité des études chinoises

Présentation du cours eTandem • Corpus collecté • Un exemple de "séquence potentiellement acquisitionnelle" (SPA) pour montrer comment l'acquisition se réalise dans l’interaction • Les indices pour la recherche et la pratique.

 

Ferdinand online

Prof. Claire Forel, Département de linguistique
Luka Nerima, LATL - CUI / Unité d'informatique

La plupart des idées de Ferdinand de Saussure, reconnu comme le fondateur de la linguistique générale, n’ont pas été publiées. Si son Mémoire sur le système primitif des voyelles dans les langues indo-européennes ont établi sa réputation de comparatiste, à 19 ans !, son autre œuvre capitale, le Cours de linguistique générale,  a été rédigée par deux de ses jeunes collègues sur la base des notes d’étudiants ayant suivi cet enseignement novateur entre 1907 et 1911. C’est dire si les quelque 50'000 feuillets manuscrits laissés par le linguiste présentent un intérêt pour ceux qui aimeraient connaître les propositions qu’il pouvait faire dans tous les domaines dont il s’est occupé. C’est de cet ensemble que traite la recherche qui va être présentée, qui met le manuscrit au centre, favorise un travail collaboratif et vise une édition numérique  permettant la création d’un réseau de connaissances autour des idées professées par le maître genevois.

Cliquez ici pour télécharger la présentation au format PDF

 

Génération de terminologies et d’index par extraction automatique d’expressions polylexicales

Luka Nerima, LATL- CUI / Département de linguistique, Unité d'informatique

L'outil de génération de terminologie et d'indexation que nous présentons est basé sur l'extracteur d'expressions polylexicales développé au Laboratoire d’analyse et de technologie du langage (LATL). L'originalité de cet outil est qu'il combine deux approches: une analyse syntaxique du corpus qui dresse une liste des paires de mots qui sont en relation syntaxique (nom-nom, nom-adjectif, nom-prep-nom, sujet-verbe, verbe-objet, etc.) et une approche statistique qui mesure le degré d'association entre les deux termes. L’analyseur syntaxique produit un arbre d’analyse canonique ce qui permet de repérer les expressions polylexicales de manière homogène même si elles ont subi des transformations syntaxiques: passivisation, relative, clivage, interrogative, etc.

Cet outil sera utilisé dans le projet d’édition numérique des manuscrits de Saussure pour construire la terminologie et indexer les manuscrits de manière incrémentale, au fur et à mesure qu’ils seront transcrits.

 Cliquez ici pour télécharger la présentation au format PDF

 

Géoréférencement et annotation sémantique d’images

Prof. Lorenz E. Baumer, Département des sciences de l'antiquité, Unité d'archéologie classique

La gestion des images numériques se fait aujourd’hui par des bases de données qui ont un certain nombre de désavantages (séparation de l’image et de l’information, lourdeur de mettre les informations, restrictions selon la structure des b.d.d.). Le projet présenté ne propose pas seulement un renouvellement pour la gestion des images numériques, mais propose avec l’utilisation d’un double géoréférencement des images et des Wordclouds des nouvelles perspectives pour l’exploitation et la recherche.

Cliquez ici pour télécharger la présentation au format PDF

 

Intertextuality in Flavian Epic Poetry: Paroles en contextes

Lavinia Galli Milic et Christopher Forstall, Département des sciences de l'antiquité, Unité de latin

Cette présentation portera sur le phénomène de l’intertextualité dans la poésie latine que nous abordons en combinant des méthodes traditionnelles et numériques. Cette approche hybride nous permet de saisir plus précisément les caractéristiques intertextuelles d’un passage donné et à la fois de l’étudier à l’intérieur d’un contexte plus large grâce au «distant reading».

Cliquez ici pour télécharger la présentation au format PDF

 

La numérisation de l'atlas dialectologique de la Suisse allemande

Yves Scherrer, LATL, CUI / Département de linguistique

L'atlas SDS (Sprachatlas der deutschen Schweiz) constitue un ouvrage majeur de la dialectologie alémanique. Cet atlas se base sur des enquêtes effectuées dans les années 1940 et 1950 et a été publié entre 1962 et 1997 sous forme de 8 volumes contenant environ 1500 cartes dessinées à la main. Je discuterai des problèmes méthodologiques et techniques rencontrés lors de la numérisation récente d'un sous-ensemble de ces cartes. J'illustrerai aussi comment la numérisation de cet atlas a permis de répondre à de nouvelles questions scientifiques, par exemple celle de l'identification automatique d'un continuum de dialectes, mais aussi celle de la caractérisation et classification numérique de l'espace dialectal alémanique.

 

Politique linguistique et usage de la langue

Daniel Elmiger, Département d'allemand

Depuis plus de trente ans, les liens entre langage et sexes sont sujet de controverse. Le présent projet de recherche, financé par le Fonds National Suisse, se propose d’étudier comment la langue administrative au sein de la Confédération a évolué au fil des années et dans quelle mesure les langues officielles de la Suisse divergent sur ce sujet.

Le projet étudie la mise en œuvre concrète de la revendication visant la parité linguistique dans l’usage administratif, dans les différentes langues nationales. Pour ce faire, un corpus de textes est établi, constitué de textes issus de trois périodes différentes (témoignant de l’évolution des directives sur l’application du principe de l’égalité des sexes). Ce corpus fera l’objet d’analyses quantitatives (utilisation de méthodes de linguistique des corpus) et qualitatives (relevant de la linguistique du texte). Les directives légales variant selon le type de texte à rédiger, ainsi que la structure linguistique même des langues administratives en Suisse, le principe d’égalité s’exprime différemment selon les contextes.

Cliquez ici pour télécharger la présentation au format PDF

 

The CHIPOMAP project: Software Studies on Chinese Environmentalism

Matteo Tarantino, Institut Confucius

The CHIPOMAP project studies environmental information disclosure technologies and protocols in China from the software point of view, focalising on how the tools for disclosure are materially designed, discussed, implemented and negotiated by political and civil society actors. In this way it intends to gain a grounded perspective on the urgent topic of the Chinese environmental crisis and to explore the potential of software studies for area studies.

Cliquez ici pour télécharger la présentation au format PDF 

 

The Parsed Corpus of Middle English Poetry

Richard Zimmermann, Département de linguistique

The Parsed Corpus of Middle English Poetry (PCMEP) is a part-of-speech tagged and syntactically annotated collection of 37 Middle English verse texts with a total of 105,915 words. Middle English is poorly attested in the period between c. 1250-1350. Thanks to the PCMEP, it is now easier to study language changes occurring during this period.

 

The Quest for Language Universals: Diachronic Trends in  the Order of Words in Latin and Ancient Greek

Prof. Paola Merlo, Computational Linguistics and Computational Learning Group, Department of Linguistics

One of main goals of linguistics  is the study of language universals, properties  that  apply  to  all existing  languages,  despite  their well-documented diversity.   We investigate  the factors  that govern one of the  most apparent sources of diversity  across languages: the order of words. Availability of several large-scale treebanks allows us  to  ask  this  question  in  a  novel  way.   In  a  large-scale, computational study  on Latin and  Ancient Greek, two  well-known and well-documented free-order languages, we confirm a trend towards more fixed-order patterns in time, a  tendency that minimises the distance between words.  Trends towards minimisation of distance between words have also been found for all the  several dozen languages for which we have large-scale computational resources.

Cliquez ici pour télécharger la présentation au format PDF 

 

Une nouvelle ressource informatique: une base de données des connecteurs (russe-français)

Olga Inkova, MESLO, Unité de russe

Présentation d'une base de données des connecteurs compilée à partir du subcorpus parallèle russe-français du Corpus national de la langue russe. Ce type de ressource augmente la fonctionnalité des corpus parallèles, en particulier grâce à la possibilité d’effectuer une analyse détaillée des unités linguistiques (y compris les unités qui se composent de plusieurs ‘mots’, c’est-à-dire des éléments séparés par un espace) à partir des critères et paramètres établis par les chercheurs en fonction des objectifs de leur étude et des phénomènes linguistiques analysés. Une base de données de ce type a été déjà crée pour les formes verbales finies en russe et en français (http://a179.ipi.ac.ru/corpora_dynasty/main.aspx) et constitue un instrument précieux notamment pour la linguistique contrastive et la traduction.

Cliquez ici pour télécharger la présentation au format PDF

 

Vie et mort du Réseau Joyeux: les mutations de l'Internet en Chine

Prof. Basile Zimmermann, directeur de l'Institut Confucius

Présentation d'un projet de recherche analysant l'évolution du design des pages du réseau social kaixin001.com, depuis son lancement en 2008 jusqu'à son déclin actuel.

Cliquez ici pour télécharger la présentation au format PDF 

 

 

 

23 octobre 2015
  2015