Séminaire de Recherche en Linguistique

Ce séminaire reçoit des conférenciers invités spécialisés dans différents domaines de la linguistique. Les membres du Département, les étudiants et les personnes externes intéressées sont tous cordialement invités.

Description du séminaire Print

Titre DBnary: de la boîte à chaussure aux données liées ouvertes
Conférencier Gilles Sérasset (Grenoble)
Date mardi 09 décembre 2014
Heure 12h15
Salle L208 (Bâtiment Candolle)
Description

Le projet DBnary est actuellement le plus grand effort d’extraction des données lexicales contenues dans différentes éditions du Wiktionaire, avec 13 éditions couvertes. Nous présenterons ici les choix que nous avons fait pour ce travail. Nous montrerons quelques problèmes propres à la tâche d’extraction des données sur un si grande échelle. Nous motiverons aussi le choix d’utiliser le Linked Open Data comme modèle de structuration et de diffusion des données extraites. Encore peu répandu (et donc difficile d’accès pour les néophytes), nous sommes convaincu que ce modèle pourra s’imposer à l’avenir car il offre une solution élégante à bon nombre de problématiques en lexicographie informatique. Nous terminerons en évoquant les différents usages possibles d’une telle ressource.

 

 

   
Document(s) joint(s)
uni-geneve-2014-serasset.pdf