Cours et séminaires

Représentation des connaissances

Cours-séminaire hebdomadaire, chaque mardi de 16h à 18h

Semestre: automne

Enseignant : Dr. Nicola Carboni

Code: 32M7134

Lieu: B 315

Lien moodle

REMARQUE PRÉLIMINAIRE

Ce cours est conçu pour des étudiants en sciences humaines: aucune compétence préalable en informatique n'est requise.

PRÉSENTATION

Comment les étudiants et les chercheurs en sciences humaines peuvent-ils utiliser des outils numériques pour enregistrer et partager des événements historiques, des interactions sociales, les dynamiques culturelles qui les influencent et les sources que nous utilisons pour les décrire ? Comment les outils informatiques peuvent-ils nous aider à suivre, dans l'espace et dans le temps, la vie d'un artiste, depuis ses œuvres et ses sujets jusqu'à ses interactions avec ses amis et ses donateurs. Comment décrire et relier, à partir de données, les sujets d'un texte, sa composition physique, sa structure, les types de références et citations qu'il contient et ce qu'elles indiquent ? Comment pouvons-nous utiliser les données pour enregistrer l'histoire d'un bâtiment, et comment sa fonction change au fil du temps ? Enfin, comment pouvons-nous collaborer avec nos collègues sur tous ces sujets, et collecter et construire ensemble un système d'information qui peut être réutilisé, élargi et partagé ?

Afin de répondre à ces questions, le séminaire introduira les étudiants en sciences humaines dans le domaine de la représentation des connaissances, une nouvelle méthode pour structurer, enrichir, et relier ensemble des informations, des sources et des documents en utilisant des outils et des méthodes numériques. En utilisant un mélange de travail théorique et d'exercices pratiques, le cours se concentrera sur les méthodologies, les défis et les techniques pour la représentation de l'information et de la connaissance extraites de documents, de livres de bases de données ou d'autres sources sous forme de données liées. L'objectif du séminaire est de fournir aux étudiants en humanités numériques et en sciences humaines la compréhension théorique nécessaire, ainsi que l'expérience pratique, dans la discipline, en les familiarisant avec les outils et les techniques de création et de partage des informations sous forme de linked data.

La partie initiale du séminaire explorera comment et pourquoi représenter les connaissances à l'aide de méthodes formelles (création et encodage d'ontologies), les standards actuels dans le domaine (Web sémantique, RDF, Knowledge Graphs) et discutera et analysera les problèmes communs rencontrés par la communauté des chercheurs en sciences humaines en ce qui concerne notamment les représentations, la structuration et le partage de trois types d'informations communément présentes en histoire, histoire de l'art et études littéraires:

  • Les événements historiques et les sources (contextualisation des événements/périodes dans le temps et l'espace).
  • Production matérielle et visuelle (techniques, agence et résultats de la production d'un artefact)
  • Contenu et références (description des sujets et citations dans les œuvres visuelles/textuelles)

Après l'introduction initiale au sujet, les étudiants seront guidés dans la création de leur première ontologie de base. Les langages standards (RDFS/OWL) pour la représentation des connaissances, ainsi que les outils disponibles (Protégé), seront présentés et utilisés ensemble. Au cours de ce processus, les étudiants seront confrontés directement aux problèmes théoriques abordés au tout début du séminaire, dévoilant la complexité du partage des catégorisations et de la sémantique.

Après cet exercice, le séminaire se concentrera sur la création de connaissances sous la forme d'un graphe de connaissances. En réutilisant des ensembles de données (données muséales ouvertes qui comprennent des informations historiques, littérales et visuelles) et des ressources existants (Wikidata), les étudiants se familiariseront avec la transformation de données tabulaires classiques en un graphe RDF utilisant des ontologies standard pensées et développées pour exprimer les recherches en sciences humaines (CIDOC-CRM).

Cette dernière composante du séminaire verra les étudiants engagés dans la représentation d'informations interconnectées dans des structures de graphes partageables. Une telle approche pratique les aidera à conceptualiser les informations sous forme de réseaux, à récupérer et à intégrer des données et des informations provenant de sources diverses, et à comprendre rapidement l'organisation d'un ensemble de données, sa chronologie éventuelle, sa cartographie, ainsi que la manière dont de nouvelles interprétations et hypothèses peuvent émerger de l'analyse.

 

 

PRÉ-Requis

Ce cours est conçu pour des étudiants en sciences humaines: aucune compétence préalable en informatique n'est requise.

Acquis

Premières notions solides de Semantic Web et Linked Data (RDF/RDFS), développement d'une ontologie, maîtrise des données et des ontologies dans le domaine des humanités numériques, maîtrise du langage de mapping (X3ML), transformation de données tabulaires en RDF, interrogation d'un graphe de connaissances (SPARQL), hébergement d'un graphe de connaissances dans un serveur de graphes RDF (fuseki / Researchspace)