hedera

C'est quoi le RDF ?

Le Resource Data Framework est un format de métadonnée "en graphe". Cela signifie que les données sont exprimées en combinant ensemble plusieurs atomes de connaissance que l'on nomme "triple" constitué chacun de trois informations, un sujet, un objet, et un prédicat reliant ces deux derniers. Chaque élément d'un triple est exprimé par le biais d'une URI. Pour donner un exemple, un possible encodage en triple RDF de l'information "L'Uni Dufour est à Genève" pourrait être la suivante:

<http://lod.unige.ch/uni-dufour> <http://lod.unige.ch/property/located-at> <http://lod.unige.ch/geneva>.

Chaque object peut être le sujet dans un autre triple et vice-versa ce qui permet de construire des graphes de connaissances et surtout d'ajouter de la sémantique aux données encodées. Dans l'exemple précédent, il est par exemple tout à fait possible de rajouter des précisions sémantiques sur quel type d'entitée sont Genève et l'Uni Dufour par le biais de nouveau triple pour chacun, l'Uni Dufour est un bâtiment tandis que Genève est une ville. Ce qui se traduit en RDF par le graphe de connaissance ci dessous:

rdf.png

De par sa nature sémantique et flexible, le RDF est un format de donnée de choix pour encoder des concepts plus abstraits de la vie réelle, comme l'acquisition d'oeuvre d'art, le déroulement d'évènements ou encore l'annotatation de documents historique.

Le RDF a aussi été conçus comme un format de donnée permettant la réconciliation des entitiés sémantiques avec le monde extérieur. La nature en URI des triples permet de facilement lier des ressources externes à l'université, comme par exemple les lieux géographiques référencés dans geonames.org, les personnes de renommés recensées dans viaf.org, ou tout autre entité autant bien concrète qu'abstraite cataloguée dans wikidata.org.
rdf2.png

L'intérêt de créer de tels "ponts" vers le monde extérieur réside à ensuite utiliser la puissance des requêtes SPARQL, et plus particulièrement les Federated Queries, pour interroger simultanément le triplestore de l'université et celui du dépôt distant. Si la ville de Genève est référencé dans un corpus d'histoire de l'art comme lieu de résidence d'une oeuvre d'art, et que son entité RDF est correctement réconciliée à son équivalent wikidata, il est alors possible de récupérer toute information à son sujet enregistrée dans wikidata, comme la date de fondation de la ville ou sa population en 1914 entre autres.