Publier et interconnecter des données historiques sur le web sémantique

Conception et direction du projet : Francesco Beretta
Développement et administration de la plateforme : Djamel Ferhod

Le projet symogih.org (Système modulaire de gestion de l'information historique – symogih.org) a conçu une plateforme modulaire et ouverte pour héberger les informations géo-historiques. La plateforme, accessible par le web, permet aux chercheurs de partager leurs données et leurs textes dans un environnement collaboratif et de produire ainsi des données structurées concernant tous les champs historiques. Les corpus relatifs aux différents projets sont publiés sur des sites web dédiés (Patrons de France ; SIPROJURIS). Un atlas historique des territoires politiques est également en cours de développement.

La richesse et l'hétérogénéité de l'information partagée requiert un modèle générique de données qui a été conçu avec la méthode Merise (ERD) (cf. Beretta & Vernus 2012) et intégré dans une base de données relationnelles PostgreSQL à laquelle les utilisateurs se connectent par une application web facile à utiliser. En parallèle, le projet symogih.org a déployé un environnement utilisant la technologie eXist-db pour analyser, partager et publier des textes encodés en XML/TEI. L'annotation sémantique des entités nommées et des unités de connaissance est accomplie en reliant les balises sémantiques définies en ligne avec la Text Encoding Initiative (TEI) aux ressources créées dans la base de données relationnelles.

L'interconnexion des objets, des unités de connaissance et des textes est effectuée par des URI qui aident à leur identification. Nous avons ainsi créé un site web (auquel appartient cette page) afin de proposer aux chercheurs participants et au public les notices d'autorité pour déréférencer les URI, identifier des objets et publier une partie des unités de connaissances recueillies sur des objets historiques.

Cependant, ceci ne permet que de lire des données sur une page web. L'étape suivante consiste à fournir le déréférencement des objets et des informations sous la forme de données RDF et, plus largement, à relier les données du projet symogih.org aux données du patrimoine culturel telles que celles publiées par les musées, les bibliothèques et les archives, et aux données produites par d'autres projets de recherche. La nature générique du modèle de données de symogih.org permet une transposition facile vers une ontologie OWL DL. Nous l'avons donc traduit en RDF et créé un point d'accès SPARQL pour un premier ensemble de données (cf. Francesco Beretta, Djamel Ferhod, Séverine Gedzelman, Pierre Vernus 2014).

Cette partie de symogih.org est toujours en cours de développement. Nous vous invitons donc à éviter d'utiliser l'ontologie générique de symogih.org pour structurer vos propres données car elle pourrait encore évoluer. Vous pouvez bien sûr interroger et utiliser les données, mais sachez qu'elles sont disponibles selon les termes de la licence Creative commons Attribution - Pas d'Utilisation Commerciale - Partage dans les Mêmes Conditions 4.0 International.

Le schéma de l'ontologie générique, à la fois aux formats RDF et PDF, peut être téléchargée depuis ce lien.
Pour visualiser cette ontologie, vous pouvez utiliser le site Webvowl : en cliquant sur le menu "Ontology" en bas de la page, vous pourrez télécharger ("upload") le fichier RDF contenu dans l'archive ZIP.

Pour une introduction aux technologies du web sémantique et de SPARQL voyez ce wiki.

Le point d'accès SPARQL contient différents graphes :