Archives par étiquette : Dbpedia

Thésaurus PLOS : test d’appariement avec DBpedia

LD_POC_Fig1-690x320PLOS utilise pour classer ses contenus (subject areas) son propre thésaurus. Relier celui-ci à des ressources externes, en particulier à DBpedia qui est au cœur du nuage de données liées, lui apporterait une visibilité accrue. C’est dans cette optique que des tests ont été réalisés pour mettre en correspondance les termes du thésaurus avec les concepts de DBpedia.

Les tests ont porté sur la section « Psychology » du thésaurus (119 termes), jugée intéressante car mêlant des termes très techniques et des termes du langage courant. La mise en correspondance a été réalisée avec l’API de DBpedia Spotlight. Les URIs et les définitions de DBpedia ont été ensuite importées dans des champs spécifiques du thésaurus (géré avec MAIstro™).

Seuls 59,7% des termes ont pu être appariés sans ambiguïté avec un concept de DBpedia, ce qui n’est pas un résultat suffisant pour s’abstenir de toute intervention manuelle. Par contre DBpedia Spotlight est une aide à l’appariement puisque 72,3% des termes sont apparus parmi les 5 meilleurs résultats pour la mise en correspondance.

L’étape suivante serait de publier le thésaurus dans le Web des données liées, au format SKOS ou OWL, et d’y intégrer les liens vers DBpedia sous forme d’assertions owl:sameAs. D’autres outils comme SILK Linked Data Integration Framework pourraient alors être utilisés pour relier les concepts du thésaurus à des ressources externes.

Article source : PLOS and DBpedia – an experiment towards Linked Data

Tagging sémantique : HdA-BO et HdA-Lab

Dans le cadre d’un projet de recherche et développement[1], les potentialités du tagging sémantique sont explorées sur un corpus d’Histoire des Arts (HdA) à travers deux outils :

  • un module de tagging  (HdA-BO – pour Back Office) permettant aux contributeurs d’utiliser, pour décrire les ressources, des titres d’articles de Wikipedia. Ces tags constitués des entrées de Wikipédia sont dotés de métadonnées, dont les URIs de DBpedia.org correspondants.
  • une interface permettant aux utilisateurs de rechercher et de naviguer dans la version sémantisée du corpus (HdA-Lab – pour Laboratoire). La première version accessible en ligne met l’accent sur la recherche par facettes. HdA-Lab proposera dans les mois qui viennent de nouvelles fonctionnalités : recherche par liste de complétion augmentée, accès multilingue, carte heuristique, index d’auteurs etc.

Ce que permet ce tagging sémantique :

  • la levée d’ambigüités entre tags,
  • l’interopérabilité du corpus avec tout autre utilisant l’URL Wikipedia pour identifier les mots-clés,
  • l’enrichissement automatique de l’indexation par extraction de métadonnées contenues dans les articles de Wikipédia,
  • des fonctionnalités de recherche enrichies car utilisant les relations logiques sous-jacentes aux contenus de Wikipédia (par exemple les relations d’inclusion entre villes, départements et régions de France).

Vu dans C/blog Culture & numérique

 


[1] Ce projet implique l’Institut de Recherche et d’Innovation (IRI) et le Département des Programmes Numériques (DPN) du Ministère de la Culture et de la Communication et utilise les données du site Histoiredesarts.culture.fr