Tagging sémantique : HdA-BO et HdA-Lab

Dans le cadre d’un projet de recherche et développement[1], les potentialités du tagging sémantique sont explorées sur un corpus d’Histoire des Arts (HdA) à travers deux outils :

  • un module de tagging  (HdA-BO – pour Back Office) permettant aux contributeurs d’utiliser, pour décrire les ressources, des titres d’articles de Wikipedia. Ces tags constitués des entrées de Wikipédia sont dotés de métadonnées, dont les URIs de DBpedia.org correspondants.
  • une interface permettant aux utilisateurs de rechercher et de naviguer dans la version sémantisée du corpus (HdA-Lab – pour Laboratoire). La première version accessible en ligne met l’accent sur la recherche par facettes. HdA-Lab proposera dans les mois qui viennent de nouvelles fonctionnalités : recherche par liste de complétion augmentée, accès multilingue, carte heuristique, index d’auteurs etc.

Ce que permet ce tagging sémantique :

  • la levée d’ambigüités entre tags,
  • l’interopérabilité du corpus avec tout autre utilisant l’URL Wikipedia pour identifier les mots-clés,
  • l’enrichissement automatique de l’indexation par extraction de métadonnées contenues dans les articles de Wikipédia,
  • des fonctionnalités de recherche enrichies car utilisant les relations logiques sous-jacentes aux contenus de Wikipédia (par exemple les relations d’inclusion entre villes, départements et régions de France).

Vu dans C/blog Culture & numérique

 


[1] Ce projet implique l’Institut de Recherche et d’Innovation (IRI) et le Département des Programmes Numériques (DPN) du Ministère de la Culture et de la Communication et utilise les données du site Histoiredesarts.culture.fr

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.