Archives par étiquette : tagging

JocondeLab : utilisation du web sémantique pour un accès multilingue aux ressources culturelles françaises

JocondeLab, site issu d’un projet expérimental de tagging sémantique contributif appliqué à 300 000 œuvres de la base Joconde du ministère de la Culture et de la Communication, a été inauguré le 27 janvier. Exploitant les technologies du Web des données il relie les mots-clés de la base Joconde aux entrées de DBpedia en français. Ces liens permettent d’enrichir la recherche et la navigation sur le site avec les métadonnées extraites de Wikipedia, et en particulier les termes équivalents dans diverses langues, offrant ainsi un accès multilingue aux ressources sans qu’il ait été nécessaire de passer par une étape de traduction. Les entrées de Wikipedia sont également utilisées pour suggérer, par autocomplétion, les tags qu’un contributeur (anonyme) peut ajouter pour décrire une œuvre de son choix ou proposée par JocondeLab. JocondeLab est actuellement proposé en 14 langues. Outre la recherche, le site permet de naviguer à partir d’une carte du monde, d’une frise chronologique ou d’un nuage de mots-clés.

Le projet Joconde-Lab est dirigé par la délégation générale à la langue française et aux langues de France en collaboration avec le service des musées de France et le département des programmes numériques. La plate-forme est développée par l’Institut de Recherche et d’Innovation (IRI).

En savoir plus : http://jocondelab.iri-research.org/jocondelab/about/

Vu sur : ENSSIB

 

Tagging sémantique : HdA-BO et HdA-Lab

Dans le cadre d’un projet de recherche et développement[1], les potentialités du tagging sémantique sont explorées sur un corpus d’Histoire des Arts (HdA) à travers deux outils :

  • un module de tagging  (HdA-BO – pour Back Office) permettant aux contributeurs d’utiliser, pour décrire les ressources, des titres d’articles de Wikipedia. Ces tags constitués des entrées de Wikipédia sont dotés de métadonnées, dont les URIs de DBpedia.org correspondants.
  • une interface permettant aux utilisateurs de rechercher et de naviguer dans la version sémantisée du corpus (HdA-Lab – pour Laboratoire). La première version accessible en ligne met l’accent sur la recherche par facettes. HdA-Lab proposera dans les mois qui viennent de nouvelles fonctionnalités : recherche par liste de complétion augmentée, accès multilingue, carte heuristique, index d’auteurs etc.

Ce que permet ce tagging sémantique :

  • la levée d’ambigüités entre tags,
  • l’interopérabilité du corpus avec tout autre utilisant l’URL Wikipedia pour identifier les mots-clés,
  • l’enrichissement automatique de l’indexation par extraction de métadonnées contenues dans les articles de Wikipédia,
  • des fonctionnalités de recherche enrichies car utilisant les relations logiques sous-jacentes aux contenus de Wikipédia (par exemple les relations d’inclusion entre villes, départements et régions de France).

Vu dans C/blog Culture & numérique

 


[1] Ce projet implique l’Institut de Recherche et d’Innovation (IRI) et le Département des Programmes Numériques (DPN) du Ministère de la Culture et de la Communication et utilise les données du site Histoiredesarts.culture.fr