Archives par étiquette : alignement de vocabulaires

Global Agricultural Concept Scheme (GACS)

Global Agricultural Concept Scheme, dont la première version GACS Beta 1.0 vient de sortir, est un projet collaboratif entre la FAO, CABI et la NAL, coordonné par Catarina Carraciolo (FAO), qui a pour objectif la réalisation d’un vocabulaire (informations terminologiques et conceptuelles) commun en agriculture, basé sur les principes et technologies du web de données.

La FAO, CABI et la NAL maintiennent chacun un thésaurus dans le domaine de l’agriculture :

  • Agrovoc : 32 000 concepts, 1,2 million de termes (20 langues)
  • CAB thesaurus : 140 000 concepts, 1,4 million de termes (anglais, espagnol, portugais, allemand, plus d’autres langages sur une moindre couverture)
  • NAL thesaurus : 53 000 concepts, 200 000 termes (anglais, espagnol)

L’enjeu est de fournir des concepts partagés par ces trois thesauri (+ de 13600 concepts communs), d’améliorer leur interopérabilité et de réaliser des économies d’échelle en coopérant pour la maintenance des concepts de base.
GACS Beta est une preuve de concept : chaque partenaire a fourni les 10 000 concepts les plus utilisés dans leurs bases respectives. Les pays, ainsi que la hiérarchie des organismes, ont été ajoutés. La mise en correspondance (mapping) automatique des concepts a été vérifiée ensuite manuellement par les organisations partenaires (5 à 600 heures). Plus de 15 000 concepts ont été identifiés dans GACS Beta à l’issue de ce mapping,.

Outils utilisés

Pour en savoir plus sur les aspects techniques du projet : Global Agricultural Concept Scheme (présentation de Osma Suominen et Thomas Baker).

Source : Global Agricultural Concept Scheme (GACS) Beta 1.0 released | Agricultural Information Management Standards (AIMS)

Concepts et vocabulaires : les différentes représentations de la réalité

La déclinaison d’un concept qui peut paraitre univoque ou consensuel peut varier selon les vocabulaires. A partir d’un exemple – Le concept « France » à travers 4 thésaurus – Sylvie Dalbin montre pourquoi il est important de connaitre le contexte d’usage et l’histoire de ces vocabulaires et de comprendre les modèles sous-jacents avant de les utiliser, en particulier pour aligner1 ses propres données à l’un d’eux.

  1. Aligner différents vocabulaires consiste à identifier les termes qui leur sont communs et à enregistrer ces relations (voir Linked data glossary ).