Archives par étiquette : Agrovoc

Mise à jour des services d’Agrovoc

La FAO annonce une mise à jour des services pour exploiter Agrovoc.

Agrovoc   est le vocabulaire contrôlé  et un thésaurus couvrant tous les domaines d’intérêt de la FAO incluant la nourriture, l’alimentation l’agriculture la pêche, l’environnement etc… (voir les billets sur blog concernant Agrovoc). Il contient 32000 concepts organisé en hiérarchie avec des traductions en 22 langues.

AGROVOC est disponible dans le language  RDF/SKOS-XL, accessible à partir d’un SPARQL endpoint et peut être téléchargé suivant différent formats. Il est également possible d’inclure Agrovoc dans les applications spécifiques à travers des web services et de le parcourir à travers le site web. Agrovoc est  disponible dans les formats du web de données (linked data) et très utilisé dans toutes les applications en agriculture proposant des données dans ces formats.

AGROVOC est géré grâce à VocBench,  une plateforme open source qui permet de travailler en mode collaboratif et d’éditer des ressources multilingues. Les outils disponibles permettent de :

Agrovoc et Agroportal

AGROVOC est également désormais intégré au portail d’ontologies en agriculture AgroPortal: http://agroportal.lirmm.fr/ontologies/AGROVOC. Ceci permet de facilement créer des alignements (liens d’équivalence) de concepts entre des ontologies hébergées dans AgroPortal (dont de nombreuses produites à l’Inra) et Agrovoc. Ces liens permettent par exemple d’enrichir un concept de son ontologie avec des équivalents dans de nombreuses langues fournis par Agrovoc.

Source : An update of Agrovoc web services. AIMS blog (Agriculture Information Management Standards) . 14 avril 2017 http://aims.fao.org/activity/blog/update-agrovoc-web-services

Une réunion d’experts pour renforcer les aspects sémantiques en agriculture

schemaGACS

from http://aims.fao.org/sites/default/files/files/Breakout_1.pdf

Un workshop « Improving Semantics in Agriculture » a réuni 35 experts  à la FAO les 2 et 3 juillet 2015. Les présentations sont disponibles sur le site AIMS. L’Inra était présent.

L’objectif de ce workshop était de dresser une feuille de route de  gestion de l’information partagée en agriculture en s’appuyant sur le partage de données sémantiques.

Le GACS (« Global Agricultural Concept Scheme ») voir le billet sur ce blog,  a commencé le travail dans cette direction en créant un noyau commun pour les trois thesaurus  majeurs en agriculture – Agrovoc, CAB et NAL – pour créer un entrepôt global de l’information conceptuelle et terminologique.

Il reste encore beaucoup à faire pour créer un point de référence et un hébergement pour les vocabulaires, taxonomies et ontologies en agriculture et nutrition. Après la phase d’expérimentation et de prototype, cette réunion avait pour objectif de proposer des pistes d’ évolutions futures.

Une synthèse « Préworkshop » des besoins de chaque institutions présente a été réuni dans un document. Les présentations des différents intervenants  et l’enregistrement audio des séances sont disponibles sur   http://aims.fao.org/node/117665

Souce « Improving Semantics in Agriculture » Workshop. 2-3 July 2015, FAO HQ. AIMS. http://aims.fao.org/node/117665

Global Agricultural Concept Scheme (GACS)

Global Agricultural Concept Scheme, dont la première version GACS Beta 1.0 vient de sortir, est un projet collaboratif entre la FAO, CABI et la NAL, coordonné par Catarina Carraciolo (FAO), qui a pour objectif la réalisation d’un vocabulaire (informations terminologiques et conceptuelles) commun en agriculture, basé sur les principes et technologies du web de données.

La FAO, CABI et la NAL maintiennent chacun un thésaurus dans le domaine de l’agriculture :

  • Agrovoc : 32 000 concepts, 1,2 million de termes (20 langues)
  • CAB thesaurus : 140 000 concepts, 1,4 million de termes (anglais, espagnol, portugais, allemand, plus d’autres langages sur une moindre couverture)
  • NAL thesaurus : 53 000 concepts, 200 000 termes (anglais, espagnol)

L’enjeu est de fournir des concepts partagés par ces trois thesauri (+ de 13600 concepts communs), d’améliorer leur interopérabilité et de réaliser des économies d’échelle en coopérant pour la maintenance des concepts de base.
GACS Beta est une preuve de concept : chaque partenaire a fourni les 10 000 concepts les plus utilisés dans leurs bases respectives. Les pays, ainsi que la hiérarchie des organismes, ont été ajoutés. La mise en correspondance (mapping) automatique des concepts a été vérifiée ensuite manuellement par les organisations partenaires (5 à 600 heures). Plus de 15 000 concepts ont été identifiés dans GACS Beta à l’issue de ce mapping,.

Outils utilisés

Pour en savoir plus sur les aspects techniques du projet : Global Agricultural Concept Scheme (présentation de Osma Suominen et Thomas Baker).

Source : Global Agricultural Concept Scheme (GACS) Beta 1.0 released | Agricultural Information Management Standards (AIMS)

Mise à jour de Agrovoc

Clipboard

Source: New AGROVOC release is out!

Le vocabulaire  international en agriculture de la FAO, AGROVOC a été mis à jour le 23 juillet  2014. Ce billet fait suite et réactualise le billet de du 12 septembre 2012 sur Agrovoc : Le thesaurus Agrovoc en linked open data.

Il est disponible aux adresses suivantes :

Il peut être également consulté en navigation sur le site web :  http://aims.fao.org/agrovoc/

Cette version apporte des nouveautés : une version ukrainienne (800 termes), la révision du Turc, et une version étendue de la couverture linguistique : allemand (plus de 10000 termes), anglais, espagnol et Italien avec plus de 1000 nouveaux termes chacun. Il n’est pas fait mention d’amélioration des contenus en français. La couverture des insectes comestibles (« edible insects ») en cinq langues a été ajoutée.

Agrovoc est maintenant aligné en linked open Data (LOD) avec le EARTh thesaurus, un thesaurus de référence sur l’Environnement.

Sur un aspect plus technique on peut noter :

  • Une amélioration du RDF dataset par suppression des triplets qui étaient le plus souvent redondants ;
  • Suppression des xLabels sans forme littérale ;
  • Suppression des labels altLabel qui répétaient le prefLabel ;
  • Création de nouveaux xLabels pour les chaines qui n’en avaient pas  (ceci change particulièrement la manière d’épeler les variantes)

Le vocabulaire de l’ontologie à également changé  (agrontology vocabulary) :

  • La propriété “hasRelatedType” est remplacée par la propriété standard skos:related ;
  • La propriété « hasSpellingVariant » est remplacée par la propriété « spellingVariant » (relation symétrique)

L’évolution d’Agrovoc et sa distribution en LOD  sont très importants pour le domaine de la gestion des connaissances pour les sciences de l’agronomie et de l’environnement. L’alignement d’Agrovoc avec d’autres vocabulaires  (voir Le thesaurus Agrovoc en linked open data) permet d’enrichir des contenus de vocabulaires plus spécifiques.

Voir aussi le billet : Le plus gros thésaurus chinois dans le domaine de l’agriculture publié en linked Open Data

Le plus gros thésaurus chinois dans le domaine de l'agriculture publié en linked Open Data

Le Chinese Agricultural Thesaurus (CAT), avec plus de 63 000 concepts (32 000 pour Agrovoc) et 130 000 relations sémantiques, est le plus gros thésaurus chinois dans le domaine de l’agriculture. Maintenu par l’Agricultural Information Institute (AII) du Chinese Academy of Agricultural Sciences (CAAS), il vient d’être publié sous la forme de données ouvertes et liées (linked Open Data ou LOD). Les concepts du CAT ont été mis en correspondance[1] avec ceux d’Agrovoc[2], d’Eurovoc[3], du NALT[4] et du LCSH[5], assurant une interopérabilité qui pourra être utilisée pour la recherche et la découverte de connaissances à travers les différentes langues.

[1] La mise en correspondance des concepts de CAT avec ceux d’Agrovoc a été réalisée en collaboration avec la FAO en utilisant les propriétés skos:exactMatch, broadMatch et narrowMatch. Les autres mappings ont été réalisés de façon automatique à partir du nom (rdfs:label) des concepts.
[2] Agrovoc : thésaurus de la FAO
[3] Eurovoc : thésaurus multilingue de l’Union Européenne
[4] NALT : thesaurus agricole de la National Agricultural Library
[5] LCSH : vedettes-matière de la Library of Congress

Vu sur AIM’s blog

Le thesaurus Agrovoc en linked open data

Annoncée le 17/07 sur le site de la FAO Agricultural Information Management Standards (AIMS)

Le vocabulaire  international en agriculture de la FAO, AGROVOC a été mis à jour. Cette nouvelle version 2012 contient 625,096 termes dans 22 langues différentes dont le malaisien, le telugu et le turc.

Il est possible d’explorer Agrovoc en recherche  (by searching terms) ou  en naviguant dans le site (browsing hierarchies). AGROVOC 2012 est disponible en téléchargement, et accessible via webservices (Les web services sont  permettent aux programmateur d’implémenter ou d’utiliser Agrovoc  dans n’importe quelle application).

AGROVOC est aussi publié en linked data et aligné (lié quand un terme est équivalent) avec d’autres vocabulaires voir la page Agrovoc Linked Open Data.

Exemple : accès en Agrovoc Linked Open Data au terme « agriculture  biologique ». Le concept c_2961 est celui utilisé dans Agrovoc quand vous rechercher le terme http://aims.fao.org/aos/agrovoc/c_29261.

Le concept « Organic agriculture » de Agrovoc  en Linked Open Data vu dans l’outil de visualisation Pubby

Le Sparql Endpoint qui permet d’interroger Agrovoc en Linked Data avec le langage SPARQL se trouve à l’adresse suivante : http://agrovoc.mimos.my:55824/catalogs/performance/repositories/agrovoc#.

Des exemples de la syntaxe SPARQL sont aussi donnés sur la page Agrovoc Linked Open Data.

Agrotagger: indexation automatique de PDFs avec le thesaurus Agrovoc

Le site  Agrotagger 2.0 en version bêta (démonstration) permet de « tagger » ou d’indexer automatiquement, en anglais, vos documents en PDF ou en format Word à l’aide du thesaurus Agrovoc de la FAO. Il utilise un extracteur de terme KEA (qui semble un peu ancien). Les résultats (mots-clés) sont présentés  sous la forme de triplets RDF avec des renvois dans Agrovoc et un nuage de tags des mots clés.
http://agrovoc.mimos.my:58301/AgroTagger/

Voici une démonstration sur le PDF de l’article : Laurent Bréhélin L.; Gascuel O.; Martin O. (2008) Using repeated measurements to validate hierarchical gene clusters. Bioinformatics 24 (5): 682-688. doi : 10.1093/bioinformatics/btn017. Les mots clés trouvés sont les suivants :

Tags Agrovoc URIs
genes http://aims.fao.org/aos/agrovoc/c_27532
gene expression http://aims.fao.org/aos/agrovoc/c_27527
Bioinformatics http://aims.fao.org/aos/agrovoc/c_37958
Animal husbandry http://aims.fao.org/aos/agrovoc/c_25746
genomes http://aims.fao.org/aos/agrovoc/c_3224
Cell differentiation http://aims.fao.org/aos/agrovoc/c_2265
operations research http://aims.fao.org/aos/agrovoc/c_5364
Experimental design http://aims.fao.org/aos/agrovoc/c_29466
transcription http://aims.fao.org/aos/agrovoc/c_35127
Sampling http://aims.fao.org/aos/agrovoc/c_6774

Un autre service est développé  par la FAO dans le cadre du projet agINFRA, utilisant le Framework d’indexation Maui. Une version de test est disponible :  http://maui-indexer.appspot.com/

Le résultat sur le même article est le suivant

Input document : Vol. 24 no. 5 2008, pages 682–688 BIOINFORMATICS doi:10.1093/bioinformatics/btn017 Gene expression Using repeated measurements to validate hierarchical gene clusters.

Source : voir http://aims.fao.org/agrotagger