Archives par étiquette : thesaurus

Mise à jour des services d’Agrovoc

La FAO annonce une mise à jour des services pour exploiter Agrovoc.

Agrovoc   est le vocabulaire contrôlé  et un thésaurus couvrant tous les domaines d’intérêt de la FAO incluant la nourriture, l’alimentation l’agriculture la pêche, l’environnement etc… (voir les billets sur blog concernant Agrovoc). Il contient 32000 concepts organisé en hiérarchie avec des traductions en 22 langues.

AGROVOC est disponible dans le language  RDF/SKOS-XL, accessible à partir d’un SPARQL endpoint et peut être téléchargé suivant différent formats. Il est également possible d’inclure Agrovoc dans les applications spécifiques à travers des web services et de le parcourir à travers le site web. Agrovoc est  disponible dans les formats du web de données (linked data) et très utilisé dans toutes les applications en agriculture proposant des données dans ces formats.

AGROVOC est géré grâce à VocBench,  une plateforme open source qui permet de travailler en mode collaboratif et d’éditer des ressources multilingues. Les outils disponibles permettent de :

Agrovoc et Agroportal

AGROVOC est également désormais intégré au portail d’ontologies en agriculture AgroPortal: http://agroportal.lirmm.fr/ontologies/AGROVOC. Ceci permet de facilement créer des alignements (liens d’équivalence) de concepts entre des ontologies hébergées dans AgroPortal (dont de nombreuses produites à l’Inra) et Agrovoc. Ces liens permettent par exemple d’enrichir un concept de son ontologie avec des équivalents dans de nombreuses langues fournis par Agrovoc.

Source : An update of Agrovoc web services. AIMS blog (Agriculture Information Management Standards) . 14 avril 2017 http://aims.fao.org/activity/blog/update-agrovoc-web-services

Le thésaurus de l’Unesco publié dans les standards du web sémantique, avec des logiciels libres

Le thésaurus de l’Unesco vient d’être publié et mis en ligne sur la plateforme http://vocabularies.unesco.org. Un billet de la société Sparta, qui a réalisé le travail, explique les technologies utilisées pour ce projet.

Le projet a été mené en deux phases :

Une plateforme de publication qui s’appuie sur  Skosmos , SKOS Play et Fuseki  La couche sémantique est assurée par la publication des données en SKOS, l’un des standards du web sémantique en tant que format d’échange des données, par une interface SPARQL qui permet d’interroger ou d’exploiter les données et par des identifiants URI déréférençables.

Skosmos  permet d’avoir une interface en 4 langues (français, anglais, espagnol et Russe), de naviguer dans le thésaurus et de rechercher directement dans la base documentaire UNESDOC.

unesco-skosmos

UNESCO thesaurus published in Skosmos (Sparna)

SKOS Play  a été utilisé pour générer automatiquement une version du Thesaurus en PDF avec plusieurs entrées.

Fuseki,avec un formulaire personnalisé en SPARQL, est utilisé pour la recherche publique dans le  public SPARQL querying of the thesaurus.

La deuxième phase correspond à l’outil de gestion du thésaurus. Celle-ci est réalisée avec VocBench, un outil libre de gestion de Thesaurus, multi-utilisateurs, en SKOS  développé par l’université de Tor Vergata à Rome. VocBench s’appuie sur le standard SKOS-XL et sur  GraphDB, un « tripplestore » RDF.

unesco-vocbench

UNESCO Thesaurus managed in VocBench (source SPARNA)

Source : UNESCO Thesaurus published with Semantic Web standards and Open-Source software. 6 février 2017. http://blog.sparna.fr/2017/02/06/unesco-thesaurus-published-with-semantic-web-standards-and-open-source-software/. visité le 6 février 2017.

Thésaurus PLOS : test d’appariement avec DBpedia

LD_POC_Fig1-690x320PLOS utilise pour classer ses contenus (subject areas) son propre thésaurus. Relier celui-ci à des ressources externes, en particulier à DBpedia qui est au cœur du nuage de données liées, lui apporterait une visibilité accrue. C’est dans cette optique que des tests ont été réalisés pour mettre en correspondance les termes du thésaurus avec les concepts de DBpedia.

Les tests ont porté sur la section « Psychology » du thésaurus (119 termes), jugée intéressante car mêlant des termes très techniques et des termes du langage courant. La mise en correspondance a été réalisée avec l’API de DBpedia Spotlight. Les URIs et les définitions de DBpedia ont été ensuite importées dans des champs spécifiques du thésaurus (géré avec MAIstro™).

Seuls 59,7% des termes ont pu être appariés sans ambiguïté avec un concept de DBpedia, ce qui n’est pas un résultat suffisant pour s’abstenir de toute intervention manuelle. Par contre DBpedia Spotlight est une aide à l’appariement puisque 72,3% des termes sont apparus parmi les 5 meilleurs résultats pour la mise en correspondance.

L’étape suivante serait de publier le thésaurus dans le Web des données liées, au format SKOS ou OWL, et d’y intégrer les liens vers DBpedia sous forme d’assertions owl:sameAs. D’autres outils comme SILK Linked Data Integration Framework pourraient alors être utilisés pour relier les concepts du thésaurus à des ressources externes.

Article source : PLOS and DBpedia – an experiment towards Linked Data

Gestion de vocabulaire : Nouvelle version de TemaTres

tematres Tematres vient d’être mis à jour (dernière version 2.0). Cet outil permet de gérer des vocabulaires de tous types :  taxonomies thesaurus ontologie (?) . avec de nouvelles fonctionnalités comme l’interaction avec Moodle, un résumé sur chaque terme, la possibilité d’éditer des rapports et de nouvelles fonctions d’import….Plus de 300 vocabulaires sont disponibles à travers cet outil.

A noter que la FAo développe Vocbench (cité plusieurs fois sur ce blog) , un outil qui rassemble la plupart de ces fonctionnalités mais qui permet la création de rôles pour travailler collectivement sur les termes.

Sources : TemaTres 2.0 released. Diego Ferreyra. August 10, 2015.http://www.vocabularyserver.com/blog/tematres-2-0-released/

Une réunion d’experts pour renforcer les aspects sémantiques en agriculture

schemaGACS

from http://aims.fao.org/sites/default/files/files/Breakout_1.pdf

Un workshop « Improving Semantics in Agriculture » a réuni 35 experts  à la FAO les 2 et 3 juillet 2015. Les présentations sont disponibles sur le site AIMS. L’Inra était présent.

L’objectif de ce workshop était de dresser une feuille de route de  gestion de l’information partagée en agriculture en s’appuyant sur le partage de données sémantiques.

Le GACS (« Global Agricultural Concept Scheme ») voir le billet sur ce blog,  a commencé le travail dans cette direction en créant un noyau commun pour les trois thesaurus  majeurs en agriculture – Agrovoc, CAB et NAL – pour créer un entrepôt global de l’information conceptuelle et terminologique.

Il reste encore beaucoup à faire pour créer un point de référence et un hébergement pour les vocabulaires, taxonomies et ontologies en agriculture et nutrition. Après la phase d’expérimentation et de prototype, cette réunion avait pour objectif de proposer des pistes d’ évolutions futures.

Une synthèse « Préworkshop » des besoins de chaque institutions présente a été réuni dans un document. Les présentations des différents intervenants  et l’enregistrement audio des séances sont disponibles sur   http://aims.fao.org/node/117665

Souce « Improving Semantics in Agriculture » Workshop. 2-3 July 2015, FAO HQ. AIMS. http://aims.fao.org/node/117665

Bartoc, LOV et VEST : des répertoires d’ontologies, de thesaurus et de vocabulaires

http://www.bartoc.org/

Le registre de l’Université de Bâle comprend 600 ontologies/thesauri/vocabulaires en 65 langues : http://Bartoc.org . Les ressources sont classées selon la classification décimale de Dewey (DCC) et le thesaurus Eurovoc (CEE). L’onglet « Ressources » répertorie des sites contenant plusieurs vocabulaires.

http://lov.okfn.org/dataset/lov/

LOV recense des vocabulaires pour des applications en linked open data, RDFS ou des ontologies en OWL.

http://aims.fao.org/vest-registry/browse-by-vocabularies

VEST Registry est un répertoire de la FAO sur des vocabulaires principalement à utiliser en indexation. Il contient plus de 500 vocabulaires.

Le plus gros thésaurus chinois dans le domaine de l'agriculture publié en linked Open Data

Le Chinese Agricultural Thesaurus (CAT), avec plus de 63 000 concepts (32 000 pour Agrovoc) et 130 000 relations sémantiques, est le plus gros thésaurus chinois dans le domaine de l’agriculture. Maintenu par l’Agricultural Information Institute (AII) du Chinese Academy of Agricultural Sciences (CAAS), il vient d’être publié sous la forme de données ouvertes et liées (linked Open Data ou LOD). Les concepts du CAT ont été mis en correspondance[1] avec ceux d’Agrovoc[2], d’Eurovoc[3], du NALT[4] et du LCSH[5], assurant une interopérabilité qui pourra être utilisée pour la recherche et la découverte de connaissances à travers les différentes langues.

[1] La mise en correspondance des concepts de CAT avec ceux d’Agrovoc a été réalisée en collaboration avec la FAO en utilisant les propriétés skos:exactMatch, broadMatch et narrowMatch. Les autres mappings ont été réalisés de façon automatique à partir du nom (rdfs:label) des concepts.
[2] Agrovoc : thésaurus de la FAO
[3] Eurovoc : thésaurus multilingue de l’Union Européenne
[4] NALT : thesaurus agricole de la National Agricultural Library
[5] LCSH : vedettes-matière de la Library of Congress

Vu sur AIM’s blog

Thésaurus pour la recherche documentaire : livre blanc pour la norme ISO 25964-1

livre blanc norme thesaurusCe Livre Blanc propose à la communauté francophone une présentation générale de la première partie de la norme ISO 25964-1 – Thésaurus pour la recherche d’information[1]. Il en expose les grandes lignes et les nouveautés, ambitionnant de donner aux professionnels des éléments de réflexion sur les enjeux sémantiques et techniques de cette norme et des pistes d’actions à mener.

Cette nouvelle norme intègre une documentation à caractère technique qui devrait faciliter le déploiement d’applications conformes à ses directives : clauses normatives sur l’intégration de thésaurus dans les applications, les formats d’échange, les protocoles et les modèles de données, informations sur le schéma XML.
Le livre blanc consacre un chapitre aux différents composants du thesaurus identifiés dans la norme : thésaurus, concepts, termes, relations entre concepts et entre concepts et termes, regroupements de concepts par thèmes ou par facettes et associe à chacun un exemple concret et une description dans le modèle de données. Un autre chapitre concerne les usages du thésaurus et de ses composants, des points de vue technique et fonctionnel : présentation des thésaurus pour consultation, formats et protocoles d’échange, conception, gestion et maintenance des thésaurus.

[1] La norme ISO 25964-1:2011 a paru officiellement, dans sa version anglaise, en août 2011. Elle annule les normes internationales et françaises sur les thésaurus précédemment publiées.
La partie 2 de la norme concernera l’interopérabilité avec les autres vocabulaires et sera publiée début 2013.

Le thesaurus Agrovoc en linked open data

Annoncée le 17/07 sur le site de la FAO Agricultural Information Management Standards (AIMS)

Le vocabulaire  international en agriculture de la FAO, AGROVOC a été mis à jour. Cette nouvelle version 2012 contient 625,096 termes dans 22 langues différentes dont le malaisien, le telugu et le turc.

Il est possible d’explorer Agrovoc en recherche  (by searching terms) ou  en naviguant dans le site (browsing hierarchies). AGROVOC 2012 est disponible en téléchargement, et accessible via webservices (Les web services sont  permettent aux programmateur d’implémenter ou d’utiliser Agrovoc  dans n’importe quelle application).

AGROVOC est aussi publié en linked data et aligné (lié quand un terme est équivalent) avec d’autres vocabulaires voir la page Agrovoc Linked Open Data.

Exemple : accès en Agrovoc Linked Open Data au terme « agriculture  biologique ». Le concept c_2961 est celui utilisé dans Agrovoc quand vous rechercher le terme http://aims.fao.org/aos/agrovoc/c_29261.

Le concept « Organic agriculture » de Agrovoc  en Linked Open Data vu dans l’outil de visualisation Pubby

Le Sparql Endpoint qui permet d’interroger Agrovoc en Linked Data avec le langage SPARQL se trouve à l’adresse suivante : http://agrovoc.mimos.my:55824/catalogs/performance/repositories/agrovoc#.

Des exemples de la syntaxe SPARQL sont aussi donnés sur la page Agrovoc Linked Open Data.

Agrotagger: indexation automatique de PDFs avec le thesaurus Agrovoc

Le site  Agrotagger 2.0 en version bêta (démonstration) permet de « tagger » ou d’indexer automatiquement, en anglais, vos documents en PDF ou en format Word à l’aide du thesaurus Agrovoc de la FAO. Il utilise un extracteur de terme KEA (qui semble un peu ancien). Les résultats (mots-clés) sont présentés  sous la forme de triplets RDF avec des renvois dans Agrovoc et un nuage de tags des mots clés.
http://agrovoc.mimos.my:58301/AgroTagger/

Voici une démonstration sur le PDF de l’article : Laurent Bréhélin L.; Gascuel O.; Martin O. (2008) Using repeated measurements to validate hierarchical gene clusters. Bioinformatics 24 (5): 682-688. doi : 10.1093/bioinformatics/btn017. Les mots clés trouvés sont les suivants :

Tags Agrovoc URIs
genes http://aims.fao.org/aos/agrovoc/c_27532
gene expression http://aims.fao.org/aos/agrovoc/c_27527
Bioinformatics http://aims.fao.org/aos/agrovoc/c_37958
Animal husbandry http://aims.fao.org/aos/agrovoc/c_25746
genomes http://aims.fao.org/aos/agrovoc/c_3224
Cell differentiation http://aims.fao.org/aos/agrovoc/c_2265
operations research http://aims.fao.org/aos/agrovoc/c_5364
Experimental design http://aims.fao.org/aos/agrovoc/c_29466
transcription http://aims.fao.org/aos/agrovoc/c_35127
Sampling http://aims.fao.org/aos/agrovoc/c_6774

Un autre service est développé  par la FAO dans le cadre du projet agINFRA, utilisant le Framework d’indexation Maui. Une version de test est disponible :  http://maui-indexer.appspot.com/

Le résultat sur le même article est le suivant

Input document : Vol. 24 no. 5 2008, pages 682–688 BIOINFORMATICS doi:10.1093/bioinformatics/btn017 Gene expression Using repeated measurements to validate hierarchical gene clusters.

Source : voir http://aims.fao.org/agrotagger