Archives de l’auteur : Sylvie Cocaud

ISTEX : extensions pour Firefox et Chrome

Parmi les améliorations apportées par la nouvelle version de l’API (4.1.0),  annoncées dans le billet de blog dédié à la platerforme ISTEX “L’OpenURL passe la seconde…“, deux extensions pour les navigateurs Chrome et Firefox, permettant d’afficher automatiquement un bouton « ISTEX » redirigeant l’utilisateur vers le plein texte PDF lorsqu’il est disponible, seront bientôt rendues publiques.

En attendant, il est déjà possible de bénéficier de cette fonctionnalité dans Google Scholar en le paramétrant pour accéder aux textes intégraux des ressources acquises par ISTEX :

  • aller dans les paramètres de Google Scholar,
  • liens vers les bibliothèques
  • Afficher les liens permettant d’accéder aux bibliothèques suivantes (cinq au maximum) : saisir “istex” et cliquer sur chercher
  • “ISTEX – [PDF] ISTEX” est proposé : le sélectionner
  • Enregistrer

Exemple de résultat dans Google Scholar :

ISTEX : initiative d’excellence en Information scientifique et technique

Vu à : Atelier Interroger et exploiter l’API ISTEX organisé au cours du CARIST2017

API ISTEX : tutoriels d’interrogation

L’INIST-CNRS vient de mettre à disposition (24/10/2016) de courts tutoriels pour découvrir et utiliser l’API de la plateforme ISTEX (initiative d’excellence en Information scientifique et technique). Pour le moment 3 modules sont proposés avec de nombreux exemples de requêtes.

Voir aussi : la documentation de l’API ISTEX

ISSN : open and not open linked data

La stratégie d’utilisation et de publication de données liées par l’ISSN International Centre a été présentée par Clément Oury au congrès IFLA satellite “Data in libraries: the big picture”[1].
Après deux premières expérimentations de publication de données en linked data (participation au développement du modèle PRESSoo, ontologie pour des ressources continues, et réalisation du projet ROAD), l’ISSN International Centre désire promouvoir l’ISSN comme un des identifiants de référence dans le web des données tout en maintenant son modèle économique. Il poursuit ainsi deux politiques qui peuvent apparaitre contradictoires dans leur application :

  • publier en linked open data d’un ensemble de métadonnées “essentielles” accompagnant l’ISSN (liste qui reste à définir),
  • publier en linked data, mais non open, des données propres du registre des ISSN (données qui ont fait l’objet d’un travail manuel important depuis des années comme les relations entre les titres, les fusions, les éditions spéciales, les traductions… ) ainsi que certains liens avec les ressources externes.

Le futur portail de l’ISSN proposera des services et des outils différents aux utilisateurs gratuits vs payants et plusieurs modèles de données (light, full et expert) seront développés.

[1] Oury, C., 2016. ISSN: Transitioning to linked data, in: Data in Libraries: The Big Picture. Satellite Meeting of IFLA World Library and Information Congress. https://halshs.archives-ouvertes.fr/halshs-01358415/document [slides]

Voir aussi : l’appel d’offre lancé le 12/09/2016 par l’ISSN-IC pour la réalisation de son nouveau portail Web et de son extranet clients.

Scigraph.com : future plateforme linked data de Springer Nature

Scigraph est un projet de plateforme basée sur les technologies des données liées. Ces  technologies sont utilisées tout au long de la chaine de publication : “we had to create an architecture where RDF is core to the publishing workflow as much as XML is” (Michele Pasin [2]). Annoncée pour fin 2016, Scigraph permettra aux scientifiques de parcourir les graphes de connaissances construits à partir des informations contenues dans les articles et enrichies par des ressources externes (DBpedia, MeSH).

Linked Data Experiences at Springer Nature

Linked Data Experiences at Springer Nature. (M. Pasin ). 14/09/2016. Slide 49. Consulté à l’adresse http://www.slideshare.net/mpasin/linked-data-experiences-at-springer-nature

Les modèles (ontologie noyau et ontologies de domaines), les jeux de données (données bibliographiques des articles et références publiées par NPG depuis 1845), les liens vers des ressources externes, sont disponibles depuis 2012 sur le site nature.com ontologies [3][4] sous licence CC BY 4.0. Le sparql endpoint proposé concomitamment mais très peu utilisé a été supprimé en 2014. Toutes les ressources sont également disponibles sur GitHub Nature Pubishing Group

Vu sur Twitter

Pour en savoir plus :

  1. Présentation de M. Pasin à Semantics 2016 : Linked Data Experiences at Springer Nature
  2. Interview de Tony Hammond et Michele Pasin, architectes du portail nature.com, par Andreas Blumauer (30 mars 2016) : Insights into Nature’s Data Publishing Portal
  3. Présentation de T. Hammond et M. Pasin à LISC2015 : The nature.com ontologies portal (Slides)
  4. Communiqué de presse Nature Publishing Group releases linked data platform du 4/04/2012

Voir aussi :

API ScienceDirect et entrepôts institutionnels

L’Université de Floride (UF) et Elsevier ont dévoilé fin mai le résultat du projet pilote sur lequel ils collaborent depuis 2014[1] et qui permet à l’université, par le biais de l’API ScienceDirect, de connecter son entrepôt institutionnel IR@UF à la plateforme ScienceDirect. Les nouveaux articles publiés par les chercheurs de UF dans les revues d’Elsevier sont ainsi automatiquement signalés dans l’entrepôt (les métadonnées des articles anciens ont également été récupérées).

Si ce lien entre la plateforme de l’éditeur et l’entrepôt peut accroître la visibilité des publications des chercheurs de l’UF en améliorant l’interopérabilité des systèmes, il ne permet pas en tant que tel le libre accès à la publication puisque les conditions d’accès de l’utilisateur aux textes intégraux sur la plateforme éditoriale sont inchangées. Par ailleurs il permet à Elsevier de collecter des données sur l’activité des utilisateurs qui accèdent à ces publications.

La prochaine étape annoncée du projet est de permettre à tout utilisateur d’accéder à une version intégrale de la publication sur la plateforme éditoriale : la version de l’éditeur pour les abonnés à Science Direct, la version acceptée du manuscript après une période d’embargo pour les autres.

Source : Opening Up the Repository: University of Florida, Elsevier explore interoperability in the publishing space

[1] Automating IR updates: The University of Florida and Elsevier answer questions about their institutional repository pilot project. By Judith Coffey Russell, University of Florida, and Alicia Wise, Elsevier | July 13, 2015

Mettre nos données en réseau – un démonstrateur

Mettre nos données en réseau

Punktokomo, le Blog technique de l’ABES, vient de mettre en ligne une série de billets très pédagogiques présentant un démonstrateur illustrant la publication de données conformément aux principes et aux bonnes pratiques du web sémantique, dont l’intérêt et les limites actuelles sont clairement exprimés à travers des exemples concrets. Huit études de cas détaillées illustrant le travail effectué permettent de bien comprendre la méthodologie suivie selon les sources.

Les données proviennent des réseaux ABES, des éditeurs, des institutions culturelles ou dédiées à l’information scientifique et technique, de l’administration. Sont ainsi traitées (modélisées et converties en RDF pour le plupart) les documents provenant d’Istex, de HAL, du Sudoc, des référentiels de personnes (VIAF, ORCID, Idref, annuaire de chercheurs de l’Université Paris IV), des référentiels d’organismes (répertoire national des structures de recherche/RNSR, structures HAL), des référentiels sujet (Rameau, Library of Congress Subject Headings, les thésaurus MeSH et Nature, la classification du Journal of economic literature), des référentiels de bouquets (bouquet Dalloz) et des localisations (liste des bibliothèques).

Les alignements sont également publiés : alignements entre les auteurs de Nature et ORCID, entre les auteurs de Nature et l’International Standard Name Identifier (ISNI), entre les auteurs HAL et IdRef, entre les chercheurs de Paris 4 et IdRef, entre les auteurs de Persée et IdRef, entre les auteurs de Nature (puisqu’ils ne sont pas identifiés de façon unique dans le dump RDF de Nature), entre les auteurs Springer et IdRef, entre les documents Springer et RAMEAU, entre les domaines HAL et Dewey, entre les structures de recherche de Paris 4 dans les référentiels RNSR, HAL et IdRef.

La modélisation, succinctement présentée, a fait appel, entre autres, aux modèles FRBR pour les documents, Vivo pour les auteurs/contributeurs. Les métadonnées de Nature Publication Group ont été récupérées directement en RDF avec le modèle spécifique à cet éditeur.

Ces données ont été agrégées dans un entrepôt RDF. L’accès aux données se fait via une requête SPARQL sur le point d’accès https://lod.abes.fr/sparql (de nombreux exemples de requête sont présentés dans les différents billets) ou par navigation depuis l’interface https://lod.abes.fr/fct.

Source : Punktokomo ; | Blog technique de l’ABES

Le Web de données dans les bibliothèques, archives et musées

Les bibliothèques, archives et musées ont consacré ces dernières années un effort considérable pour investir l’univers du Web des données.

La revue Library Technology Reports consacre un numéro spécial à ce sujet identifiant les tendances, les grands projets, les enjeux et les opportunités, les principaux vocabulaires, schémas, standards et technologies utilisés, les services développés.
Mitchell, E. T. (2016). Library Linked Data: Early Activity and Development. Library Technology Reports, 52(1), 37 p. https://journals.ala.org/ltr/issue/download/534/290

Dans le billet critique Linked data caution Jonathan Rochkind (Johns Hopkins University) interroge les motivations et les risques de ce mouvement, où des projets ambitieux et gourmands en ressources peuvent être guidés d’avantage par la technologie que par des objectifs clairement énoncés, au risque de ne répondre ni aux besoins des utilisateurs ni à la volonté de partager des données. Pour lui les principaux obstacles à l’interopérabilité des données et des services concernent avant tout la modélisation des domaines, la description des données et l’utilisation de modèles et référentiels communs (ainsi que la réticence à partager ses données, les modèles économiques des parties prenantes…). Il est important de bien évaluer les potentialités du Web de données dans son projet, se former aux technologies, rester centré sur les besoins des utilisateurs, ne pas sacrifier la qualité des données dans le processus, ne pas investir des ressources importantes dans le projet sans pouvoir en tirer des bénéfices à chaque étape, et, sans attendre que ses données soient publiées dans le Web des données, leur attribuer des identifiants et les partager sous licence libre.

Data Literature Interlinking service

dli_logo_bigLe portail Data Literature Interlinking Service est un service pilote développé conjointement par le groupe de travail Research Data Alliance Europe/WDS Publishing Data Interest Group, OpenAIRE,  et ICSU World Data System. Basé sur l’outil open source pour la construction d’infrastructures de données D-Net et le moteur de recherche Elasticsearch, il intègre, harmonise et interconnecte jeux de données et publications provenant de diverses sources*, générant un graphe de liens entre les jeux de données et entre les jeux de données et la littérature scientifique. Données et relations sont accessibles via une interface de recherche, via des APIs ou via le protocole OAI-PMH. Des statistiques sur les sources (nombre de jeux de données, de publications et de liens) sont également disponibles. L’enjeu est d’améliorer la visibilité, l’accessibilité et la réutilisation des données.

* Actuellement 19 sources de données :

  • 3TU Datacentrum
  • Australian National Data Service
  • Cambridge Crystallographic Data Centre
  • CrossRef
  • DataCite Resolver
  • Datasets in DataCite
  • Elsevier
  • ICPSR
  • IEDA
  • IEEE
  • OpenAIRE
  • OpenAIRE Resolver
  • PANGAEA
  • PubMed
  • PubMed Resolver
  • RCSB
  • Springer Nature
  • System Deduction
  • Thomson Reuters

Zotero : comment organiser sa bibliothèque ?

Le blog Zotero francophone inaugure dans sa rubrique “Trucs et astuces” une série de billets sur l’organisation des documents dans Zotero. Le premier billet traite des collections, marqueurs et recherches enregistrées, leurs avantages et leurs inconvénients.
Suivront des cas concrets d’organisation de bibliothèques personnelles.

Zotero : Comment organiser sa bibliothèque ?

Thésaurus PLOS : test d’appariement avec DBpedia

LD_POC_Fig1-690x320PLOS utilise pour classer ses contenus (subject areas) son propre thésaurus. Relier celui-ci à des ressources externes, en particulier à DBpedia qui est au cœur du nuage de données liées, lui apporterait une visibilité accrue. C’est dans cette optique que des tests ont été réalisés pour mettre en correspondance les termes du thésaurus avec les concepts de DBpedia.

Les tests ont porté sur la section “Psychology” du thésaurus (119 termes), jugée intéressante car mêlant des termes très techniques et des termes du langage courant. La mise en correspondance a été réalisée avec l’API de DBpedia Spotlight. Les URIs et les définitions de DBpedia ont été ensuite importées dans des champs spécifiques du thésaurus (géré avec MAIstro™).

Seuls 59,7% des termes ont pu être appariés sans ambiguïté avec un concept de DBpedia, ce qui n’est pas un résultat suffisant pour s’abstenir de toute intervention manuelle. Par contre DBpedia Spotlight est une aide à l’appariement puisque 72,3% des termes sont apparus parmi les 5 meilleurs résultats pour la mise en correspondance.

L’étape suivante serait de publier le thésaurus dans le Web des données liées, au format SKOS ou OWL, et d’y intégrer les liens vers DBpedia sous forme d’assertions owl:sameAs. D’autres outils comme SILK Linked Data Integration Framework pourraient alors être utilisés pour relier les concepts du thésaurus à des ressources externes.

Article source : PLOS and DBpedia – an experiment towards Linked Data