Archives par étiquette : linked open data

I4OC et Open Citation Corpus pour la citation ouverte

L’initiative pour des citations ouvertes, The Initiative for Open Citations,  I4OC est une collaboration entre des éditeurs scientifiques, des chercheurs et d’autres organismes intéressés pour promouvoir la disponibilité sans restrictions des données sur les citations entre les publications scientifiques.

Les citations ne sont généralement pas accessibles en libre accès, elles sont souvent soumises à des licences incohérentes, difficiles à analyser, et sont rarement lisibles par des machines [1]. Les données sur les citations de Crossref seront diffusées par les partenaires qui voient ainsi une nouvelle manière d’identifier les réseaux de recherches à travers les réseaux de citations ou encore, pour les financeurs, de mieux évaluer l’impact des publications [2].

Les données sur les citations sont déposées dans Crossref par les éditeurs et alimentent le service Cited By. Un éditeur participant à I4OC pourra rendre disponibles les citations identifiées par un DOI dont il gère le préfixe et qui seront alors accessibles via les services de CrossRef Metadata Delivery, en particulier via une API REST (voir le guide de l’API  et la FAQ) et un dump.

I4OC  mettra régulièrement à jour le corpus public de citations. Les citations sont aussi disponibles à travers le OpenCitations Corpus,  une base de données qui moissonne systématiquement les données de Crossref et d’autres sources, et qui met ces données à disposition, en “linked open data” suivant l’ontologie Spar – Semantic Publishing and Referencing Ontologies, ainsi qu’un SPARQL Endpoint  pour l’interrogation. Open Citation Corpus diffuse les données sous licence CC0 No Rights Reserved.

Les fondateurs de l’initiative I4OC sont : OpenCitations, Wikimedia Foundation, PLOS, eLife, DataCite et le Centre for Culture and Technology de Curtin University ainsi que des chercheurs (liste reprise du site [1]):  Jonathan Dugan, Martin Fenner, Jan Gerlach, Catriona MacCallum, Daniel Mietchen, Cameron Neylon, Mark Patterson, Michelle Paulson, Silvio Peroni, David Shotton, and Dario Taraborelli.

Le nombre d’éditeurs et des différentes parties intéressées (stakeholders) par l’initiative I4OC  est assez impressionnants voir [1].

sources

  1. i4oc : Initiative for Open Citations.  https://i4oc.org/
  2. Initiative for Open Citations (I4OC) launches with early success. Retrieved April 10, 2017, from http://www.alphagalileo.org/ViewItem.aspx?ItemId=174352&CultureCode=en
  3. OpenCitations  Retrieved April 10, 2017, from http://opencitations.net/

    voir aussi :

    Schiermeier, Q. (n.d.). Initiative aims to break science’s citation paywall. Nature News. https://doi.org/10.1038/nature.2017.21800
    Now free: citation data from 14 million papers, and more might come. Retrieved April 13, 2017, from http://www.sciencemag.org/news/2017/04/now-free-citation-data-14-million-papers-and-more-might-come

Persée ouvre son portail de données liées http://data.persee.fr/

Le portail Persée regroupe 650 000 publications scientifiques accessibles librement et gratuitement et  permet une recherche au travers d’outils de navigation exploitant trois index (documents, illustrations et auteurs) et proposant des fonctionnalités de tri par facettes. L’Unité Mixte de Service Persée propose maintenant l’exposition de ses données au format RDF au travers de son triplestore data.persee.fr.

Il ne s’agit toutefois pas uniquement d’une exposition des données, le portail data.persee.fr. se distingue par :

Des alignements avec des référentiels nationaux et internationaux qui “permettent de questionner non plus seulement les données de Persée, mais également celles proposées par IdRef, DBpedia, data.bnf.fr, le Cairo Gazetteer, GBIF, … en une seule et même requête.” (voir le document source cité en référence)

Plusieurs modes d’exploration sont disponibles : le sparql endpoint pour les initiés et l’outil Sparklis qui permettra au plus grand nombre de formuler ses requêtes en langage naturel, sans connaissance a priori des contenus et de leurs modèles.

Des outils de visualisation des données et jeux de données.

Des services d’accompagnement : tutoriels, formations et des lieux d’interaction avec Persée permettant la co-construction de jeux de données et d’outils pour les exploiter.

Le site http://data.persee.fr/

 

Les contacts pour ce projet sont :

  • Nathalie Fargier | nathalie.fargier@persee.fr | 04 26 73 14 80
  • Viviane Boulétreau | viviane.bouletreau@persee.fr | 04 26 73 14 82

Sources : Persée ouvre son triplestore : data.persee.fr et renforce son inscription dans l’environnement des données liées. 10 février 2017.  http://www.persee.fr/documents/10099/0/Annoncesortiedata.pdf/944c70b4-bd11-4f02-9053-570c44e44577. consulté le 10 févier 2017.

Voir aussi les tutoriels sur le site Canalu.tv : https://www.canal-u.tv/producteurs/persee/data_persee_fr.