Archives par étiquette : crossref

Crossref Event Data pour observer et analyser les événements sur le web

Tracez les activités autour de vos jeux de données et publications grâce à leur DOI !

Un nouveau service de Crossref vient de voir le jour : Event Data. Aujourd’hui, les données et publications ne sont plus cantonnées aux portails des éditeurs et autres entrepôts. Ils sont l’objet de nombreux évènements web : citation dans des blogs, liens, signets, commentaires, partage sur les réseaux sociaux, etc. On estime à plus de 100 000 le nombre quotidien de ces évènements, autant d’informations qu’il est désormais possible d’observer et d’analyser grâce à  Crossref Event Data.

Crossref Event Data collecte et conserve cette activité et la rend accessible à travers ses services en toute transparence. Les données sont brutes et ne dépendent d’aucun traitement ou métrique. Autre point important : la provenance et le contexte de collecte de chaque événement sont également disponibles.

Event Data se positionne d’ors et déjà comme un service incontournable dans la production des métriques alternatives pour les résultats de recherche. Il peut aussi être utilisé directement par les bibliométriciens pour enrichir leurs données.

L’API de test est dès à présent accessible ici : https://www.crossref.org/services/event-data/

I4OC et Open Citation Corpus pour la citation ouverte

L’initiative pour des citations ouvertes, The Initiative for Open Citations,  I4OC est une collaboration entre des éditeurs scientifiques, des chercheurs et d’autres organismes intéressés pour promouvoir la disponibilité sans restrictions des données sur les citations entre les publications scientifiques.

Les citations ne sont généralement pas accessibles en libre accès, elles sont souvent soumises à des licences incohérentes, difficiles à analyser, et sont rarement lisibles par des machines [1]. Les données sur les citations de Crossref seront diffusées par les partenaires qui voient ainsi une nouvelle manière d’identifier les réseaux de recherches à travers les réseaux de citations ou encore, pour les financeurs, de mieux évaluer l’impact des publications [2].

Les données sur les citations sont déposées dans Crossref par les éditeurs et alimentent le service Cited By. Un éditeur participant à I4OC pourra rendre disponibles les citations identifiées par un DOI dont il gère le préfixe et qui seront alors accessibles via les services de CrossRef Metadata Delivery, en particulier via une API REST (voir le guide de l’API  et la FAQ) et un dump.

I4OC  mettra régulièrement à jour le corpus public de citations. Les citations sont aussi disponibles à travers le OpenCitations Corpus,  une base de données qui moissonne systématiquement les données de Crossref et d’autres sources, et qui met ces données à disposition, en « linked open data » suivant l’ontologie Spar – Semantic Publishing and Referencing Ontologies, ainsi qu’un SPARQL Endpoint  pour l’interrogation. Open Citation Corpus diffuse les données sous licence CC0 No Rights Reserved.

Les fondateurs de l’initiative I4OC sont : OpenCitations, Wikimedia Foundation, PLOS, eLife, DataCite et le Centre for Culture and Technology de Curtin University ainsi que des chercheurs (liste reprise du site [1]):  Jonathan Dugan, Martin Fenner, Jan Gerlach, Catriona MacCallum, Daniel Mietchen, Cameron Neylon, Mark Patterson, Michelle Paulson, Silvio Peroni, David Shotton, and Dario Taraborelli.

Le nombre d’éditeurs et des différentes parties intéressées (stakeholders) par l’initiative I4OC  est assez impressionnants voir [1].

sources

  1. i4oc : Initiative for Open Citations.  https://i4oc.org/
  2. Initiative for Open Citations (I4OC) launches with early success. Retrieved April 10, 2017, from http://www.alphagalileo.org/ViewItem.aspx?ItemId=174352&CultureCode=en
  3. OpenCitations  Retrieved April 10, 2017, from http://opencitations.net/

    voir aussi :

    Schiermeier, Q. (n.d.). Initiative aims to break science’s citation paywall. Nature News. https://doi.org/10.1038/nature.2017.21800
    Now free: citation data from 14 million papers, and more might come. Retrieved April 13, 2017, from http://www.sciencemag.org/news/2017/04/now-free-citation-data-14-million-papers-and-more-might-come

Scholix : lier les données de la recherche et la littérature scientifique

scholix2La Research Data Alliance (RDA) et le  International Council for Science World Data System (ICSU-WDS) ont annoncé un nouvel environnement pour lier les publications et les données de la recherche :  The Scholix framework pour  Scholarly Link Exchange.

Scholix consiste en un ensemble de principes et de guides pratiques  pour implémenter des services facilitant la réutilisation, la reproductibilité  des données et l’évaluation transparente de la science.

Les premières recommendations (Guidelines) sont élaborées dans le groupe de travail de RDA : « WDS-RDA Data Publishing Services Working Group« . Elles expliquent que ce travail s’appuie sur les systèmes qui concentrent déjà l’information sur les liens entre la littérature et les données de la recherche et qui sont issus de différentes communautés, par exemple  :

  • CrossRef : système d’agrégation pour les éditeurs
  • DataCite : système d’agrégation pour les « data centre »
  • OpenAIRE : système d’agrégation pour les entrepôts institutionnels : données, preprints et publications
  • Des lieux d’intégration spécifiques à certains domaines scientifiques comme PubMed, Inspire….

Il y a deux options pour que les systèmes d’informations participent à Scholix (onglet participate) :

  • option 1 : les systèmes d’informations fournissent les liens entre données et publications à travers les schéma de métadonnées standards existants, comme Datacite ou Crossref ;
  • option 2 : le système d’information peut devenir un « hub » et partager ses informations sur les publications et les données en utilisant les standards Scholix décrits dans les Guidelines. Le système fournissant ce service sera alors rajouté à la liste des premiers services utilisant ces standards. A voir le DLI service développé par OpenAIRE et Pangaea : http://dliservice.research-infrastructures.eu/index.html#

Sources :

Crossref va permettre d’associer des DOI spécifiques aux préprints

A partir du mois d’août 2016, Crossref  va modifier sa politique d’enregistrement des documents auprès de ses membre et va permettre d’assigner des Digital Object Identifiers (DOIs) à des « duplicative works. »  La nouvelle politique signifie que les préprints auront des  DOIs séparés des versions ultérieures et pourront être enregistrés auprès de Crossref. Les différentes versions seront ensuite reliées.

L’article rappelle que « Preprint » est un terme qui a différentes significations mais celle retenue par Crossref est :  « un contenu original qui a pour objectif d’être publié dans une publication classique, incluant un contenu qui a déjà été soumis, mais pas encore accepté pour publication ».(original content which is intended for formal publication, including content that has been submitted, but has not yet been accepted for publication).

Source : Crossref To Accept Preprints In Change To Long-standing Policy. http://www.science20.com/news_articles/crossref_to_accept_preprints_in_change_to_longstanding_policy-171985. Accedé le 6 mai 2016.

Bilbo, un outil d’annotation automatique des références citées dans Revues.org

La plateforme Revues.org est un site de revues en accès libre principalement en SHS, fonctionnant selon le modèle Freemium. Elle fait partie des plateformes de diffusion du  OpenEdition.org.

Open Edition a annoncé la mise en place de Bilbo [2], un  outil d’annotation automatique des références bibliographiques,  dans le cadre du programme de recherche et développement « Robust and Language Independent Machine Learning Approaches for Automatic Annotation of Bibliographical References in DH Books, Articles and Blogs ».

Extrait de [1] : Initié en 2011 suite à l’obtention d’un Google Grant for Digital Humanities, ce programme a été mené par les équipes du LIA (université d’Avignon) puis du LSIS (Aix-Marseille université – CNRS) et du Cléo sous la direction de Patrice Bellot et Marin Dacos.  Il porte sur l’ensemble des références bibliographiques présentes sur les quatre plateformes : Revues.org, Calenda, Hypothèses et OpenEdition Books. Il doit permettre de développer des fonctionnalités avancées de cross-linking (références croisées) entre les contenus d’OpenEdition et vers les contenus extérieurs.

Bilbo permet par exemple de rajouter des DOI aux références des articles de Revues.org (voir ci-dessous).

Sources :

Crossref va lancer Prospect : un service de text mining et data mining

Le service de data mining et text mining de Crossref, Propect, a été approuvé en novembre et sera lancé en 2014. Le pilote est  déjà disponible.

Il y aura deux aspects à ce service :

  • une API  TDM (pour texte standard pour le text mining et le data mining) qui permettra aux chercheurs de demander le texte intégral au site de l’éditeur sous une forme standard.
  • une bibliothèque des conditions d’utilisations pour les éditeurs qui souhaitent que les chercheurs acceptent des conditions d’utilisation. Ces conditions d’utilisation ne sont pas requises quand les documents sont en open access ou quand les chercheurs font partie d’une organisation abonnée à la revue ou aux contenus de l’éditeur.

Pour les informations techniques voir :

Sources :