Archives de catégorie : Identifiant numérique

Crossref Event Data pour observer et analyser les événements sur le web

Tracez les activités autour de vos jeux de données et publications grâce à leur DOI !

Un nouveau service de Crossref vient de voir le jour : Event Data. Aujourd’hui, les données et publications ne sont plus cantonnées aux portails des éditeurs et autres entrepôts. Ils sont l’objet de nombreux évènements web : citation dans des blogs, liens, signets, commentaires, partage sur les réseaux sociaux, etc. On estime à plus de 100 000 le nombre quotidien de ces évènements, autant d’informations qu’il est désormais possible d’observer et d’analyser grâce à  Crossref Event Data.

Crossref Event Data collecte et conserve cette activité et la rend accessible à travers ses services en toute transparence. Les données sont brutes et ne dépendent d’aucun traitement ou métrique. Autre point important : la provenance et le contexte de collecte de chaque événement sont également disponibles.

Event Data se positionne d’ors et déjà comme un service incontournable dans la production des métriques alternatives pour les résultats de recherche. Il peut aussi être utilisé directement par les bibliométriciens pour enrichir leurs données.

L’API de test est dès à présent accessible ici : https://www.crossref.org/services/event-data/

Open Isni for Organizations, un nouveau service pour partager les identifiants ISNI des organisations

L’ISNI est un code international normalisé servant à identifier de manière univoque, sur le long terme et à l’échelle internationale, les personnes et les organismes. La BnF participe à la création et au maintien de cet identifiant et l’intègre dans ses propres données. […] Il permet d’identifier au niveau international les identités publiques des personnes ou des organismes impliqués dans la création, la production, la gestion et la distribution de contenus intellectuels et artistiques ou faisant l’objet de ces contenus. Les personnes identifiées peuvent être, par exemple, l’auteur, l’éditeur, le traducteur, l’illustrateur ou le sujet d’une œuvre.  (extraits du document de la BNF « Qu’est-ce l’ISNI ? »  http://www.bnf.fr/fr/professionnels/isni_informer.html)

« Open Isni for Organizations »  est un nouveau service  pour partager les identifiants ISNI   (International Standard Name Identifier) et les données de plus de  400,000 organisations dans le monde. Le service propose « Open Isni for Organizations » propose :

  • Une API pour obtenir et résoudre les ISNI d’organisation déjà existantes
  • un jeu de données complet à  télédécharger  contenant les ISNI, les noms des organisations, les localisations, les noms alternatifs et les URL et disponible dans les formats Json et CSV.
  • Un service en ligne gratuit pour rechercher les notices ISNI.

Ringgold  est une agence d’enregistrement des ISNI  permet la mise à dispotition des données. Cependant les données propriétaires détenues par Ringgold  comme le  Ringgold ID, metadata, les métadonnées, la démographie et les relations d’organisation, ne ne sont pas disponibles dans ce jeu de données.

Ringgold précise aussi que ce service est dans un but académique et que des entreprises pourraient ne pas figurer dans ce fichier, mais peuvent être trouvées à travers l’interface de recherche de l’ISNI.

source : Open ISNI: a new service to share ISNI identifiers and data for over 400,000 organizations with the world. http://isni.ringgold.com/

Une feuille de route pour les citations des données dans les entrepôts

Les entrepôts de données jouent un rôle central dans la citation des données car ils fournissent des services de gestion et de découverte des données, un accès pérennes aux données, des identifiants uniques et les métadonnées nécessaires. Pour la citation des données, les entrepôts doivent travailler avec différents acteurs comme les éditeurs, les bases de données bibliographiques, les chercheurs.

Un article publié en preprint dans BioRxiv présente une feuille de route pour que l’implémentation de la citation de données par les entrepôts de données, en particulier dans le domaine des sciences de la vie, soit en accord avec la « Joint Declaration of Data Citation Principles« . Ce travail fait partie du projet DCIP Data Citation Implementation Pilot de Force11.

Cet article synthétise et harmonise les principales recommandations existantes et présente 11 recommandations regroupées selon trois niveaux de priorité de mise en place :

  1. Étapes requises pour suivre « the Joint Declaration of Data Citation Principles »,
  2. Étapes recommandées pour faciliter le workflow de publication article/données
  3. Étapes optionnelles pour renforcer la citation de données dans les entrepôts

Ce document insiste sur l’importance pour l’entrepôt de fournir des métadonnées, que ce soit pour la citation ou pour la découverte des jeux de données, dans les formats les plus utilisés : Dublin Core, Schema.org, DataCite et DATS. Il insiste également sur l’importance de la « landing page » à laquelle doit mener l’identifiant persistant attribué au jeu de données, et qui doit fournir les informations sur les données (métadonnées, accès, licence d’utilisation) dans des formats lisibles par les humains et par les machines en utilisant les balises de Schema.org au format JSON-LD (point 7), mais aussi dans des formats de meta-balises en HTML comme PRISM ou encore Dublin Core HTML (point 8) .

La négociation de contenu  entre les différents services (les entrepôts et les services d’enregistrement d’identifiants comme DataCite ou identifier.org) est également mentionnée : les identifiants pérennes (Persistent Identifier ou PID) doivent pointer vers la landing page et des formats sont également préconisés

Les pratiques de la citation de données peuvent être implémentées dans de nouveaux services comme BioCADDIE, un service de recherche de données en biomédecine.

source :

A Data Citation Roadmap for Scholarly Data Repositories [Preprint]. Martin Fenner, Mercè Crosas, Jeffrey Grethe, David Kennedy, Henning Hermjakob, Philippe Rocca-Serra, Robin Berjon, Sebastian Karcher, Maryann Martone, TimothyClark. 

Voir aussi sur le site Inra Gestion et partage des données scientifiques : citer des données

oaDOI : un DOI qui pointe vers la version en accès libre de la ressource

oadoi-logo Un blog du billet de Carnet’IST présente le oaDOI. « Cet outil, grâce à un simple copier-coller du DOI d’un document, va à la recherche d’une éventuelle version en accès libre. Un lien oaDOI.org est en quelque sorte une alternative au résolveur doi.org afin d’éviter à l’utilisateur de se retrouver devant une version payante du document qu’il cherche alors qu’il en existe une version en Open Access. Le fonctionnement d’oaDOI pour sa recherche repose principalement sur le DOAJ, BASE et les informations retournées par CrossRef (voir toutes les sources présentées ici). »

Un exemple est donnée sur la page oadoi.about

Pour l’utiliser, il suffit de copier coller son doi sur le site https://oadoi.org/. Une API* est disponible et a déjà été implémentée dans Zotero, dans un package R et pour un widget LibGuides, (lire le billet de Odile contat cité dans les sources).

sources :

* note l’API ou Application Programming Interface est un ensemble normalisé de classes, de méthodes ou de fonctions qui sert de façade par laquelle un logiciel offre des services à d’autres logiciels (source wikipedia).

ISSN : open and not open linked data

La stratégie d’utilisation et de publication de données liées par l’ISSN International Centre a été présentée par Clément Oury au congrès IFLA satellite « Data in libraries: the big picture »[1].
Après deux premières expérimentations de publication de données en linked data (participation au développement du modèle PRESSoo, ontologie pour des ressources continues, et réalisation du projet ROAD), l’ISSN International Centre désire promouvoir l’ISSN comme un des identifiants de référence dans le web des données tout en maintenant son modèle économique. Il poursuit ainsi deux politiques qui peuvent apparaitre contradictoires dans leur application :

  • publier en linked open data d’un ensemble de métadonnées « essentielles » accompagnant l’ISSN (liste qui reste à définir),
  • publier en linked data, mais non open, des données propres du registre des ISSN (données qui ont fait l’objet d’un travail manuel important depuis des années comme les relations entre les titres, les fusions, les éditions spéciales, les traductions… ) ainsi que certains liens avec les ressources externes.

Le futur portail de l’ISSN proposera des services et des outils différents aux utilisateurs gratuits vs payants et plusieurs modèles de données (light, full et expert) seront développés.

[1] Oury, C., 2016. ISSN: Transitioning to linked data, in: Data in Libraries: The Big Picture. Satellite Meeting of IFLA World Library and Information Congress. https://halshs.archives-ouvertes.fr/halshs-01358415/document [slides]

Voir aussi : l’appel d’offre lancé le 12/09/2016 par l’ISSN-IC pour la réalisation de son nouveau portail Web et de son extranet clients.

Crossref va permettre d’associer des DOI spécifiques aux préprints

A partir du mois d’août 2016, Crossref  va modifier sa politique d’enregistrement des documents auprès de ses membre et va permettre d’assigner des Digital Object Identifiers (DOIs) à des « duplicative works. »  La nouvelle politique signifie que les préprints auront des  DOIs séparés des versions ultérieures et pourront être enregistrés auprès de Crossref. Les différentes versions seront ensuite reliées.

L’article rappelle que « Preprint » est un terme qui a différentes significations mais celle retenue par Crossref est :  « un contenu original qui a pour objectif d’être publié dans une publication classique, incluant un contenu qui a déjà été soumis, mais pas encore accepté pour publication ».(original content which is intended for formal publication, including content that has been submitted, but has not yet been accepted for publication).

Source : Crossref To Accept Preprints In Change To Long-standing Policy. http://www.science20.com/news_articles/crossref_to_accept_preprints_in_change_to_longstanding_policy-171985. Accedé le 6 mai 2016.

Nouveau DOI pour les données ARGO : avec Seanoe, une nouvelle façon de citer des données dynamiques

 Texte de Frederic Merceur (email Frederic.Merceur@ifremer.fr)  (Ifremer) diffusé sur la liste Renater Acces ouvert le 20 avril 2016 et reproduit avec son aimable autorisation.

Les DOI attribués aux données publiés dans Seanoe (http://www.seanoe.org) permettent de fiabiliser les citations, de simplifier l’accès aux données et de permettre la traçabilité de leur utilisation.

Les données publiées par SEANOE sont accessibles gratuitement. Elles peuvent être réutilisées et contribuer ainsi à une progression plus rapide de la science. Si elles sont citées dans une publication scientifique, un lecteur peut également les rejouer pour vérifier un résultat. La publication et la citation des données dans une publication peuvent donc augmenter la crédibilité de l’étude.

Si les données évoluent dans le temps, plusieurs solutions permettent d’assurer la reproductibilité d’une expérience. Pour les données Argo, une image (snapshot) de l’ensemble des données est figée et conservée tous les mois.

Dans une première version, un DOI principal avait été attribué au jeu de données Argo et des DOI spécifiques avaient été attribués à chaque snapshot mensuel.

Pour se rapprocher des nouvelles recommandations[1] de la Research Data Alliance (RDA), un nouveau DOI unique vient d’être attribué par Seanoe aux données ARGO. Ce DOI unique permet de citer le jeu de données global ou un snaphot spécifique à l’aide du même DOI. Dans cette perspective, chaque snapshot est uploadé dans Seanoe qui lui attribue une URL et une clé. La clé 42350 a par exemple été attribuée au snapshot du 2016-02-08.

La citation du jeu de données global s’effectue en citant le nouveau DOI sans paramètre :

Argo (2000). Argo float data and metadata from Global Data Assembly Centre (Argo GDAC). Seanoe.http://doi.org/10.17882/42182

La citation d’un snapshot spécifique se fait en ajoutant sa clé précédée du caractère # au DOI :

Argo (2016). Argo float data and metadata from Global Data Assembly Centre (Argo GDAC) – Snapshot of Argo GDAC of February, 8th 2016. Seanoe. http://doi.org/10.17882/42182#42350

senaoe

Ce nouveau DOI Argo unique permettra notamment un repérage plus simple des publications qui le citent. Le calcul de statistiques d’utilisation sera également facilité.

Cette solution pour publier les données ARGO dans Seanoe peut-être mise en œuvre pour n’importe quel type de données marines évolutives.

[1] Data Citation of Evolving Data – Research Data Alliancehttps://rd-alliance.org/system/files/documents/RDA-DC-Recommendations_151020.pdf

Altmetrics : une nouvelle version de ImpactStory

Impactstory est une organisation sans but lucratif qui aide les scientifiques à savoir où leurs recherches sont citées, partagées et bien plus.

Une nouvelle version a été mise en ligne le 8 avril 2016. Impacstory partage maintenant ses indicateurs en trois : le Buzz , l’engagement et l’ouverture en accès libre (openness). Le repérage de notifications par email  « nouvelle génération » est renforcé. Des fonctionnalités qui étaient très peu utilisées ont été supprimées. Enfin, il n’y a plus de métriques sur les citations.

Pour créer un compte impactstory, il faut absolument  posséder un identifiant Orcid avec les publications mises à jour dans votre profil car Impactstory vous demandera de vous identifier avec ce système. Seuls les documents avec des DOIs seront pris en compte.

Voici un exemple de la nouvelle interface avec mon compte Orcid https://www.impactstory.org/u/0000-0003-0211-4549/: impactstory-achivement

sources :

GRID : nouveau répertoire international des organismes de recherche

GRID (Global Research Identifier Database), répertoire international des organismes de recherche, est un nouveau produit lancé le 12 octobre par la société Digital Science* (également à l’origine, entre autre, de Figshare, Altmetric, readcube…).

GRID attribue à chaque organisme un identifiant unique, des métadonnées, des liens vers des sites externes (Wikipedia, sites officiels des organismes) et vers d’autres identifiants (GeoNames IDs, NUTS3 regions, Fundref IDs, ISNI, UCAS codes, UKPRN numbers, HESA codes…etc) ainsi que des relations de type « parent-child » et « affiliate » entre organismes. Environ 50 000 organismes sont actuellement recensés dans GRID.

Les données utilisées proviennent des bases d’informations sur les financements de la recherche et des affiliations dans les publications académiques. Elles sont associées manuellement aux organismes enregistrés dans GRID.

Identifiants et métadonnées sont publiés sous licence CC BY 4.0. La base de données peut être téléchargée au format Json ou csv.

*Digital Science est une division du groupe Holtzbrinck.com

Vu sur echosdoc

Une palette d’outils pour les chercheurs

A l’heure de la « transition numérique », chacun peut se sentir un peu désorienté par la multiplication des outils qui fleurissent sur la toile, utilisables pour une gamme d’actions très variées touchant à la fois aux sphères personnelle et professionnelle.

En recherche, comme dans les autres secteurs, l’offre est très large, les outils nombreux et évolutifs,  souvent en interaction les uns les autres. Comment connaître, comparer et évaluer les outils disponibles ? quelles sont les grandes tendances d’utilisation ?

Des pistes de réponses sont données sur un site original développé par l’université d’Utrecht : Innovations in Scholarly Communications. Changing research workflows.

L’ambition affichée de ce site est de présenter d’une part l’offre en matière d’outils pour la recherche, de l’autre d’identifier et tracer grâce à une large enquête internationale, les usages réels de ces outils et leur impact sur le comportement et le travail des scientifiques.

Plus de 550 outils ou sites sont répertoriés et décrits. Une liste et une représentation graphique originale de cette palette d’outils sont proposées.

L’enquête  s’adresse  à tous les acteurs de la recherche (des étudiants aux chercheurs et  professeurs ) , ou d’appui à la recherche (documentalistes, éditeurs, financeurs ). Ouverte depuis mai 2015, elle restera active jusqu’en février 2016. En août 2015, plus de 4000 personnes y avaient répondu  (26% issues secteur IST, 63% de la communauté scientifique internationale). Les résultats établis sur les 1000 premières réponses sont déjà consultables en ligne. Leur lecture est intéressante et éclairante. Elle confirme comme d’autres enquêtes  l’usage grandissant des réseaux sociaux. Elle permet d’avoir une image des positions relatives par famille d’outils, de pointer certains positionnements dominants ou émergents (Google Scholar, ResearchGate, Twitter…) et celui des outils institutionnels. A terme, les responsables du projet espèrent aussi pouvoir identifier des différences de comportement dans les usages selon les disciplines, les origines géographiques …

Au delà des résultats  de l’enquête, une autre originalité est la présentation de  différents types de  « worflows » possibles qualifiés selon les outils utilisés aux différentes étapes du travail de recherche de : traditionnel, moderne, open science,  innovant, expérimental…

Le site liste enfin, par type d’activité,  les tendances,  attentes, incertitudes, opportunités ou défis sur les développements des outils et leurs usages.

Le poster ci-dessous présenté par les responsables du projet à la conférence  Force2015   (Oxford, Janvier 2015) résume l’ensemble de la démarche.

tableautendances-outils-usages

Prenez plaisir comme moi, à découvrir ce site coloré, clair et riche en informations.

Liens utiles :

Pour mémoire, d’autres sites inventorient des outils utiles en recherche

http://dirtdirectory.org/

Outils 2.0
Webographie de sites gratuits avec une interface en français