Rétrospective 2016

CC0 Public domain

 

 

 

 

 

 

 

L’observatoire de l’IST a publié 27 billets en 2016, ce qui  a généré plus de 33 000  lectures, le nombre de lecture des billets de toutes les années est bien évidemment supérieur. Le compte Twitter lié à ce blog a atteint les 189 “followers”. Les sujets abordés correspondent à des thématiques qui préoccupent la communauté “Information scientifique et technique” de l’INRA : les données liées et leurs applications, les données de la recherche, les nouveaux modes de publications, les métriques alternatives, le text mining et la bibliométrie, l’évolution des outils de l’open access,  les réseaux sociaux académiques….

Nous vous souhaitons une très bonne année 2017  !

L’équipe des rédacteurs et rédactrices.

Liste des billets publiés en 2016. 

SocArXiv, nouveau serveur de preprints en sciences sociales

URFIST : Eléments de comparaison archives ouvertes et réseaux sociaux académiques

Un site web INRA sur la gestion et le partage des données de la recherche

Une thèse au sujet du crowdsourcing et des bibliothèques numériques

oaDOI : un DOI qui pointe vers la version en accès libre de la ressource

Réseaux sociaux académiques : usages, limites et recommandations Inra

API ISTEX : tutoriels d’interrogation

ISSN : open and not open linked data

Scigraph.com : future plateforme linked data de Springer Nature

Softwareheritage.org : une plateforme universelle pour conserver les logiciels libres

Elsevier dataSearch : un nouveau moteur de recherche des données de la recherche

Voyant tools : un environnement en ligne d’analyse de textes

Scholix : lier les données de la recherche et la littérature scientifique

ScanR : le moteur de recherche du MENESR pour identifier les structures de recherche françaises

Zotero 5.0 en version bêta

Elsevier achète le site de preprints en sociologie SSRN

Mettre nos données en réseau – un démonstrateur

Open Knowledge Maps : une interface visuelle pour chercher dans les contenus scientifiques

Crossref va permettre d’associer des DOI spécifiques aux préprints

Opendatamonitor: un site pour trouver, analyser et comparer des données ouvertes

Le panorama des réseaux sociaux 2016 de Fred Cavazza

Nouveau DOI pour les données ARGO : avec Seanoe, une nouvelle façon de citer des données dynamiques

Altmetrics : une nouvelle version de ImpactStory

Une nouvelle façon de publier la recherche ?

Le Web de données dans les bibliothèques, archives et musées

Data Literature Interlinking service

Zotero : comment organiser sa bibliothèque ?

Une feuille de route pour les citations des données dans les entrepôts

Les entrepôts de données jouent un rôle central dans la citation des données car ils fournissent des services de gestion et de découverte des données, un accès pérennes aux données, des identifiants uniques et les métadonnées nécessaires. Pour la citation des données, les entrepôts doivent travailler avec différents acteurs comme les éditeurs, les bases de données bibliographiques, les chercheurs.

Un article publié en preprint dans BioRxiv présente une feuille de route pour que l’implémentation de la citation de données par les entrepôts de données, en particulier dans le domaine des sciences de la vie, soit en accord avec la “Joint Declaration of Data Citation Principles“. Ce travail fait partie du projet DCIP Data Citation Implementation Pilot de Force11.

Cet article synthétise et harmonise les principales recommandations existantes et présente 11 recommandations regroupées selon trois niveaux de priorité de mise en place :

  1. Étapes requises pour suivre “the Joint Declaration of Data Citation Principles”,
  2. Étapes recommandées pour faciliter le workflow de publication article/données
  3. Étapes optionnelles pour renforcer la citation de données dans les entrepôts

Ce document insiste sur l’importance pour l’entrepôt de fournir des métadonnées, que ce soit pour la citation ou pour la découverte des jeux de données, dans les formats les plus utilisés : Dublin Core, Schema.org, DataCite et DATS. Il insiste également sur l’importance de la “landing page” à laquelle doit mener l’identifiant persistant attribué au jeu de données, et qui doit fournir les informations sur les données (métadonnées, accès, licence d’utilisation) dans des formats lisibles par les humains et par les machines en utilisant les balises de Schema.org au format JSON-LD (point 7), mais aussi dans des formats de meta-balises en HTML comme PRISM ou encore Dublin Core HTML (point 8) .

La négociation de contenu  entre les différents services (les entrepôts et les services d’enregistrement d’identifiants comme DataCite ou identifier.org) est également mentionnée : les identifiants pérennes (Persistent Identifier ou PID) doivent pointer vers la landing page et des formats sont également préconisés

Les pratiques de la citation de données peuvent être implémentées dans de nouveaux services comme BioCADDIE, un service de recherche de données en biomédecine.

source :

A Data Citation Roadmap for Scholarly Data Repositories [Preprint]. Martin Fenner, Mercè Crosas, Jeffrey Grethe, David Kennedy, Henning Hermjakob, Philippe Rocca-Serra, Robin Berjon, Sebastian Karcher, Maryann Martone, TimothyClark. 

Voir aussi sur le site Inra Gestion et partage des données scientifiques : citer des données

SocArXiv, nouveau serveur de preprints en sciences sociales

SocArXiv,  est une plateforme open access, open source en sciences sociales, ouverte depuis le 7 décembre 2016, en beta version. Ce site créé en partenariat avec le Center for Open Science (COS)  fournit un service gratuit et non commercial pour la partage des documents scientifiques. Coté technique, il a été construit sur  le  Open Science Framework,  une plateforme générique qui permet aux chercheurs de déposer leurs données, leurs résultats de recherche et leurs codes.

Cette plateforme constitue une alternative  au site Social Science Research Network (SSRN) racheté par Elsevier en 2016 (voir notre billet du 1er juin 2016).

Le COS a ouvert un serveur générique de preprints  le “open preprint repository network”. Ce systéme  héberge  SocArXiv   et permet l’intégration de documents provenant de différents services comme  arXiv (maths et physique),  bioRxiv (Biologie), et les autres  communautés hébergées par COS, dont  engRxiv, and PsyArXiv. (3)

socarchiv

Accès au site https://osf.io/preprints/socarxiv

Sources :

(1) Price, Gary (2016). SocArXiv Formally Launches in Beta Today and Announces Grants From Open Society and Sloan Foundations. InfoDocket. 7 Décembre 2016. http://www.infodocket.com/2016/12/07/repositories-socarxiv-formally-launches-beta-today-announces-grants-from-open-society-and-sloan-foundations/ . Consulté le 12/12/2016.

(2) Cohen, Philip N. (2016). SocArXiv launches, brings sociology and social science into the open, with new grant support.  Scooped. 7 décembre 2016. https://socopen.org/2016/12/07/socarxiv-launches-brings-social-science-out-into-the-open/ Consulté le 12/12/2016.

(3)  SocOpen: Home of SocArXiv (2016).  https://socopen.org. Consulté le 12/12/2016.

URFIST : Eléments de comparaison archives ouvertes et réseaux sociaux académiques

Sur le même sujet que notre Activ’IST 1: “ResearchGate et Academia : usages, limites et recommandations Inra“, Aline Bouchard de l’URFIST propose des éléments comparant HAL et les réseaux sociaux académique Researchgate et Academia.edu.

Le résumé ci-dessous est diffusé sur le site de l’Urfist Paris (*) :

Le succès des réseaux sociaux destinés aux chercheurs ne se dément pas. Paradoxe, et preuve sans doute de ce succès, de plus en plus de chercheurs et d’institutions en appellent à une utilisation vigilante. Les doutes existant en effet sur leurs modèles économiques, le droit des documents déposés ou encore leur usage des données personnelles rappellent combien ces services sont parfois loin des principes de l’open access et et ne sont pas des archives ouvertes.
Si archives ouvertes et réseaux sociaux permettent de diffuser et valoriser la production scientifique, il convient de mettre en lumière leurs différences et leurs points communs. C’est également l’occasion de :
– situer les réseaux sociaux académiques et les archives ouvertes dans l’offre d’outils permettant d’assurer une visibilité à ses travaux sur le web ;
– connaître les principaux réseaux (Academia, ResearchGate) et la principale archive ouverte française (HAL) ;
– avoir conscience des enjeux et des limites de ces services.

Accès au document :  Bouchard, Aline. (2016). Eléments de comparaison archives ouvertes (HAL) et réseaux sociaux académiques (Academia, ResearchGate). 29 Novembre 2016. 49 p.   http://urfist.enc-sorbonne.fr/sites/default/files/ab/Bouchard_Comparaison_AO_RSX_112016.pdf. Consulté le 06/12/2016.

(*) http://urfist.enc.sorbonne.fr/ressources/veille-sur-les-outils/diffuser-ses-travaux-sur-les-reseaux-sociaux-academiques-ou-sur-des

Un site web INRA sur la gestion et le partage des données de la recherche

datapartagebandeau

L’inra s’engage sur le partage des données, en diffusant une Charte pour le libre accès aux publications et aux données  et avec un site web, Datapartage, pour accompagner la gestion des données et présenter l ’offre de services «gestion et partage des données ». Le site propose 4 rubriques : Gérer, Partager, Réutiliser et Technologies.

Les services proposés sont :  attribuer un DOI à un jeu de données INRA, choisir un entrepôt pour déposer ses données, écrire un plan de gestion de donnés à l’aide d’un site dédié et des formations et publier un vocabulaire ou une ontologie. Une offre de formation se met progressivement en place à travers les infodoc express et les classes virtuelles (voir la formation sur les datapapers).

https://www6.inra.fr/datapartage/

Documents complémentaires

Une thèse au sujet du crowdsourcing et des bibliothèques numériques

By James Montgomery Flagg (http://www.usscreen.com/american_spirit/) [Public domain], via Wikimedia Commons

By James Montgomery Flagg (http://www.usscreen.com/american_spirit/) [Public domain], via Wikimedia Commons

Les bibliothèques ont déjà eu recours à l’externalisation de certaines tâches de saisies de notices bibliographiques, de catalogage, d’indexation ou encore de correction de l’OCR auprès de prestataires dans des pays où la main d’œuvre est dite à bas coût. Cette externalisation est demeurée dans un cadre contractuel et limité et n’a pas bouleversé en profondeur le mode de fonctionnement sur lequel repose les bibliothèques. Mais, avec le développement du crowdsourcing, il pourrait être envisagé d’externaliser (« outsourcing ») certaines de ces tâches, non plus auprès de prestataires, mais auprès de foules (« crowd ») d’internautes et donc de faire faire une partie du travail des professionnels par des amateurs. Le « crowdsourcing » modifie ainsi le paradigme sur lequel repose des bibliothèques encore largement centrées sur la constitution et la conservation de collections. Il modifie également le rapport entre les producteurs d’un service que sont les bibliothécaires et ses consommateurs que sont les usagers, ces derniers devenant également des producteurs actifs du service. Le crowdsourcing pourrait aussi interroger les politiques documentaires des bibliothèques qui anticipent les besoins dans une logique d’offre qui n’est pas directement et immédiatement déterminée par la demande. C’est particulièrement le cas avec la numérisation à la demande par crowdfunding, une forme de crowdsourcing faisant appel, non pas au travail des foules mais à leurs ressources financières ou avec l’impression à la demande qui lui est indissociable. Avec ces modèles économiques à la demande, la politique documentaire est finalement partagée avec les usagers qui décident de ce qui sera numérisé et/ou imprimé. Les collections deviennent ainsi l’œuvre des usagers. Continuer la lecture

oaDOI : un DOI qui pointe vers la version en accès libre de la ressource

oadoi-logo Un blog du billet de Carnet’IST présente le oaDOI. “Cet outil, grâce à un simple copier-coller du DOI d’un document, va à la recherche d’une éventuelle version en accès libre. Un lien oaDOI.org est en quelque sorte une alternative au résolveur doi.org afin d’éviter à l’utilisateur de se retrouver devant une version payante du document qu’il cherche alors qu’il en existe une version en Open Access. Le fonctionnement d’oaDOI pour sa recherche repose principalement sur le DOAJ, BASE et les informations retournées par CrossRef (voir toutes les sources présentées ici).”

Un exemple est donnée sur la page oadoi.about

Pour l’utiliser, il suffit de copier coller son doi sur le site https://oadoi.org/. Une API* est disponible et a déjà été implémentée dans Zotero, dans un package R et pour un widget LibGuides, (lire le billet de Odile contat cité dans les sources).

sources :

* note l’API ou Application Programming Interface est un ensemble normalisé de classes, de méthodes ou de fonctions qui sert de façade par laquelle un logiciel offre des services à d’autres logiciels (source wikipedia).

Réseaux sociaux académiques : usages, limites et recommandations Inra

Le Numéro 1 de ACTIV’IST Focus sur l’IST  de l’INRA porte sur les réseaux sociaux académiques (Researchgate, Academia.edu…), leurs usages et leurs limites  et présente des recommandations pour le chercheur. Il rappelle également la différence entre réseaux sociaux académiques et archives ouvertes.   Télécharger Activ’ist1

 

API ISTEX : tutoriels d’interrogation

L’INIST-CNRS vient de mettre à disposition (24/10/2016) de courts tutoriels pour découvrir et utiliser l’API de la plateforme ISTEX (initiative d’excellence en Information scientifique et technique). Pour le moment 3 modules sont proposés avec de nombreux exemples de requêtes.

Voir aussi : la documentation de l’API ISTEX

ISSN : open and not open linked data

La stratégie d’utilisation et de publication de données liées par l’ISSN International Centre a été présentée par Clément Oury au congrès IFLA satellite “Data in libraries: the big picture”[1].
Après deux premières expérimentations de publication de données en linked data (participation au développement du modèle PRESSoo, ontologie pour des ressources continues, et réalisation du projet ROAD), l’ISSN International Centre désire promouvoir l’ISSN comme un des identifiants de référence dans le web des données tout en maintenant son modèle économique. Il poursuit ainsi deux politiques qui peuvent apparaitre contradictoires dans leur application :

  • publier en linked open data d’un ensemble de métadonnées “essentielles” accompagnant l’ISSN (liste qui reste à définir),
  • publier en linked data, mais non open, des données propres du registre des ISSN (données qui ont fait l’objet d’un travail manuel important depuis des années comme les relations entre les titres, les fusions, les éditions spéciales, les traductions… ) ainsi que certains liens avec les ressources externes.

Le futur portail de l’ISSN proposera des services et des outils différents aux utilisateurs gratuits vs payants et plusieurs modèles de données (light, full et expert) seront développés.

[1] Oury, C., 2016. ISSN: Transitioning to linked data, in: Data in Libraries: The Big Picture. Satellite Meeting of IFLA World Library and Information Congress. https://halshs.archives-ouvertes.fr/halshs-01358415/document [slides]

Voir aussi : l’appel d’offre lancé le 12/09/2016 par l’ISSN-IC pour la réalisation de son nouveau portail Web et de son extranet clients.