Présentation des évolutions de HAL en 2017

LE CCSD présente  les évolutions de la plateforme d’archives ouvertes HAL.  Les développements sont principalement assurés par le CCSD et  l’INRIA. Une nouvelle interface de dépôt est disponible, plus simple et plus rapide et les métadonnées seront complétées soit à partir des données intégrées dans le PDF, soit à partir d’identifiant du document (DOI, PMID,…) . Les co-auteurs et les administrateurs des différents portails HAL seront informés du dépôt et les co-auteurs pourront valider leur statut de co-auteur par email. Une API Affiliation  permettra de repérer et d’harmoniser les affiliations. Le répérage des références citées sera automatique en utilisant Grobid et le lien vers le texte intégral sera affiché en utilisant  OaDOI . Les identifiants Orcid pourront être signalé avec l’identifiant auteur IDHAL. Enfin un portail data.archive-ouvertes.fr permettra de rechercher dans les données bibliographiques, les données sur les structures, les données sur les projets de les exploiter  dans le web sémantique.

 

L'interface du portail de données data.archives-ouvertes.fr

L’interface du portail de données data.archives-ouvertes.fr

 

source : Barborini Y.;Berthaud, C.; Denoux, S.; Tourney R. (2017).Les évolutions de HAL : présentation du 20 septembre 2017. https://www.slideshare.net/OAccsd/les-volutions-de-hal-prsentation-du-20-septembre-2017

Le “Research Data Shared Service” du Jisc intègre une solution de préservation à long terme

Le JISC (Joint Information Systems Committe – UK ) construit un data pilot pour un service de données ( Research Data Shared Service RDSS ) à destination des institutions de l’éducation supérieure du Royaume Uni.  RDSS sera un service partagée pour conserver les données (data curation) et de fournir des services (interopérabilité…) pour les institutions. RDSS produira un nouveau système qui pourra être proposé comme un service de gestion de données allégeant le travail des services informatiques des institutions et comme un fournisseur de services en gestion de données, mais aussi en consultance pour que les institutions puissent implémenter leur politique sur les données.

Le projet fournira des services dans les domaines suivants :  entrepôts de données,  plateformes de préservation,  plateformes de rapports sur les données, services de développements autour de plugin sur les entrepôts, interopérabilité avec des systèmes externes et expérience utilisateurs.

Dans ce projet , Arkivum, un fournisseur de solutions pour conserver les données  sur le long terme,  interviendra en s’appuyant sur Artefactual  l’un des développeurs de la solution open source Archivematica.

 

Source :

Nouvelle version de Open Refine 2.7

Open Refine  est un outil open source, multiplateformes, qui s’installe sur son ordinateur et qui  permet le traitement et le nettoyage des données. La version  2.7 de Open Refine  est sortie le 17 juin 2017. Les principales nouveautés (voir realeases) sont  :

  • La reconciliation des données avec Wikidata, maintenu par la Wikimedia Foundation  qui remplace l’ancien service de reconciliation avec Freebase.
  • un bouton d’export de clusters dans les fonctionnalités de clustering
  • La traduction en japonais
  • Des opérations logiques multiples
  •  une fonction “Transform All” qui permet d’appliquer les opérations sur les autres colonnes
  • La résolution de bug

Un manuel d’utilisation collaboratif, en français, est disponible sur le wiki de l’IST INRA “Traitements documentaires – Outils et savoir-faire” . Détaillé et illustré de nombreux exemples, il s’étoffera et évoluera avec les astuces et cas d’usages que nous partagerons.

Sources

Mendeley Funding pour trouver des financements de recherche

Mendeley Funding est un nouvel outil qui  regroupe les offres de financement au niveau mondial. Il inclut les appel d’offres des organisations les plus importantes  incluant l’Union européenne, les organisations départementales des Etats-Unis comme le National Institute of Health, les UK Research councils etc. Le site recense plus de 22 000 appels d’offre mais seulement 18 appels à projets de l’ANR (voir figure).

Il existe des bases nationales (exemple en Allemagne) ou thématiques de recensement d’appels d’offres. Il existe un service payant Find Funding  de la Foundation Center (50 $ par mois) ou des bases de financements de gros financeurs comme l’Union européene. Mais pour l’instant il ne semble pas qu’il y ait d’autres services équivalents en ligne.

Les chercheurs peuvent rechercher par termes pour les financements pertinents, naviguer par type d’appel d’offres, thématiques ou bailleurs de fonds. Il est possible de sauvegarder les offres intéressantes et d’accéder aux informations détaillées des bailleurs.

Mendeley Funding ; recherche pour les financeurs français

 

 

Accès par http://www.mendeley.com/funding. ll est nécessaire d’avoir un compte.

Source :  Defeo, Christian (2017). Introducing Mendeley Funding. Mendeley Blog. 16 mai 2017.  https://blog.mendeley.com/2017/05/16/introducing-mendeley-funding

Crossref Event Data pour observer et analyser les événements sur le web

Tracez les activités autour de vos jeux de données et publications grâce à leur DOI !

Un nouveau service de Crossref vient de voir le jour : Event Data. Aujourd’hui, les données et publications ne sont plus cantonnées aux portails des éditeurs et autres entrepôts. Ils sont l’objet de nombreux évènements web : citation dans des blogs, liens, signets, commentaires, partage sur les réseaux sociaux, etc. On estime à plus de 100 000 le nombre quotidien de ces évènements, autant d’informations qu’il est désormais possible d’observer et d’analyser grâce à  Crossref Event Data.

Crossref Event Data collecte et conserve cette activité et la rend accessible à travers ses services en toute transparence. Les données sont brutes et ne dépendent d’aucun traitement ou métrique. Autre point important : la provenance et le contexte de collecte de chaque événement sont également disponibles.

Event Data se positionne d’ors et déjà comme un service incontournable dans la production des métriques alternatives pour les résultats de recherche. Il peut aussi être utilisé directement par les bibliométriciens pour enrichir leurs données.

L’API de test est dès à présent accessible ici : https://www.crossref.org/services/event-data/

Les aspects techniques pour les services de preprints

Un pre-print est une contribution scientifique non validée par les pairs, qui peut être destinée à la publication, mais ce n’est pas une obligation [1]. Les initiatives autour des pre-prints se multiplient et ce type de publication devient de plus en utilisé en sciences de la vie (voir figure 1).

Le document Technical aspects of preprint services in the life sciences: a workshop report [2] reprend les conclusions d’un workshop Asapbio qui est une initiative visant à promouvoir l’usage du preprint en biosciences et dans les communautés en sciences de la vie pour indiquer des recommandations techniques pour les serveur de preprints. Différents acteurs  – éditeurs, financeurs, scientifiques et institutions – ont participé à ce travail. Les recommandations, synthétisées dans le tableau 3 de l’article, concernent entre autres :

  •  l’utilisation de standards (les métadonnées doivent être compatibles avec schema.org et reconnaître les API comme OAI-PMH,
  • l’utilisation d’identifiants pérennes pour les auteurs,  les organisations etc. pour lier les ressources,
  • la convertion des documents dans le format ouvert JATS et/ou XHTML,
  • l’utilisation de licences et de technologies ouvertes pour les applications logicielles
  • l’utilisation de bonnes pratiques pour la vérification manuelle des manuscrits, ainsi que l’utilisation de machine screening (vérification automatique),
  • l’incitation pour le dépôt et le partage des données dans les entrepôts appropriés, mais aussi  faciliter le dépôt direct des supplementary  materials qui devront avoir des identifiants et être correctement indexés et sauvegardés,
  • l’acceptation des soumissions en Word et la diffusion rapide en PDF
  • l’accessibilité des documents pour la fouille de texte et les traitements logiciels
  • le transfert simple des preprints vers le workflow des journaux traditionnels.
évolution des preprints en biologie - http://asapbio.org/preprint-info/biology-preprints-over-time

Figure 1 – Evolution des preprints en biologie – http://asapbio.org/preprint-info/biology-preprints-over-time

 

Sources :

  1. “Les Pre-Prints En 10 Points.” Marlène’s Corner, February 26, 2017. https://marlenescorner.net/2017/02/26/les-pre-prints-en-10-points/.
  2. Chodacki J, Lemberger T, Lin J, Martone M, Mietchen D, Polka J, Sever R, Strasser C (2017) Technical aspects of preprint services in the life sciences: a workshop report. Research Ideas and Outcomes 3: e11825. https://doi.org/10.3897/rio.3.e11825
  3. “ASAPbio : towards a Central Service for Preprints in the Life Sciences”. AIMS Blog.  http://aims.fao.org/activity/blog/asapbio-towards-central-service-preprints-life-science

Voir aussi  les présentations du séminaire  INRA “Publier Autrement” organisé par l’INRA, le 10 Janvier 2017 : https://seminaire.inra.fr/publier/Diaporamas

Mise à jour des services d’Agrovoc

La FAO annonce une mise à jour des services pour exploiter Agrovoc.

Agrovoc   est le vocabulaire contrôlé  et un thésaurus couvrant tous les domaines d’intérêt de la FAO incluant la nourriture, l’alimentation l’agriculture la pêche, l’environnement etc… (voir les billets sur blog concernant Agrovoc). Il contient 32000 concepts organisé en hiérarchie avec des traductions en 22 langues.

AGROVOC est disponible dans le language  RDF/SKOS-XL, accessible à partir d’un SPARQL endpoint et peut être téléchargé suivant différent formats. Il est également possible d’inclure Agrovoc dans les applications spécifiques à travers des web services et de le parcourir à travers le site web. Agrovoc est  disponible dans les formats du web de données (linked data) et très utilisé dans toutes les applications en agriculture proposant des données dans ces formats.

AGROVOC est géré grâce à VocBench,  une plateforme open source qui permet de travailler en mode collaboratif et d’éditer des ressources multilingues. Les outils disponibles permettent de :

Agrovoc et Agroportal

AGROVOC est également désormais intégré au portail d’ontologies en agriculture AgroPortal: http://agroportal.lirmm.fr/ontologies/AGROVOC. Ceci permet de facilement créer des alignements (liens d’équivalence) de concepts entre des ontologies hébergées dans AgroPortal (dont de nombreuses produites à l’Inra) et Agrovoc. Ces liens permettent par exemple d’enrichir un concept de son ontologie avec des équivalents dans de nombreuses langues fournis par Agrovoc.

Source : An update of Agrovoc web services. AIMS blog (Agriculture Information Management Standards) . 14 avril 2017 http://aims.fao.org/activity/blog/update-agrovoc-web-services

I4OC et Open Citation Corpus pour la citation ouverte

L’initiative pour des citations ouvertes, The Initiative for Open Citations,  I4OC est une collaboration entre des éditeurs scientifiques, des chercheurs et d’autres organismes intéressés pour promouvoir la disponibilité sans restrictions des données sur les citations entre les publications scientifiques.

Les citations ne sont généralement pas accessibles en libre accès, elles sont souvent soumises à des licences incohérentes, difficiles à analyser, et sont rarement lisibles par des machines [1]. Les données sur les citations de Crossref seront diffusées par les partenaires qui voient ainsi une nouvelle manière d’identifier les réseaux de recherches à travers les réseaux de citations ou encore, pour les financeurs, de mieux évaluer l’impact des publications [2].

Les données sur les citations sont déposées dans Crossref par les éditeurs et alimentent le service Cited By. Un éditeur participant à I4OC pourra rendre disponibles les citations identifiées par un DOI dont il gère le préfixe et qui seront alors accessibles via les services de CrossRef Metadata Delivery, en particulier via une API REST (voir le guide de l’API  et la FAQ) et un dump.

I4OC  mettra régulièrement à jour le corpus public de citations. Les citations sont aussi disponibles à travers le OpenCitations Corpus,  une base de données qui moissonne systématiquement les données de Crossref et d’autres sources, et qui met ces données à disposition, en “linked open data” suivant l’ontologie Spar – Semantic Publishing and Referencing Ontologies, ainsi qu’un SPARQL Endpoint  pour l’interrogation. Open Citation Corpus diffuse les données sous licence CC0 No Rights Reserved.

Les fondateurs de l’initiative I4OC sont : OpenCitations, Wikimedia Foundation, PLOS, eLife, DataCite et le Centre for Culture and Technology de Curtin University ainsi que des chercheurs (liste reprise du site [1]):  Jonathan Dugan, Martin Fenner, Jan Gerlach, Catriona MacCallum, Daniel Mietchen, Cameron Neylon, Mark Patterson, Michelle Paulson, Silvio Peroni, David Shotton, and Dario Taraborelli.

Le nombre d’éditeurs et des différentes parties intéressées (stakeholders) par l’initiative I4OC  est assez impressionnants voir [1].

sources

  1. i4oc : Initiative for Open Citations.  https://i4oc.org/
  2. Initiative for Open Citations (I4OC) launches with early success. Retrieved April 10, 2017, from http://www.alphagalileo.org/ViewItem.aspx?ItemId=174352&CultureCode=en
  3. OpenCitations  Retrieved April 10, 2017, from http://opencitations.net/

    voir aussi :

    Schiermeier, Q. (n.d.). Initiative aims to break science’s citation paywall. Nature News. https://doi.org/10.1038/nature.2017.21800
    Now free: citation data from 14 million papers, and more might come. Retrieved April 13, 2017, from http://www.sciencemag.org/news/2017/04/now-free-citation-data-14-million-papers-and-more-might-come

ISTEX : extensions pour Firefox et Chrome

Parmi les améliorations apportées par la nouvelle version de l’API (4.1.0),  annoncées dans le billet de blog dédié à la platerforme ISTEX “L’OpenURL passe la seconde…“, deux extensions pour les navigateurs Chrome et Firefox, permettant d’afficher automatiquement un bouton « ISTEX » redirigeant l’utilisateur vers le plein texte PDF lorsqu’il est disponible, seront bientôt rendues publiques.

En attendant, il est déjà possible de bénéficier de cette fonctionnalité dans Google Scholar en le paramétrant pour accéder aux textes intégraux des ressources acquises par ISTEX :

  • aller dans les paramètres de Google Scholar,
  • liens vers les bibliothèques
  • Afficher les liens permettant d’accéder aux bibliothèques suivantes (cinq au maximum) : saisir “istex” et cliquer sur chercher
  • “ISTEX – [PDF] ISTEX” est proposé : le sélectionner
  • Enregistrer

Exemple de résultat dans Google Scholar :

ISTEX : initiative d’excellence en Information scientifique et technique

Vu à : Atelier Interroger et exploiter l’API ISTEX organisé au cours du CARIST2017

Unpaywall, une extension chrome pour trouver la version des articles en open access

Des outils qui exploitent les infrastructures du libre accès et mettent en valeur  le travail effectué par les revues scientifiques, les archives ouvertes et les bibliothèques sur le libre accès se développent. Ainsi  Unpaywall est une nouvelle extension disponible pour le navigateur Chrome (pas testé avec Firefox)  qui permet de trouver les versions en accès libre (open access) des articles que vous êtes en train de consulter.  Unpaywall, développé par Impactstory, utilise l’api oadoi (voir aussi  le billet sur le blog) qui pointe par défaut sur la version open access des documents.  Unpaywall permet d’accéder aux versions open access des articles légalement déposés en accédant aux sources comme  le DOAJ (répertoire des journaux en libre accès), Crossref (service d’échange de métadonnées des articles des principaux éditeurs), DataCite (gestion des identifants), et BASE ( principal moissonneur des archives ouvertes). (voir le billet de AIMS-FAO).

En consultation, dans le navigateur Chrome, un voyant vert apparaît (s’il n’y a pas de version open access, il est gris):

En cliquant sur le voyant vert, la version open access s’affiche :

 

sources :