Archives par étiquette : données pour la recherche

Academic torrents

Deux étudiants de l’Université de Massachusetts ont ouvert la plateforme Academic Torrents qui permet aux scientifiques de partager des publications et des données de la recherche [1].  A la différence des autres entrepôts de données comme Zenodo, Dryad ou encore Figshare, AcademicTorrents utilise le protocole bittorrent pour proposer des ressources distribuées (Peer to Peer ou P2P). Le site indexe plus de 1.5 pétabits de données selon [1] et plus de 6.91Tb de données disponibles selon Academic Torrents. Il contient des « données phares » comme la carte de Mars de la NASA, ou une copie de Wikipedia.

Academic Torrents permet de rechercher à travers les documents, les jeux de données ou les collections, voir ci-dessous l’affichage par collections :

Ce site est intéressant car il offre une réponse aux problèmes de persistance et de disponibilité des données de la recherche gérées par les institutions [2]. Les données en P2P étant réparties sur les sites qui les ont téléchargées, elles peuvent être déchargées même si le site principal n’est pas connecté. L’inconvénient majeur est justement que l’utilisation du P2P  est souvent restreint  dans les institutions de recherche et qu’un client bittorrent est nécessaire pour utiliser le site.

http://academictorrents.com/

[1] “Academics Launch Torrent Site to Share Papers and Datasets | TorrentFreak.” Accessed February 26, 2014. http://torrentfreak.com/academics-launch-torrent-site-to-share-papers-and-datasets-140131/.

[2] “Academic Torrents: Bringing P2P Technology to the Academic World.” MyScienceWork. Accessed February 26, 2014. https://www.mysciencework.com/news/11123/academic-torrents-bringing-p2p-technology-to-the-academic-world.

 

IPOL : une revue innovante pour valider, di ffuser, et partager la recherche en mathématiques appliquées

IPOL-header-logoPour être vérifiable et reproductible, la recherche en mathématiques appliquées doit être accompagnée d’une implémentation complète, fiable et documentée. Pour répondre à ce besoin et valoriser les travaux sur le logiciel, Jean-Michel Morel et Nicolas Limare du CMLA (Centre de Mathématiques et de Leurs Applications) de l’ENS Cachan ont lancé en 2011 IPOL (Image Processing On Line), un journal en ligne et en libre accès, revu par les pairs, qui propose une nouvelle manière de valider, diffuser, et partager la recherche dans ce domaine. IPOL publie des articles décrivant des algorithmes, le code source de ceux-ci et les données, permettant ainsi non seulement de vérifier et de reproduire les résultats et aussi de tester ces algorithmes en ligne avec ses propres données. Les expériences originales sont archivées et accessibles. Les articles sont référencés par un DOI et indexés dans les bases bibliographiques.

Les articles sont sous Creative Commons avec restrictions CC-BY-NC-SA, les données sous Creative Commons ouvert CC-BY et les logiciels sous licence libre GPL, AGPL, LGPL ou BSD.

Vu sur le site Descripteurs : Libérer les Revues et les données de la recherche

Pour en savoir plus :

Zenodo, un entrepôt de données

Zenodo permet, comme d’autres outils  (figshare, Dryad,…), de déposer des ensembles de donnés et de les lier aux publications scientifiques qui ont été écrites  à partir de ces données. Il est cependant à considérer avec attention, en particulier parce qu’il est issu du projet européen  OpenAIREplus , développé par le CERN et lié aux projets pilotes de la Commission européenne en matière de gestion de données.

La recherche peut se faire sur différents types de documents :Datasets, Images, Posters, Presentations, Publications (article,livre,…), Video/Audio.

Zenodo affecte des DOIs  aux objets et expose les métadonnées de description au moissonnage à travers le protocole OAI-PMH, le protocole d’interopérabilité des archives ouvertes (Prodinra, HAL…)

Un point particulièrement intéressant : Zenodo permet de créer des communautés et de les gérer soi-même en filtrant ce qui peut y être déposé ou non et son niveau d’accès, « open access » ou « restricted access » avec le courriel à contacter pour obtenir le document, closed access. Une communauté peut correspondre à un colloque ou à un projet par exemple.

figure 1 : un dataset en libre accès

figure 2 : un article en accès réservé

Zenodo utilise le altmetrics donut qui permet de connaitre l’impact de documents dans les réseaux sociaux.

Un exemple de « Donut » de Altmetric dans un journal scientifique

Zenodo pourrait devenir un outil important pour les scientifiques qui souhaitent partager leurs données mais qui n’ont pas d’entrepôts institutionnels ou thématiques pour le faire. Il pourra être un élément important pour répondre à l ‘obligation de rendre les publications et les données librement accessibles, déclarée dans le programme Horizon 2020 de la Commission européenne

Références :

Utopia Documents : un lecteur de fichier PDF optimisé pour les publications scientifiques

Utopia Documents explore le contenu d’un article au format PDF en s’appuyant sur des ressources externes et sur les enrichissements présents dans le document lorsqu’ils existent.

Il permet ainsi d’afficher directement dans l’interface de visualisation du pdf :

  • la référence correspondante sous différents formats (via CrossRef),
  • l’impact de l’article dans les réseaux sociaux (via Altmetric),
  • les articles en relation (via Mendeley),
  • la politique de dépôt de la revue (via Sherpa/RoMEO),
  • des données en relation avec l’article (via Dryad),
  • des informations sur les molécules, les gènes, les espèces… ou les matériels de laboratoire utilisés (via SciBite, Protein DataBank, dbpedia, AQnowledge,…)

Les enrichissements apportés par les éditeurs sont exploités (exemple des articles enrichis de Portland Press’ Biochemichal Journal ou de la Royal Society of Chemistry : affichage et rotation d’une molécule en 3D, export ou présentation sous une autre forme des données d’un tableau…).

Cette analyse est réalisée automatiquement à l’ouverture du document.

L’image ci-dessous montre la publication « Towards a worldwide wood economics spectrum » juste après son chargement dans Utopia Documents. A droite apparaissent les informations en relation avec cette publication.

la publication "Towards a worldwide wood economics spectrum" juste après son chargement dans Utopia Documents

Cette première analyse peut être complétée par l’exploration des ressources externes à partir d’un terme ou d’une phrase sélectionnés par l’utilisateur (fonction « Explore » disponible via un menu en info-bulle) ou saisis dans une boite de recherche.

Exemple ci-dessous avec terme « Populus » :

la fonction "Explore" sur le terme "Populus"

Le résultat de l’exploration est affiché dans le partie droite de l’écran :

résultat de l'exploration du terme "populus"

Un terme sélectionné par l’utilisateur peut également faire l’objet d’une recherche sur des sites externes (clic droit puis « Lookup selected text ») : NCBI, Quertle, Google, Wikipedia, Dictionary.com et Thesaurus.com.

Tout document peut être annoté (clic droit puis « Annotate document ») au moyen de différents annotateurs : GPCRDB (information system for G protein-coupled receptors), NuclearDB (information system for Nuclear Receptors) et Reflect (Reflect highlights protein and small molecule names).

Exemple d’information obtenue sur la protéine « PgC » après une annotation par Reflect :

Exemple d'information obtenue sur la protéine "PgC" après une annotation par Reflect

Les informations affichées par Utopia documents sont obtenues via des web-services, des accès à des bases de données ou à des entrepôts RDF (Bio2RDF et DBPedia en particulier).

Les utilisateurs peuvent commenter des parties du document et partager ces commentaires.

Utopia Documents est publié par Lost Island Labs Ltd (LIL) en association avec Academic Concept Knowledge Ltd (AQnowledge) ; il est gratuit et disponible pour Mac, Windows et Linux à http://utopiadocs.com.

Site d’information inter-instituts sur les données de la recherche

Le site d’information sur les données de la recherche, créé à l’initiative du ministère de l’Enseignement supérieur et de la Recherche, est  une plateforme d’information et de veille sur les données de la recherche. Le CNRS, L’inist, L’inra et l’Inserm et l’IRD en sont partenaires.

Le site propose différentes rubriques : Actualités, Normes formats et protocoles, Politiques et textes de références, Projets et Initiatives ainsi qu’une webographie par type de documents.
Selon la ligne éditoriale, le site  a comme objectifs de :

  • développer les connaissances sur les données de la recherche ;
  • sensibiliser à l’importance qu’elles revêtent ;
  • favoriser la réflexion autour des problématiques qui y sont liées.

Le site s’adresse aux professionnels de l’information scientifique et technique et aux différentes communautés scientifiques qui bénéficient ainsi d’un espace commun d’information sur les problématiques liées aux données.

Il a vocation à être alimenté par un réseau de veilleurs représentatifs des différentes disciplines scientifiques et des métiers, et appartenant à différents établissements de recherche.

http://www.donneesdelarecherche.fr/