Recherche d’entrepôts de données d’IRM

Existe-t-il des entrepôts qui sont dédiés aux données IRM (Imagerie par Résonance Magnétique) ?
Ces données sont en général de images ou volume d’images (3D ou 4D) qui ont été réalisés sur le végétal, le petit animal, l’homme ou encore des produits agro-alimentaires. Elles sont de plusieurs types en fonction des paramètres d’acquisition utilisés. Dans la communauté IRM plusieurs formats existent pour structurer les données et les métadonnées, mais ils peuvent bien sûr être converties vers les autres formats à posteriori.
Nous possédons une collection d’images potentiellement intéressantes dans notre labo.

INRA-QR-IST-LOGO-50

Pour rechercher des entrepôts de données spécialisés, il existe plusieurs répertoires et portails d’entrepôts permettant la recherche par thèmes, mots-clés, types de données, pays…

Parmi les répertoires généralistes accessibles gratuitement, un des plus important est re3data (http://www.re3data.org/). Il vient de fusionner avec le répertoire Databib, et recense actuellement plus de 1200 entrepôts.

En l’interrogeant, on y trouve par exemple les entrepôts OpenfMRI (http://openfmri.org/) et 3TU.Datacentrum (http://datacentrum.3tu.nl/en/home/) qui contiennent des images d’IRM.

Datacite (http://www.datacite.org) est une « non-for-profit organisation » qui propose un ensemble des services visant à faciliter le partage des données. En collaboration avec re3data.org, le site permet la recherche d’entrepôt (sur la même base que re3data.org), et aussi la recherche directe de jeux de données.

Les répertoires Open Access Directory (http://www.opendoar.org/) et OpenDOAR (http://oad.simmons.edu/oadwiki/Data_repositories) recensent des entrepôts uniquement en Open Access.

S’agissant du dépôt éventuel de vos données, vous vous reporterez également aux annuaires précités. Il vous faudra veiller à sélectionner les entrepôts qui remplissent les conditions suffisantes de qualité et de fiabilité  pour le traitement, la citation et la conservation pérenne des données (standards reconnus  pour citer les données – le DOI par exemple), et pour protéger les données (licences Creative Commons – http://creativecommons.fr/).

Ainsi, pour Datacentrum, la licence est spécifiée à l’adresse suivante : https://data.3tu.nl/static/docs/upload_agreement.pdf, et pour openfmri, les données sont publiées par défaut sous licence pddl (http://opendatacommons.org/licenses/pddl/1.0/).

Vous veillerez également à considérer les limites en termes de taille des fichiers.
Vous devrez aussi considérer le caractère « Trusted » ou pas de l’entrepôt : Datacentrum a une pastille Data Seal of Approval, ce qui signifie que les données qui y sont déposées seront préservées, citables, et accessibles sur le long terme. Cela ne semble pas être le cas pour openfrmi.

Pour le choix d’un entrepôt, 2 stratégies sont possibles :
– une orientation « communauté scientifique » en recherchant un entrepôt spécialisé sur un domaine scientifique, un type de données (comme fMRI ou 3TU.Datacentrum)
– une ouverture plus large et multidisciplinaire avec des entrepôts comme Dryad (http://datadryad.org) ou Zenodo (http://zenodo.org) par exemple.

Un espace communautaire Inra a été créé dans Zenodo (https://zenodo.org/collection/user-inra). Dans cet espace, il n’ y a pas de limite de taille des fichiers téléchargés, néanmoins Zenodo marche bien avec des fichiers de 10GB maximum. Il n’ y a pas non plus de limite dans le choix des licences attachées aux jeux de données. Les métadonnées elles, sont sous licence CC0, exceptées les adresses mails.

Pour en savoir plus :
Dans le cadre du chantier « Gestion et partage des données de la recherche à l’Inra », une offre de service autour des données est en construction. Les premiers éléments de cette offre sont décrits dans le site web suivant : https://intranet6.inra.fr/openscience.

Questions en relation :
https://ist.blogs.inra.fr/questionreponses/2015/03/06/publication-dans-plos-one-ou-deposer-ses-donnees/
https://ist.blogs.inra.fr/questionreponses/2011/09/27/conservation-des-donnees-scientifiques/

Ce contenu a été publié dans Données de la recherche. Vous pouvez le mettre en favoris avec ce permalien.