Archives par étiquette : open data

OpenAIRE en Linked Open Data

openaireLOD

OpenAire est un projet européen visant à diffuser en accès ouvert les publications et les données scientifiques  en libre accès des travaux  des différents projets européns. OpenAire diffuse plus de 13 millions de publications.

Last OpenAIRE portal content update (Dec. 1) = 13.294.130 publications from 688 data providers pic.twitter.com/n03zaK0bov— Pedro Príncipe (@pedroprincipe) 1 Décembre 2015.

OpenAIRE propose à travers le OpenAIRE LOD Services,  l’accès  ouvert à ses contenus publiés  en linked open data. L’objectif étant de  développer l’interopérabilité technique et d’ assurer une meilleure réutilisation et  intégration de différents contenus avec par exemple les données de la recherche ou encore les outils autour de l’écriture et de la communication  scientifique.

Le public ciblé, à la différence du  portail web,  comprend  les développeurs d’application tiers parties et de services mais aussi  des utilisateurs finaux avec les compétences techniques suffisantes pour exploiter les technologies du web sémantique.

Ce service propose trois manières d’accéder aux données :  en explorant les enregistrements de données d’OpenAIRE avec la possibilités de suivre les liens entre les entités reliées de télécharger l’ensemble des données Dump (attention 1.6 Go ) et d’interroger les données de manière interactive avec un SPARQL endpoint.

Les travaux effectués ou en projet portent sur

  • L’implémentation et la spécification du modèle de données OpenAIRE dans un vocabulaire de linked data (un schéma RDF) en s’appuyant sur les vocabulaires existants mais en spécifiant ce qui est propre à OpenAire,
  • L’alignement  des différentes entités de l’espace d’information OpenAire vers d’autres ressources RDF et leur automatisation,
  • La liaison de  OpenAIRE LOD avec d’autres linked open datatsets pour les mettre en valeur, permettre de meilleurs modes de recherche d’information etc..

Accès au site : http://lod.openaire.eu/

Une documentation technique est disponible sur le  LOD Wiki . Certains documents sont réservés aux membres du projet.

 

Intégration entre Open Journal Systems et Dataverse pour déposer les données de la recherche

source : Altman M., Castro E. , Crosas M., Durbin P , Garnett A., and Whitney J. (2015). Open Journal Systems and Dataverse Integration– Helping Journals to Upgrade Data Publication for Reusable Research . Code {4}lib Journal. http://journal.code4lib.org/articles/10989

Cet article décrit un nouvel outil libre pour la publication des données en « open data » dans le processus de soumission d’un article scientifique à un journal. Il comprend un plugin pour Open Journal Systems (OJS) qui supporte la soumission de données, la citation, l’évaluation et le processus de publication et fonctionne comme une extention du Dataverse Systems qui fournit une API standard de dépôt.

Le dataverse Project a commencé en 2006 à Harvard’s Institute for Quantitative Social Science (IQSS). Il contient maintenant plus de 60 000 ensemble de données de la recherche. Pour plus d’informations sur Open Journal Systems, voir le billet sur ce blog.

Dataverse a developpé une extention SWORD qui permet de déposer des fichiers de données et autres types de document à partir d’autres systèmes comme OJS maintenant mais pourrait aussi être implémenté sur Open Science Framework (voir integrating Dataverse with the Open Science Framework) .

La figure ci-dessous, issu de l’article,  montre le processus de soumission complet. Les auteurs soumettent en même temps le jeu de données et l’article.

dataverse

Open Data : le ministère de l’Education nationale, de l’Enseignement supérieur et de la Recherche ouvre ses données

Dans le cadre de la transparence et de l’ouverture des données publiques, le ministère de l’Education nationale, de l’Enseignement supérieur et de la Recherche (MENESR) a lancé la première plate-forme ministérielle de mise à disposition de données sur l’enseignement supérieur et la recherche. L’annonce a été faite le 24 avril par Geneviève Fioraso, secrétaire d’Etat à l’Enseignement supérieur et à la Recherche, lors de la Conférence de Paris sur l’Open Data et le Gouvernement ouvert [2]

http://data.enseignementsup-recherche.gouv.fr

Pour mener à bien ce projet, le MENESR s’est associé à OpenDataSoft, entreprise spécialisée dans le traitement et la publication de données en ligne.

Ce sont plus de 2,5 millions de lignes de données et 23 jeux de données qui ont déjà été publiés sur data.enseignementsup-recherche.gouv.fr, voir le document réalisé par le MENESR [1]. Toutes les données sont disponibles sous différents formats ouverts (CSV, JSON, APIs…) adaptés au partage et à différentes utilisations. Les jeux de données sont également synchronisés avec la plate-forme interministérielle data.gouv.fr animée par la mission Etalab [2].

L’interface est assez classique avec des facettes (contributeur, producteur, thématiques, années, mots clés,…) et un moteur de recherche. voir ci dessous. Le site propose également une prise en main illustrée par des exemples d’utilisation des séries de données [1].

et un détail de quelques sources :

Source :
[2] Communiqué de presse OpenDataSoft. 24 avril 2014 Open Data : le ministère de l’Education nationale, de l’Enseignement supérieur et de la Recherche ouvre ses données avec OpenDataSoft. http://www.opendatasoft.com/fr/2014/04/24/open-data-le-ministere-de-leducation-nationale-de-lenseignement-superieur-et-de-la-recherche-ouvre-ses-donnees-avec-opendatasoft/

Open data : apprendre à utiliser les données

L’École des Données est une version francophone du projet School of Data de l’Open Knowledge Foundation lancé en mai 2012, dont l’objectif est de donner plus de pouvoir à la société civile en enseignant les compétences nécessaires pour réutiliser des données disponibles librement.
L’école des données s’adresse à tous, aucun niveau de compétence n’est requis, et propose des cours complets, des recettes et astuces et des cas concrets à partir de données existantes.
Deux grandes parties sont disponibles pour le moment (« Les fondamentaux des données » et « Brève introduction sur le nettoyage des données« ) chacune comprenant plusieurs chapitres dans lesquels sont intégrés une partie de cours, des exercices (tâches rapides : 15 à 30 mn, ou plus longues : 1h) ainsi qu’une liste de lecture.
La participation de tous est encouragée pour collaborer à la traduction des contenus, à l’adaptation des cours au contexte français, au développement de nouveaux cours ou à l’animation du site.

Un outil vraiment agréable au premier abord !

Vu sur http://lalist.inist.fr/

Site d’information inter-instituts sur les données de la recherche

Le site d’information sur les données de la recherche, créé à l’initiative du ministère de l’Enseignement supérieur et de la Recherche, est  une plateforme d’information et de veille sur les données de la recherche. Le CNRS, L’inist, L’inra et l’Inserm et l’IRD en sont partenaires.

Le site propose différentes rubriques : Actualités, Normes formats et protocoles, Politiques et textes de références, Projets et Initiatives ainsi qu’une webographie par type de documents.
Selon la ligne éditoriale, le site  a comme objectifs de :

  • développer les connaissances sur les données de la recherche ;
  • sensibiliser à l’importance qu’elles revêtent ;
  • favoriser la réflexion autour des problématiques qui y sont liées.

Le site s’adresse aux professionnels de l’information scientifique et technique et aux différentes communautés scientifiques qui bénéficient ainsi d’un espace commun d’information sur les problématiques liées aux données.

Il a vocation à être alimenté par un réseau de veilleurs représentatifs des différentes disciplines scientifiques et des métiers, et appartenant à différents établissements de recherche.

http://www.donneesdelarecherche.fr/

OpenAIREplus : connexion entre publications et données de recherches

Lancé le 6 décembre dernier, le projet OpenAIREplus (Open Access Infrastructure for Research in Europe), d’une durée de 30 mois, veut établir un lien entre les publications scientifiques, les données de recherches et les sources de financement qui y sont associées.
Il utilise l’infrastructure du projet OpenAIRE qui donne la possibilité aux scientifiques  de déposer en Open Access publications et résultats des recherches financées par la Commission Européenne. Les chercheurs qui ne peuvent déposer dans une archive compatible OpenAIRE peuvent le faire dans l’archive orpheline disponible sur le site.

Vu sur echosdoc.net

Le site OpenAIRE

open data : ouverture de data.gouv.fr

data.gouv.frLe site www.data.gouv.fr vient d’ouvrir (en version Bêta). Data.gouv.fr est la plateforme française d’ouverture des données publiques. L’initiative est menée par Etalab une mission sous l’autorité du premier Ministre chargée de l’open data. Les données sont diffusées sous licence ouverte.

il contient plus de 350 000 données de plus de 90 fournisseurs. on peut interroger le site par mots-clés ou par fournisseurs. On y trouve par exemple des données du Ministère de l’Agriculture, de l’Alimentation, de la Pèche, de la Ruralité et de l’Aménagement du territoire sur les produits Appellation d’Origine contrôlée (AOC), Indication Géographique Protégée (IGP) et leur localisation géographique.

Un état des lieux de l'Open data

David Eaves dresse un état des lieux de la réutilisation des données publiques. Il nous montre que 2011 a été une année charnière marquée par l’explosion des portails Open data dans le monde, par une meilleure compréhension des problématiques notamment par les politiciens, et par la multiplication des expériences concrètes (https://scraperwiki.com, http://buzzdata.com, http://www.socrata.comhttp://lucasmanual.com/mywiki/DataHubhttp://visual.ly ou http://recollect.net).

David Eaves insiste cependant sur les prochains défis à relever notamment celui de l’interopérabilité. Pour lui la multiplication des portails Open Data ne sera pas un facteur de déploiement et de visibilité. Un des enjeux est donc de pouvoir disposer de schémas de données, de standards communs afin de pouvoir exploiter ces données.

Lire le billet sur Owni…

Paris sémantique

Voici un exemple pratique de ce qu’il est possible de faire avec les technologies du web sémantique…

Paris sémantique est une nouvelle initiative privée, liée à l’ouverture de certaines données publiques de la Ville de Paris, visant à exploiter le maximum de ces informations publiques en données aisément compréhensibles par les machines à l’aide des technologies du web sémantique. D’autre part l’idée est de favoriser l’exploration de ces données par les utilisateurs à l’aide d’une interface facilement abordable et conçue dans un esprit collaboratif et participatif.

Le site permet de naviguer par type de données mais propose aussi un outil de visualisation VisualDataWeb RelFinder (qui permet d’afficher de façon graphique les relations entre les objets).

Visiter Paris Sémantique…