Archives par étiquette : web sémantique

Mettre nos données en réseau – un démonstrateur

Mettre nos données en réseau

Punktokomo, le Blog technique de l’ABES, vient de mettre en ligne une série de billets très pédagogiques présentant un démonstrateur illustrant la publication de données conformément aux principes et aux bonnes pratiques du web sémantique, dont l’intérêt et les limites actuelles sont clairement exprimés à travers des exemples concrets. Huit études de cas détaillées illustrant le travail effectué permettent de bien comprendre la méthodologie suivie selon les sources.

Les données proviennent des réseaux ABES, des éditeurs, des institutions culturelles ou dédiées à l’information scientifique et technique, de l’administration. Sont ainsi traitées (modélisées et converties en RDF pour le plupart) les documents provenant d’Istex, de HAL, du Sudoc, des référentiels de personnes (VIAF, ORCID, Idref, annuaire de chercheurs de l’Université Paris IV), des référentiels d’organismes (répertoire national des structures de recherche/RNSR, structures HAL), des référentiels sujet (Rameau, Library of Congress Subject Headings, les thésaurus MeSH et Nature, la classification du Journal of economic literature), des référentiels de bouquets (bouquet Dalloz) et des localisations (liste des bibliothèques).

Les alignements sont également publiés : alignements entre les auteurs de Nature et ORCID, entre les auteurs de Nature et l’International Standard Name Identifier (ISNI), entre les auteurs HAL et IdRef, entre les chercheurs de Paris 4 et IdRef, entre les auteurs de Persée et IdRef, entre les auteurs de Nature (puisqu’ils ne sont pas identifiés de façon unique dans le dump RDF de Nature), entre les auteurs Springer et IdRef, entre les documents Springer et RAMEAU, entre les domaines HAL et Dewey, entre les structures de recherche de Paris 4 dans les référentiels RNSR, HAL et IdRef.

La modélisation, succinctement présentée, a fait appel, entre autres, aux modèles FRBR pour les documents, Vivo pour les auteurs/contributeurs. Les métadonnées de Nature Publication Group ont été récupérées directement en RDF avec le modèle spécifique à cet éditeur.

Ces données ont été agrégées dans un entrepôt RDF. L’accès aux données se fait via une requête SPARQL sur le point d’accès https://lod.abes.fr/sparql (de nombreux exemples de requête sont présentés dans les différents billets) ou par navigation depuis l’interface https://lod.abes.fr/fct.

Source : Punktokomo ; | Blog technique de l’ABES

schema.org 2.0

La version 2.0 du vocabulaire schema.org (balisage sémantique des pages Web) a été publiée le 13 mai 2015. Elle offre en particulier un nouveau mécanisme d’extension permettant l’intégration de types et propriétés propres à divers domaines spécialisés.
Voir les spécifications de schema.org version 2.0 et les détails de la mise à jour.

Vu sur schema blog

MOOC « Web sémantique et Web de données »

video_imageUn cours en ligne ouvert et massif (MOOC) niveau licence, en français, sur les standards du Web de données et du Web sémantique, réalisé par l’Inria dans le cadre du projet IDEFI uTO, se déroulera du 2 mars au 17 avril 2015. Les enseignants sont Fabien Gandon (Inria), Olivier Corby (Inria) et Catherine Faron Zucker (Université Nice Sophia Antipolis)

Pour en savoir plus et pour s’inscrire : https://www.france-universite-numerique-mooc.fr/courses/inria/41002/Trimestre_1_2015/about

Web sémantique : une nouvelle plate-forme de ressources pédagogiques

L’ADBS (Association des professionnels de l’information et de la documentation, secteur Taxonomies-Métadonnées) et le GFII ( Groupement français de l’industrie de l’information , groupe Web Sémantique) se sont associés pour créer une plate-forme de ressources pédagogiques sur le web sémantique et le linked open data.

La première étape de ce projet est un catalogue rassemblant une sélection d’une centaine de documents de référence, sous la forme d’une bibliothèque publique Zotero, et associé à une liste de discussion qui permet à chacun de proposer de nouvelles ressources à partager.

Ce projet est présenté aujourd’hui au salon Documation (lire le communiqué : Plateforme documentaire pour comprendre et partager les enjeux du web sémantique).

Les APIs ou la valeur ajoutée des éditeurs au livre numérique

En créant des index sémantisés s’appuyant sur des schémas standards, sur schema.org ou sur des microformats, les éditeurs peuvent imaginer et proposer, via des APIs, des services nouveaux exploitant pleinement la connaissance qu’ils ont des livres qu’ils publient et de leur contexte.
C’est ce qu’expose et illustre de quelques exemples Hugh McGuire dans l’article  A Publisher’s Job Is to Provide a Good API for Books. You can start with your index.

PressBooks y est cité comme un des outils (gratuit) permettant à tout un chacun de réaliser un livre numérique intégrant une indexation sémantique.

L’article de High McGuire est traduit en français par Virginie Clayssen : Le travail d’un éditeur, selon Hugh McGuire.

Vu sur Bibliomancienne

"Et 1 et 2 et 3.0!" : une journée FULBI sur le web de données

La FULBI (Fédération des Utilisateurs de Logiciels pour Bibliothèques, Documentation & Information) organisait le 13/01/2013 une journée sur le web de données  intitulée :  » « Et 1 et 2 et 3.0 ! ». Quelles opportunités pour nos missions ? Quelles incidences sur nos outils ? »

Le programme et les  présentations, malheureusement seulement partiellement disponibles sont à l’adresse : http://www.fulbi.fr/?q=content/journee-fulbi-du-17-janvier-2013

En matière d’introduction : la présentation très illustrée, didactique et pédagogique d’Emmanuelle Bermès, qui rappelle les définitions et principes du web sémantique, et celle de Romain Wenz qui donne des exemples d’application à la BNF (dans data.bnf.fr)

Rapport final du W3C : « Bibliothèques et web de données »

La traduction en français du Rapport final du groupe d’incubation W3C « Bibliothèques et web de données«  est disponible. Le groupe dont la mission était de « contribuer à améliorer de façon globale l’interopérabilité entre les données de bibliothèque sur le web en rassemblant des professionnels travaillant sur le Web sémantique – notamment sur le web de données –  » aboutit aux recommandations suivantes :

  • Les dirigeants de bibliothèque doivent identifier des jeux de données susceptibles d’être exposés dans un premier temps sur le web de données et encourager le débat sur l’ouverture des données et les aspects juridiques afférents.
  • Les organismes responsables des normes bibliographiques doivent renforcer la participation des bibliothèques au processus de standardisation du web sémantique, développer pour ces dernières des normes compatibles avec le web de données et diffuser des bonnes pratiques en matière des patrons de conception pour les données liées de bibliothèque.
  • Les concepteurs de systèmes et de données doivent rendre plus performants les services aux utilisateurs en s’appuyant sur les possibilités du web de données, créer des URI pour les items appartenant aux jeux de données des bibliothèques, mettre en œuvre des politiques pour la gestion des vocabulaires RDF et leurs URI et exprimer les données de bibliothèque avec la réutilisation ou la mise en correspondance des vocabulaires existants dans le web de données.
  • Les bibliothécaires et les archivistes doivent veiller à la conservation des éléments de description et des vocabulaires d’autorité du web de données et appliquer leur savoir-faire – conserver et gérer sur le long terme – au web de données.

On trouve en annexe un inventaire des ressources existantes :

  • jeux de données décrivant les ressources de la bibliothèque telles que le British National Bibliography, le SUDOC, CrossRef et Europeana ;
  • vocabulaires d’autorité tels que la Liste des vedettes matières de la Bibliothèque du Congrès, AGROVOC, le fichier d’autorité international virtuel (VIAF), la Classification décimale Dewey et Geonames ;
  • éléments de description de métadonnées tels que les termes de métadonnées DCMI, les éléments de RDA (Resource Description and Access), Simple Knowledge Organization System (SKOS) et Friend of a Friend Vocabulary (FOAF).

ainsi qu’un aperçu des technologies qui permettent la production et la consommation de données liées. L’importance de l’alignement pour l’interopérabilité des ressources y est également développé.

 

Publier pour le web des données et le faire savoir

Comme pour le web des documents, l’indexation des données publiées dans le web des données est importante. Il existe deux approches pour référencer ses données dans le web des données:

  1. créer un fichier VoID (Vocabulary for Interlinked Dataset) et le déclarer sur les principaux moteurs de recherche sémantiques tels que Sindice. Un tel fichier permet de décrire le contenu d’un ensemble de données (informations de base, informations utiles, licences, sujets), les services associés à cet ensemble de données, et l’organisation du contenu (en sous ensembles de données notamment)
  2. créer un sitemap sémantique et le référencer sur les principaux moteurs de recherche sémantiques.

Lisez l’article qui se trouve ici si vous souhaitez savoir comment créer en pratique un fichier VoID et un sitemap sémantique et comment les déclarer sur les moteurs de recherche sémantiques.

Quel SUDOC demain ?

Le blog [Bibliothèque relaoded] propose un billet très complet sur l’avenir du SUDOC tel qui a été envisagé lors des dernières journées de l’ABES. Si l’auteur du billet semble regretter qu’on ne soit pas allé assez loin dans les apports du Web des données, il présente comment les fonctionnalité et la philosophie des SIGB nouvelles générations modifieraient l’utilisation du SUDOC dans le cadre de SIGB mutualisées. Tous les détails ici.

Paris sémantique

Voici un exemple pratique de ce qu’il est possible de faire avec les technologies du web sémantique…

Paris sémantique est une nouvelle initiative privée, liée à l’ouverture de certaines données publiques de la Ville de Paris, visant à exploiter le maximum de ces informations publiques en données aisément compréhensibles par les machines à l’aide des technologies du web sémantique. D’autre part l’idée est de favoriser l’exploration de ces données par les utilisateurs à l’aide d’une interface facilement abordable et conçue dans un esprit collaboratif et participatif.

Le site permet de naviguer par type de données mais propose aussi un outil de visualisation VisualDataWeb RelFinder (qui permet d’afficher de façon graphique les relations entre les objets).

Visiter Paris Sémantique…