Archives de catégorie : Cartographie de l’information

Crossref Event Data pour observer et analyser les événements sur le web

Tracez les activités autour de vos jeux de données et publications grâce à leur DOI !

Un nouveau service de Crossref vient de voir le jour : Event Data. Aujourd’hui, les données et publications ne sont plus cantonnées aux portails des éditeurs et autres entrepôts. Ils sont l’objet de nombreux évènements web : citation dans des blogs, liens, signets, commentaires, partage sur les réseaux sociaux, etc. On estime à plus de 100 000 le nombre quotidien de ces évènements, autant d’informations qu’il est désormais possible d’observer et d’analyser grâce à  Crossref Event Data.

Crossref Event Data collecte et conserve cette activité et la rend accessible à travers ses services en toute transparence. Les données sont brutes et ne dépendent d’aucun traitement ou métrique. Autre point important : la provenance et le contexte de collecte de chaque événement sont également disponibles.

Event Data se positionne d’ors et déjà comme un service incontournable dans la production des métriques alternatives pour les résultats de recherche. Il peut aussi être utilisé directement par les bibliométriciens pour enrichir leurs données.

L’API de test est dès à présent accessible ici : https://www.crossref.org/services/event-data/

Voyant tools : un environnement en ligne d’analyse de textes

voyanttool

Voyant Tools est un environnement en ligne de lecture et d’analyse de textes complété avec des outils de visualisation. Il est  hébergé sur la plateforme Huma-Num, une très grande infrastructure de recherche (TGIR) en humanité numérique qui propose  des services et outils pour traiter les données tout au au long de leur cycle de vie.

Fonctionnement

il suffit d’insérer des urls ou des documents pour pouvoir accéder automatiquement à une interface complète d’analyse : classement des mots les plus fréquents nuage de mots , contexte, etc. Il est possible de choisir et modifier une liste des mots qui ne doivent pas apparaître (stoplist).

La liste d’outils  disponibles est impressionnante http://voyant.tools.huma-num.fr/docs/#!/guide/tools. Un guide d’utilisation est disponible. Chaque corpus est sauvegardé avec une URL disponible pour y accéder. Il est possible de modifier le corpus mais dans ce cas l’URL change.

Voici un exemple d’analyse sur la consultations sur la consultation du Projet de loi pour une République numérique https://www.republique-numerique.fr/project/projet-de-loi-numerique/consultation/consultation.
voyanttoolexemple

 

Accès à Voyant Tools : http://voyant.tools.huma-num.fr/

voir aussi :
Deschamps,Christophe. 2016. Voyant Tools, un puissant service de text mining en open source. 5 février 2016 . Outils froids.  http://www.outilsfroids.net/2016/02/voyant-tools-un-puissant-service-de-text-mining-en-open-source/

Open Knowledge Maps : une interface visuelle pour chercher dans les contenus scientifiques

Open knowledge Maps  est une initiative pour créer des interfaces visuelles interactives utilisant des techniques de visualisation de données et de text mining qui peuvent être utilisées par tous pour améliorer la découverte de résultats de recherche.

Les informations du site ne permettent pas de déterminer précisément l’origine de l’initiative, mais les partenaires sont des spécialistes de l’open data, des informations sous licences ouvertes et de la fouille de texte : ContentMine, ROpenSci, Internet Archive Labs,  Know Center (Autriche), et Open Knowledge Austria. Le site lui-même diffuse ses contenus en CC-BY Creative Commons Attribution 4.0 International License.

Pour l’instant l’interface de recherche ne permet que d’explorer les contenus et métadonnées de l’éditeur open access PLOS Public Library of Science Journals.

La carte suivante diffusée sur le site montre les résultats sur le thème « Zika virus » en s’appuyant sur les données de PLOS. On peut choisir  de cliquer sur les cercles pour affiner les résultats ou d’afficher ou non les publications.
openknowledgemapszika

En cliquant sur le cercle « Sequence databases, Sequence alignment », on voit les articles relevant de cette thématique.
openknowledgemapszikacerccle_sequence

Autour de ces cartes, cette initiative souhaite développer un espace pour l’organisation et l’exploration en connectant les chercheurs, les étudiants, les bibliothécaires, les journalistes les utilisateurs et les citoyens (voir « our mission« ).

Une initiative intéressante et à suivre, mais on aimerait en savoir plus sur son fonctionnement.

ezVIS, un outil libre développé par l’INIST pour analyser et visualiser des données structurées

reseauderelations

Exemple des Séries télévisées : Réseau de relations (plus de 3 co-publications) entre les thématiques et les mots clés

Source : ezVIS, un outil libre pour analyser et visualiser des données structurées. http://www.inist.fr/?ezVIS-un-outil-libre-pour-analyser&lang=fr. Page consultée le 10/09/2015.

ezVIS est un outil libre dédié à la constitution, à partir de données structurées, de tableaux de bord dynamiques entre autres sous forme de rapports web consultables en ligne.  Les rapports web sont accessibles en ligne de manière autonome et sécurisée.

La page d’information montre quelques exemples. L’un porte sur une étude bibliométrique de la production scientifique sur les séries télévisées.  Le champ d’application peut être étendu au-delà des données bibliographiques.

 

Gephi pour visualiser des graphes RDF : un cas pratique

Source : Gephi pour visualiser des graphes RDF. http://blog.sparna.fr/gephi-visualiser-des-graphes-rdf/. 22/04/2015.

sparnagraphcopieecran

L’auteur Thomas Francart pensait qu’il n’y avait pas beaucoup d’intérêt à visualiser les graphes d’un ensemble de triplets RDF jusqu’à ce qu’il doive traiter une problématique de représentation de cartographie d’acteurs du numérique en Touraine. Il explique  les étapes techniques qu’il a réalisées pour construire et visualiser ce graphe.

Le dispositif : Wiki sémantique + triplestore + Gephi / sigma.js

un première étape a été d’utiliser Semantic Media Wiki (voir aussi le billet sur le blog de Sparna). Semantic Media Wiki dispose des mêmes fonctionnalités qu’un wiki « classique » mais avec une description sémantique des informations qui peuvent être exportées et synchronisées  ( fonction d’export RDF) avec un triplestore RDF Sesame. Le triplestore rend les données accessibles sur le web, interrogeables et manipulables via  SPARQL).

Gephi   est un outil de visualisation de  graphe. il peut importer des données en RDF avec un plugin d’intégration à partir de SPARQL , Gephi Semantic Web Import Plugin. Enfin SigmaJS, une librairie jabascript permet de rendre le graphe interactif.

Voir les articles sur Gephi sur notre blog.

Inkscape et XIA pour créer des images actives en html5

Inkscape

Xia est un convertisseur qui prend en entrée un fichier svg (image vectorielle) et fournit en sortie une image active en html5.  Xia permet en outre de générer des activités interactives : jeux de glisser-déposer, discrimination, sélection, etc. C’est un logiciel libre développé par la délégation académique pour le numérique éducatif de l’académie de Versailles. voir le  site http://images-actives.crdp-versailles.fr/beta/#

INkscape est un éditeur de graphismes vectoriels libre de qualité professionnelle qui permet  de générer des fichiers SVG ou de retoucher des fichiers PDF. Il est utilisé pour améliorer des graphismes en sortie des logiciels de visualisation de données utilisés en bibliométrie comme Gephi ou Cortext.

Une vidéo montre comment réaliser un petit jeu html5 basé sur le principe du glisser/déposer. Le jeu est conçu avec Inkscape et généré en html5 grâce à XIA.

La combinaison de ces deux outils pourrait permettre de générer des cartes animées avec les cartes issues des logiciels de cartographie et de les diffuser sur un site web.

Source : CANOPÉ Académie d’Amiens – Inkscape et XIA permet de créer des images actives et des jeux sérieux en html5 http://crdp.ac-amiens.fr/cddpoise/blog_mediatheque/?p=14982. Scooped by Tuic numerique

infomous : un outil simple de visualisation sémantique

Infomous est un outil permettant de générer des cartographies de mots-clés depuis un flux RSS, un site web (à l’aide de la requête site:) ou de réseaux sociaux (Twitter, Facebook et Instagram). Les termes les plus cités sont mis en avant visuellement et ils sont regroupés selon les liens sémantiques analysés. Les mots-clés permettent d’accéder directement aux sources agrégées.

Cartographie du hashtag #inra sur Twitter

Cartographie du hashtag #inra sur Twitter

Les cartographies peuvent être directement intégrées à un site web. Ce qui peut permettre de proposer aux lecteurs de son site, de son blog ou de sa veille un point d’entrée visuel au contenu publié.

A noter également l’existence d’une extension pour le navigateur Chrome (permettant d’analyser directement le contenu d’un site) et d’un plugin pour WordPress (création de cartographies directement dans son blog).

Cet outil pourra permettre aux professionnels de l’information de visualiser rapidement le contenu d’un site web, les sujets traités par un blog ou un utilisateur de Twitter. Lors de la mise en place d’une veille documentaire il pourra aussi faciliter l’identification de tout le champ lexical autour de la thématique surveillée.

Infomous.com

Lire aussi d’autres billets sur cet outil  sur Bases publications, Cadd e Réputation ou Intelligences connectées.

 

Linked Open Data Cloud : nouvelle version

Linked Open Data cloud La nouvelle version du nuage des données liées (Linked Open Data Cloud : 570 jeux de données, 2900 liens), publiée en août par M. Schmachtenberg, C. Bizer et H. Paulheim de l’université de Mannheim (Allemagne), est présentée et commentée par Thomas Francart sur son blog Sparna blog.
La version précédente datait de 2011.
L’importance relative et le rôle des données liées vs contenus structurés (Microdata/RDFa/Microformats) sont soulignés.

La datavisualisation

Encore un nouveau mot pour désigner l’art de représenter les données de façon visuelle, interactive, dynamique…

Surfant sur cette tendance la société suisse Interactive Things propose via leur  site datavisualization.ch une sélection d’une quarantaine d’outils de visualisation des informations. La sélection est affichée sur le site de façon très visuelle et propose pour chaque outil les informations suivantes :

Type de l’outil, technologie utilisée, licence, ainsi que des liens vers les sites des éditeurs de l’outil, vers les documentions ou vers un repository…

http://selection.datavisualization.ch/

D’autres infos sur le site : http://datavisualization.ch/

Fabrica : un site sur les outils de gestion de l’information

Le site Fabrica, mis en place par les services IST de l’Inria, est un service de partage de connaissances sur les outils et astuces facilitant la gestion de l’information et testés par des documentalistes ou des chercheurs de l’institut. Il est maintenant ouvert aux contributions extérieures et toute personne peut signaler un outil, décrire une méthodologie ou une simple astuce dont elle a éprouvé la pertinence dans les domaines de la recherche et de la gestion de l’information.

Outils et astuces sont présentés à travers 6 rubriques :

  • Gérer une bibliographie
  • Optimiser sa recherche sur le web
  • Rédiger collectivement et partager des documents
  • Surveiller le web
  • Visualiser et exploiter l’information
  • Rechercher des documents sur son disque dur

Régulièrement, un  outil différent est mis en avant.

Fabrica est une action du projet Atelier Documentaire du Chercheur.

http://fabrica.inria.fr/

image du site Fabrica de l'INRIA