Archives par étiquette : fouille de texte

Crossref va lancer Prospect : un service de text mining et data mining

Le service de data mining et text mining de Crossref, Propect, a été approuvé en novembre et sera lancé en 2014. Le pilote est  déjà disponible.

Il y aura deux aspects à ce service :

  • une API  TDM (pour texte standard pour le text mining et le data mining) qui permettra aux chercheurs de demander le texte intégral au site de l’éditeur sous une forme standard.
  • une bibliothèque des conditions d’utilisations pour les éditeurs qui souhaitent que les chercheurs acceptent des conditions d’utilisation. Ces conditions d’utilisation ne sont pas requises quand les documents sont en open access ou quand les chercheurs font partie d’une organisation abonnée à la revue ou aux contenus de l’éditeur.

Pour les informations techniques voir :

Sources :

Fouille de texte et publications savantes

Le Publishing Research Consortium a publié en février un guide sur la fouille de texte appliquée aux publications savantes : « Guide to text mining and scholarly publishing« . Ce document s’adresse à des lecteurs non-experts. Il présente de façon simple ce qu’est la fouille de texte et quels en sont les enjeux. Il donne des indications de base pour commencer dans ce domaine, que l’on soit chercheur (comment sélectionner ses sources, choisir un outil d’extraction…) ou éditeur (pourquoi permettre l’accès aux données, faire du text mining sur ses propres sources pour faciliter le travail des chercheurs, proposer des mash-ups, permettre la recherche sémantique…). Trois études de cas sont présentées : SureChem, BrainMap.org et Relay Technology Management Inc. Un glossaire est présent en fin de document.