etcML, un outil gratuit des chercheurs de Stanford pour l’analyse textuelle

EtcML =Easy Text Classification with Machine learning.

http://www.etcml.com/

EtcML se présente comme un outil web mis gratuitement à disposition par les chercheurs de l’unité de Stanford pour analyser les textes tout en améliorant le processus d’apprentissage. Il permet aussi de prédire avec des « sentiments » comme positif / négatif ou encore de classer des informations à partir d’une recherche dans Twitter ou dans un ensemble de données textuelles.

La première étape demande la préparation de données

Le site explique comment créer et préparer un jeu de données textuelles (avec ou sans tag). Il est également possible de créer des données à partir de recherches dans Twitter par mot-clé ou hashtag. Les jeux de données déposés sur le site peuvent être publics.

La deuxième étape propose de créer ou de choisir un « classifier » qui va séparer les données.

Enfin la troisième étape « train » consiste à améliorer le « classifier » par l’apprentissage.

Ci dessous, un exemple avec une recherche sur « Agroecology » sur Twitter :

Source  : Stanford Scientists Put Free Text-Analysis Tool on the Web | Engineering. January 30th 2014. Accessed February 6, 2014. http://engineering.stanford.edu/research-profile/stanford-scientists-put-free-text-analysis-tool-web.

2 réflexions sur « etcML, un outil gratuit des chercheurs de Stanford pour l’analyse textuelle »

  1. Ping : etcML, un outil gratuit des chercheurs de Stanf...

  2. Ping : etcML, un outil gratuit des chercheurs de Stanf...

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.