Archives par étiquette : analyse linguistique

TXM : textométrie, analyse quantitative et qualitative de corpus textuels numériques

La plateforme TXM aide à construire et à analyser tout type de corpus textuel numérique éventuellement étiqueté et structuré. Elle est diffusée sous forme de logiciel Windows ou Linux et sous forme d’application web hébergée sur un serveur :

TXM | Développement ESR PLUME.

Google Ngram Viewer, un énorme corpus linguistique

Google Ngram Viewer, un énorme corpus linguistique – Actualité Abondance.

Google présente un nouvel outil qui analyse les mots présents dans les ouvrages numérisés dans Google Books … soit environ 5,2 millions d’ouvrages écrits en anglais, mais aussi français, chinois, allemand, russe et espagnol qui représentent environ 4% de la production des livres publiés sur Terre en deux siècles. L’outil examine l’ensemble des mots contenus dans les ouvrages et permet de dégager des tendances d’utilisations et la récurrence de mots, phrases ou expressions, sur une année précise ou une période.

Un site web est d’ores et déjà disponible, proposant liste et statistiques sur les mots et « n-grammes » (suites de n mots consécutifs, n étant inférieur ou égal à 5).

En savoir plus :

Tester par soi-même : Essayer Ngram Viewer