Google Ngram Viewer, un énorme corpus linguistique

Google Ngram Viewer, un énorme corpus linguistique – Actualité Abondance.

Google présente un nouvel outil qui analyse les mots présents dans les ouvrages numérisés dans Google Books … soit environ 5,2 millions d’ouvrages écrits en anglais, mais aussi français, chinois, allemand, russe et espagnol qui représentent environ 4% de la production des livres publiés sur Terre en deux siècles. L’outil examine l’ensemble des mots contenus dans les ouvrages et permet de dégager des tendances d’utilisations et la récurrence de mots, phrases ou expressions, sur une année précise ou une période.

Un site web est d’ores et déjà disponible, proposant liste et statistiques sur les mots et « n-grammes » (suites de n mots consécutifs, n étant inférieur ou égal à 5).

En savoir plus :

Tester par soi-même : Essayer Ngram Viewer

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.