N-gramme

De Wikipast
Aller à : navigation, rechercher

définition

Un n-gramme est une sous-séquence de n éléments construite à partir d'une séquence donnée. [1]

applications

Cette notion s'utilise généralement avec des séquences de caractères ou de mots:

  • n-gramme de caractères : suite consécutive et ordonnée de n caractères.

exemple : Si la séquence est "le chat court." la liste des 3-grammes de caractère est "le_", "e_c", "_ch", "cha", "hat", "at_", "t_c", "_co", "cou", "our" et "urt".

  • n-gramme de mots : suite consécutive et ordonnée de n mots.

exemple : Si la séquence est "le chat noir court vite." la liste des 3-grammes de mots est "le chat noir", "chat noir court" et "noir court vite".

n-gram viewer

Le n-gram viewer est l'outil qui permet d'afficher le graphique de la fréquence normalisée (généralement par année) des n-grammes de mots par rapport au temps (généralement les années). Il permet de visualiser le profil temporel des mots, c.a.d. l'évolution de la fréquence d'utilisation des mots, dans un corpus donnée.