Fréquence normalisée
Aller à la navigation
Aller à la recherche
Une fréquence normalisée est une fréquence qui est calculée relativement à une subdivision de l'ensemble de départ.
Exemple: Soit un corpus de données textuelles qui s'étale sur plusieurs années. La fréquence d'un n-gramme N normalisée par l'année Y, est la fréquence dun n-gramme N dans le sous-corpus déterminé par l'année Y. Il s'agit donc du nombre de fois que le n-gramme N apparait durant l'année Y dans le corpus, divisé par le nombre de n-grammes apparaissant au cours de cette année Y dans ce même corpus. La fréquence d'un n-gramme N normalisée par l'année Y représente une estimation de la probabilité d'apparition du n-gramme N dans un échantillon de données textuelles du sous-corpus déterminé par l'année Y.