Fréquence normalisée

De Wikipast
Aller à la navigation Aller à la recherche

Une fréquence normalisée est une fréquence qui est calculée relativement à une subdivision de l'ensemble de départ.

Exemple: Soit un corpus de données textuelles qui s'étale sur plusieurs années. La fréquence d'un n-gramme N normalisée par l'année Y, est la fréquence dun n-gramme N dans le sous-corpus déterminé par l'année Y. Il s'agit donc du nombre de fois que le n-gramme N apparait durant l'année Y dans le corpus, divisé par le nombre de n-grammes apparaissant au cours de cette année Y dans ce même corpus. La fréquence d'un n-gramme N normalisée par l'année Y représente une estimation de la probabilité d'apparition du n-gramme N dans un échantillon de données textuelles du sous-corpus déterminé par l'année Y.