Fréquence normalisée

De Wikipast
Version datée du 20 février 2017 à 10:27 par Vbuntinx (discussion | contributions) (Page créée avec « Une fréquence normalisée est une fréquence qui est calculée relativement à une subdivision de l'ensemble de départ. '''Exemple:''' Soit un corpus de données te... »)
(diff) ← Version précédente | Voir la version actuelle (diff) | Version suivante → (diff)
Aller à la navigation Aller à la recherche

Une fréquence normalisée est une fréquence qui est calculée relativement à une subdivision de l'ensemble de départ.

Exemple: Soit un corpus de données textuelles qui s'étale sur plusieurs années. La fréquence d'un n-gramme N normalisée par l'année Y, est la fréquence dun n-gramme N dans le sous-corpus déterminé par l'année Y. Il s'agit donc du nombre de fois que le n-gramme N apparait durant l'année Y dans le corpus, divisé par le nombre de n-grammes apparaissant au cours de cette année Y dans ce même corpus. La fréquence d'un n-gramme N normalisée par l'année Y représente une estimation de la probabilité d'apparition du n-gramme N dans un échantillon de données textuelles du sous-corpus déterminé par l'année Y.