CurvyBot

De Wikipast
Version datée du 13 mai 2019 à 20:21 par Shoggy (discussion | contributions) (Ajout description technique partielle CurvyBot)
Aller à la navigation Aller à la recherche

Résumés des fonctionnalités

L'objectif de ce bot est de créer pour chaque biographie un graphe avec en abscisse le temps (en années) et en ordonnée le nombre d'articles par année qui traitent du personnage de la biographie. Les événements mentionnés dans la biographie sont clairement indiqués. Le graphe doit donner une idée de la popularité médiatique du personnage au fil du temps, en fonction des événements marquants le concernant.

Description technique

Le bot se base sur les biographies existantes. La page de chaque biographie est analysée pour en extraire le nom du personnage, des mots remarquables qui seront utilisés pour l'évaluation de la performance et les événements biographiques qui seront affichés sur le graphe.

Le nom du personnage est utilisé pour effectuer une requête à la base de données Impresso, qui retourne pour chaque année le nombre d'article total comprenant les mots cherchés. Ces données permettent directement de créer le graphe.

On peut affiner le graphe en traitant les données de plusieurs courbes générées à partir de recherche sur des mots-clef différents. A VENIR

Évaluation des performances

L'usage de mots remarquables permet de générer plusieurs courbes en effectuant une requête plus précise. La comparaison de ces courbes permet d'évaluer leur fiabilité. On effectue notamment une recherche avec le nom complet du personnage, une recherche avec uniquement son nom de famille, et des recherches avec des mots remarquables. Plusieurs techniques d'extraction de mots remarquables sont proposées:

  • Extraction des mots à occurrences multiples dans les pages.
  • Extraction des fonctions générées par le SPARQLBot dans les mentions. A VENIR

Vitesse

A VENIR

Exemple de résultats

A VENIR


Code

A VENIR