« EventFormatBot » : différence entre les versions

De Wikipast
Aller à la navigation Aller à la recherche
Aucun résumé des modifications
(Page blanchie)
Ligne 1 : Ligne 1 :
EventFormatBot a pour but d'étendre les fonctionnalités de [[FormatBot]]. Il vérifie que la syntaxe d'écriture des événements est bien respectée selon le dictionnaire des typologies d'événements. Si ce n'est pas le cas, le bot réécrit si possible les entrées selon une syntaxe basique.


== Implémentation Technique ==
EventFormatBot prend un article Wikipast comme argument. Il distingue les entrées et vérifie la syntaxe indépendament de chacune d'elles.
=== Interprétation de la nature d'un mot ===
Dans le cadre de cet algorithme, il est nécessaire de déterminer la nature d'un mot (Personnage, Lieu, Objet, autre...).
La syntaxe d'un événement est une succession ordonnée de mots de nature spécifique.
Example
NAISSANCE : DATE / LIEU. Naissance de PERSONNAGE.
L'une des étapes du EventFormatBot est donc de vérifier que la nature du mot correspond à
celle attendue par la syntaxe de l'événement.
Dans le cadre du cours, nous n'avons pas le temps de développer nous-même le NER (Named Entity Recognition), nous utiliserons une librairie externe : spaCy.
=== Vérification de la syntaxe ===

Version du 7 mai 2019 à 11:00