« EntryMakerBot » : différence entre les versions

Version du 7 mai 2018 à 07:30

Description

(Sur les bases du SPARQLbot, ce bot cherche à créer un profil à partir des archives du temps, de manière à créer des ébauches de nouvelles entrées pour wikipast, ainsi que des propositions de nouvelles pages.) EntryMakerBot se base sur les archives du journal "Le temps" afin de déterminer quelles informations pourraient être ajoutées à la page wikipast associée à la recherche. En téléchargeant le texte brut depuis les archives, il est possible de déterminer quelles lignes correspondent au personnage recherché, la date de publication du journal, puis d'effectuer un simple triage en fonction de leur pertinence.

Le fonctionnement du bot se divise en X étapes: Premièrement, un scrapping d'informations sur le site de référence (wikipédia ou letempsarchives) est effectué. L'algorithme détermine, grâce aux locations du nom de la personne recherchée, les phrases du texte importantes pour la recherche d'informations. Deuxièmement, les phrases passent par un premier test d'importance puis les dix plus importantes sont sélectionnées afin de passer par la troisième étape: Une sélection basée sur le lexique 382.

@@ Ligne 3 : / Ligne 3 : @@
 EntryMakerBot se base sur les archives du journal "Le temps" afin de déterminer quelles informations pourraient être ajoutées à la page wikipast associée à la recherche. En téléchargeant le texte brut depuis les archives, il est possible de déterminer quelles lignes correspondent au personnage recherché, la date de publication du journal, puis d'effectuer un simple triage en fonction de leur pertinence.
+Le fonctionnement du bot se divise en X étapes: Premièrement, un scrapping d'informations sur le site de référence (wikipédia ou letempsarchives) est effectué. L'algorithme détermine, grâce aux locations du nom de la personne recherchée, les phrases du texte importantes pour la recherche d'informations. Deuxièmement, les phrases passent par un premier test d'importance puis les dix plus importantes sont sélectionnées afin de passer par la troisième étape: Une sélection basée sur le lexique 382.
+== Scrapping d'informations ==
+== Test d'importance 1 ==
+== Test d'importance 2 ==
 ==Exemples==

« EntryMakerBot » : différence entre les versions

Version du 7 mai 2018 à 07:30

Sommaire

Description

Scrapping d'informations

Test d'importance 1

Test d'importance 2

Exemples

Menu de navigation

« EntryMakerBot » : différence entre les versions

Version du 7 mai 2018 à 07:30

Description

Scrapping d'informations

Test d'importance 1

Test d'importance 2

Exemples

Menu de navigation

Rechercher

« EntryMakerBot » : différence entre les versions