« GenealogyBot » : différence entre les versions

De Wikipast
Aller à la navigation Aller à la recherche
Aucun résumé des modifications
Ligne 12 : Ligne 12 :


==Discussion des performances==
==Discussion des performances==
===Nombre de pages générées ou modifiées===
===Améliorations possibles===
Données non exploitées par le bot :
année de naissance de l'épouse
adresse
toutes les informations sur les pensionnaires
Gestion des erreurs d'OCR:
pour les dates
pour les noms


==Code==
==Code==


L'entièreté du code est disponible sur GitHub. [https://github.com/JeremyDezalos/GenealogyBot]
L'entièreté du code est disponible sur GitHub. [https://github.com/JeremyDezalos/GenealogyBot]

Version du 18 mai 2021 à 12:48

Le but de ce bot est de traiter les données généalogiques provenant du recensement lausannois de 1832.

Données traitées

Les données traitées par ce bot sont des données généalogiques issues du recensement de 1832 dans la ville de Lausanne. Le document original est accessible sur le site des archives de Lausanne [1]. C'est la transcription automatique par un OCR de ces données qui est utilisée [2]. Cela correspond à 3701 entrées sous le format d'un tableau Excel.

Résumé des fonctionnalités

Dans un premier temps, le bot doit traiter toutes les entrées pour en extraire le nom de tous les chefs de famille et de leurs enfants ainsi que leurs dates de naissances respectives. Ensuite, il doit créer sur Wikipast les pages et/ou les entrées correspondantes en respectant la bonne syntaxe.

Description technique

Discussion des performances

Nombre de pages générées ou modifiées

Améliorations possibles

Données non exploitées par le bot : année de naissance de l'épouse adresse toutes les informations sur les pensionnaires

Gestion des erreurs d'OCR: pour les dates pour les noms

Code

L'entièreté du code est disponible sur GitHub. [3]