« LinkBot2 » : différence entre les versions
Ligne 15 : | Ligne 15 : | ||
*[[2032]] / [[Lune]]. [[Présentation]] du moonwalk sur la [[Lune]] par [[Michael Jackson]]. | *[[2032]] / [[Lune]]. [[Présentation]] du moonwalk sur la [[Lune]] par [[Michael Jackson]]. | ||
Ici, la page "2032" n'existe pas encore, le bot va donc crée cette page et y ajouter l'entrée complète. | |||
Mais le bot va aussi modifier les pages : "Lune", "Présentation", "Michael Jackson", pour y ajouter l'entrée si elle n'y est pas déjà présente. | |||
===Division en sous-pages=== | ===Division en sous-pages=== |
Version du 25 mai 2021 à 13:35
Résumé des fonctionnalités
LinkBot2 a comme but d'augmenter le nombre de liens entre les datafications biographiques sur Wikipast. Ceci est un but important pour finalement pouvoir augmenter la visibilité de Wikipast sur les moteurs de recherche (SEO).
Le bot a deux fonctionnalités principales:
- Vérifier, et éventuellement ajouter, le contre lien d'une entrée biographique sur la pages d'un hyper-mot utilisé dans une entrée. Pour ceci, le bot PageUpdaterBot a été pris comme base et a été amélioré.
- Diviser des pages trop longues dans des sous pages selon des périodes (siècles, décennies) pour éviter d'avoir des pages trop longues.
Description technique
Compléter les liens
Le bot utilise un dump de wikipast en local, il faut donc avoir une archive correspondante pour lancer cette partie du bot. Il effectue une recherche sur ces différentes pages en local pour observer quelles entrées doivent être mises à jour et les pages qu'ils faut créer. Le bot les crée ensuite sur le site wikipast et ajoute l'entrée sur la nouvelle page, si la page existe déjà, le bot ajoute seulement l'entrée s'il elle n'est pas déjà présente sur la page.
Exemple de fonctionnement
Prenons l'entrée suivant :
- 2032 / Lune. Présentation du moonwalk sur la Lune par Michael Jackson.
Ici, la page "2032" n'existe pas encore, le bot va donc crée cette page et y ajouter l'entrée complète. Mais le bot va aussi modifier les pages : "Lune", "Présentation", "Michael Jackson", pour y ajouter l'entrée si elle n'y est pas déjà présente.
Division en sous-pages
Le bot suppose que pour cette opération:
- Toutes les entrées des datafications biographiques commencent avec un
*
. - La date des entrées est dans le format
yyyy.mm.dd
,yyyy.mm
ou bienyyyy
.
Exemple de fonctionnement
Discussion des performances
Améliorations possibles
parler de faire une "naissance archive" ...
Code
Le code est disponible sur l'instance GitLab de l'EPFL. [1]