« Bots » : différence entre les versions

De Wikipast
Aller à la navigation Aller à la recherche
 
(212 versions intermédiaires par le même utilisateur non affichées)
Ligne 1 : Ligne 1 :
== Exemples de syntaxe de bots ==
== Propositions 2021 ==


* [[Retrievecontentsbot]]
{| class="wikitable"
* [[Newpagescreationbot]]
|- style="font-weight:bold; text-decoration:underline;"
* [[Chronobot]]
! Nom du bot
* [[Spaciobot]]
! Description
! Membre 1
! Membre 2
! Membre 3
! Membre 4
|-
| style="font-weight:bold;" | [[DisambiguationBot]]
| Création d'une page de désambiugation pour des pages ayant des noms similaires
| Clara Beaubis
| Julia Heiniger
| Simon Liétar
|
|-
| style="font-weight:bold;" | ImpressoBot
| Importation des entitées nommées non présentes dans Wikidata et trouvées dans les journaux d'[https://impresso-project.ch/app/ Impresso] (extraction déjà effectuée)
|
|
|
|
|-
| style="font-weight:bold;" | WebLinkBot
| Recherche d’informations supplémentaires à ajouter sur les pages Wikipast et création de liens vers ces pages
|
|
|
|
|-
| style="font-weight:bold;" | WikidataImporterBot
| Complétion des pages Wikipast ayant des information sur Wikidata (à partir de l'annotation de [http://wikipast.epfl.ch/wiki/Wikidataficator Wikidataficator])
|
|
|
|
|-
| style="font-weight:bold;" | [[UniqueIDBot]]
| Définition d’un WikipastID unique et insertion dans les pages déjà créées
| Louis-Dardaye Dramé
| Eloi Garandel
| Robin Ottinger
|
|-
| style="font-weight:bold;" | [[EliteBot]]
| Importation dans Wikipast des données de la base des [https://www2.unil.ch/elitessuisses/index.php?page=accueil Élites Suisses]
| Joshua Bernimoulin
| Nicolas Raulin
| Ira Dobbelaere
|
|-
| style="font-weight:bold;" | [[MostWantedBot]]
| Création dans Wikipast de pages à partir de la liste [https://en.wikipedia.org/wiki/Wikipedia:Most-wanted_articles “Most Wanted Wikipedia Article”]
| Arthur André
| Xavier Dulex
|  Yucef Grebici
|
|-
| style="font-weight:bold;" | [[LinkBot2]]
| Augmenter le nombre de liens entre les pages Wikipast par la création d’index plus nombreux. Note: Contient deux fonctionnalités: Amélioration de [[PageUpdaterBot]] et division de pages trop longues en sous-pages en regroupant les entrées selon décennies. N'a pas vraiment un lien avec [[LinkBot]] au niveau de fonctionnalité.
| Parzival Nussbaum
| Noah Kaltenrieder
| Léonard Flückiger
|
|-
| style="font-weight:bold;" | ImageBot2
| Amelioration d’[http://wikipast.epfl.ch/wiki/ImageBot ImageBot] (avec par exemple, la création d’images génériques dans le cas où aucune image est présente)
|
|
|
|
|-
| style="font-weight:bold;" | [[GenealogyBot]]
| Importation d’informations à partir de base généalogique (source à choisir et citer)
| Jeremy Dezalos
| Romain Küenzi
| Armelle Bouhali
|
|-
| style="font-weight:bold;" | PlaceBot
| Importation d’informations à partir de Geonames ou autre et recherche des pages Wikipast ayant des informations sur ces lieux
|
|
|
|-
| style="font-weight:bold;" | [[ArtBot]]
| Importation d’événements de ventes d’oeuvres d’art à partir de [https://github.com/thegetty/provenance-index-csv Getty Provenance Index]
| Michael Richter
| Vincent Philippoz
| Agatha Duranceau
|
|-
| style="font-weight:bold;" | [[SportBot]]
| Importation de données sur des évènements sportifs (source à choisir et citer)
| Antonin Stampbach
| Enzo Palmisano
| Alessio Verardo
| Aurelien Ferlay
|-
| style="font-weight:bold;" | [[WarBot]]
| Importation de données sur les guerres mondiales (source à choisir et citer)
| Mohamed Ali Dhraief
| Nora Bugmann
| Stefan Eric
|
|-
|}


== Pages pour faire des essais avec les bots ==
== Projets 2020 ==


* [[Bacasable]]
À partir de l'extraction de 4 million d’adresses dans les anciens annuaires de la ville de Paris effectuée par l'équipe du DHLAB (Di Lenardo, I., Barman, R., Descombes, A., Kaplan F. (2019). [https://dev.clariah.nl/files/dh2019/boa/0878.html Repopulating Paris: massive extraction of 4 Million addresses from city directories between 1839 and 1922, Digital Humanities conference DH2019, Utrecht, Pays-Bas]), les étudiants du cours en 2020 ont créé des millions de nouvelles entrées dans Wikipast en programmant des BottinBots – chacun se voyant attribuée une partie du corpus, et prêtant attention aux cas d'homonymie, d'erreurs d'OCR, et de pages préexistantes.


== Projets ==
{| class="wikitable"
! style="text-align:left;" | Horaire de passage
! style="text-align:left;" | Nom de bot
! style="text-align:left;" | Membre 1
! style="text-align:left;" | Membre 2
! style="text-align:left;" | Membre 3
! style="text-align:left;" | Données
|-
! style="text-align:left;"| 13:15-13:30
| [[BottinBot1]]
| Basile Spaenlehauer || Ahmed Zouaoui || Abed Alrahman Shabaan || [https://drive.google.com/open?id=1A6v_xDeul3HnPcsojaxYO2KgvIcbO8Dv données groupe 1]
|-
! style="text-align:left;" | 13:30-13:45
| [[BottinBot2]]
| Maximilian Forberg || Damien Geissbuhler  || Eliott Mamon || [https://drive.google.com/open?id=1uJYlR6m1W-yje9vXhR2g2focueXKvD34 données groupe 2]
|-
! style="text-align:left;" | 13:45-14:00
| [[BottinBot3]]
|  Maxime Jan|| Aleandro Eccel  || || [https://drive.google.com/open?id=1gvN6Fq1z2cfIJA_IwWOgRubctOiYNEZT données groupe 3]
|-
! style="text-align:left;" | 14:00-14:15
| [[BottinBot4]]
| Raphael Bonatti || Benoît Maillard || Justin Deschenaux || [https://drive.google.com/open?id=1MLv_BWPFr5xpetDbVYzztBWnJTtB2AAi données groupe 4]
|-
! style="text-align:left;" |14:15:14:30
| [[BottinBot5]]
| Pierre Henon|| Juliette Barbier || || [https://drive.google.com/open?id=1mtHLF8DSZ2pyB_DPkzmB7mT2DZ-6fOwP données groupe 5]
|-
! style="text-align:left;" | 14:30-14:45
| [[BottinBot6]]
| Ayman Mezghani || Clément Lhoste ||  || [https://drive.google.com/open?id=15gYaCw5cYOGoEDfLoTi5pakzpOcias0a données groupe 6]
|}
 
== Projets 2019 ==
 
{| class="wikitable"
! style="text-align:left;" | Nom de bot
! style="text-align:left;" | Membre 1
! style="text-align:left;" | Membre 2
! style="text-align:left;" | Membre 3
|-
! style="text-align:left;" | [[Wikidataficator]]
| Jeremy Mion|| Andrea Scalisi ||
|-
! style="text-align:left;" | [[GallicaSPARQLBot]]
| Eric Jollès || Robin Mamie ||
|-
! style="text-align:left;" | [[EventFormatBot]]
| Julien Malka || Antoine Crettenand ||
|-
! style="text-align:left;" | [[CurvyBot]]
| Ugo Damiano|| Cédric Tomasini||
|-
! style="text-align:left;" | [[MasterBot]]
| Karim Assi|| ||
|-
! style="text-align:left;" | [[MinerRegExBot]]
| Lucien Iseli|| Jules Gottraux|| Florian Ravasi
|-
! style="text-align:left;" | [[StatBot]]
| Nicholas Greensmith || Ruslan Mushkaev ||
|}
 
== Projets 2018 ==
{| class="wikitable"
! style="text-align:left;" | Nom de bot
! style="text-align:left;" | Membre 1
! style="text-align:left;" | Membre 2
! style="text-align:left;" | Membre 3
! style="text-align:left;" | Membre 4
! style="text-align:left;" | Membre 5
|-
! style="text-align:left;" | [[SummarizingBot]]
| Andrey Piskunov || Daniil Morzhakov ||  ||  ||
|-
! style="text-align:left;" | [[SimilarBot]]
| Christian Bertoni || Ludovico Machet || Mathieu Suter || Elisa Vidal-Revel || Rémi Petitpierre
|-
! style="text-align:left;" | [[TranslatorBot]]
| Pierre Gabioud || Maxime Lemarignier || Natalia Nessler || Kopiga Rasiah || Yusi Zou
 
|-
! style="text-align:left;" | [[VandalBot]]
| Mathieu Ducroux || Frédéric Myotte || Stanislas Michel || Vincent Coriou ||
|-
 
! style="text-align:left;" | [[Triplificator]]
| Basil Hall || Shana Calmes || Jan Frogg || Souhail Elaissaoui ||
 
|-
! style="text-align:left;" | [[Creatobot]]
| Bourquin Vladimir || Duruz Noé || Natalija Ljubic || Evard Amandine ||
|-
! style="text-align:left;" | [[SliderBot]]
| Paul Guhennec || Maël Wildi || Etienne Bonvin || Mathilde Raynal || Stefano Politi
|-
! style="text-align:left;" | [[GraderBot]]
| Aurélien Debbas || Léo Meynent || || ||
|-
! style="text-align:left;" | [[EntryMakerBot]]
| Luca Marti || Alexandre Pages ||  || ||
|}


=== Vue d'ensemble des projects sélectionnés ===
== Projets 2017 ==


{| class="wikitable"
{| class="wikitable"
Ligne 29 : Ligne 234 :
|-
|-
! style="text-align:left;" | [[TangoBot]]
! style="text-align:left;" | [[TangoBot]]
| Patrik Wagner || Stephane Selim || Alex Cavaleri || Gomez Vivolo Antoine ||
| Patrik Wagner || Stephane Selim || Alex Cavaleri || Antoine Gomez ||
|-
|-
! style="text-align:left;" | [[LinkBot]]
! style="text-align:left;" | [[LinkBot]]
Ligne 41 : Ligne 246 :
|-
|-
! style="text-align:left;" | [[SPARQLBot]]
! style="text-align:left;" | [[SPARQLBot]]
| Marc Bickel || Raphaël Barman || Grégoire Hirt || ||
| Marc Bickel || Raphaël Barman || Grégoire Hirt || Houssam Ben Hallam ||
|-
|-
! style="text-align:left;" | [[FormatBot]]
! style="text-align:left;" | [[FormatBot]]
Ligne 55 : Ligne 260 :
| Christophe Badoux || Kim Lan Phan Hoang || Robin Lang || Julien Burkhard ||
| Christophe Badoux || Kim Lan Phan Hoang || Robin Lang || Julien Burkhard ||
|}
|}
=== Bots de formatage ===
==== [[HypermotBot]] ====
Bot qui detecte des formulations qui pourraient bénéficier d'une version formalisée sous la forme d'un hypermot et suggère une nouvelle écriture.
Exemple : Le bot rencontre la phrase :
*[[1828.05.08]] [[Henri Dunant]] est né à [[Genève]] [http://letemps.archives.world/page/GDL_1978_04_20/5/%22Henri%20Dunant%22] | [http://letemps.archives.world/page/GDL_1985_10_26/14/%22Henry%20Dunant%22]
il propose :
*[[1828.05.08]] / [[Genève]]. [[Naissance]] de [[Henri Dunant]]. [http://letemps.archives.world/page/GDL_1978_04_20/5/%22Henri%20Dunant%22] | [http://letemps.archives.world/page/GDL_1985_10_26/14/%22Henry%20Dunant%22]
Ce même bot peut vérifier si les utilisations d'hypermots sont compatibles avec la syntaxe décrite dans leur page.
==== [[Orthobot]] ====
* Le bot est un robot détecteur de fautes d'orthographe.
* Il parcourt les différentes sites.
* Vérifie l'intégralité des mots à l'aide d'un dictionnaire
* Si une correction est trouvée il propose à l'auteur une correction
==== [[SourceBot]] ====
* Le bot détecte l'absence éventuelle d'une source dans une ligne biographique et la signale
* Il met à jour une page FactChecking qui liste les entrées non sourcées en associant une référence particulière à cet inconnue
* Il scanne régulièrement la page, si la sourcée est ajoutée il a remet dans la biographie.
==== [[VandalBot]] ====
Le bot détecte les opérations qui peuvent être du vandalisme (ex : suppression rapide d'un grand nombre de lignes, etc.). En cas de detection il émet une alerte.
=== Bots de mise à jour de databiographie ===
==== [[PageUpdaterBot]] ====
Bot qui surveille toutes les nouvelles entrées biographiques et met à jour les pages concernant les entités présentes automatiquement. Si la page n'existe pas il la créé.
Exemple : Un utilisateur qui met à jour la page [[Henri Dunant]] rentre l'information 
*[[1864.08.22]] / [[Genève]]. [[Création]] par [[Henri Dunant]] de la [[Croix rouge]]. [http://letemps.archives.world/page/JDG_1897_12_31/1/%22Henri%20Dunant%22]
Le bot recopie la ligne à la bonne place sur la page  [[Croix rouge]].
==== [[BioPathBot]] ====
Ce bot effectue deux types d'actions en parallèle :
1) Il gère automatiquement les informations ayant lieu dans des zones spatiotemporelles en recopiant toutes les informations correspondant à une [[zone spatiotemporelle]] donnée.
Exemple le bot détecte
*[[1864.08.22]] / [[Genève]]. [[Création]] par [[Henri Dunant]] de la [[Croix rouge]]. [http://letemps.archives.world/page/JDG_1897_12_31/1/%22Henri%20Dunant%22]
et ajoute l'évènement dans la page de référence spatiotemporelle de taille minimale correspondante.
2) Il construit et maintient pour chaque personne une page spéciale qui trace la trajectoire biographique de cette personne.
La biographie d'Henri Dunant est transformée en séquence de zones spatiotemporelles.
Eventuellement cette page peut aussi contenir une carte temporelle.
==== [[SPARQLBot]] ====
Ce bot utilise l'extraction effectuée de plusieurs millions d'entités nommées accessible depuis le  [http://letemps.archives.world/sparql SPARQL endpoint].
Il s'agit d'automatiquement créer (après avoir fait des tests à petite échelle bien sur) des pages databiographiques pour les personnes ou les lieux mentionnés.
L'hypermot [[Mention]] sera dans un premier temps utilisé.
==== [[LinkBot]] ====
* Lien automatique vers la page Wikipedia quand elle existe.
* Idem avec d'autres bases du web semantique
=== Bots d'inférences et tests de contraintes ===
==== [[CheckerBot]] ====
Ce bot teste
* Qu'une personne n'est pas impliquée dans certains type d'évènements avant d'être né et après être mort. Il faudra pour cela catégoriser les hypermots qui correspondent à ce type d'évènement (exemple [[Rencontre]] à cette contrainte mais pas [[Distinction]])
* Qu'une personne n'est pas à deux endroit au même moment et en même temps (une utilisant pas exemple la notion de [[zone spatiotemporelle]]).
* autres contraintes à déterminer
==== [[InferenceBot]] ====
* Ce bot reconstruit automatiquement le réseau social d'une personne en trouvant toute les personnes qui cette personne connait, en faisant des inférences à partir de certains hypermots (ex : [[Rencontre]]). Le réseau est ensuite mis à jour dans une section particulière de la page d'une personne en utilisant le vocabulaire des [[Predicats]].
* Ce bot met également à jour les lien des parentés et l'arbre généalogique en utilisant aussi le vocabulaire des [[Predicats]].
==== [[MiningBot]] ====
* Bot qui cherche des évènements particuliers directement dans les archives du Temps en utilisant des templates syntaxiques.
* Exemple 1 : Recherche de toutes les manières d'exprimer l'évènement [[Naissance]] et proposition de completion des pages Wiki
* Exemple 2 : Recherche de toutes les manières d'exprimer l'évènement [[Fondation]] et proposition de completion des pages Wiki
=== Meta Bots  ===
==== [[Wiki Language for Bot Programming]] ====
Inventer une nouvelle syntaxe pour programmer facilement des bots directement dans les pages wiki. Ceci demande une analyse des bots en cours de créations pour repérer les parties redondante et proposer une formulation plus compact ouvrant l'écriture des bots aux personnes qui ne savent pas programmer dans des langages comme Python.
=== Suggestion d'autres bots par les étudiants  ===
==== [[ChronoBot]] ====
Regroupe tous les évènements qui se sont passés à un jour donné, un mois donné, une année donnée. Les classe par ordre chronologique et fait des statistiques de base sur leurs typologies (Nombre de Naissance, etc.)
==== [[ImageBot]] ====
Illustre les pages avec des contenus en Creative Commons.
====[[FormatBot]]====
Scanne les différents articles et met à un format standard tout ce qui est dates, nom propre ... (tout ce qui pourrait avoir une forme standard)
===[[TangoBot]]===
Bot qui complète ou crée la page lié à un hypermot.
Exemple : Le bot rencontre la phrase :
*[[1828.05.08]] [[Henri Dunant]] est né à [[Genève]] [http://letemps.archives.world/page/GDL_1978_04_20/5/%22Henri%20Dunant%22] | [http://letemps.archives.world/page/GDL_1985_10_26/14/%22Henry%20Dunant%22]
-Il propose de créer une page pour la date donnée ou il indique la naissance de Henri Dunant.
-Il vérifie si la naissance de Henri Duant est indiquée dans la page Naissance et complète si ce n'est pas le cas.
-Même pour la page Genève: Indique que Henri Dunant est né à Genève.

Dernière version du 1 juin 2021 à 12:35

Propositions 2021

Nom du bot Description Membre 1 Membre 2 Membre 3 Membre 4
DisambiguationBot Création d'une page de désambiugation pour des pages ayant des noms similaires Clara Beaubis Julia Heiniger Simon Liétar
ImpressoBot Importation des entitées nommées non présentes dans Wikidata et trouvées dans les journaux d'Impresso (extraction déjà effectuée)
WebLinkBot Recherche d’informations supplémentaires à ajouter sur les pages Wikipast et création de liens vers ces pages
WikidataImporterBot Complétion des pages Wikipast ayant des information sur Wikidata (à partir de l'annotation de Wikidataficator)
UniqueIDBot Définition d’un WikipastID unique et insertion dans les pages déjà créées Louis-Dardaye Dramé Eloi Garandel Robin Ottinger
EliteBot Importation dans Wikipast des données de la base des Élites Suisses Joshua Bernimoulin Nicolas Raulin Ira Dobbelaere
MostWantedBot Création dans Wikipast de pages à partir de la liste “Most Wanted Wikipedia Article” Arthur André Xavier Dulex Yucef Grebici
LinkBot2 Augmenter le nombre de liens entre les pages Wikipast par la création d’index plus nombreux. Note: Contient deux fonctionnalités: Amélioration de PageUpdaterBot et division de pages trop longues en sous-pages en regroupant les entrées selon décennies. N'a pas vraiment un lien avec LinkBot au niveau de fonctionnalité. Parzival Nussbaum Noah Kaltenrieder Léonard Flückiger
ImageBot2 Amelioration d’ImageBot (avec par exemple, la création d’images génériques dans le cas où aucune image est présente)
GenealogyBot Importation d’informations à partir de base généalogique (source à choisir et citer) Jeremy Dezalos Romain Küenzi Armelle Bouhali
PlaceBot Importation d’informations à partir de Geonames ou autre et recherche des pages Wikipast ayant des informations sur ces lieux
ArtBot Importation d’événements de ventes d’oeuvres d’art à partir de Getty Provenance Index Michael Richter Vincent Philippoz Agatha Duranceau
SportBot Importation de données sur des évènements sportifs (source à choisir et citer) Antonin Stampbach Enzo Palmisano Alessio Verardo Aurelien Ferlay
WarBot Importation de données sur les guerres mondiales (source à choisir et citer) Mohamed Ali Dhraief Nora Bugmann Stefan Eric

Projets 2020

À partir de l'extraction de 4 million d’adresses dans les anciens annuaires de la ville de Paris effectuée par l'équipe du DHLAB (Di Lenardo, I., Barman, R., Descombes, A., Kaplan F. (2019). Repopulating Paris: massive extraction of 4 Million addresses from city directories between 1839 and 1922, Digital Humanities conference DH2019, Utrecht, Pays-Bas), les étudiants du cours en 2020 ont créé des millions de nouvelles entrées dans Wikipast en programmant des BottinBots – chacun se voyant attribuée une partie du corpus, et prêtant attention aux cas d'homonymie, d'erreurs d'OCR, et de pages préexistantes.

Horaire de passage Nom de bot Membre 1 Membre 2 Membre 3 Données
13:15-13:30 BottinBot1 Basile Spaenlehauer Ahmed Zouaoui Abed Alrahman Shabaan données groupe 1
13:30-13:45 BottinBot2 Maximilian Forberg Damien Geissbuhler Eliott Mamon données groupe 2
13:45-14:00 BottinBot3 Maxime Jan Aleandro Eccel données groupe 3
14:00-14:15 BottinBot4 Raphael Bonatti Benoît Maillard Justin Deschenaux données groupe 4
14:15:14:30 BottinBot5 Pierre Henon Juliette Barbier données groupe 5
14:30-14:45 BottinBot6 Ayman Mezghani Clément Lhoste données groupe 6

Projets 2019

Nom de bot Membre 1 Membre 2 Membre 3
Wikidataficator Jeremy Mion Andrea Scalisi
GallicaSPARQLBot Eric Jollès Robin Mamie
EventFormatBot Julien Malka Antoine Crettenand
CurvyBot Ugo Damiano Cédric Tomasini
MasterBot Karim Assi
MinerRegExBot Lucien Iseli Jules Gottraux Florian Ravasi
StatBot Nicholas Greensmith Ruslan Mushkaev

Projets 2018

Nom de bot Membre 1 Membre 2 Membre 3 Membre 4 Membre 5
SummarizingBot Andrey Piskunov Daniil Morzhakov
SimilarBot Christian Bertoni Ludovico Machet Mathieu Suter Elisa Vidal-Revel Rémi Petitpierre
TranslatorBot Pierre Gabioud Maxime Lemarignier Natalia Nessler Kopiga Rasiah Yusi Zou
VandalBot Mathieu Ducroux Frédéric Myotte Stanislas Michel Vincent Coriou
Triplificator Basil Hall Shana Calmes Jan Frogg Souhail Elaissaoui
Creatobot Bourquin Vladimir Duruz Noé Natalija Ljubic Evard Amandine
SliderBot Paul Guhennec Maël Wildi Etienne Bonvin Mathilde Raynal Stefano Politi
GraderBot Aurélien Debbas Léo Meynent
EntryMakerBot Luca Marti Alexandre Pages

Projets 2017

Wikipast Bot Projects member_1 member_2 member_3 member_4 member_5
InferenceBot Marc Jollès Pierre-Alexandre Lee Leandro Kieliger Quentin Bacuet Aurélien Monbaron
SourceBot Karine Perrard Matthieu Baud Alexis Dewaele Grégoire Mayrhofer
TangoBot Patrik Wagner Stephane Selim Alex Cavaleri Antoine Gomez
LinkBot Thierry Bossy Ignacio Aleman Andy Caforio Ziyan Li Nawel Naas
ImageBot Thomas Boyer Ghislain Asin Samuel Sekarski Christine Roth
ChronoBot Aurélien Verdier Jonathan Charrière Arnau Albà Sonia Bouchiba Sébastien Morel
SPARQLBot Marc Bickel Raphaël Barman Grégoire Hirt Houssam Ben Hallam
FormatBot Cem Musluoglu Alex Jourdan Jan Snoeijs Claudio Loureiro
OrthoBot Leblanc Martin Antoine Launay Bruno Wicht Cinéus Jennifer M.
PageUpdaterBot Pannatier Arnaud Fournier Romain Giorla Matteo Viaccoz Cédric
BioPathBot Christophe Badoux Kim Lan Phan Hoang Robin Lang Julien Burkhard