« Creatobot » : différence entre les versions
Aucun résumé des modifications |
Aucun résumé des modifications |
||
Ligne 11 : | Ligne 11 : | ||
*Page texte: [http://wikipast.epfl.ch/wikipast/index.php/Angela_Merkel_re%C3%A7ue_par_Donald_Trump_pour_une_visite_express] | *Page texte: [http://wikipast.epfl.ch/wikipast/index.php/Angela_Merkel_re%C3%A7ue_par_Donald_Trump_pour_une_visite_express] | ||
*Page classique: [[Test Creatobot]] | *Page classique: [[Test Creatobot]] | ||
== Liste des fonctions == | |||
* existInDictionnary : Teste si le mot existe dans le dictionnaire et si il existe dans la liste des prénoms | |||
* onlyContainLetters : Teste si le mot ne contient que des lettres en utilisant les "Regular Expression" [https://docs.python.org/2/library/re.html] | |||
* beginWithACapitalLetter : Teste si le mot commence avec une majuscule en utilisant aussi les "Regular Expression" [https://docs.python.org/2/library/re.html] | |||
* needBrackets : Teste si toutes les conditions nécessaires sont remplies | |||
== Code source== | == Code source== | ||
<nowiki> | <nowiki> | ||
</nowiki> | </nowiki> |
Version du 1 mai 2018 à 12:00
Creatobot est un bot codé en language Python, il a pour mission de rechercher des potentiels hypermots afin de rajouter les balises correspondant à des lien Wikipast.
Fonctionnement
Creatobot travaille sur les pages créés pas les étudiants du cours SHS Humanités Digitals 2018.Il récupère le lien de la page et scanne ensuite le contenu de la page affin d'effectuer une recherche de potentiels hypermots. Pour ce faire il utilise un algorithme bien précis. Le bot omet d’abord les titres, car la syntaxe Wikipast ne contient pas d'hypermot dans ces derniers, puis il scanne par double mot. Pour réaliser ceci, il sépare le texte de la page en mot, avec comme délimitant les espaces. Pour chaque pair de mot, il commence par enlever la ponctuation si celle-ci existe après le deuxième mot. Il effectue ensuite une batterie de test sur chaque mot. Il test si celui-ci ne contient que des lettres (pas de ponctuation, pas de chiffres, pas de caractères spéciaux) puis ce dernier commence par une majuscule et enfin s'il appartient au dictionnaire francophone. Notons encore que le bot crée sont propre dictionnaire des prénoms francophones, il l'utilise pour tester si un mot, bien que présent dans le dictionnaire appartient à cette liste. Ceci voudrait dire que nous pouvons donc l'inclure. Pour qu'un hypermot soit créé autour d'un double mot il faut donc que les deux mots qui le compose n'appartiennent pas au dictionnaire à moins qu'ils soient dans la liste des prénoms, ne contiennent que des lettres, commencent par une majuscule et ne soit pas déjà entouré d'un hyperlien.
Généralités
- Concepteurs : Amandine Evard, Natalija Ljubic, Duruz Noé, Bourquin Vladimir
- UserName : Creatobot
Exemple de pages modifiées
- Page texte: [1]
- Page classique: Test Creatobot
Liste des fonctions
- existInDictionnary : Teste si le mot existe dans le dictionnaire et si il existe dans la liste des prénoms
- onlyContainLetters : Teste si le mot ne contient que des lettres en utilisant les "Regular Expression" [2]
- beginWithACapitalLetter : Teste si le mot commence avec une majuscule en utilisant aussi les "Regular Expression" [3]
- needBrackets : Teste si toutes les conditions nécessaires sont remplies