« TangoBot » : différence entre les versions

De Wikipast
Aller à la navigation Aller à la recherche
(Contenu remplacé par « == Résumé des fonctionnalités == Ce bot permet d'enlever l'information redondante sur une page. Le tout avec une musique de tango en arrière fond pour bercer vos o... »)
Aucun résumé des modifications
Ligne 4 : Ligne 4 :
== Description technique ==
== Description technique ==


== Exemples ==
1) Si le TangoBot compare deux phrases identiques :
*"[[1828.05.08]] / [[Genève]]. [[Naissance]] de [[Henri Dunant]]. [http://letemps.archives.world/page/GDL_1978_04_20/5/%22Henri%20Dunant%22] | [http://letemps.archives.world/page/GDL_1985_10_26/14/%22Henry%20Dunant%22]." est présente deux fois dans la même page. Alors le TangoBot remarquera directement que les mêmes phrases possèdent les mêmes mots aux mêmes endroits. Il décidera donc d'en supprimer une des deux.
2) Si le TangoBot compare deux phrases contenant les mêmes mots-clés mais pas identiques :
*"[[1828.05.08]] / [[Genève]]. [[Naissance]] de [[Henri Dunant]]. [http://letemps.archives.world/page/GDL_1978_04_20/5/%22Henri%20Dunant%22] | [http://letemps.archives.world/page/GDL_1985_10_26/14/%22Henry%20Dunant%22]."
*"[[1828.05.08]] / [[Genève]]. Un médecin donne [[Naissance]] à [[Henri Dunant]]. [http://letemps.archives.world/page/GDL_1978_04_20/5/%22Henri%20Dunant%22] | [http://letemps.archives.world/page/GDL_1985_10_26/14/%22Henry%20Dunant%22]."
*Dans ce cas particulier, le TangoBot remarque que les mots clés des 2 phrases sont identiques. Alors le TangoBot ne garde que la première des deux phrases. 
3) Si le TangoBot compare deux phrases similaires :
*"[[1828.05.08]] / [[Genève]]. [[Naissance]] de [[Henri Dunant]]. [http://letemps.archives.world/page/GDL_1978_04_20/5/%22Henri%20Dunant%22] | [http://letemps.archives.world/page/GDL_1985_10_26/14/%22Henry%20Dunant%22]."
*"[[1828.05.08]] / [[Genève]]. [[Henri Dunant]] est né. [http://letemps.archives.world/page/GDL_1978_04_20/5/%22Henri%20Dunant%22] | [http://letemps.archives.world/page/GDL_1985_10_26/14/%22Henry%20Dunant%22]."
*Ici, le TangoBot voit qu'il y a [[Henri Dunant]] dans les 2 phrases et que le nom est associé à "[[Naissance]]" et "né". Il établit donc un lien entre les 2 phrases et remarque qu'elles sont fortement similaires. Il décide donc de garder la première.
== Le tango ==
Comme le TangoBot est un grand amateur de musiques de salon, il souhaite après chaque execution, vous faire partager sa passion. Il devrait donc mettre un player ou un lien youtube en bas de la page qu'il a vérifié afin que vous puissiez écouter un bout de son morceaux préféré.


== Code ==
== Code ==

Version du 9 mai 2017 à 16:03

Résumé des fonctionnalités

Ce bot permet d'enlever l'information redondante sur une page. Le tout avec une musique de tango en arrière fond pour bercer vos oreilles.

Description technique

Exemples

1) Si le TangoBot compare deux phrases identiques :

  • "1828.05.08 / Genève. Naissance de Henri Dunant. [1] | [2]." est présente deux fois dans la même page. Alors le TangoBot remarquera directement que les mêmes phrases possèdent les mêmes mots aux mêmes endroits. Il décidera donc d'en supprimer une des deux.

2) Si le TangoBot compare deux phrases contenant les mêmes mots-clés mais pas identiques :

3) Si le TangoBot compare deux phrases similaires :

Le tango

Comme le TangoBot est un grand amateur de musiques de salon, il souhaite après chaque execution, vous faire partager sa passion. Il devrait donc mettre un player ou un lien youtube en bas de la page qu'il a vérifié afin que vous puissiez écouter un bout de son morceaux préféré.

Code