« TangoBot » : différence entre les versions
Aller à la navigation
Aller à la recherche
(→Code) |
(→Code) |
||
Ligne 23 : | Ligne 23 : | ||
== Code == | == Code == | ||
[https://github.com/cavEpfl/TangoBot/ Code accessible sur Github] |
Version du 9 mai 2017 à 20:07
Résumé des fonctionnalités
Ce bot permet d'enlever l'information redondante sur une page. Le tout avec une musique de tango en arrière fond pour bercer vos oreilles.
Description technique
Exemples
1) Si le TangoBot compare deux phrases identiques :
- "1828.05.08 / Genève. Naissance de Henri Dunant. [1] | [2]." est présente deux fois dans la même page. Alors le TangoBot remarquera directement que les mêmes phrases possèdent les mêmes mots aux mêmes endroits. Il décidera donc d'en supprimer une des deux.
2) Si le TangoBot compare deux phrases contenant les mêmes mots-clés mais pas identiques :
- "1828.05.08 / Genève. Naissance de Henri Dunant. [3] | [4]."
- "1828.05.08 / Genève. Un médecin donne Naissance à Henri Dunant. [5] | [6]."
- Dans ce cas particulier, le TangoBot remarque que les mots clés des 2 phrases sont identiques. Alors le TangoBot ne garde que la première des deux phrases.
3) Si le TangoBot compare deux phrases similaires :
- "1828.05.08 / Genève. Naissance de Henri Dunant. [7] | [8]."
- "1828.05.08 / Genève. Henri Dunant est né. [9] | [10]."
- Ici, le TangoBot voit qu'il y a Henri Dunant dans les 2 phrases et que le nom est associé à "Naissance" et "né". Il établit donc un lien entre les 2 phrases et remarque qu'elles sont fortement similaires. Il décide donc de garder la première.
Le tango
Comme le TangoBot est un grand amateur de musiques de salon, il souhaite après chaque execution, vous faire partager sa passion. Il devrait donc mettre un player ou un lien youtube en bas de la page qu'il a vérifié afin que vous puissiez écouter un bout de son morceaux préféré.