« TranslatorBot » : différence entre les versions
Aucun résumé des modifications |
Aucun résumé des modifications |
||
Ligne 19 : | Ligne 19 : | ||
*Un autre problème important consiste en traduction des noms propres. A première vue, les noms propres tels que les noms géographiques doivent être traduits; cependant, les noms des personnes ne sont pas à traduire. Un autre problème se pose ici: comment distinguer un nom de famille d'origine géographique d'un nom géographique? | *Un autre problème important consiste en traduction des noms propres. A première vue, les noms propres tels que les noms géographiques doivent être traduits; cependant, les noms des personnes ne sont pas à traduire. Un autre problème se pose ici: comment distinguer un nom de famille d'origine géographique d'un nom géographique? | ||
La solution la plus élégante serait de laisser à la prochaine volée d'étudiants la création d'un nouveau bot qui classerait les pages existantes selon leur genre. Ceci permettrait de facilement distinguer les pages de personnalités des autres. | |||
*comment créer une page - répértoire NR | *comment créer une page - répértoire NR |
Version du 30 avril 2018 à 16:00
Description
TranslatorBot a pour but de traduire les pages en plusieurs langues au moyen de la librairie de Python, googletrans.
Méthode de traduction
On traduit par bloc d'environ 4500 caractères, en adaptant la taille du bloc selon la ponctuation (afin d'être certain de traduire une phrase complète et non une partie de la phrase).
Afin d'avoir une meilleure synergie avec d'autres bots, TranslatorBot prendra en paramètres la liste de pages à traduire ainsi que la langue choisie. Ceci permet d'éviter des actions du TranslatorBot pouvant porter préjudices aux autres bots, et d'assurer un total contrôle du bot.
TranslatorBot est entièrement modulable grâce à un système de vérification du vocabulaire distinguant les noms propres des noms communs.
TranslatorBot crée la page traduite dans un répertoire correspondant à la langue choisie.
MAX ET YUSI RAJOUTEZ ICI DES TRUCS :P
Problèmes rencontrés
- Un des premiers problèmes considérés, au vu des pages déjà existantes sur WikiPast, a été la traduction des pages générées ou modifiées par des bots. Celles-ci étant parfois victimes d'actions indésirables d'autres bots, leur contenu n'a aucun sens et, par conséquent, devient impossible à traduire.
→ Le problème s'est réglé de lui-même: la méthode appelée par TranslatorBot garde la partie problématique du texte non modifiée.
- Un autre problème important consiste en traduction des noms propres. A première vue, les noms propres tels que les noms géographiques doivent être traduits; cependant, les noms des personnes ne sont pas à traduire. Un autre problème se pose ici: comment distinguer un nom de famille d'origine géographique d'un nom géographique?
La solution la plus élégante serait de laisser à la prochaine volée d'étudiants la création d'un nouveau bot qui classerait les pages existantes selon leur genre. Ceci permettrait de facilement distinguer les pages de personnalités des autres.
- comment créer une page - répértoire NR
- séparation des blocs à traduire NR
- mise en page ?
- hyperlink?
- si on traduit pas les hyperlinks, comment tu fais la différence entre un hyperlink d'un nom propre qui va vers une page en français et celui qui mène en anglais -> noveau bot qui classe les pages selon personne ou non
Exemples de Résultats
Ici y aura des résultats.
Évaluation du Bot
temps de traduction
qualité
Programmation
programmation: GitHub, recherche sur des bots, environnement: Anaconda, Jupiter Notebook Python est comme du Java.
Code
Conclusion et Remerciements
organisation
efficace
flexibilité