« Accueil » : différence entre les versions
m (Révocation des modifications de Mattie7611 (discussion) vers la dernière version de PageUpdaterBot) |
(Wikipastbot update) |
||
Ligne 1 : | Ligne 1 : | ||
Bienvenue sur <strong>Wikipast</strong>, le mediawiki du cours Digital humanities (HUM-369). | Bienvenue sur <strong>Wikipast</strong>, le <span style="color:red">mediawiki</span> (correction(s): <span style="color:green"> | ||
</span>) du cours Digital <span style="color:red">humanities</span> (correction(s): <span style="color:green"> | |||
</span>) (HUM-369). | |||
==Contact== | ==Contact== | ||
Ligne 8 : | Ligne 10 : | ||
==Liens== | ==Liens== | ||
* Site Moodle [http://moodle.epfl.ch/course/view.php?id=14977] | * Site Moodle [http://<span style="color:red">moodle</span> (correction(s): <span style="color:green"> | ||
</span>).epfl.ch/course/view.php?id=14977] | |||
* Archive de presse utilisée dans le cours [http://letempsarchives.ch] | * Archive de presse utilisée dans le cours [http://letempsarchives.ch] | ||
* Ngram viewer : [http://dhlabsrv4.epfl.ch/ngviewer.php] | * Ngram <span style="color:red">viewer</span> (correction(s): <span style="color:green"> | ||
</span>) : [http://dhlabsrv4.epfl.ch/ngviewer.php] | |||
* Datafication biographiques en cours de création: page [[Biographies ]] | * Datafication biographiques en cours de création: page [[Biographies ]] | ||
* Typologie d'[[évènements]] | * Typologie d'[[évènements]] | ||
Ligne 30 : | Ligne 34 : | ||
* 21.02.2017 Introduction au cours. Présentation des outils du cours (MediaWiki, Python). Ecriture d'une biographie simple pour s'initier à la syntaxe MediaWiki | * 21.02.2017 Introduction au cours. Présentation des outils du cours (MediaWiki, Python). Ecriture d'une biographie simple pour s'initier à la syntaxe MediaWiki | ||
* 28.02.2017 Principes de la reconstitution à partir d'archives. Exemple du projet Venice Time Machine. Techniques pour la numérisation massive (méthodes robotiques, tomographie). Reconnaissance des écritures manuscrites. Introduction au concept d'entité nommée. Réseaux d'entités nommées. Principes de la reconstitution cadastrale. Modélisation 4d. Introduction à la base d'archives de presse qui sera utilisée ce semestre pour le cours. Principe de la [[datafication biographique]]. Discussion d'un exemple. Choix d'une personne pour le projet personnel. | * 28.02.2017 Principes de la reconstitution à partir d'archives. Exemple du projet Venice Time Machine. Techniques pour la numérisation massive (méthodes robotiques, tomographie). Reconnaissance des écritures manuscrites. Introduction au concept d'entité nommée. Réseaux d'entités nommées. Principes de la reconstitution cadastrale. Modélisation 4d. Introduction à la base d'archives de presse qui sera utilisée ce semestre pour le cours. Principe de la [[<span style="color:red">datafication</span> (correction(s): <span style="color:green"> | ||
</span>) biographique]]. Discussion d'un exemple. Choix d'une personne pour le projet personnel. | |||
* 07.03.2017 Linguistique des grands nombres. [[N-gramme]]. Champ attentionel d'un media (attention temporelle, attention spatiale). [[Typologie de courbes]]. Suite de la [[datafication biographique]]. Exercice d'indexation en transformant chaque terme en [[hypermot]]. | * 07.03.2017 Linguistique des grands nombres. [[N-gramme]]. Champ <span style="color:red">attentionel</span> (correction(s): <span style="color:green"> | ||
</span>) d'un media (attention temporelle, attention spatiale). [[Typologie de courbes]]. Suite de la [[<span style="color:red">datafication</span> (correction(s): <span style="color:green"> | |||
</span>) biographique]]. Exercice d'indexation en transformant chaque terme en [[hypermot]]. | |||
* 14.03.2017 Discretisation de l'espace et du temps. [[UT]].[[TAI]]. [[UTC]]. Classes d'équivalences temporelles. Classes d'équivalences spatiales. Exercices de conversion de dates. Complétion de la [[datafication biographique]] | * 14.03.2017 Discretisation de l'espace et du temps. [[UT]].[[TAI]]. [[UTC]]. Classes d'équivalences temporelles. Classes d'équivalences spatiales. Exercices de conversion de dates. Complétion de la [[<span style="color:red">datafication</span> (correction(s): <span style="color:green"> | ||
</span>) biographique]] | |||
* 21.03.2017(*) Procéduralité et automatisme - Les bots dans Wikipedia - Statistiques - Wikification du domaine public - Les controverses des bots - Présention des projets de bots - Deadline pour la remise de la datafication biographique (30%) | * 21.03.2017(*) Procéduralité et automatisme - Les bots dans Wikipedia - Statistiques - Wikification du domaine public - Les controverses des bots - Présention des projets de bots - Deadline pour la remise de la <span style="color:red">datafication</span> (correction(s): <span style="color:green"> | ||
</span>) biographique (30%) | |||
* 28.03.2017 Constitution des groupes (4 +/- 1) et choix des projets - Explication du Peer-grading - Tutorial Python | * 28.03.2017 Constitution des groupes (4 +/- 1) et choix des projets - Explication du Peer-<span style="color:red">grading</span> (correction(s): <span style="color:green">gradin, gradins | ||
</span>) - Tutorial Python | |||
* 04.04.2017 Crowdsourcing - Onboarding - Roles et specialisation dans Wikipedia - Deadline Peer-grading des datatifactions biographiques (10%) | * 04.04.2017 Crowdsourcing - Onboarding - Roles et <span style="color:red">specialisation</span> (correction(s): <span style="color:green">spécialisation | ||
</span>) dans Wikipedia - Deadline Peer-<span style="color:red">grading</span> (correction(s): <span style="color:green">gradin, gradins | |||
</span>) des <span style="color:red">datatifactions</span> (correction(s): <span style="color:green"> | |||
</span>) biographiques (10%) | |||
* 11.04.2017(*) Algorithmes d'analyses textuelles - Introduction aux techniques de traitement du langage naturel - Les conférences MUC - Typologie des entités nommées (ENAMEX, TIMEX, NUMEX) - Gazetters - Tokenizers / Language guessers / POS - Tagger - Méthodes à base de règles - Méthodes à base d'apprentissage (Bayesian classifier, Hidden Markov Models, CRF) - Clustering / Linking - Extraction des entitées nommées dans la base des articles de presse - Calcul sur les noeuds du cluster - Exemple de règles ecrites en ExPRESS - Cascade de règles - Travail sur les projets | * 11.04.2017(*) Algorithmes d'analyses textuelles - Introduction aux techniques de traitement du langage naturel - Les conférences MUC - Typologie des entités nommées (ENAMEX, TIMEX, NUMEX) - Gazetters - Tokenizers / Language <span style="color:red">guessers</span> (correction(s): <span style="color:green"> | ||
</span>) / POS - Tagger - Méthodes à base de règles - Méthodes à base d'apprentissage (Bayesian classifier, Hidden Markov Models, CRF) - Clustering / Linking - Extraction des <span style="color:red">entitées</span> (correction(s): <span style="color:green">entêtées, entités | |||
</span>) nommées dans la base des articles de presse - Calcul sur les noeuds du cluster - Exemple de règles <span style="color:red">ecrites</span> (correction(s): <span style="color:green">écrites | |||
</span>) en ExPRESS - Cascade de règles - Travail sur les projets | |||
* 18.04.2017 Pas de cours | * 18.04.2017 Pas de cours | ||
* 25.04.2017 Algorithmes d'analyses visuelles - Méthode de comparaison de recherche visuelle et distances entre images - Histogrammes de gradients - Deep learning - Moteur de recherche visuel - Travail sur les projets - Presentation des résultats du peer-grading | * 25.04.2017 Algorithmes d'analyses visuelles - Méthode de comparaison de recherche visuelle et distances entre images - Histogrammes de gradients - Deep <span style="color:red">learning</span> (correction(s): <span style="color:green"> | ||
</span>) - Moteur de recherche visuel - Travail sur les projets - Presentation des résultats du <span style="color:red">peer</span> (correction(s): <span style="color:green">puer, peler, peur, pier, peser | |||
</span>)-<span style="color:red">grading</span> (correction(s): <span style="color:green">gradin, gradins | |||
</span>) | |||
* 02.05.2017 Travail sur les projets - Presentation informelle de chaque groupe - Detection des éventuelles incompatibilités entre bots | * 02.05.2017 Travail sur les projets - Presentation informelle de chaque groupe - Detection des éventuelles incompatibilités entre bots | ||
Ligne 75 : | Ligne 94 : | ||
=== Barème pour la [[Datafication biographique]] (30 % de la note finale) === | === Barème pour la [[Datafication biographique]] (30 % de la note finale) === | ||
* Une biographie avec au moins 15 entrées a été écrite sous la forme d'une chronologie sourcée. Certaines entrées ont été indexées avec des hypermots > 4 | * Une biographie avec au moins 15 entrées a été écrite sous la forme d'une chronologie <span style="color:red">sourcée</span> (correction(s): <span style="color:green">source | ||
</span>). Certaines entrées ont été <span style="color:red">indexées</span> (correction(s): <span style="color:green">indexée | |||
</span>) avec des hypermots > 4 | |||
** La présentation et la syntaxe Wiki ont été respectée +0.5 | ** La présentation et la syntaxe Wiki ont été respectée +0.5 | ||
** Toutes les entrées sont sourcées avec au moins un article +0.5 | ** Toutes les entrées sont <span style="color:red">sourcées</span> (correction(s): <span style="color:green">sources | ||
</span>) avec au moins un article +0.5 | |||
** Le codage utilisant des hypermots est satisfaisant +0.5 | ** Le codage utilisant des hypermots est satisfaisant +0.5 | ||
** Au moins cinq pages liées ont été créées ou mises à jour.+0.5 | ** Au moins cinq pages liées ont été créées ou mises à jour.+0.5 | ||
=== Barème pour le peer-grading (10 % de la note finale) === | === Barème pour le <span style="color:red">peer</span> (correction(s): <span style="color:green">puer, peler, peur, pier, peser | ||
</span>)-<span style="color:red">grading</span> (correction(s): <span style="color:green">gradin, gradins | |||
</span>) (10 % de la note finale) === | |||
* 5 datafication ont été notée : 6, sinon 0 | * 5 <span style="color:red">datafication</span> (correction(s): <span style="color:green"> | ||
</span>) ont été notée : 6, sinon 0 | |||
=== Barème pour la description technique du bot (30 % de la note finale) === | === Barème pour la description technique du bot (30 % de la note finale) === | ||
* La page du bot a été créée, le code est inséré sur Wikipast ou GitHub, un résumé des fonctionnalités est présent ainsi qu'une discussion critique des performances (au moins 300 mots) > 4 | * La page du bot a été créée, le code est inséré sur Wikipast ou GitHub, un résumé des <span style="color:red">fonctionnalités</span> (correction(s): <span style="color:green">fonctionnalité | ||
** Le bot réalisé répond aux fonctionnalités attendues +0.5 | </span>) est présent ainsi qu'une discussion critique des performances (au moins 300 mots) > 4 | ||
** Le bot réalisé répond aux <span style="color:red">fonctionnalités</span> (correction(s): <span style="color:green">fonctionnalité | |||
</span>) attendues +0.5 | |||
** La description est claire et précise +0.5 | ** La description est claire et précise +0.5 | ||
** Des exemples de résultats sont proposés +0.5 | ** Des exemples de résultats sont proposés +0.5 | ||
** La discussion est bien argumentée +0.5 | ** La discussion est bien <span style="color:red">argumentée</span> (correction(s): <span style="color:green">argumenté, argumente | ||
</span>) +0.5 | |||
=== Barème pour la presentation (30 % de la note finale) === | === Barème pour la <span style="color:red">presentation</span> (correction(s): <span style="color:green">présentation | ||
</span>) (30 % de la note finale) === | |||
* Une présentation en groupe du projet de bot (10 mn) avec des slides est effectuée > 4 | * Une présentation en groupe du projet de bot (10 mn) avec des <span style="color:red">slides</span> (correction(s): <span style="color:green">séides, solides | ||
</span>) est effectuée > 4 | |||
** La présentation orale est dynamique, précise et claire +0.5 | ** La présentation orale est dynamique, précise et claire +0.5 | ||
** Les réponses aux questions sont pertinentes + 0.5 | ** Les réponses aux questions sont pertinentes + 0.5 | ||
** Les slides sont bien présentés +0.5 | ** Les <span style="color:red">slides</span> (correction(s): <span style="color:green">séides, solides | ||
</span>) sont bien présentés +0.5 | |||
** L'ensemble du projet est cohérent et bien réalisé +0.5 | ** L'ensemble du projet est cohérent et bien réalisé +0.5 |
Version du 30 mai 2017 à 08:04
Bienvenue sur Wikipast, le mediawiki (correction(s):
) du cours Digital humanities (correction(s):
) (HUM-369).
Contact
Professeur: Frédéric Kaplan
Assistant: Vincent Buntinx
Liens
- Site Moodle [http://moodle (correction(s):
).epfl.ch/course/view.php?id=14977]
- Archive de presse utilisée dans le cours [1]
- Ngram viewer (correction(s):
) : [2]
- Datafication biographiques en cours de création: page Biographies
- Typologie d'évènements
- FAQ pour ce cours
- Utilisateurs
- Typologie de courbes
- Bots
- Peergrading
- Tutorial_python
- SPARQL_python
- Hackathon Le Temps 2016
- Bot pour obtenir une liste de pages récentes et valides
Résumé
Ce cours permet de découvrir les Digital Humanities par la pratique.
Plan
- 21.02.2017 Introduction au cours. Présentation des outils du cours (MediaWiki, Python). Ecriture d'une biographie simple pour s'initier à la syntaxe MediaWiki
- 28.02.2017 Principes de la reconstitution à partir d'archives. Exemple du projet Venice Time Machine. Techniques pour la numérisation massive (méthodes robotiques, tomographie). Reconnaissance des écritures manuscrites. Introduction au concept d'entité nommée. Réseaux d'entités nommées. Principes de la reconstitution cadastrale. Modélisation 4d. Introduction à la base d'archives de presse qui sera utilisée ce semestre pour le cours. Principe de la [[datafication (correction(s):
) biographique]]. Discussion d'un exemple. Choix d'une personne pour le projet personnel.
- 07.03.2017 Linguistique des grands nombres. N-gramme. Champ attentionel (correction(s):
) d'un media (attention temporelle, attention spatiale). Typologie de courbes. Suite de la [[datafication (correction(s): ) biographique]]. Exercice d'indexation en transformant chaque terme en hypermot.
- 14.03.2017 Discretisation de l'espace et du temps. UT.TAI. UTC. Classes d'équivalences temporelles. Classes d'équivalences spatiales. Exercices de conversion de dates. Complétion de la [[datafication (correction(s):
) biographique]]
- 21.03.2017(*) Procéduralité et automatisme - Les bots dans Wikipedia - Statistiques - Wikification du domaine public - Les controverses des bots - Présention des projets de bots - Deadline pour la remise de la datafication (correction(s):
) biographique (30%)
- 28.03.2017 Constitution des groupes (4 +/- 1) et choix des projets - Explication du Peer-grading (correction(s): gradin, gradins
) - Tutorial Python
- 04.04.2017 Crowdsourcing - Onboarding - Roles et specialisation (correction(s): spécialisation
) dans Wikipedia - Deadline Peer-grading (correction(s): gradin, gradins ) des datatifactions (correction(s): ) biographiques (10%)
- 11.04.2017(*) Algorithmes d'analyses textuelles - Introduction aux techniques de traitement du langage naturel - Les conférences MUC - Typologie des entités nommées (ENAMEX, TIMEX, NUMEX) - Gazetters - Tokenizers / Language guessers (correction(s):
) / POS - Tagger - Méthodes à base de règles - Méthodes à base d'apprentissage (Bayesian classifier, Hidden Markov Models, CRF) - Clustering / Linking - Extraction des entitées (correction(s): entêtées, entités ) nommées dans la base des articles de presse - Calcul sur les noeuds du cluster - Exemple de règles ecrites (correction(s): écrites ) en ExPRESS - Cascade de règles - Travail sur les projets
- 18.04.2017 Pas de cours
- 25.04.2017 Algorithmes d'analyses visuelles - Méthode de comparaison de recherche visuelle et distances entre images - Histogrammes de gradients - Deep learning (correction(s):
) - Moteur de recherche visuel - Travail sur les projets - Presentation des résultats du peer (correction(s): puer, peler, peur, pier, peser )-grading (correction(s): gradin, gradins )
- 02.05.2017 Travail sur les projets - Presentation informelle de chaque groupe - Detection des éventuelles incompatibilités entre bots
- 09.05.2017 Travail sur les projets - Essai de tous les bots sur une page test - Deadline pour la description technique du bot (30%)
- 16.05.2017 Travail sur les projets - Scheduling des bots - Remise des fiches d'évaluation
- 23.05.2017 Presentation des projets (30%) - 15 minutes par projet (10 minutes présentation, 5 minutes questions)
- 30.05.2017 Presentation des projets (30%) - 15 minutes par projet (10 minutes présentation, 5 minutes questions)
Références
Référentiels temporels :
Référentiels spatiaux :
Barème
Barème pour la Datafication biographique (30 % de la note finale)
- Une biographie avec au moins 15 entrées a été écrite sous la forme d'une chronologie sourcée (correction(s): source
). Certaines entrées ont été indexées (correction(s): indexée ) avec des hypermots > 4
- La présentation et la syntaxe Wiki ont été respectée +0.5
- Toutes les entrées sont sourcées (correction(s): sources
) avec au moins un article +0.5
- Le codage utilisant des hypermots est satisfaisant +0.5
- Au moins cinq pages liées ont été créées ou mises à jour.+0.5
=== Barème pour le peer (correction(s): puer, peler, peur, pier, peser )-grading (correction(s): gradin, gradins ) (10 % de la note finale) ===
- 5 datafication (correction(s):
) ont été notée : 6, sinon 0
Barème pour la description technique du bot (30 % de la note finale)
- La page du bot a été créée, le code est inséré sur Wikipast ou GitHub, un résumé des fonctionnalités (correction(s): fonctionnalité
) est présent ainsi qu'une discussion critique des performances (au moins 300 mots) > 4
- Le bot réalisé répond aux fonctionnalités (correction(s): fonctionnalité
) attendues +0.5
- La description est claire et précise +0.5
- Des exemples de résultats sont proposés +0.5
- La discussion est bien argumentée (correction(s): argumenté, argumente
) +0.5
=== Barème pour la presentation (correction(s): présentation ) (30 % de la note finale) ===
- Une présentation en groupe du projet de bot (10 mn) avec des slides (correction(s): séides, solides
) est effectuée > 4
- La présentation orale est dynamique, précise et claire +0.5
- Les réponses aux questions sont pertinentes + 0.5
- Les slides (correction(s): séides, solides
) sont bien présentés +0.5
- L'ensemble du projet est cohérent et bien réalisé +0.5