Accueil : Différence entre versions

De Wikipast
Sauter à la navigation Sauter à la recherche
 
(32 révisions intermédiaires par 2 utilisateurs non affichées)
Ligne 3 : Ligne 3 :
 
==Contact==
 
==Contact==
 
Professeur: [http://people.epfl.ch/frederic.kaplan Frédéric Kaplan]<br>
 
Professeur: [http://people.epfl.ch/frederic.kaplan Frédéric Kaplan]<br>
Assistant: [https://people.epfl.ch/raphael.barman Raphaël Barman]<br>
+
Assistant: [https://people.epfl.ch/paul.guhennec/ Paul Guhennec] <br>
Horaire: Mardi de 13h à 15h à [https://plan.epfl.ch/?lang=fr&room=INM202 INM 202]
+
Horaire: Mardi de 13h15 à 15h sur Zoom : https://epfl.zoom.us/j/2693459226
  
==Liens==
+
[https://tube.switch.ch/channels/e49530f9 Lien vers le channel SwitchTube (Enregistrements des cours)]
* [http://moodle.epfl.ch/course/view.php?id=14977 Moodle]
 
* [https://annuel2.framapad.org/p/dh-bachelor-2020 Framapad]
 
* MediaWiki: [https://www.mediawiki.org/wiki/Help:Formatting/fr Syntaxe] et [https://www.mediawiki.org/wiki/Help:Links/fr Liens]
 
* [https://impresso-project.ch/app Archive de presse - Impresso]
 
* [http://letempsarchives.ch Archive de presse - Le Temps]
 
* [[Trouver une personne]]
 
* Datafication biographique sur la page [[Biographies]]
 
* Typologie d'[[évènements]]
 
* [https://gallica.bnf.fr Gallica - BNF]
 
* [https://github.com/dhlab-epfl/HUM-369-tutorials Tutoriel python]
 
* [[Peergrading‎]]
 
* Projets de [[Bots]]
 
  
 
==Résumé==
 
==Résumé==
Ligne 25 : Ligne 13 :
 
==Plan ==
 
==Plan ==
  
* 18.02.2020 Introduction au cours. Présentation des outils du cours (MediaWiki). Ecriture d'une biographie simple pour s'initier à la syntaxe MediaWiki. Recherche d'une personne ne figurant pas sur Wikipedia et Wikidata.
+
* 02.03.2021 Exercice sur FramaPad. Présentation des étudiants. Introduction au cours. Présentation des outils du cours (MediaWiki). Ecriture d'une biographie simple pour s'initier à la syntaxe MediaWiki. Recherche d'une personne ne figurant pas sur Wikipedia et Wikidata.
 
 
* 25.02.2020 Présentation des principes d'extraction automatiques à base de segmentation. Introduction à la base d'archives de presse qui sera utilisée ce semestre pour le cours: Impresso. Sigature du NDA pour s'inscrire sur Impresso <ref>Pour des raisons de droits d'auteur et afin d'avoir un accès complet aux données d'Impresso, il est nécessaire de signer un [https://fr.wikipedia.org/wiki/Accord_de_non-divulgation NDA]. Il faut donc se rendre sur le [https://impresso-project.ch/app/ site web d'Impresso], télécharger le NDA, le remplir et le renvoyer à l'adresse mentionnée sur le site d'Impresso.</ref>. Principe de la [[Biographies|datafication biographique]]. Discussion d'un exemple.  Choix d'une personne pour le projet personnel. [[Trouver une personne]].
 
 
 
* 03.03.2020 Linguistique des grands nombres. [[N-gramme]]. Champ attentionel d'un media (attention temporelle, attention spatiale). [[Typologie de courbes]]. Suite de la [[Biographies|datafication biographique]]. Exercice d'indexation en transformant chaque terme en [[hypermot]].
 
  
* 10.03.2020 Discretisation de l'espace et du temps. [[UT]].[[TAI]]. [[UTC]]. Classes d'équivalences temporelles. Classes d'équivalences spatiales. Exercices de conversion de dates. Complétion de la [[Biographies|datafication biographique]]
+
* 09.03.2021 Introduction à la base d'archives de presse qui sera utilisée ce semestre pour le cours: Impresso. Vue générale de la pipeline de processing des informations depuis les documents numérisés. Extraction d'information, entités nommées. Co-creation des interfaces d'accès. Signature du NDA (Non Disclosure Agreement) pour s'inscrire sur Impresso <ref>Pour des raisons de droits d'auteur et afin d'avoir un accès complet aux données d'Impresso, il est nécessaire de signer un [https://fr.wikipedia.org/wiki/Accord_de_non-divulgation NDA]. Il faut donc se rendre sur le [https://impresso-project.ch/app/ site web d'Impresso], télécharger le NDA, le remplir et le renvoyer à l'adresse mentionnée sur le site d'Impresso.</ref>.  
  
* 17.03.2020 [https://github.com/dhlab-epfl/HUM-369-tutorials Tutoriel python] - Complétion de la [[Biographies|datafication biographique]] - Deadline pour la remise de la [[Biographies|datafication biographique]] (30%)
+
* 16.03.2021 Analyse statistique de contenu d'une archive de presse. [[N-gramme]]. Champ attentionel d'un media (attention temporelle, attention spatiale). [[Typologie de courbes]]. Principe de la [[Biographies|datafication biographique]]. Discussion d'un exemple.  Choix d'une personne pour le projet personnel. [[Trouver une personne]]. Exercice d'indexation en transformant chaque terme en [[hypermot]].
  
* 24.03.2020 Présention des projets de bots pour Wikipast -  Début de la constitution des équipes - Travail à la définition des projets
+
* 23.03.2021 Analyse automatique de documents. Présentation des principes d'extraction automatiques à base de segmentation. Exemple de la libraire dhSegment. Complétion de la [[Biographies|datafication biographique]].
  
* 31.05.2020 Procéduralité et automatisme - Les bots dans Twitter - Les bots dans Wikipedia - Statistiques - Wikification du domaine public - Les controverses des bots - Les bots et le capitalisme linguistique - Constitution finale des groupes (2-3) et choix des projets - Explication du [[Peergrading‎]]
+
* 30.03.2021 Extraction automatique d'information dans des images d'archives. - Complétion de la [[Biographies|datafication biographique]] - Deadline pour la remise de la [[Biographies|datafication biographique]] (30%)
  
* 07.04.2020 Algorithmes d'analyses textuelles - Introduction aux techniques de traitement du langage naturel - Les conférences MUC - Typologie des entités nommées (ENAMEX, TIMEX, NUMEX) - Gazetters - Tokenizers / Language guessers / POS - Tagger - Méthodes à base de règles - Méthodes à base d'apprentissage (Bayesian classifier, Hidden Markov Models, CRF) - Clustering / Linking - Extraction des entitées nommées dans la base des articles de presse - Calcul sur les noeuds du cluster - Exemple de règles ecrites en ExPRESS - Cascade de règles - Deadline [[Peergrading‎]] des datatifactions biographiques (10%) - [https://github.com/dhlab-epfl/HUM-369-tutorials exercices pandas]
+
* 06.04.2021 Pas de cours.
  
* 14.04.2020 Pas de cours
+
* 13.04.2021 Présentation des projets de bots pour Wikipast -  Début de la constitution des équipes - Travail à la définition des projets.Optionnel : [https://github.com/dhlab-epfl/HUM-369-tutorials Tutoriel python]
  
* 21.04.2020  Presentation des résultats du peer-grading - Correction des [https://github.com/dhlab-epfl/HUM-369-tutorials exercices pandas] - Travail sur les projets
+
* 20.04.2021 Procéduralité et automatisme - Les bots dans Twitter - Les bots dans Wikipedia - Statistiques - Wikification du domaine public - Les controverses des bots - Les bots et le capitalisme linguistique - Constitution finale des groupes (3-4) et choix des projets - Explication du [[Peergrading‎]].
  
* 28.04.2020 Travail sur les projets - Presentation informelle de chaque groupe (5 - 10 min) - Detection des éventuelles incompatibilités entre bots
+
* 27.04.2021 Deadline [[Peergrading‎]] des datatifactions biographiques (10%)
  
* 05.05.2020  Travail sur les projets
+
* 04.05.2021 Presentation des résultats du peer-grading - Travail sur les projets.
  
* 12.05.2020  Travail sur les projets -  
+
* 11.05.2021 Travail sur les projets - Presentation informelle de chaque groupe (5 - 10 min)  - Detection des éventuelles incompatibilités entre bots
  
* 19.05.2020 Presentation des projets (30%) - 15 minutes par projet (10 minutes présentation, 5 minutes questions)- Deadline pour la description technique du bot (30%)
+
* 18.05.2021  Travail sur les projets -
  
* 26.05.2020  Pas de cours
+
* 25.05.2021 Presentation des projets (30%) - 15 minutes par projet (10 minutes présentation, 5 minutes questions)- Deadline pour la description technique du bot (30%)
  
 +
* 01.06.2021  Presentation des projets (30%) - 15 minutes par projet (10 minutes présentation, 5 minutes questions)
  
 
<references/>
 
<references/>
  
==Références==
+
==Liens==
 +
* Datafications biographiques sur la page [[Biographies]]
 +
* Assignation des biographies pour le [[Peergrading‎]]
 +
* Projets de [[Bots]]
  
Référentiels temporels :
+
* [http://moodle.epfl.ch/course/view.php?id=14977 Moodle]
 
+
* [https://annuel2.framapad.org/p/dh-bachelor-2020 Framapad]
* [[UT|UT : Temps universel]]
+
* MediaWiki: [https://www.mediawiki.org/wiki/Help:Formatting/fr Syntaxe] et [https://www.mediawiki.org/wiki/Help:Links/fr Liens]
* [[TAI|TAI : Temps Atomique International]]
+
* [https://impresso-project.ch/app Archive de presse - Impresso]
* [[UTC|UTC : Temps Universel Coordonné]]
+
* [http://letempsarchives.ch Archive de presse - Le Temps]
 
+
* [[Trouver une personne]]
Référentiels spatiaux :
+
* Typologie d'[[évènements]]
 
+
* [https://gallica.bnf.fr Gallica - BNF]
* [[Ellipsoidal_Coordinates|Coordonnées ellipsoïdales]]
+
* [https://github.com/dhlab-epfl/HUM-369-tutorials Tutoriel python]
* [[WGS84_GRS80|Exemples : WGS84, GRS80]]
 
  
 
==Barème ==
 
==Barème ==
Ligne 76 : Ligne 63 :
  
 
* Une biographie d'une personne ne figurant pas sur Wikipedia et Wikidata avec au moins 15 entrées a été écrite sous la forme d'une chronologie sourcée. Certaines entrées ont été indexées avec des hypermots > 4  
 
* Une biographie d'une personne ne figurant pas sur Wikipedia et Wikidata avec au moins 15 entrées a été écrite sous la forme d'une chronologie sourcée. Certaines entrées ont été indexées avec des hypermots > 4  
** La présentation et la syntaxe Wiki ont été respectée +0.5
+
** La présentation et la syntaxe Wiki ont été respectées +0.5
 
** Toutes les entrées sont sourcées avec au moins un article +0.5
 
** Toutes les entrées sont sourcées avec au moins un article +0.5
 
** Le codage utilisant des hypermots est satisfaisant +0.5
 
** Le codage utilisant des hypermots est satisfaisant +0.5
** Au moins cinq pages liées ont été créées ou mises à jour.+0.5
+
** Au moins cinq pages liées ont été créées ou mises à jour +0.5
  
 
=== Barème pour le peer-grading (10 % de la note finale)  ===
 
=== Barème pour le peer-grading (10 % de la note finale)  ===
  
* 5 datafication ont été notées : 6, sinon 0
+
* 5 datafications ont été notées : 6, sinon 0
  
 
=== Barème pour la description technique du bot  (30 % de la note finale)  ===
 
=== Barème pour la description technique du bot  (30 % de la note finale)  ===
Ligne 93 : Ligne 80 :
 
** La discussion est bien argumentée +0.5
 
** La discussion est bien argumentée +0.5
  
=== Barème pour la presentation (30 % de la note finale)  ===
+
=== Barème pour la présentation (30 % de la note finale)  ===
  
 
* Une présentation en groupe du projet de bot (10 mn) avec des slides est effectuée > 4
 
* Une présentation en groupe du projet de bot (10 mn) avec des slides est effectuée > 4
 
** La présentation orale est dynamique, précise et claire +0.5
 
** La présentation orale est dynamique, précise et claire +0.5
 
** Les réponses aux questions sont pertinentes + 0.5
 
** Les réponses aux questions sont pertinentes + 0.5
** Les slides sont bien présentés +0.5
+
** Les slides sont bien présentées +0.5
 
** L'ensemble du projet est cohérent et bien réalisé +0.5
 
** L'ensemble du projet est cohérent et bien réalisé +0.5
 +
 +
 +
 +
 +
==Références==
 +
 +
Référentiels temporels :
 +
 +
* [[UT|UT : Temps universel]]
 +
* [[TAI|TAI : Temps Atomique International]]
 +
* [[UTC|UTC : Temps Universel Coordonné]]
 +
 +
Référentiels spatiaux :
 +
 +
* [[Ellipsoidal_Coordinates|Coordonnées ellipsoïdales]]
 +
* [[WGS84_GRS80|Exemples : WGS84, GRS80]]

Version actuelle datée du 13 avril 2021 à 13:52

Bienvenue sur Wikipast, le mediawiki du cours Digital humanities (HUM-369).

Contact

Professeur: Frédéric Kaplan
Assistant: Paul Guhennec
Horaire: Mardi de 13h15 à 15h sur Zoom : https://epfl.zoom.us/j/2693459226

Lien vers le channel SwitchTube (Enregistrements des cours)

Résumé

Ce cours permet de découvrir les Digital Humanities par la pratique.

Plan

  • 02.03.2021 Exercice sur FramaPad. Présentation des étudiants. Introduction au cours. Présentation des outils du cours (MediaWiki). Ecriture d'une biographie simple pour s'initier à la syntaxe MediaWiki. Recherche d'une personne ne figurant pas sur Wikipedia et Wikidata.
  • 09.03.2021 Introduction à la base d'archives de presse qui sera utilisée ce semestre pour le cours: Impresso. Vue générale de la pipeline de processing des informations depuis les documents numérisés. Extraction d'information, entités nommées. Co-creation des interfaces d'accès. Signature du NDA (Non Disclosure Agreement) pour s'inscrire sur Impresso [1].
  • 23.03.2021 Analyse automatique de documents. Présentation des principes d'extraction automatiques à base de segmentation. Exemple de la libraire dhSegment. Complétion de la datafication biographique.
  • 06.04.2021 Pas de cours.
  • 13.04.2021 Présentation des projets de bots pour Wikipast - Début de la constitution des équipes - Travail à la définition des projets.Optionnel : Tutoriel python
  • 20.04.2021 Procéduralité et automatisme - Les bots dans Twitter - Les bots dans Wikipedia - Statistiques - Wikification du domaine public - Les controverses des bots - Les bots et le capitalisme linguistique - Constitution finale des groupes (3-4) et choix des projets - Explication du Peergrading‎.
  • 27.04.2021 Deadline Peergrading‎ des datatifactions biographiques (10%)
  • 04.05.2021 Presentation des résultats du peer-grading - Travail sur les projets.
  • 11.05.2021 Travail sur les projets - Presentation informelle de chaque groupe (5 - 10 min) - Detection des éventuelles incompatibilités entre bots
  • 18.05.2021 Travail sur les projets -
  • 25.05.2021 Presentation des projets (30%) - 15 minutes par projet (10 minutes présentation, 5 minutes questions)- Deadline pour la description technique du bot (30%)
  • 01.06.2021 Presentation des projets (30%) - 15 minutes par projet (10 minutes présentation, 5 minutes questions)
  1. Pour des raisons de droits d'auteur et afin d'avoir un accès complet aux données d'Impresso, il est nécessaire de signer un NDA. Il faut donc se rendre sur le site web d'Impresso, télécharger le NDA, le remplir et le renvoyer à l'adresse mentionnée sur le site d'Impresso.

Liens

Barème

Barème pour la Datafication biographique (30 % de la note finale)

  • Une biographie d'une personne ne figurant pas sur Wikipedia et Wikidata avec au moins 15 entrées a été écrite sous la forme d'une chronologie sourcée. Certaines entrées ont été indexées avec des hypermots > 4
    • La présentation et la syntaxe Wiki ont été respectées +0.5
    • Toutes les entrées sont sourcées avec au moins un article +0.5
    • Le codage utilisant des hypermots est satisfaisant +0.5
    • Au moins cinq pages liées ont été créées ou mises à jour +0.5

Barème pour le peer-grading (10 % de la note finale)

  • 5 datafications ont été notées : 6, sinon 0

Barème pour la description technique du bot (30 % de la note finale)

  • La page du bot a été créée, le code est inséré sur Wikipast ou GitHub, un résumé des fonctionnalités est présent ainsi qu'une discussion critique des performances (au moins 300 mots) > 4
    • Le bot réalisé répond aux fonctionnalités attendues +0.5
    • La description est claire et précise +0.5
    • Des exemples de résultats sont proposés +0.5
    • La discussion est bien argumentée +0.5

Barème pour la présentation (30 % de la note finale)

  • Une présentation en groupe du projet de bot (10 mn) avec des slides est effectuée > 4
    • La présentation orale est dynamique, précise et claire +0.5
    • Les réponses aux questions sont pertinentes + 0.5
    • Les slides sont bien présentées +0.5
    • L'ensemble du projet est cohérent et bien réalisé +0.5



Références

Référentiels temporels :

Référentiels spatiaux :