« Accueil » : différence entre les versions

De Wikipast
Aller à la navigation Aller à la recherche
m (A modifié les paramètres de protection pour « Accueil » ([Modifier = Autoriser uniquement les administrateurs] (infini) [Renommer = Autoriser uniquement les administrateurs] (infini)))
 
(62 versions intermédiaires par le même utilisateur non affichées)
Ligne 1 : Ligne 1 :
Bienvenue sur <strong>Wikipast</strong>, le mediawiki du cours Digital humanities (HUM-369).
Bienvenue sur <strong>Wikipast</strong>, le mediawiki du cours Digital humanities (HUM-369).


==Contact==
== Contact ==
Professeur: [http://people.epfl.ch/frederic.kaplan Frédéric Kaplan]<br>
Teachers: [http://people.epfl.ch/isabella.dilenardo Isabella di Lenardo], [http://people.epfl.ch/maud.ehrmann Maud Ehrmann]<br>
Assistant: [https://people.epfl.ch/raphael.barman Raphaël Barman]<br>
Assistant: [https://people.epfl.ch/remi.petitpierre Rémi Petitpierre] <br>
Horaire: Mardi de 13h à 15h sur Zoom : https://epfl.zoom.us/j/2693459226
Horaire: Mardi de 13h15 à 15h. INM 202.


==Liens==
== Résumé ==
* [http://moodle.epfl.ch/course/view.php?id=14977 Moodle]
Les Digital Humanities sont une discipline à la croisée des sciences de l'information et des sciences humaines et sociales. Dans ce cours, les étudiantes et étudiants découvrent ce nouveau domaine de recherche en apprenant à extraire des informations de plusieurs millions d'articles de presse.
* [https://annuel2.framapad.org/p/dh-bachelor-2020 Framapad]
 
* MediaWiki: [https://www.mediawiki.org/wiki/Help:Formatting/fr Syntaxe] et [https://www.mediawiki.org/wiki/Help:Links/fr Liens]
== Plan ==
* [https://impresso-project.ch/app Archive de presse - Impresso]
 
* [http://letempsarchives.ch Archive de presse - Le Temps]
20.02.2024 – <strong>Introduction</strong>
* [[Trouver une personne]]
* Présentation de la thématique, des objectifs et de l’organisation du cours.
* Datafication biographique sur la page [[Biographies]]
 
* Typologie d'[[évènements]]
28.02.2024 – <strong>Cours 1. Wikipedia</strong>
* [https://gallica.bnf.fr Gallica - BNF]
* Introduction au projet Wikipedia (Frédéric Kaplan).
* [https://github.com/dhlab-epfl/HUM-369-tutorials Tutoriel python]
 
* [[Peergrading‎]]
05.03.2024 – <strong>Cours 2. Explorer la presse numérisée (1/2).</strong>
* Projets de [[Bots]]
* Introduction au projet <i>impresso</i> (1/2). (Maud Ehrmann)
* Tutoriel et exercices: Création d’une page sur Wikipast (Rémi Petitpierre).
 
12.03.2024 – <strong>Cours 3. Présentation des sources.</strong>
* Présentation des sources (Isabella di Lenardo, Rémi Petitpierre).
* Présentation et indication pour le rendu final.
* Tutoriel et exercices: Python et humanités digitales (Rémi Petitpierre).


==Résumé==
19.03.2024 – <strong>Cours 4. Explorer la presse numérisée (2/2).</strong>
Ce cours permet de découvrir les Digital Humanities par la pratique.
* Introduction au projet <i>impresso</i> (2/2). (Maud Ehrmann)
* Constitution des groupes de travail


==Plan ==
26.03.2024 – <strong>Cours 5. Panorama DH 1. Le texte.</strong>
* Panorama des Humanités Digitales (1/3): Texte. (Maud Ehrmann)
* Tutoriel et exercices: N-grams (Rémi Petitpierre).


* 23.02.2021 Présentation des étudiants. Introduction au cours. Présentation des outils du cours (MediaWiki). Ecriture d'une biographie simple pour s'initier à la syntaxe MediaWiki. Recherche d'une personne ne figurant pas sur Wikipedia et Wikidata.
02.04.2024 – <strong>Vacances.</strong>
* Pas de cours


* 02.03.2021 Présentation des principes d'extraction automatiques à base de segmentation. Introduction à la base d'archives de presse qui sera utilisée ce semestre pour le cours: Impresso. Sigature du NDA pour s'inscrire sur Impresso <ref>Pour des raisons de droits d'auteur et afin d'avoir un accès complet aux données d'Impresso, il est nécessaire de signer un [https://fr.wikipedia.org/wiki/Accord_de_non-divulgation NDA]. Il faut donc se rendre sur le [https://impresso-project.ch/app/ site web d'Impresso], télécharger le NDA, le remplir et le renvoyer à l'adresse mentionnée sur le site d'Impresso.</ref>. Principe de la [[Biographies|datafication biographique]]. Discussion d'un exemple.  Choix d'une personne pour le projet personnel. [[Trouver une personne]].
09.04.2024 – <strong>Cours 6. Panorama DH 2. Cartographie et Spatial Digital Humanities.</strong>
* Panorama des Humanités Digitales (2/3): Cartographie et Spatial Digital Humanities. (Isabella di Lenardo, Rémi Petitpierre)


* 09.03.2021 Linguistique des grands nombres. [[N-gramme]]. Champ attentionel d'un media (attention temporelle, attention spatiale). [[Typologie de courbes]]. Suite de la [[Biographies|datafication biographique]]. Exercice d'indexation en transformant chaque terme en [[hypermot]].
16.04.2024 – <strong>Cours 7. Panorama DH 3. Systèmes d'information géohistoriques.</strong>
* Panorama des Humanités Digitales (3/3): Systèmes d'information géohistoriques. (Isabella di Lenardo, Rémi Petitpierre)
* Tutoriel et exercices: Carte interactive (Rémi Petitpierre).


* 16.03.2021 Discretisation de l'espace et du temps. [[UT]].[[TAI]]. [[UTC]]. Classes d'équivalences temporelles. Classes d'équivalences spatiales. Exercices de conversion de dates. Complétion de la [[Biographies|datafication biographique]]
23.04.2024 – <strong>Présentations intermédiaires.</strong>
* Présentations intermédiaires sur le contexte et les informations collectées (30 % de la note finale). Peergrading (10 % de la note finale).


* 23.03.2021 [https://github.com/dhlab-epfl/HUM-369-tutorials Tutoriel python] - Complétion de la [[Biographies|datafication biographique]] - Deadline pour la remise de la [[Biographies|datafication biographique]] (30%)
30.04.2024 – <strong>Retour sur les présentations intermédiaires.</strong>
* Retour sur les présentations intermédiaires.
* Questions-réponses sur le rendu final.


* 30.03.2020 Présention des projets de bots pour Wikipast -  Début de la constitution des équipes - Travail à la définition des projets
07.05.2024 – <strong>Travail autonome.</strong>
* Travail autonome en groupe sur les projets en présence des enseignants.


* 06.04.2021 Pas de cours
14.05.2024 – <strong>Travail autonome.</strong>
* Travail autonome en groupe sur les projets en présence des enseignants.


* 13.04.2021 Procéduralité et automatisme - Les bots dans Twitter - Les bots dans Wikipedia - Statistiques - Wikification du domaine public - Les controverses des bots -  Les bots et le capitalisme linguistique - Constitution finale des groupes (2-3) et choix des projets - Explication du [[Peergrading‎]]
21.05.2024 – <strong>Travail autonome.</strong>
* Travail autonome en groupe sur les projets en présence des enseignants.


* 20.04.2021 Algorithmes d'analyses textuelles - Introduction aux techniques de traitement du langage naturel - Les conférences MUC - Typologie des entités nommées (ENAMEX, TIMEX, NUMEX) - Gazetters - Tokenizers / Language guessers / POS - Tagger - Méthodes à base de règles - Méthodes à base d'apprentissage (Bayesian classifier, Hidden Markov Models, CRF) - Clustering / Linking - Extraction des entitées nommées dans la base des articles de presse - Calcul sur les noeuds du cluster - Exemple de règles ecrites en ExPRESS - Cascade de règles - Deadline [[Peergrading‎]] des datatifactions biographiques (10%) - [https://github.com/dhlab-epfl/HUM-369-tutorials exercices pandas]
28.05.2024 – <strong>Examen.</strong>
* Rendu final des datafications biographiques (30 % de la note finale).
* Présentations finales de projets de groupe (30 % de la note finale).


* 27.04.2021  Presentation des résultats du peer-grading - Correction des [https://github.com/dhlab-epfl/HUM-369-tutorials exercices pandas] - Travail sur les projets
== Description du travail attendu ==
=== 1. Définition / Préparation ===
* Choix d’une thématique.
* Constitution du groupe (3 pers max).
* Choix d’un set de personnes (min 5), en cohérence avec la thématique


* 04.05.2021 Travail sur les projets - Presentation informelle de chaque groupe (5 - 10 min) - Detection des éventuelles incompatibilités entre bots
Quelques conseils:
* Les personnes choisies sont mentionnées dans au moins ~100 articles dans impresso.
* Ne pas hésiter à changer de personne(s) si nécessaire.
* Faire des collections dans impresso pour garder vos données.


* 11.05.2021  Travail sur les projets -
=== 2. Recueillir des éléments contextuels généraux sur la thématique et les personnes choisies. ===
==== Présentation intermédiaire ====
* Description de la thématique: de quoi s’agit-il?
* Introduction du cadre temporel retenu: quelle période couvrez-vous?
* Détermination des principaux enjeux: quelles questions importantes identifiez-vous?
* Présentation des principaux acteurs: quelles personnes avez-vous retenues et pourquoi?


* 18.05.2021  Travail sur les projets -
=== 3. Collection des données pour les datafications biographiques. ===
Datafication biographique: collecter des informations sur les personnes dans la presse à l’aide d’outils numériques.
* Qualitativement (lecture et exploration des sources: DHS et Impresso)
* Quantitativement (sur la base d’outils/scripts appliqués sur les articles de presse)


* 25.05.2021 Presentation des projets (30%) - 15 minutes par projet (10 minutes présentation, 5 minutes questions)- Deadline pour la description technique du bot (30%)
=== 4. Écriture de pages dans Wikipast, avec visualisation(s). ===
Résultat attendu:
* Une page wiki présentant la thématique (quelques paragraphes)
* Pour chaque personne, une page résumant les (15-20) principaux [[évènements]] de sa vie, en respectant la syntaxe wiki. ([[Jeanne Hersch|exemple]])


* 01.06.2021  Pas de cours
Structure des pages des personnes:
* Liste des évènements avec la date, le lieu, la typologie d'évènement (e.g. [[Publication]], [[Naissance]], [[Voyage]], etc.) et une brève description, ainsi qu'un lien vers votre source.
* Exemples des années précédentes: [[Gaston Clerc]], [[Henri Baud]]


Structure des pages thématiques:
* Présentation du thème, délimitation chronologique et thématique
* Brève description des enjeux (env. 50-200 mots)
* Liste des personnages (avec hyperliens vers les pages), complémenté par une brève explication de leur rapport au thème
* Données, illustrations des analyses, avec légendes
* Analyse et conclusion (env. 150-400 mots)
* Exemples des années précédentes: [[Scoutisme]], [[Mouvements ouvriers en Suisse au début du XXe siècle]]


<references/>
Conseils:
* Pour toutes les pages, ne pas hésiter à mettre des visualisations (segment d'une page de journal jugée pertinente, un graphe ngram, un histogramme des topics, un histograms des entités nommées, une carte, etc.).
* Sourcer vos informations en ajoutant des liens vers les sources primaires utilisées (ici: les articles de presse Impresso)


==Références==
==== Présentation finale ====
* Bref rappel de la thématique et des personnes choisies
* Présentation des analyses quantitatives, discussion qualitative sur la base des parcours de vie et des sources
* Conclusion


Référentiels temporels :
== Barème et critères d'évaluation ==
Barème général:


* [[UT|UT : Temps universel]]
# Description des éléments généraux du contexte et des personnes (30 % de la note finale)
* [[TAI|TAI : Temps Atomique International]]
# [[Peergrading]] du travail des autres étudiants (10 %)
* [[UTC|UTC : Temps Universel Coordonné]]
# Production de la [[Biographies|datafication biographique]] des personnes choisies (30 %)
# Présentation orale du projet réalisé (30 %)


Référentiels spatiaux :
=== 1. Présentation intermédiaire, description des éléments généraux du contexte et des personnes (30% de la note finale) ===
Consignes pour la présentation intermédiaire: La présentation intermédiaire se fait par groupe de projet. Elle doit durer 8 minutes et sera suivie de 5 minutes de questions. La parole doit être répartie de manière équitable entre tou·te·s les membres du groupe. Les slides devront être remises sur le Moodle avant mardi 23 avril, 9h.


* [[Ellipsoidal_Coordinates|Coordonnées ellipsoïdales]]
=== 2. Peergrading (10% de la note finale) ===
* [[WGS84_GRS80|Exemples : WGS84, GRS80]]
Critère d'évaluation:
* L'étudiant·e a complété le formulaire de peer-grading, sur la base de la présentation des autres groupes.


==Barème ==
=== 3. Présentation finale (30% de la note finale) ===
Consignes pour la présentation finale: La présentation se fait par groupe de projet. Elle doit durer 8 minutes et sera suivie de 5 minutes de questions. La parole doit être répartie de manière équitable entre tou·te·s les membres du groupe. Les slides devront être remises sur le Moodle avant mardi 30 mai, 10h.


=== Barème pour la [[Datafication biographique]] (30 % de la note finale) ===
=== 4. Datafications biographiques (30% de la note finale) ===
Cf. description du résultat attendu ci-dessus.


* Une biographie d'une personne ne figurant pas sur Wikipedia et Wikidata avec au moins 15 entrées a été écrite sous la forme d'une chronologie sourcée. Certaines entrées ont été indexées avec des hypermots > 4
== Liens ==
** La présentation et la syntaxe Wiki ont été respectée +0.5
* Datafications biographiques sur la page [[Biographies]]
** Toutes les entrées sont sourcées avec au moins un article +0.5
* Assignation des biographies pour le [[Peergrading‎]]
** Le codage utilisant des hypermots est satisfaisant +0.5
** Au moins cinq pages liées ont été créées ou mises à jour.+0.5


=== Barème pour le peer-grading (10 % de la note finale)  ===
* [http://moodle.epfl.ch/course/view.php?id=14977 Moodle]
* MediaWiki: [https://www.mediawiki.org/wiki/Help:Formatting/fr Syntaxe] et [https://www.mediawiki.org/wiki/Help:Links/fr Liens]
* [https://impresso-project.ch/app Archive de presse - Impresso]
* [http://letempsarchives.ch Archive de presse - Le Temps]
* [[Trouver une personne]]
* Typologie d'[[évènements]]
* [https://gallica.bnf.fr Gallica - BNF]
* [https://github.com/dhlab-epfl/HUM-369-tutorials Tutoriel python]


* 5 datafication ont été notées : 6, sinon 0
== Références ==


=== Barème pour la description technique du bot  (30 % de la note finale)  ===
Référentiels temporels :


* La page du bot a été créée, le code est inséré sur Wikipast ou GitHub, un résumé des fonctionnalités est présent ainsi qu'une discussion critique des performances (au moins 300 mots) > 4
* [[UT|UT : Temps universel]]
** Le bot réalisé répond aux fonctionnalités attendues +0.5
* [[TAI|TAI : Temps Atomique International]]
** La description est claire et précise +0.5
* [[UTC|UTC : Temps Universel Coordonné]]
** Des exemples de résultats sont proposés +0.5
** La discussion est bien argumentée +0.5


=== Barème pour la presentation  (30 % de la note finale)  ===
Référentiels spatiaux :


* Une présentation en groupe du projet de bot (10 mn) avec des slides est effectuée > 4
* [[Ellipsoidal_Coordinates|Coordonnées ellipsoïdales]]
** La présentation orale est dynamique, précise et claire +0.5
* [[WGS84_GRS80|Exemples : WGS84, GRS80]]
** Les réponses aux questions sont pertinentes + 0.5
** Les slides sont bien présentés  +0.5
** L'ensemble du projet est cohérent et bien réalisé +0.5

Dernière version du 31 mai 2024 à 10:16

Bienvenue sur Wikipast, le mediawiki du cours Digital humanities (HUM-369).

Contact

Teachers: Isabella di Lenardo, Maud Ehrmann
Assistant: Rémi Petitpierre
Horaire: Mardi de 13h15 à 15h. INM 202.

Résumé

Les Digital Humanities sont une discipline à la croisée des sciences de l'information et des sciences humaines et sociales. Dans ce cours, les étudiantes et étudiants découvrent ce nouveau domaine de recherche en apprenant à extraire des informations de plusieurs millions d'articles de presse.

Plan

20.02.2024 – Introduction

  • Présentation de la thématique, des objectifs et de l’organisation du cours.

28.02.2024 – Cours 1. Wikipedia

  • Introduction au projet Wikipedia (Frédéric Kaplan).

05.03.2024 – Cours 2. Explorer la presse numérisée (1/2).

  • Introduction au projet impresso (1/2). (Maud Ehrmann)
  • Tutoriel et exercices: Création d’une page sur Wikipast (Rémi Petitpierre).

12.03.2024 – Cours 3. Présentation des sources.

  • Présentation des sources (Isabella di Lenardo, Rémi Petitpierre).
  • Présentation et indication pour le rendu final.
  • Tutoriel et exercices: Python et humanités digitales (Rémi Petitpierre).

19.03.2024 – Cours 4. Explorer la presse numérisée (2/2).

  • Introduction au projet impresso (2/2). (Maud Ehrmann)
  • Constitution des groupes de travail

26.03.2024 – Cours 5. Panorama DH 1. Le texte.

  • Panorama des Humanités Digitales (1/3): Texte. (Maud Ehrmann)
  • Tutoriel et exercices: N-grams (Rémi Petitpierre).

02.04.2024 – Vacances.

  • Pas de cours

09.04.2024 – Cours 6. Panorama DH 2. Cartographie et Spatial Digital Humanities.

  • Panorama des Humanités Digitales (2/3): Cartographie et Spatial Digital Humanities. (Isabella di Lenardo, Rémi Petitpierre)

16.04.2024 – Cours 7. Panorama DH 3. Systèmes d'information géohistoriques.

  • Panorama des Humanités Digitales (3/3): Systèmes d'information géohistoriques. (Isabella di Lenardo, Rémi Petitpierre)
  • Tutoriel et exercices: Carte interactive (Rémi Petitpierre).

23.04.2024 – Présentations intermédiaires.

  • Présentations intermédiaires sur le contexte et les informations collectées (30 % de la note finale). Peergrading (10 % de la note finale).

30.04.2024 – Retour sur les présentations intermédiaires.

  • Retour sur les présentations intermédiaires.
  • Questions-réponses sur le rendu final.

07.05.2024 – Travail autonome.

  • Travail autonome en groupe sur les projets en présence des enseignants.

14.05.2024 – Travail autonome.

  • Travail autonome en groupe sur les projets en présence des enseignants.

21.05.2024 – Travail autonome.

  • Travail autonome en groupe sur les projets en présence des enseignants.

28.05.2024 – Examen.

  • Rendu final des datafications biographiques (30 % de la note finale).
  • Présentations finales de projets de groupe (30 % de la note finale).

Description du travail attendu

1. Définition / Préparation

  • Choix d’une thématique.
  • Constitution du groupe (3 pers max).
  • Choix d’un set de personnes (min 5), en cohérence avec la thématique

Quelques conseils:

  • Les personnes choisies sont mentionnées dans au moins ~100 articles dans impresso.
  • Ne pas hésiter à changer de personne(s) si nécessaire.
  • Faire des collections dans impresso pour garder vos données.

2. Recueillir des éléments contextuels généraux sur la thématique et les personnes choisies.

Présentation intermédiaire

  • Description de la thématique: de quoi s’agit-il?
  • Introduction du cadre temporel retenu: quelle période couvrez-vous?
  • Détermination des principaux enjeux: quelles questions importantes identifiez-vous?
  • Présentation des principaux acteurs: quelles personnes avez-vous retenues et pourquoi?

3. Collection des données pour les datafications biographiques.

Datafication biographique: collecter des informations sur les personnes dans la presse à l’aide d’outils numériques.

  • Qualitativement (lecture et exploration des sources: DHS et Impresso)
  • Quantitativement (sur la base d’outils/scripts appliqués sur les articles de presse)

4. Écriture de pages dans Wikipast, avec visualisation(s).

Résultat attendu:

  • Une page wiki présentant la thématique (quelques paragraphes)
  • Pour chaque personne, une page résumant les (15-20) principaux évènements de sa vie, en respectant la syntaxe wiki. (exemple)

Structure des pages des personnes:

  • Liste des évènements avec la date, le lieu, la typologie d'évènement (e.g. Publication, Naissance, Voyage, etc.) et une brève description, ainsi qu'un lien vers votre source.
  • Exemples des années précédentes: Gaston Clerc, Henri Baud

Structure des pages thématiques:

  • Présentation du thème, délimitation chronologique et thématique
  • Brève description des enjeux (env. 50-200 mots)
  • Liste des personnages (avec hyperliens vers les pages), complémenté par une brève explication de leur rapport au thème
  • Données, illustrations des analyses, avec légendes
  • Analyse et conclusion (env. 150-400 mots)
  • Exemples des années précédentes: Scoutisme, Mouvements ouvriers en Suisse au début du XXe siècle

Conseils:

  • Pour toutes les pages, ne pas hésiter à mettre des visualisations (segment d'une page de journal jugée pertinente, un graphe ngram, un histogramme des topics, un histograms des entités nommées, une carte, etc.).
  • Sourcer vos informations en ajoutant des liens vers les sources primaires utilisées (ici: les articles de presse Impresso)

Présentation finale

  • Bref rappel de la thématique et des personnes choisies
  • Présentation des analyses quantitatives, discussion qualitative sur la base des parcours de vie et des sources
  • Conclusion

Barème et critères d'évaluation

Barème général:

  1. Description des éléments généraux du contexte et des personnes (30 % de la note finale)
  2. Peergrading du travail des autres étudiants (10 %)
  3. Production de la datafication biographique des personnes choisies (30 %)
  4. Présentation orale du projet réalisé (30 %)

1. Présentation intermédiaire, description des éléments généraux du contexte et des personnes (30% de la note finale)

Consignes pour la présentation intermédiaire: La présentation intermédiaire se fait par groupe de projet. Elle doit durer 8 minutes et sera suivie de 5 minutes de questions. La parole doit être répartie de manière équitable entre tou·te·s les membres du groupe. Les slides devront être remises sur le Moodle avant mardi 23 avril, 9h.

2. Peergrading (10% de la note finale)

Critère d'évaluation:

  • L'étudiant·e a complété le formulaire de peer-grading, sur la base de la présentation des autres groupes.

3. Présentation finale (30% de la note finale)

Consignes pour la présentation finale: La présentation se fait par groupe de projet. Elle doit durer 8 minutes et sera suivie de 5 minutes de questions. La parole doit être répartie de manière équitable entre tou·te·s les membres du groupe. Les slides devront être remises sur le Moodle avant mardi 30 mai, 10h.

4. Datafications biographiques (30% de la note finale)

Cf. description du résultat attendu ci-dessus.

Liens

Références

Référentiels temporels :

Référentiels spatiaux :