« Accueil » : différence entre les versions

De Wikipast
Aller à la navigation Aller à la recherche
m (A modifié les paramètres de protection pour « Accueil » ([Modifier = Autoriser uniquement les administrateurs] (infini) [Renommer = Autoriser uniquement les administrateurs] (infini)))
 
(23 versions intermédiaires par le même utilisateur non affichées)
Ligne 1 : Ligne 1 :
Bienvenue sur <strong>Wikipast</strong>, le mediawiki du cours Digital humanities (HUM-369).
Bienvenue sur <strong>Wikipast</strong>, le mediawiki du cours Digital humanities (HUM-369).


==Contact==
== Contact ==
Professeur: [http://people.epfl.ch/frederic.kaplan Frédéric Kaplan]<br>
Teachers: [http://people.epfl.ch/isabella.dilenardo Isabella di Lenardo], [http://people.epfl.ch/maud.ehrmann Maud Ehrmann]<br>
Assistant: [https://people.epfl.ch/paul.guhennec/ Paul Guhennec] <br>
Assistant: [https://people.epfl.ch/remi.petitpierre Rémi Petitpierre] <br>
Horaire: Mardi de 13h15 à 15h sur Zoom : https://epfl.zoom.us/j/2693459226
Horaire: Mardi de 13h15 à 15h. INM 202.


[https://tube.switch.ch/channels/e49530f9 Lien vers le channel SwitchTube (Enregistrements des cours)]
== Résumé ==
Les Digital Humanities sont une discipline à la croisée des sciences de l'information et des sciences humaines et sociales. Dans ce cours, les étudiantes et étudiants découvrent ce nouveau domaine de recherche en apprenant à extraire des informations de plusieurs millions d'articles de presse.


==Résumé==
== Plan ==
Ce cours permet de découvrir les Digital Humanities par la pratique.


==Plan ==
20.02.2024 – <strong>Introduction</strong>
* Présentation de la thématique, des objectifs et de l’organisation du cours.


* 02.03.2021 Exercice sur FramaPad. Présentation des étudiants. Introduction au cours. Présentation des outils du cours (MediaWiki). Ecriture d'une biographie simple pour s'initier à la syntaxe MediaWiki. Recherche d'une personne ne figurant pas sur Wikipedia et Wikidata.
28.02.2024 – <strong>Cours 1. Wikipedia</strong>
* Introduction au projet Wikipedia (Frédéric Kaplan).


* 09.03.2021 Introduction à la base d'archives de presse qui sera utilisée ce semestre pour le cours: Impresso. Vue générale de la pipeline de processing des informations depuis les documents numérisés. Extraction d'information, entités nommées. Co-creation des interfaces d'accès. Signature du NDA (Non Disclosure Agreement) pour s'inscrire sur Impresso <ref>Pour des raisons de droits d'auteur et afin d'avoir un accès complet aux données d'Impresso, il est nécessaire de signer un [https://fr.wikipedia.org/wiki/Accord_de_non-divulgation NDA]. Il faut donc se rendre sur le [https://impresso-project.ch/app/ site web d'Impresso], télécharger le NDA, le remplir et le renvoyer à l'adresse mentionnée sur le site d'Impresso.</ref>.  
05.03.2024 – <strong>Cours 2. Explorer la presse numérisée (1/2).</strong>
* Introduction au projet <i>impresso</i> (1/2). (Maud Ehrmann)
* Tutoriel et exercices: Création d’une page sur Wikipast (Rémi Petitpierre).


* 16.03.2021 Analyse statistique de contenu d'une archive de presse. [[N-gramme]]. Champ attentionel d'un media (attention temporelle, attention spatiale). [[Typologie de courbes]]. Principe de la [[Biographies|datafication biographique]]. Discussion d'un exemple.  Choix d'une personne pour le projet personnel. [[Trouver une personne]]. Exercice d'indexation en transformant chaque terme en [[hypermot]].
12.03.2024 – <strong>Cours 3. Présentation des sources.</strong>
* Présentation des sources (Isabella di Lenardo, Rémi Petitpierre).
* Présentation et indication pour le rendu final.
* Tutoriel et exercices: Python et humanités digitales (Rémi Petitpierre).


* 23.03.2021 Analyse automatique de documents. Présentation des principes d'extraction automatiques à base de segmentation. Exemple de la libraire dhSegment. Complétion de la [[Biographies|datafication biographique]].
19.03.2024 – <strong>Cours 4. Explorer la presse numérisée (2/2).</strong>
* Introduction au projet <i>impresso</i> (2/2). (Maud Ehrmann)
* Constitution des groupes de travail


* 30.03.2021 Extraction automatique d'information dans des images d'archives. - Complétion de la [[Biographies|datafication biographique]] - Deadline pour la remise de la [[Biographies|datafication biographique]] (30%)
26.03.2024 – <strong>Cours 5. Panorama DH 1. Le texte.</strong>
* Panorama des Humanités Digitales (1/3): Texte. (Maud Ehrmann)
* Tutoriel et exercices: N-grams (Rémi Petitpierre).


* 06.04.2021 Pas de cours.
02.04.2024 – <strong>Vacances.</strong>
* Pas de cours


* 13.04.2021 Présentation des projets de bots pour Wikipast -  Début de la constitution des équipes - Travail à la définition des projets.Optionnel : [https://github.com/dhlab-epfl/HUM-369-tutorials Tutoriel python]
09.04.2024 – <strong>Cours 6. Panorama DH 2. Cartographie et Spatial Digital Humanities.</strong>
* Panorama des Humanités Digitales (2/3): Cartographie et Spatial Digital Humanities. (Isabella di Lenardo, Rémi Petitpierre)


* 20.04.2021 Procéduralité et automatisme - Les bots dans Twitter - Les bots dans Wikipedia - Statistiques - Wikification du domaine public - Les controverses des bots -  Les bots et le capitalisme linguistique - Constitution finale des groupes (3-4) et choix des projets - Explication du [[Peergrading‎]].
16.04.2024 – <strong>Cours 7. Panorama DH 3. Systèmes d'information géohistoriques.</strong>
* Panorama des Humanités Digitales (3/3): Systèmes d'information géohistoriques. (Isabella di Lenardo, Rémi Petitpierre)
* Tutoriel et exercices: Carte interactive (Rémi Petitpierre).


* 27.04.2021 Deadline [[Peergrading‎]] des datatifactions biographiques (10%). [[Horaires_supervision_(2021) | Créneaux à réserver]] pour la supervision de cette semaine.
23.04.2024 – <strong>Présentations intermédiaires.</strong>
* Présentations intermédiaires sur le contexte et les informations collectées (30 % de la note finale). Peergrading (10 % de la note finale).


* 04.05.2021 Travail sur les projets. [[Horaires_supervision_(2021) | Créneaux à réserver]] pour la supervision de cette semaine.
30.04.2024 – <strong>Retour sur les présentations intermédiaires.</strong>
* Retour sur les présentations intermédiaires.
* Questions-réponses sur le rendu final.


* 11.05.2021 '''Présentation informelle de chaque groupe (5 - 10 min)'''  - Présentation des résultats du peer-grading - Travail sur les projets - Detection des éventuelles incompatibilités entre bots.
07.05.2024 – <strong>Travail autonome.</strong>
* Travail autonome en groupe sur les projets en présence des enseignants.


* 18.05.2021  Travail sur les projets -  [[Horaires_supervision_(2021) | Créneaux à réserver]] pour la supervision de cette semaine.
14.05.2024 – <strong>Travail autonome.</strong>
* Travail autonome en groupe sur les projets en présence des enseignants.


* 25.05.2021 '''Deadline pour la description technique du bot (30%)''' - Travail sur les projets -  [[Horaires_supervision_(2021) | Créneaux à réserver]] pour la supervision de cette semaine.
21.05.2024 – <strong>Travail autonome.</strong>
* Travail autonome en groupe sur les projets en présence des enseignants.


* 01.06.2021  '''Presentation des projets (30%)''' - [http://wikipast.epfl.ch/wiki/Horaires_supervision_(2021)#Horaires_des_pr.C3.A9sentations_pour_le_01.2F06.2F2021 '''Horaires de passage'''] - 15 minutes par projet (10 minutes présentation, 5 minutes questions) - Les présentations risquent de dépasser un peu.
28.05.2024 – <strong>Examen.</strong>
* Rendu final des datafications biographiques (30 % de la note finale).
* Présentations finales de projets de groupe (30 % de la note finale).


<references/>
== Description du travail attendu ==
=== 1. Définition / Préparation ===
* Choix d’une thématique.
* Constitution du groupe (3 pers max).
* Choix d’un set de personnes (min 5), en cohérence avec la thématique


==Liens==
Quelques conseils:
* Les personnes choisies sont mentionnées dans au moins ~100 articles dans impresso.
* Ne pas hésiter à changer de personne(s) si nécessaire.
* Faire des collections dans impresso pour garder vos données.
 
=== 2. Recueillir des éléments contextuels généraux sur la thématique et les personnes choisies. ===
==== Présentation intermédiaire ====
* Description de la thématique: de quoi s’agit-il?
* Introduction du cadre temporel retenu: quelle période couvrez-vous?
* Détermination des principaux enjeux: quelles questions importantes identifiez-vous?
* Présentation des principaux acteurs: quelles personnes avez-vous retenues et pourquoi?
 
=== 3. Collection des données pour les datafications biographiques. ===
Datafication biographique: collecter des informations sur les personnes dans la presse à l’aide d’outils numériques.
* Qualitativement (lecture et exploration des sources: DHS et Impresso)
* Quantitativement (sur la base d’outils/scripts appliqués sur les articles de presse)
 
=== 4. Écriture de pages dans Wikipast, avec visualisation(s). ===
Résultat attendu:
* Une page wiki présentant la thématique (quelques paragraphes)
* Pour chaque personne, une page résumant les (15-20) principaux [[évènements]] de sa vie, en respectant la syntaxe wiki. ([[Jeanne Hersch|exemple]])
 
Structure des pages des personnes:
* Liste des évènements avec la date, le lieu, la typologie d'évènement (e.g. [[Publication]], [[Naissance]], [[Voyage]], etc.) et une brève description, ainsi qu'un lien vers votre source.
* Exemples des années précédentes: [[Gaston Clerc]], [[Henri Baud]]
 
Structure des pages thématiques:
* Présentation du thème, délimitation chronologique et thématique
* Brève description des enjeux (env. 50-200 mots)
* Liste des personnages (avec hyperliens vers les pages), complémenté par une brève explication de leur rapport au thème
* Données, illustrations des analyses, avec légendes
* Analyse et conclusion (env. 150-400 mots)
* Exemples des années précédentes: [[Scoutisme]], [[Mouvements ouvriers en Suisse au début du XXe siècle]]
 
Conseils:
* Pour toutes les pages, ne pas hésiter à mettre des visualisations (segment d'une page de journal jugée pertinente, un graphe ngram, un histogramme des topics, un histograms des entités nommées, une carte, etc.).
* Sourcer vos informations en ajoutant des liens vers les sources primaires utilisées (ici: les articles de presse Impresso)
 
==== Présentation finale ====
* Bref rappel de la thématique et des personnes choisies
* Présentation des analyses quantitatives, discussion qualitative sur la base des parcours de vie et des sources
* Conclusion
 
== Barème et critères d'évaluation ==
Barème général:
 
# Description des éléments généraux du contexte et des personnes (30 % de la note finale)
# [[Peergrading]] du travail des autres étudiants (10 %)
# Production de la [[Biographies|datafication biographique]] des personnes choisies (30 %)
# Présentation orale du projet réalisé (30 %)
 
=== 1. Présentation intermédiaire, description des éléments généraux du contexte et des personnes (30% de la note finale) ===
Consignes pour la présentation intermédiaire: La présentation intermédiaire se fait par groupe de projet. Elle doit durer 8 minutes et sera suivie de 5 minutes de questions. La parole doit être répartie de manière équitable entre tou·te·s les membres du groupe. Les slides devront être remises sur le Moodle avant mardi 23 avril, 9h.
 
=== 2. Peergrading (10% de la note finale) ===
Critère d'évaluation:
* L'étudiant·e a complété le formulaire de peer-grading, sur la base de la présentation des autres groupes.
 
=== 3. Présentation finale (30% de la note finale) ===
Consignes pour la présentation finale: La présentation se fait par groupe de projet. Elle doit durer 8 minutes et sera suivie de 5 minutes de questions. La parole doit être répartie de manière équitable entre tou·te·s les membres du groupe. Les slides devront être remises sur le Moodle avant mardi 30 mai, 10h.
 
=== 4. Datafications biographiques (30% de la note finale) ===
Cf. description du résultat attendu ci-dessus.
 
== Liens ==
* Datafications biographiques sur la page [[Biographies]]
* Datafications biographiques sur la page [[Biographies]]
* Assignation des biographies pour le [[Peergrading‎]]
* Assignation des biographies pour le [[Peergrading‎]]
* Projets de [[Bots]]


* [http://moodle.epfl.ch/course/view.php?id=14977 Moodle]
* [http://moodle.epfl.ch/course/view.php?id=14977 Moodle]
* [https://annuel2.framapad.org/p/dh-bachelor-2020 Framapad]
* MediaWiki: [https://www.mediawiki.org/wiki/Help:Formatting/fr Syntaxe] et [https://www.mediawiki.org/wiki/Help:Links/fr Liens]
* MediaWiki: [https://www.mediawiki.org/wiki/Help:Formatting/fr Syntaxe] et [https://www.mediawiki.org/wiki/Help:Links/fr Liens]
* [https://impresso-project.ch/app Archive de presse - Impresso]
* [https://impresso-project.ch/app Archive de presse - Impresso]
Ligne 58 : Ligne 147 :
* [https://github.com/dhlab-epfl/HUM-369-tutorials Tutoriel python]
* [https://github.com/dhlab-epfl/HUM-369-tutorials Tutoriel python]


==Barème ==
== Références ==
 
=== Barème pour la [[Datafication biographique]] (30 % de la note finale) ===
 
* Une biographie d'une personne ne figurant pas sur Wikipedia et Wikidata avec au moins 15 entrées a été écrite sous la forme d'une chronologie sourcée. Certaines entrées ont été indexées avec des hypermots > 4
** La présentation et la syntaxe Wiki ont été respectées +0.5
** Toutes les entrées sont sourcées avec au moins un article +0.5
** Le codage utilisant des hypermots est satisfaisant +0.5
** Au moins cinq pages liées ont été créées ou mises à jour +0.5
 
=== Barème pour le peer-grading (10 % de la note finale)  ===
 
* 5 datafications ont été notées : 6, sinon 0
 
=== Barème pour la description technique du bot  (30 % de la note finale)  ===
 
* La page du bot a été créée, le code est inséré sur Wikipast ou GitHub, un résumé des fonctionnalités est présent ainsi qu'une discussion critique des performances (au moins 300 mots) > 4
** Le bot réalisé répond aux fonctionnalités attendues +0.5
** La description est claire et précise +0.5
** Des exemples de résultats sont proposés +0.5
** La discussion est bien argumentée +0.5
 
=== Barème pour la présentation  (30 % de la note finale)  ===
 
* Une présentation en groupe du projet de bot (10 mn) avec des slides est effectuée > 4
** La présentation orale est dynamique, précise et claire +0.5
** Les réponses aux questions sont pertinentes + 0.5
** Les slides sont bien présentées  +0.5
** L'ensemble du projet est cohérent et bien réalisé +0.5
 
==Références==


Référentiels temporels :
Référentiels temporels :

Dernière version du 31 mai 2024 à 10:16

Bienvenue sur Wikipast, le mediawiki du cours Digital humanities (HUM-369).

Contact

Teachers: Isabella di Lenardo, Maud Ehrmann
Assistant: Rémi Petitpierre
Horaire: Mardi de 13h15 à 15h. INM 202.

Résumé

Les Digital Humanities sont une discipline à la croisée des sciences de l'information et des sciences humaines et sociales. Dans ce cours, les étudiantes et étudiants découvrent ce nouveau domaine de recherche en apprenant à extraire des informations de plusieurs millions d'articles de presse.

Plan

20.02.2024 – Introduction

  • Présentation de la thématique, des objectifs et de l’organisation du cours.

28.02.2024 – Cours 1. Wikipedia

  • Introduction au projet Wikipedia (Frédéric Kaplan).

05.03.2024 – Cours 2. Explorer la presse numérisée (1/2).

  • Introduction au projet impresso (1/2). (Maud Ehrmann)
  • Tutoriel et exercices: Création d’une page sur Wikipast (Rémi Petitpierre).

12.03.2024 – Cours 3. Présentation des sources.

  • Présentation des sources (Isabella di Lenardo, Rémi Petitpierre).
  • Présentation et indication pour le rendu final.
  • Tutoriel et exercices: Python et humanités digitales (Rémi Petitpierre).

19.03.2024 – Cours 4. Explorer la presse numérisée (2/2).

  • Introduction au projet impresso (2/2). (Maud Ehrmann)
  • Constitution des groupes de travail

26.03.2024 – Cours 5. Panorama DH 1. Le texte.

  • Panorama des Humanités Digitales (1/3): Texte. (Maud Ehrmann)
  • Tutoriel et exercices: N-grams (Rémi Petitpierre).

02.04.2024 – Vacances.

  • Pas de cours

09.04.2024 – Cours 6. Panorama DH 2. Cartographie et Spatial Digital Humanities.

  • Panorama des Humanités Digitales (2/3): Cartographie et Spatial Digital Humanities. (Isabella di Lenardo, Rémi Petitpierre)

16.04.2024 – Cours 7. Panorama DH 3. Systèmes d'information géohistoriques.

  • Panorama des Humanités Digitales (3/3): Systèmes d'information géohistoriques. (Isabella di Lenardo, Rémi Petitpierre)
  • Tutoriel et exercices: Carte interactive (Rémi Petitpierre).

23.04.2024 – Présentations intermédiaires.

  • Présentations intermédiaires sur le contexte et les informations collectées (30 % de la note finale). Peergrading (10 % de la note finale).

30.04.2024 – Retour sur les présentations intermédiaires.

  • Retour sur les présentations intermédiaires.
  • Questions-réponses sur le rendu final.

07.05.2024 – Travail autonome.

  • Travail autonome en groupe sur les projets en présence des enseignants.

14.05.2024 – Travail autonome.

  • Travail autonome en groupe sur les projets en présence des enseignants.

21.05.2024 – Travail autonome.

  • Travail autonome en groupe sur les projets en présence des enseignants.

28.05.2024 – Examen.

  • Rendu final des datafications biographiques (30 % de la note finale).
  • Présentations finales de projets de groupe (30 % de la note finale).

Description du travail attendu

1. Définition / Préparation

  • Choix d’une thématique.
  • Constitution du groupe (3 pers max).
  • Choix d’un set de personnes (min 5), en cohérence avec la thématique

Quelques conseils:

  • Les personnes choisies sont mentionnées dans au moins ~100 articles dans impresso.
  • Ne pas hésiter à changer de personne(s) si nécessaire.
  • Faire des collections dans impresso pour garder vos données.

2. Recueillir des éléments contextuels généraux sur la thématique et les personnes choisies.

Présentation intermédiaire

  • Description de la thématique: de quoi s’agit-il?
  • Introduction du cadre temporel retenu: quelle période couvrez-vous?
  • Détermination des principaux enjeux: quelles questions importantes identifiez-vous?
  • Présentation des principaux acteurs: quelles personnes avez-vous retenues et pourquoi?

3. Collection des données pour les datafications biographiques.

Datafication biographique: collecter des informations sur les personnes dans la presse à l’aide d’outils numériques.

  • Qualitativement (lecture et exploration des sources: DHS et Impresso)
  • Quantitativement (sur la base d’outils/scripts appliqués sur les articles de presse)

4. Écriture de pages dans Wikipast, avec visualisation(s).

Résultat attendu:

  • Une page wiki présentant la thématique (quelques paragraphes)
  • Pour chaque personne, une page résumant les (15-20) principaux évènements de sa vie, en respectant la syntaxe wiki. (exemple)

Structure des pages des personnes:

  • Liste des évènements avec la date, le lieu, la typologie d'évènement (e.g. Publication, Naissance, Voyage, etc.) et une brève description, ainsi qu'un lien vers votre source.
  • Exemples des années précédentes: Gaston Clerc, Henri Baud

Structure des pages thématiques:

  • Présentation du thème, délimitation chronologique et thématique
  • Brève description des enjeux (env. 50-200 mots)
  • Liste des personnages (avec hyperliens vers les pages), complémenté par une brève explication de leur rapport au thème
  • Données, illustrations des analyses, avec légendes
  • Analyse et conclusion (env. 150-400 mots)
  • Exemples des années précédentes: Scoutisme, Mouvements ouvriers en Suisse au début du XXe siècle

Conseils:

  • Pour toutes les pages, ne pas hésiter à mettre des visualisations (segment d'une page de journal jugée pertinente, un graphe ngram, un histogramme des topics, un histograms des entités nommées, une carte, etc.).
  • Sourcer vos informations en ajoutant des liens vers les sources primaires utilisées (ici: les articles de presse Impresso)

Présentation finale

  • Bref rappel de la thématique et des personnes choisies
  • Présentation des analyses quantitatives, discussion qualitative sur la base des parcours de vie et des sources
  • Conclusion

Barème et critères d'évaluation

Barème général:

  1. Description des éléments généraux du contexte et des personnes (30 % de la note finale)
  2. Peergrading du travail des autres étudiants (10 %)
  3. Production de la datafication biographique des personnes choisies (30 %)
  4. Présentation orale du projet réalisé (30 %)

1. Présentation intermédiaire, description des éléments généraux du contexte et des personnes (30% de la note finale)

Consignes pour la présentation intermédiaire: La présentation intermédiaire se fait par groupe de projet. Elle doit durer 8 minutes et sera suivie de 5 minutes de questions. La parole doit être répartie de manière équitable entre tou·te·s les membres du groupe. Les slides devront être remises sur le Moodle avant mardi 23 avril, 9h.

2. Peergrading (10% de la note finale)

Critère d'évaluation:

  • L'étudiant·e a complété le formulaire de peer-grading, sur la base de la présentation des autres groupes.

3. Présentation finale (30% de la note finale)

Consignes pour la présentation finale: La présentation se fait par groupe de projet. Elle doit durer 8 minutes et sera suivie de 5 minutes de questions. La parole doit être répartie de manière équitable entre tou·te·s les membres du groupe. Les slides devront être remises sur le Moodle avant mardi 30 mai, 10h.

4. Datafications biographiques (30% de la note finale)

Cf. description du résultat attendu ci-dessus.

Liens

Références

Référentiels temporels :

Référentiels spatiaux :