« Accueil » : différence entre les versions

De Wikipast
Aller à la navigation Aller à la recherche
m (A modifié les paramètres de protection pour « Accueil » ([Modifier = Autoriser uniquement les administrateurs] (infini) [Renommer = Autoriser uniquement les administrateurs] (infini)))
 
(105 versions intermédiaires par le même utilisateur non affichées)
Ligne 1 : Ligne 1 :
Bienvenue sur <strong>Wikipast</strong>, le mediawiki du cours Digital humanities (HUM-369).
Bienvenue sur <strong>Wikipast</strong>, le mediawiki du cours Digital humanities (HUM-369).


==Contact==
== Contact ==
Professeur: [http://people.epfl.ch/frederic.kaplan Frédéric Kaplan]<br>
Teachers: [http://people.epfl.ch/isabella.dilenardo Isabella di Lenardo], [http://people.epfl.ch/maud.ehrmann Maud Ehrmann]<br>
Assistant: [http://people.epfl.ch/vincent.buntinx Vincent Buntinx]
Assistant: [https://people.epfl.ch/remi.petitpierre Rémi Petitpierre] <br>
Horaire: Mardi de 13h15 à 15h. INM 202.


==Liens==
== Résumé ==
* [http://moodle.epfl.ch/course/view.php?id=14977 Site Moodle]
Les Digital Humanities sont une discipline à la croisée des sciences de l'information et des sciences humaines et sociales. Dans ce cours, les étudiantes et étudiants découvrent ce nouveau domaine de recherche en apprenant à extraire des informations de plusieurs millions d'articles de presse.
* MediaWiki:[https://www.mediawiki.org/wiki/Help:Formatting/fr Syntaxe] et [https://www.mediawiki.org/wiki/Help:Links/fr Liens]
 
* [http://letempsarchives.ch Archive de presse - Le Temps]
== Plan ==
* [https://gallica.bnf.fr Gallica - BNF]
 
* Datafication biographiques en cours de création: page [[Biographies]]
20.02.2024 – <strong>Introduction</strong>
* [[FAQ]] pour ce cours
* Présentation de la thématique, des objectifs et de l’organisation du cours.
<!--
 
* Projets de [[Bots]]
28.02.2024 – <strong>Cours 1. Wikipedia</strong>
* [[Typologie de courbes]]
* Introduction au projet Wikipedia (Frédéric Kaplan).
* Typologie d'[[évènements]]
 
* [[Tutorial python]]
05.03.2024 – <strong>Cours 2. Explorer la presse numérisée (1/2).</strong>
* [[Peergrading‎]]
* Introduction au projet <i>impresso</i> (1/2). (Maud Ehrmann)
* [[SPARQL_python]]
* Tutoriel et exercices: Création d’une page sur Wikipast (Rémi Petitpierre).
-->
 
12.03.2024 – <strong>Cours 3. Présentation des sources.</strong>
* Présentation des sources (Isabella di Lenardo, Rémi Petitpierre).
* Présentation et indication pour le rendu final.
* Tutoriel et exercices: Python et humanités digitales (Rémi Petitpierre).
 
19.03.2024 – <strong>Cours 4. Explorer la presse numérisée (2/2).</strong>
* Introduction au projet <i>impresso</i> (2/2). (Maud Ehrmann)
* Constitution des groupes de travail
 
26.03.2024 – <strong>Cours 5. Panorama DH 1. Le texte.</strong>
* Panorama des Humanités Digitales (1/3): Texte. (Maud Ehrmann)
* Tutoriel et exercices: N-grams (Rémi Petitpierre).


==Résumé==
02.04.2024 – <strong>Vacances.</strong>
Ce cours permet de découvrir les Digital Humanities par la pratique.
* Pas de cours


==Plan ==
09.04.2024 – <strong>Cours 6. Panorama DH 2. Cartographie et Spatial Digital Humanities.</strong>
* Panorama des Humanités Digitales (2/3): Cartographie et Spatial Digital Humanities. (Isabella di Lenardo, Rémi Petitpierre)


* 19.02.2019 Introduction au cours. Présentation des outils du cours (MediaWiki). Ecriture d'une biographie simple pour s'initier à la syntaxe MediaWiki
16.04.2024 – <strong>Cours 7. Panorama DH 3. Systèmes d'information géohistoriques.</strong>
* Panorama des Humanités Digitales (3/3): Systèmes d'information géohistoriques. (Isabella di Lenardo, Rémi Petitpierre)
* Tutoriel et exercices: Carte interactive (Rémi Petitpierre).


* 26.02.2019 Principes de la reconstitution à partir d'archives. Exemple du projet Venice Time Machine. Techniques pour la numérisation massive (méthodes robotiques, tomographie). Reconnaissance des écritures manuscrites. Introduction au concept d'entité nommée. Réseaux d'entités nommées. Principes de la reconstitution cadastrale. Modélisation 4d. Introduction à la base d'archives de presse qui sera utilisée ce semestre pour le cours. Principe de la [[datafication biographique]]. Discussion d'un exemple.  Choix d'une personne pour le projet personnel.
23.04.2024 – <strong>Présentations intermédiaires.</strong>
* Présentations intermédiaires sur le contexte et les informations collectées (30 % de la note finale). Peergrading (10 % de la note finale).


* 05.03.2019 Linguistique des grands nombres. [[N-gramme]]. Champ attentionel d'un media (attention temporelle, attention spatiale). [[Typologie de courbes]]. Suite de la [[datafication biographique]]. Exercice d'indexation en transformant chaque terme en [[hypermot]].
30.04.2024 – <strong>Retour sur les présentations intermédiaires.</strong>
* Retour sur les présentations intermédiaires.
* Questions-réponses sur le rendu final.


* 12.03.2019 Discretisation de l'espace et du temps. [[UT]].[[TAI]]. [[UTC]]. Classes d'équivalences temporelles. Classes d'équivalences spatiales. Exercices de conversion de dates. Complétion de la [[datafication biographique]]
07.05.2024 – <strong>Travail autonome.</strong>
* Travail autonome en groupe sur les projets en présence des enseignants.


* 19.03.2019 [[Tutorial python]] - Complétion de la [[datafication biographique]] - Deadline pour la remise de la [[datafication biographique]] (30%)
14.05.2024 – <strong>Travail autonome.</strong>
* Travail autonome en groupe sur les projets en présence des enseignants.


* 26.03.2019 Explication du Peer-grading - Présention des projets de bots pour Wikipast -  Début de la constitution des équipes - Travail à la définition des projets
21.05.2024 – <strong>Travail autonome.</strong>
* Travail autonome en groupe sur les projets en présence des enseignants.


* 02.04.2019 Algorithmes d'analyses textuelles - Introduction aux techniques de traitement du langage naturel - Les conférences MUC - Typologie des entités nommées (ENAMEX, TIMEX, NUMEX) - Gazetters - Tokenizers / Language guessers / POS - Tagger - Méthodes à base de règles - Méthodes à base d'apprentissage (Bayesian classifier, Hidden Markov Models, CRF) - Clustering / Linking - Extraction des entitées nommées dans la base des articles de presse - Calcul sur les noeuds du cluster - Exemple de règles ecrites en ExPRESS - Cascade de règles - Deadline Peer-grading des datatifactions biographiques (10%) - Constitution finale des groupes (4 +/- 1) et choix des projets
28.05.2024 – <strong>Examen.</strong>
* Rendu final des datafications biographiques (30 % de la note finale).
* Présentations finales de projets de groupe (30 % de la note finale).


* 09.04.2019 Procéduralité et automatisme - Les bots dans Twitter - Les bots dans Wikipedia - Statistiques - Wikification du domaine public - Les controverses des bots -  Les bots et le capitalisme linguistique - Travail sur les projets
== Description du travail attendu ==
=== 1. Définition / Préparation ===
* Choix d’une thématique.
* Constitution du groupe (3 pers max).
* Choix d’un set de personnes (min 5), en cohérence avec la thématique


* 16.04.2019 Algorithmes d'analyses visuelles - Méthode de comparaison de recherche visuelle et distances entre images -  Histogrammes de gradients - Deep learning - Moteur de recherche visuel - Travail sur les projets - Presentation des résultats du peer-grading
Quelques conseils:
* Les personnes choisies sont mentionnées dans au moins ~100 articles dans impresso.
* Ne pas hésiter à changer de personne(s) si nécessaire.
* Faire des collections dans impresso pour garder vos données.


* 23.04.2019 Pas de cours
=== 2. Recueillir des éléments contextuels généraux sur la thématique et les personnes choisies. ===
==== Présentation intermédiaire ====
* Description de la thématique: de quoi s’agit-il?
* Introduction du cadre temporel retenu: quelle période couvrez-vous?
* Détermination des principaux enjeux: quelles questions importantes identifiez-vous?
* Présentation des principaux acteurs: quelles personnes avez-vous retenues et pourquoi?


* 30.04.2019 Travail sur les projets - Presentation informelle de chaque groupe (5 - 10 min) - Detection des éventuelles incompatibilités entre bots
=== 3. Collection des données pour les datafications biographiques. ===
Datafication biographique: collecter des informations sur les personnes dans la presse à l’aide d’outils numériques.
* Qualitativement (lecture et exploration des sources: DHS et Impresso)
* Quantitativement (sur la base d’outils/scripts appliqués sur les articles de presse)


* 07.05.2019  Travail sur les projets - Essai de tous les bots sur une page test - Deadline pour la description technique du bot (30%)
=== 4. Écriture de pages dans Wikipast, avec visualisation(s). ===
Résultat attendu:
* Une page wiki présentant la thématique (quelques paragraphes)
* Pour chaque personne, une page résumant les (15-20) principaux [[évènements]] de sa vie, en respectant la syntaxe wiki. ([[Jeanne Hersch|exemple]])


* 14.05.2019  Travail sur les projets - Scheduling des bots - incompatibilités entre bots - déployment des bots à grande échelle
Structure des pages des personnes:
* Liste des évènements avec la date, le lieu, la typologie d'évènement (e.g. [[Publication]], [[Naissance]], [[Voyage]], etc.) et une brève description, ainsi qu'un lien vers votre source.
* Exemples des années précédentes: [[Gaston Clerc]], [[Henri Baud]]


* 21.05.2019 Presentation des projets (30%) - 15 minutes par projet (10 minutes présentation, 5 minutes questions)
Structure des pages thématiques:
<!--
* Présentation du thème, délimitation chronologique et thématique
**12h45: SummarizingBot
* Brève description des enjeux (env. 50-200 mots)
**13h00: SimilarBot
* Liste des personnages (avec hyperliens vers les pages), complémenté par une brève explication de leur rapport au thème
**13h15: TranslatorBot
* Données, illustrations des analyses, avec légendes
**13h30: VandalBot
* Analyse et conclusion (env. 150-400 mots)
**13h45: Triplificator
* Exemples des années précédentes: [[Scoutisme]], [[Mouvements ouvriers en Suisse au début du XXe siècle]]
**14h00: Creatobot
**14h15: SliderBot
**14h30: GraderBot
**14h45: EntryMakerBot
-->


* 28.05.2019  Pas de cours
Conseils:
* Pour toutes les pages, ne pas hésiter à mettre des visualisations (segment d'une page de journal jugée pertinente, un graphe ngram, un histogramme des topics, un histograms des entités nommées, une carte, etc.).
* Sourcer vos informations en ajoutant des liens vers les sources primaires utilisées (ici: les articles de presse Impresso)


==Références==
==== Présentation finale ====
* Bref rappel de la thématique et des personnes choisies
* Présentation des analyses quantitatives, discussion qualitative sur la base des parcours de vie et des sources
* Conclusion


Référentiels temporels :
== Barème et critères d'évaluation ==
Barème général:


* [[UT|UT : Temps universel]]
# Description des éléments généraux du contexte et des personnes (30 % de la note finale)
* [[TAI|TAI : Temps Atomique International]]
# [[Peergrading]] du travail des autres étudiants (10 %)
* [[UTC|UTC : Temps Universel Coordonné]]
# Production de la [[Biographies|datafication biographique]] des personnes choisies (30 %)
# Présentation orale du projet réalisé (30 %)


Référentiels spatiaux :
=== 1. Présentation intermédiaire, description des éléments généraux du contexte et des personnes (30% de la note finale) ===
Consignes pour la présentation intermédiaire: La présentation intermédiaire se fait par groupe de projet. Elle doit durer 8 minutes et sera suivie de 5 minutes de questions. La parole doit être répartie de manière équitable entre tou·te·s les membres du groupe. Les slides devront être remises sur le Moodle avant mardi 23 avril, 9h.


* [[Ellipsoidal_Coordinates|Coordonnées ellipsoïdales]]
=== 2. Peergrading (10% de la note finale) ===
* [[WGS84_GRS80|Exemples : WGS84, GRS80]]
Critère d'évaluation:
* L'étudiant·e a complété le formulaire de peer-grading, sur la base de la présentation des autres groupes.


==Barème ==
=== 3. Présentation finale (30% de la note finale) ===
Consignes pour la présentation finale: La présentation se fait par groupe de projet. Elle doit durer 8 minutes et sera suivie de 5 minutes de questions. La parole doit être répartie de manière équitable entre tou·te·s les membres du groupe. Les slides devront être remises sur le Moodle avant mardi 30 mai, 10h.


=== Barème pour la [[Datafication biographique]] (30 % de la note finale) ===
=== 4. Datafications biographiques (30% de la note finale) ===
Cf. description du résultat attendu ci-dessus.


* Une biographie avec au moins 15 entrées a été écrite sous la forme d'une chronologie sourcée. Certaines entrées ont été indexées avec des hypermots > 4
== Liens ==
** La présentation et la syntaxe Wiki ont été respectée +0.5
* Datafications biographiques sur la page [[Biographies]]
** Toutes les entrées sont sourcées avec au moins un article +0.5
* Assignation des biographies pour le [[Peergrading‎]]
** Le codage utilisant des hypermots est satisfaisant +0.5
** Au moins cinq pages liées ont été créées ou mises à jour.+0.5


=== Barème pour le peer-grading (10 % de la note finale)  ===
* [http://moodle.epfl.ch/course/view.php?id=14977 Moodle]
* MediaWiki: [https://www.mediawiki.org/wiki/Help:Formatting/fr Syntaxe] et [https://www.mediawiki.org/wiki/Help:Links/fr Liens]
* [https://impresso-project.ch/app Archive de presse - Impresso]
* [http://letempsarchives.ch Archive de presse - Le Temps]
* [[Trouver une personne]]
* Typologie d'[[évènements]]
* [https://gallica.bnf.fr Gallica - BNF]
* [https://github.com/dhlab-epfl/HUM-369-tutorials Tutoriel python]


* 5 datafication ont été notée : 6, sinon 0
== Références ==


=== Barème pour la description technique du bot  (30 % de la note finale)  ===
Référentiels temporels :


* La page du bot a été créée, le code est inséré sur Wikipast ou GitHub, un résumé des fonctionnalités est présent ainsi qu'une discussion critique des performances (au moins 300 mots) > 4
* [[UT|UT : Temps universel]]
** Le bot réalisé répond aux fonctionnalités attendues +0.5
* [[TAI|TAI : Temps Atomique International]]
** La description est claire et précise +0.5
* [[UTC|UTC : Temps Universel Coordonné]]
** Des exemples de résultats sont proposés +0.5
** La discussion est bien argumentée +0.5


=== Barème pour la presentation  (30 % de la note finale)  ===
Référentiels spatiaux :


* Une présentation en groupe du projet de bot (10 mn) avec des slides est effectuée > 4
* [[Ellipsoidal_Coordinates|Coordonnées ellipsoïdales]]
** La présentation orale est dynamique, précise et claire +0.5
* [[WGS84_GRS80|Exemples : WGS84, GRS80]]
** Les réponses aux questions sont pertinentes + 0.5
** Les slides sont bien présentés  +0.5
** L'ensemble du projet est cohérent et bien réalisé +0.5

Dernière version du 31 mai 2024 à 10:16

Bienvenue sur Wikipast, le mediawiki du cours Digital humanities (HUM-369).

Contact

Teachers: Isabella di Lenardo, Maud Ehrmann
Assistant: Rémi Petitpierre
Horaire: Mardi de 13h15 à 15h. INM 202.

Résumé

Les Digital Humanities sont une discipline à la croisée des sciences de l'information et des sciences humaines et sociales. Dans ce cours, les étudiantes et étudiants découvrent ce nouveau domaine de recherche en apprenant à extraire des informations de plusieurs millions d'articles de presse.

Plan

20.02.2024 – Introduction

  • Présentation de la thématique, des objectifs et de l’organisation du cours.

28.02.2024 – Cours 1. Wikipedia

  • Introduction au projet Wikipedia (Frédéric Kaplan).

05.03.2024 – Cours 2. Explorer la presse numérisée (1/2).

  • Introduction au projet impresso (1/2). (Maud Ehrmann)
  • Tutoriel et exercices: Création d’une page sur Wikipast (Rémi Petitpierre).

12.03.2024 – Cours 3. Présentation des sources.

  • Présentation des sources (Isabella di Lenardo, Rémi Petitpierre).
  • Présentation et indication pour le rendu final.
  • Tutoriel et exercices: Python et humanités digitales (Rémi Petitpierre).

19.03.2024 – Cours 4. Explorer la presse numérisée (2/2).

  • Introduction au projet impresso (2/2). (Maud Ehrmann)
  • Constitution des groupes de travail

26.03.2024 – Cours 5. Panorama DH 1. Le texte.

  • Panorama des Humanités Digitales (1/3): Texte. (Maud Ehrmann)
  • Tutoriel et exercices: N-grams (Rémi Petitpierre).

02.04.2024 – Vacances.

  • Pas de cours

09.04.2024 – Cours 6. Panorama DH 2. Cartographie et Spatial Digital Humanities.

  • Panorama des Humanités Digitales (2/3): Cartographie et Spatial Digital Humanities. (Isabella di Lenardo, Rémi Petitpierre)

16.04.2024 – Cours 7. Panorama DH 3. Systèmes d'information géohistoriques.

  • Panorama des Humanités Digitales (3/3): Systèmes d'information géohistoriques. (Isabella di Lenardo, Rémi Petitpierre)
  • Tutoriel et exercices: Carte interactive (Rémi Petitpierre).

23.04.2024 – Présentations intermédiaires.

  • Présentations intermédiaires sur le contexte et les informations collectées (30 % de la note finale). Peergrading (10 % de la note finale).

30.04.2024 – Retour sur les présentations intermédiaires.

  • Retour sur les présentations intermédiaires.
  • Questions-réponses sur le rendu final.

07.05.2024 – Travail autonome.

  • Travail autonome en groupe sur les projets en présence des enseignants.

14.05.2024 – Travail autonome.

  • Travail autonome en groupe sur les projets en présence des enseignants.

21.05.2024 – Travail autonome.

  • Travail autonome en groupe sur les projets en présence des enseignants.

28.05.2024 – Examen.

  • Rendu final des datafications biographiques (30 % de la note finale).
  • Présentations finales de projets de groupe (30 % de la note finale).

Description du travail attendu

1. Définition / Préparation

  • Choix d’une thématique.
  • Constitution du groupe (3 pers max).
  • Choix d’un set de personnes (min 5), en cohérence avec la thématique

Quelques conseils:

  • Les personnes choisies sont mentionnées dans au moins ~100 articles dans impresso.
  • Ne pas hésiter à changer de personne(s) si nécessaire.
  • Faire des collections dans impresso pour garder vos données.

2. Recueillir des éléments contextuels généraux sur la thématique et les personnes choisies.

Présentation intermédiaire

  • Description de la thématique: de quoi s’agit-il?
  • Introduction du cadre temporel retenu: quelle période couvrez-vous?
  • Détermination des principaux enjeux: quelles questions importantes identifiez-vous?
  • Présentation des principaux acteurs: quelles personnes avez-vous retenues et pourquoi?

3. Collection des données pour les datafications biographiques.

Datafication biographique: collecter des informations sur les personnes dans la presse à l’aide d’outils numériques.

  • Qualitativement (lecture et exploration des sources: DHS et Impresso)
  • Quantitativement (sur la base d’outils/scripts appliqués sur les articles de presse)

4. Écriture de pages dans Wikipast, avec visualisation(s).

Résultat attendu:

  • Une page wiki présentant la thématique (quelques paragraphes)
  • Pour chaque personne, une page résumant les (15-20) principaux évènements de sa vie, en respectant la syntaxe wiki. (exemple)

Structure des pages des personnes:

  • Liste des évènements avec la date, le lieu, la typologie d'évènement (e.g. Publication, Naissance, Voyage, etc.) et une brève description, ainsi qu'un lien vers votre source.
  • Exemples des années précédentes: Gaston Clerc, Henri Baud

Structure des pages thématiques:

  • Présentation du thème, délimitation chronologique et thématique
  • Brève description des enjeux (env. 50-200 mots)
  • Liste des personnages (avec hyperliens vers les pages), complémenté par une brève explication de leur rapport au thème
  • Données, illustrations des analyses, avec légendes
  • Analyse et conclusion (env. 150-400 mots)
  • Exemples des années précédentes: Scoutisme, Mouvements ouvriers en Suisse au début du XXe siècle

Conseils:

  • Pour toutes les pages, ne pas hésiter à mettre des visualisations (segment d'une page de journal jugée pertinente, un graphe ngram, un histogramme des topics, un histograms des entités nommées, une carte, etc.).
  • Sourcer vos informations en ajoutant des liens vers les sources primaires utilisées (ici: les articles de presse Impresso)

Présentation finale

  • Bref rappel de la thématique et des personnes choisies
  • Présentation des analyses quantitatives, discussion qualitative sur la base des parcours de vie et des sources
  • Conclusion

Barème et critères d'évaluation

Barème général:

  1. Description des éléments généraux du contexte et des personnes (30 % de la note finale)
  2. Peergrading du travail des autres étudiants (10 %)
  3. Production de la datafication biographique des personnes choisies (30 %)
  4. Présentation orale du projet réalisé (30 %)

1. Présentation intermédiaire, description des éléments généraux du contexte et des personnes (30% de la note finale)

Consignes pour la présentation intermédiaire: La présentation intermédiaire se fait par groupe de projet. Elle doit durer 8 minutes et sera suivie de 5 minutes de questions. La parole doit être répartie de manière équitable entre tou·te·s les membres du groupe. Les slides devront être remises sur le Moodle avant mardi 23 avril, 9h.

2. Peergrading (10% de la note finale)

Critère d'évaluation:

  • L'étudiant·e a complété le formulaire de peer-grading, sur la base de la présentation des autres groupes.

3. Présentation finale (30% de la note finale)

Consignes pour la présentation finale: La présentation se fait par groupe de projet. Elle doit durer 8 minutes et sera suivie de 5 minutes de questions. La parole doit être répartie de manière équitable entre tou·te·s les membres du groupe. Les slides devront être remises sur le Moodle avant mardi 30 mai, 10h.

4. Datafications biographiques (30% de la note finale)

Cf. description du résultat attendu ci-dessus.

Liens

Références

Référentiels temporels :

Référentiels spatiaux :