« ArtBot » : différence entre les versions
Ligne 12 : | Ligne 12 : | ||
<code> import pandas as pd </code> | <code> import pandas as pd </code> | ||
=== Récupération des données === | === Récupération des données === | ||
Ligne 22 : | Ligne 20 : | ||
[[Fichier:Dataframe.JPG|vignette|redresse= 3|center | Exemple d'informations contenues dans la base de données]] | [[Fichier:Dataframe.JPG|vignette|redresse= 3|center | Exemple d'informations contenues dans la base de données]] | ||
<code> | |||
df_SC1 = pd.read_csv('https://raw.githubusercontent.com/thegetty/provenance-index-csv/master/sales_catalogs/sales_contents_1.csv', | |||
low_memory=False) | |||
df_SC2 = pd.read_csv('https://raw.githubusercontent.com/thegetty/provenance-index-csv/master/sales_catalogs/sales_contents_2.csv', | |||
low_memory=False) | |||
df_SC3 = pd.read_csv('https://raw.githubusercontent.com/thegetty/provenance-index-csv/master/sales_catalogs/sales_contents_3.csv', | |||
low_memory=False) | |||
df_SC4 = pd.read_csv('https://raw.githubusercontent.com/thegetty/provenance-index-csv/master/sales_catalogs/sales_contents_4.csv', | |||
low_memory=False) | |||
df_SC5 = pd.read_csv('https://raw.githubusercontent.com/thegetty/provenance-index-csv/master/sales_catalogs/sales_contents_5.csv', | |||
low_memory=False) | |||
df_SC6 = pd.read_csv('https://raw.githubusercontent.com/thegetty/provenance-index-csv/master/sales_catalogs/sales_contents_6.csv', | |||
low_memory=False) | |||
df_SC7 = pd.read_csv('https://raw.githubusercontent.com/thegetty/provenance-index-csv/master/sales_catalogs/sales_contents_7.csv', | |||
low_memory=False) | |||
df_SC8 = pd.read_csv('https://raw.githubusercontent.com/thegetty/provenance-index-csv/master/sales_catalogs/sales_contents_8.csv', | |||
low_memory=False) | |||
df_SC9 = pd.read_csv('https://raw.githubusercontent.com/thegetty/provenance-index-csv/master/sales_catalogs/sales_contents_9.csv', | |||
low_memory=False) | |||
df_SC10 = pd.read_csv('https://raw.githubusercontent.com/thegetty/provenance-index-csv/master/sales_catalogs/sales_contents_10.csv', | |||
low_memory=False) | |||
df_SC11 = pd.read_csv('https://raw.githubusercontent.com/thegetty/provenance-index-csv/master/sales_catalogs/sales_contents_11.csv', | |||
low_memory=False) | |||
df_SC12 = pd.read_csv('https://raw.githubusercontent.com/thegetty/provenance-index-csv/master/sales_catalogs/sales_contents_12.csv', | |||
low_memory=False) | |||
df_SC13 = pd.read_csv('https://raw.githubusercontent.com/thegetty/provenance-index-csv/master/sales_catalogs/sales_contents_13.csv', | |||
low_memory=False) | |||
</code> | |||
=== Identifiants Wikidata === | === Identifiants Wikidata === |
Version du 22 mai 2021 à 15:00
Langue | Français |
Description
Le but de l'ArtBot est de créer des pages pour des œuvres qui regroupent l'historique de leurs ventes. Il utilise comme base de données les registres de ventes du Getty Provenance Index fourni par le Getty Research Institute [1].
Gestion des bases de données
L'ArtBot utilise la bibliothèque pandas pour les fonctions de gestion de bases de données.
import pandas as pd
Récupération des données
Les fichiers .csv ont directement été récupérés sur GitHub [2], mais ne contiennent pas tous les mêmes catégories, ou les mêmes noms pour les mêmes catégories. Les entrées pertinentes ont été sélectionnées et renommées, puis les fichiers concaténés afin de travailler sur une nouvelle base plus facile à lire par l'ArtBot.
L'ArtBot travaille avec les informations suivantes : Titre de l'œuvre, artiste, nationalité de l'artiste, date de vente, maison de ventes, prix de vente, vendeur, acheteur, et éventuellement type d'œuvre et genre.
df_SC1 = pd.read_csv('https://raw.githubusercontent.com/thegetty/provenance-index-csv/master/sales_catalogs/sales_contents_1.csv',
low_memory=False)
df_SC2 = pd.read_csv('https://raw.githubusercontent.com/thegetty/provenance-index-csv/master/sales_catalogs/sales_contents_2.csv',
low_memory=False)
df_SC3 = pd.read_csv('https://raw.githubusercontent.com/thegetty/provenance-index-csv/master/sales_catalogs/sales_contents_3.csv',
low_memory=False)
df_SC4 = pd.read_csv('https://raw.githubusercontent.com/thegetty/provenance-index-csv/master/sales_catalogs/sales_contents_4.csv',
low_memory=False)
df_SC5 = pd.read_csv('https://raw.githubusercontent.com/thegetty/provenance-index-csv/master/sales_catalogs/sales_contents_5.csv',
low_memory=False)
df_SC6 = pd.read_csv('https://raw.githubusercontent.com/thegetty/provenance-index-csv/master/sales_catalogs/sales_contents_6.csv',
low_memory=False)
df_SC7 = pd.read_csv('https://raw.githubusercontent.com/thegetty/provenance-index-csv/master/sales_catalogs/sales_contents_7.csv',
low_memory=False)
df_SC8 = pd.read_csv('https://raw.githubusercontent.com/thegetty/provenance-index-csv/master/sales_catalogs/sales_contents_8.csv',
low_memory=False)
df_SC9 = pd.read_csv('https://raw.githubusercontent.com/thegetty/provenance-index-csv/master/sales_catalogs/sales_contents_9.csv',
low_memory=False)
df_SC10 = pd.read_csv('https://raw.githubusercontent.com/thegetty/provenance-index-csv/master/sales_catalogs/sales_contents_10.csv',
low_memory=False)
df_SC11 = pd.read_csv('https://raw.githubusercontent.com/thegetty/provenance-index-csv/master/sales_catalogs/sales_contents_11.csv',
low_memory=False)
df_SC12 = pd.read_csv('https://raw.githubusercontent.com/thegetty/provenance-index-csv/master/sales_catalogs/sales_contents_12.csv',
low_memory=False)
df_SC13 = pd.read_csv('https://raw.githubusercontent.com/thegetty/provenance-index-csv/master/sales_catalogs/sales_contents_13.csv',
low_memory=False)
Identifiants Wikidata
Pour le type d'œuvre et le genre, des identifiants wikidata sont utilisés :
Type d'œuvre :
- peinture : Q3305213
- sculpture : Q860861
- photographie : Q125191
- émail : Q79496108
- dessin : Q93184
- tapisserie : Q184296
- broderie : Q28966302
- meuble : Q14745
- fresque : Q134194
- objet d'arts décoratifs : Q631931
- gravure sur pierres précieuses : Q1501187
- médaille : Q131647
- mosaïque : Q133067
- miniature
- dentelle : Q231250
- marqueterie : Q1049923
- aquarelle : Q18761202
- estampe ou lithographie : Q11060274
- pastel : Q12043905
- livre : Q571
- horloge ou montre: Q376
- cartes à jouer : Q47883
- assiette de cuivre
- vêtement : Q11460
- carte : Q4006
- minéraux : Q7946
Genre :
- paysage : Q191163
- portrait : Q134307
- œuvre abstraite : Q128115
- nature morte : Q170571
- représentations d'animaux : Q16875712
- scènes historiques : Q742333
Fonctionnement
L'ArtBot utilise la bibliothèque pywikiapi pour lire et écrire dans les pages de wikipast.
Création/modification d'une page
L'ArtBot vérifie pour chaque œuvre si une page de type Titre de l'œuvre (Auteur) existe déjà. Si non, il crée la page en question et ajoute la description de l'œuvre et une entrée pour l'évènement de vente dans les sections correspondantes. Si oui, il copie le texte de la page, insère la nouvelle entrée au bon endroit et écrase l'ancienne version de la page.
Structure des pages
Titre de la page : Titre de l'œuvre (Artiste)
Description : [[type oeuvre]], [[genre]]
Syntaxe pour un évènement de vente :
- [[Année.Mois.Jour]] / [[lieu]]. [[Vente]] de [[titre œuvre]] de [[artiste]] (de nationalité [[nationalité]]) par [[vendeur]] à [[acheteur]] au prix de [[prix]] [[monnaie]] par la maison [[maison de ventes]]. [Source]
Lorsque certaines données sont absentes, elles sont ignorées et la proposition correspondante n'est pas écrite.
Insertion d'une entrée à une page déjà éxistante
Création de liens entre les pages
Afin de mieux référencer les pages crées par l'ArtBot, elles sont toutes liées entre-elles. Pour cela, une page regroupant l'intégralité des années de ventes est créée, et pour chaque année, une page pour chaque date regroupe l'ensemble des ventes effectuées ce jour-là.
Discussion des performances de l'ArtBot
nombre de page créées, problèmes rencontrés etc.