« SliderBot » : différence entre les versions
Ligne 81 : | Ligne 81 : | ||
== Extraction de données == | == Extraction de données == | ||
BeautifulSoup est une | BeautifulSoup est une bibliothèque de parsage (analyse syntaxique) en code Python pour le langage HTML/XML. Dans ce cas elle est utilisé pour extraire des données de Wikipast: villes et personnes mentionnées, dans les pages existantes concernant les années. | ||
Geopy | |||
=== maincode.py === | === maincode.py === |
Version du 7 mai 2018 à 14:21
Objectifs
- Crée une base de données en associant [Personne, Date, Lieu] via un scrapping de page.
- Crée un ensemble de cartes affichant les positions de toutes les personnes recensées pour chaque date (discretisation par année ?).
- Création d’un slider dynamique, où l’annee souhaitée est choisie, et affiche la carte correspondante (JavaScript ou HTML)
Description
Le bot extrait les données nécessaires de Wikipast, en parcourant chaque page existante d'années à travers le temps. Les informations retenues sont d'abord les mentions de villes et deuxièmement les mentions de personnes respectives pour chaque année. Ce travail est fait par un code python, qui va sauvegarder l'information dans un tableaux. Le tableaux va être utilisé pour afficher les villes qui ont été mentionné et les personnes respectives sur une carte, pour une année spécifique, en utilisant un code en JavaScript. Ceci va être appliquée pour chaque année existante dans la base de données de Wikipast pour créer une carte interactive dont on peut naviguer à travers le temps et l'espace et visualizer la distribution de personnes dans le globe.
Server
Node.js est une plateforme logicielle libre en JavaScript orientée vers les applications réseau qui doivent pouvoir monter en charge. Parmi les modules natifs de Node.js, on retrouve HTTP qui permet le développement de serveurs HTTP.
Username | Password |
---|---|
SliderBot | SliderBot123 |
server.js
Le serveur est initialisé a l'aide du module 'express' de Node.js, pour générer le cadre d'une application. La méthode app.post() indique au serveur qu'il est en attente d'une demande HTTP. La méthode app.listen() définie le chemin sur lequel le serveur est prêt à l'écoute.
const express = require('express'); const app = express(); app.post('/', function(req, res){ console.log('Post request received: '); res.writeHead(200, { 'Content-Type': 'text/plain' }); req.on('data', function (chunk) { var buffer = JSON.stringify(chunk); var data = getData(buffer); console.log('GOT DATA : '+data); }); res.end(JSON.stringify({"data":0})); }); app.listen(3000, () => { console.log('Server listening on port 3000!'); });
communication.js
JSON (JavaScript Object Notation) est un format de données textuelles dérivé de la notation des objets du langage JavaScript. La fonction sendReq() envoie une demande au server pour recevoir l'information sous ce format.
var XMLHttpRequest = require("xmlhttprequest").XMLHttpRequest; var IP_ADDRESSE = "128.179.178.60"; var PORT = "3000"; function sendReq(){ var request = new XMLHttpRequest(); request.open('POST', 'http://'+IP_ADDRESSE+':'+PORT, true); request.setRequestHeader("Content-type", "application/json"); request.onload = () => { if (request.status >= 200 && request.status < 400) { const res = JSON.parse(request.responseText); console.log(res); } else { console.log("Error on server side.") } }; request.onerror = () => { console.log("Error on communication."); }; request.send(JSON.stringify({"year":1996})); } sendReq();
Extraction de données
BeautifulSoup est une bibliothèque de parsage (analyse syntaxique) en code Python pour le langage HTML/XML. Dans ce cas elle est utilisé pour extraire des données de Wikipast: villes et personnes mentionnées, dans les pages existantes concernant les années. Geopy
maincode.py
Placement sur la carte
index.html
Groupe
Nom | Prénom |
---|---|
Guhennec | Paul |
Wildi | Maël |
Etienne | Bonvin |
Mathilde | Raynal |
Stefano | Politi |