« Retrievecontentsbot » : différence entre les versions
Aller à la navigation
Aller à la recherche
(Page créée avec « Extrait le contenu d'une page wiki en wikicode == code == <nowiki> # -*- coding: utf-8 -*- import requests from bs4 import BeautifulSoup baseurl='http://wikipast.epfl... ») |
(→code) |
||
Ligne 15 : | Ligne 15 : | ||
for name in names: | for name in names: | ||
result=requests.post(baseurl+'api.php?action=query&titles='+name+'&export&exportnowrap') | result=requests.post(baseurl+'api.php?action=query&titles='+name+'&export&exportnowrap') | ||
soup=BeautifulSoup(result.text) | soup=BeautifulSoup(result.text, "lxml") | ||
#soup=BeautifulSoup(result.text) | |||
code='' | code='' | ||
for primitive in soup.findAll("text"): | for primitive in soup.findAll("text"): | ||
code+=primitive.string | code+=primitive.string | ||
print(code) | print(code) | ||
</nowiki> | </nowiki> |
Dernière version du 19 mars 2017 à 09:26
Extrait le contenu d'une page wiki en wikicode
code
# -*- coding: utf-8 -*- import requests from bs4 import BeautifulSoup baseurl='http://wikipast.epfl.ch/wikipast/' names=['Henri_Dunant'] for name in names: result=requests.post(baseurl+'api.php?action=query&titles='+name+'&export&exportnowrap') soup=BeautifulSoup(result.text, "lxml") #soup=BeautifulSoup(result.text) code='' for primitive in soup.findAll("text"): code+=primitive.string print(code)