« Retrievecontentsbot » : différence entre les versions
Aller à la navigation
Aller à la recherche
(Page créée avec « Extrait le contenu d'une page wiki en wikicode == code == <nowiki> # -*- coding: utf-8 -*- import requests from bs4 import BeautifulSoup baseurl='http://wikipast.epfl... ») |
(→code) |
||
| Ligne 15 : | Ligne 15 : | ||
for name in names: | for name in names: | ||
result=requests.post(baseurl+'api.php?action=query&titles='+name+'&export&exportnowrap') | result=requests.post(baseurl+'api.php?action=query&titles='+name+'&export&exportnowrap') | ||
soup=BeautifulSoup(result.text) | soup=BeautifulSoup(result.text, "lxml") | ||
#soup=BeautifulSoup(result.text) | |||
code='' | code='' | ||
for primitive in soup.findAll("text"): | for primitive in soup.findAll("text"): | ||
code+=primitive.string | code+=primitive.string | ||
print(code) | print(code) | ||
</nowiki> | </nowiki> | ||
Dernière version du 19 mars 2017 à 09:26
Extrait le contenu d'une page wiki en wikicode
code
# -*- coding: utf-8 -*-
import requests
from bs4 import BeautifulSoup
baseurl='http://wikipast.epfl.ch/wikipast/'
names=['Henri_Dunant']
for name in names:
result=requests.post(baseurl+'api.php?action=query&titles='+name+'&export&exportnowrap')
soup=BeautifulSoup(result.text, "lxml")
#soup=BeautifulSoup(result.text)
code=''
for primitive in soup.findAll("text"):
code+=primitive.string
print(code)