« Retrievecontentsbot » : différence entre les versions

De Wikipast
Aller à la navigation Aller à la recherche
(Page créée avec « Extrait le contenu d'une page wiki en wikicode == code == <nowiki> # -*- coding: utf-8 -*- import requests from bs4 import BeautifulSoup baseurl='http://wikipast.epfl... »)
 
 
Ligne 15 : Ligne 15 :
for name in names:
for name in names:
     result=requests.post(baseurl+'api.php?action=query&titles='+name+'&export&exportnowrap')
     result=requests.post(baseurl+'api.php?action=query&titles='+name+'&export&exportnowrap')
     soup=BeautifulSoup(result.text)
     soup=BeautifulSoup(result.text, "lxml")
    #soup=BeautifulSoup(result.text)
     code=''
     code=''
     for primitive in soup.findAll("text"):
     for primitive in soup.findAll("text"):
         code+=primitive.string
         code+=primitive.string
     print(code)
     print(code)
</nowiki>
</nowiki>

Dernière version du 19 mars 2017 à 09:26

Extrait le contenu d'une page wiki en wikicode

code

# -*- coding: utf-8 -*-

import requests
from bs4 import BeautifulSoup

baseurl='http://wikipast.epfl.ch/wikipast/'

names=['Henri_Dunant']

for name in names:
    result=requests.post(baseurl+'api.php?action=query&titles='+name+'&export&exportnowrap')
    soup=BeautifulSoup(result.text, "lxml")
    #soup=BeautifulSoup(result.text)
    code=''
    for primitive in soup.findAll("text"):
        code+=primitive.string
    print(code)