Форум сайта python.su
0
Есть код:
from lxml import html def get_urls_from_page(url): result = [] path = './/*[@class = "span10"]/div[1]/text()' for page in range(10): doc = html.parse(url + 'page') values = doc.xpath(path) for i in values: result.append(i) return result headers = get_urls_from_page('http://msl.ua/ru/megalot/archive/page/') for h in headers: print(h)
Офлайн
0
doc = html.parse(url + 'page')
doc = html.parse(url + str(page))
Офлайн
0
from lxml import html def get_urls_from_page(url): result = [] path = './/*[@class = "span10"]/div[1]/text()' for page in range(10): doc = html.parse(url + str(page)) values = doc.xpath(path) for i in values: result.append(i) return result headers = get_urls_from_page('http://msl.ua/ru/megalot/archive/page/') for h in headers: print(h)
Отредактировано mgnmaster (Сен. 5, 2015 21:04:12)
Офлайн
0
Спасибо.
Офлайн