Уведомления

Группа в Telegram: @pythonsu

#1 Фев. 25, 2016 17:39:12

Notan1310
Зарегистрирован: 2014-09-14
Сообщения: 98
Репутация: +  0  -
Профиль   Отправить e-mail  

При парсинге таблицы не видит значения ячеек [requests, lxml]

Здравствуйте. Пытаюсь получить значения ссылок на праздники с этого сайта Использую lxml, requests

[code python]
def get_holidays(country_item):
session = requests.Session()
getPage = session.get(country_item['href'])
pageHtml = html.fromstring(getPage.text)
getAllBlock = pageHtml.cssselect(".holidayweek>table>tbody>tr>td>ul>li>a")
lists = []
for item in getAllBlock:
href = 'http://www.calend.ru/' + item.attrib['href']
title = item.text
country = country_item['coutry']
[/code]
Этот строка кода всегда возвращает пустой список

getAllBlock = pageHtml.cssselect(".holidayweek>table>tbody>tr>td>ul>li>a")

Выборка селекторов таким css "a" получает слишком много ссылок. Также использовал xpath, но результат не возвращает хотя в браузере все подчеркивает. Почему не возвращает селекторы при выборке, хотя точно должен возвращать ? Помогите пожалуйста решить данную проблему.

Спасибо!

Офлайн

Board footer

Модераторировать

Powered by DjangoBB

Lo-Fi Version