Уведомления

Группа в Telegram: @pythonsu

#1 Сен. 30, 2012 20:03:01

mironich
От:
Зарегистрирован: 2011-05-23
Сообщения: 118
Репутация: +  2  -
Профиль   Отправить e-mail  

Парсинг HTML HTMLparser

Есть допустим такой HTML:

<div id="test"><div>jjj</div></div
Можно ли как-то то что внутри div-a с id test, тоесть полностью текст <div>jjj</div>?



Офлайн

#2 Сен. 30, 2012 20:26:59

odnochlen
Зарегистрирован: 2012-06-28
Сообщения: 794
Репутация: +  14  -
Профиль   Отправить e-mail  

Парсинг HTML HTMLparser

Выбрать div, а потом сделать tostring?

При этом вывод может не совпадать с оригинальным html.

Офлайн

#3 Сен. 30, 2012 20:32:13

mironich
От:
Зарегистрирован: 2011-05-23
Сообщения: 118
Репутация: +  2  -
Профиль   Отправить e-mail  

Парсинг HTML HTMLparser

odnochlen
Можно пример?
И как его вообще выбрать через что, какой модуль?
Вопрос решился с помощью: lxml
	
print doc.cssselect('.test')[0].text_content().encode('utf-8')
Он правда только текст возвращает.



Отредактировано mironich (Сен. 30, 2012 20:43:53)

Офлайн

#4 Сен. 30, 2012 21:37:32

odnochlen
Зарегистрирован: 2012-06-28
Сообщения: 794
Репутация: +  14  -
Профиль   Отправить e-mail  

Парсинг HTML HTMLparser

lxml.etree.tostring(узел)

Офлайн

Board footer

Модераторировать

Powered by DjangoBB

Lo-Fi Version