Найти - Пользователи
Полная версия: Парсинг HTML HTMLparser
Начало » Python для новичков » Парсинг HTML HTMLparser
1
mironich
Есть допустим такой HTML:
<div id="test"><div>jjj</div></div
Можно ли как-то то что внутри div-a с id test, тоесть полностью текст <div>jjj</div>?
odnochlen
Выбрать div, а потом сделать tostring?

При этом вывод может не совпадать с оригинальным html.
mironich
odnochlen
Можно пример?
И как его вообще выбрать через что, какой модуль?
Вопрос решился с помощью: lxml
	
print doc.cssselect('.test')[0].text_content().encode('utf-8')
Он правда только текст возвращает.
odnochlen
lxml.etree.tostring(узел)
This is a "lo-fi" version of our main content. To view the full version with more information, formatting and images, please click here.
Powered by DjangoBB