Найти - Пользователи
Полная версия: Помогите с вложенными div'ами
Начало » Data Mining » Помогите с вложенными div'ами
1
ajib6ept
<div>1
	<div id='idname'>2
		<div class='classname'>33</div>
	2</div>
	1
</div>

Подскажите, как из вложенных div получить список вида

['11', '22', '33'] or ['<div>11</div>', '<div id='idname'>22</div>', '<div class='classname'>33</div>']

Уровень вложенности может быть больше
py.user.next
>>> import lxml.html
>>> 
>>> text = """
... <div>1
...     <div id='idname'>2
...             <div class='classname'>33</div>
...     2</div>
...     1
... </div>
... """
>>> 
>>> doc = lxml.html.fromstring(text)
>>> 
>>> out = [''.join(map(str.strip, i.xpath(r'text()')))
...        for i in doc.xpath(r'//div')]
>>> out
['11', '22', '33']
>>>
This is a "lo-fi" version of our main content. To view the full version with more information, formatting and images, please click here.
Powered by DjangoBB