Уведомления

Группа в Telegram: @pythonsu

#1 Фев. 13, 2009 21:18:51

bobry
От:
Зарегистрирован: 2008-08-03
Сообщения: 54
Репутация: +  0  -
Профиль   Отправить e-mail  

lxml, парсинг html

Товарисчи, вопрос в следующем. Имеется следующая конструкция (lxml.etree):

<p>
<a>link11</a>
<a>link12</a>
<a>link13</a>
<br />
text
<br />
<a>link21</a>
<a>link22</a>
<a>link23</a>
</p>
Есть ли какой нибудь способ выдернуть из нее text c помощью lxml?
По идее с этим должен справляться атрибут tail у тега <br />, но он почему то выводит пустую строку.



Отредактировано (Фев. 13, 2009 21:19:30)

Офлайн

#2 Фев. 13, 2009 22:30:33

bobry
От:
Зарегистрирован: 2008-08-03
Сообщения: 54
Репутация: +  0  -
Профиль   Отправить e-mail  

lxml, парсинг html

хмм..) спасибо, сейчас попробую
видимо html5lib не предоставляет такой метод для елемента



Офлайн

Board footer

Модераторировать

Powered by DjangoBB

Lo-Fi Version