Найти - Пользователи
Полная версия: lxml, парсинг html
Начало » Python для новичков » lxml, парсинг html
1
bobry
Товарисчи, вопрос в следующем. Имеется следующая конструкция (lxml.etree):
<p>
<a>link11</a>
<a>link12</a>
<a>link13</a>
<br />
text
<br />
<a>link21</a>
<a>link22</a>
<a>link23</a>
</p>
Есть ли какой нибудь способ выдернуть из нее text c помощью lxml?
По идее с этим должен справляться атрибут tail у тега <br />, но он почему то выводит пустую строку.
bobry
хмм..) спасибо, сейчас попробую
видимо html5lib не предоставляет такой метод для елемента
This is a "lo-fi" version of our main content. To view the full version with more information, formatting and images, please click here.
Powered by DjangoBB