Форум сайта python.su
Надо пропарсить блог. Тема, дата читаеться без проблем, а тело в <p> абзацах + форматирование и прочии тэги.
parser = etree.HTMLParser()
doc = etree.parse(StringIO(html), parser)
body_xpath = "//div/p/text()“
body = doc.xpath(body_xpath)
for p in body:
print p.encode(”utf-8")
Как прочитать все вложенные теги в пути body_xpath ?
Офлайн