Надо пропарсить блог. Тема, дата читаеться без проблем, а тело в <p> абзацах + форматирование и прочии тэги.

parser = etree.HTMLParser()
doc = etree.parse(StringIO(html), parser)
body_xpath = "//div/p/text()“
body = doc.xpath(body_xpath)
for p in body:
print p.encode(”utf-8")

Как прочитать все вложенные теги в пути body_xpath ?