Прошу вашей помощи в таком вопросике.
Имеется файлик в хтмл, в нем находится кусок отформатированного текста.
Необходимо выдрать из него текстовые данные.
Но вот беда - BeautifulSoup при выдирании не реагирует на <br> тэг.
В результате из
“Привет</br>Вася”
Получается “ПриветВася” хотя должно бы
“Привет
Вася”
paga = open("page.html").read().decode("UTF-8")
soup = BeautifulSoup.BeautifulSoup(paga)
for data in soup.findAll("div", "text_content"):
print data.getText()
Но вот с переносами строк то выходит месиво…
Подскажите как это можно правильно и элегантно реализовать.