Форум сайта python.su
использовал BeautifulSoup и все как бы прекрасно :)
но вот наткнулся на тег <work-time>, так как он пишется через минус возникает проблема с его распарсировкой …
a.address.contents - работает
a.work-time.contents - не отрабатывает, так как не видит полного названия тега
может как то регэкспами ? или есть решение попроще ?
Офлайн
html5lib + lxml
либо регулярки. суп - не камильфо
Офлайн
Psixoрегулярки тоже не есть хорошо для XML
либо регулярки
Офлайн