Уведомления

Группа в Telegram: @pythonsu

#1 Апрель 15, 2011 18:10:08

sonniy
От:
Зарегистрирован: 2009-12-18
Сообщения: 84
Репутация: +  0  -
Профиль   Отправить e-mail  

проблемные теги при XML парсинге

использовал BeautifulSoup и все как бы прекрасно :)

но вот наткнулся на тег <work-time>, так как он пишется через минус возникает проблема с его распарсировкой …
a.address.contents - работает
a.work-time.contents - не отрабатывает, так как не видит полного названия тега

может как то регэкспами ? или есть решение попроще ?



Офлайн

#2 Апрель 16, 2011 16:58:06

Psixo
От:
Зарегистрирован: 2007-09-12
Сообщения: 113
Репутация: +  0  -
Профиль   Отправить e-mail  

проблемные теги при XML парсинге

html5lib + lxml

либо регулярки. суп - не камильфо



Офлайн

#3 Апрель 17, 2011 21:18:12

zheromo
От:
Зарегистрирован: 2010-10-02
Сообщения: 356
Репутация: +  2  -
Профиль   Отправить e-mail  

проблемные теги при XML парсинге

Psixo
либо регулярки
регулярки тоже не есть хорошо для XML



Офлайн

Board footer

Модераторировать

Powered by DjangoBB

Lo-Fi Version