Уведомления

Группа в Telegram: @pythonsu

#1 Авг. 10, 2009 00:10:00

Ockonal
От:
Зарегистрирован: 2009-03-05
Сообщения: 85
Репутация: +  0  -
Профиль   Отправить e-mail  

Regexp

Есть html-код web-страницы, его я получил. Нужно вытянуть значение из тегов:
<div class=“deg”>%значение%</div>

regexpHandler = re.compile('(<div class="deg">(?P<div class="deg">.*?)</div>)')
result = regexpHandler.search( pageData )
Пробовал что-то такое… Неудачно. Что я делаю не так?



Офлайн

#2 Авг. 10, 2009 01:43:05

pasaranax
От:
Зарегистрирован: 2009-06-13
Сообщения: 574
Репутация: +  0  -
Профиль   Отправить e-mail  

Regexp

re.findall('(?<=<div class="deg">).*?(?=</div>)', page)
где page это содержимое страницы
но если внутри этого div будет другой div, то получится косяк



Офлайн

#3 Авг. 10, 2009 11:33:41

Ockonal
От:
Зарегистрирован: 2009-03-05
Сообщения: 85
Репутация: +  0  -
Профиль   Отправить e-mail  

Regexp

regexHandler = re.compile(r'<div class="deg">([^<]*)</div>')
Спасибо всем, сделал так.



Офлайн

Board footer

Модераторировать

Powered by DjangoBB

Lo-Fi Version