Уведомления

Группа в Telegram: @pythonsu

#1 Дек. 13, 2013 17:13:19

gelius
Зарегистрирован: 2013-03-18
Сообщения: 132
Репутация: +  0  -
Профиль   Отправить e-mail  

вопрос по xpath

Собираю ссылки залинкованные с картинок вот так:

urls = urls.xpath('//img/parent::a[not(re:match(@href, "(slovo)")) ]/@href', namespaces={"re": "http://exslt.org/regular-expressions"})
Споткнулся на таком html:
<li>
<a href="/url/link.html" title="title"><span class="image"><img src="http://domain.com/1.jpg" alt="alt"></span><span class="title">title</span></a>
</li>
Видимо благодаря “<span class=”image“>”.
Какие варианты сделать наиболее универсально?

Офлайн

#2 Дек. 13, 2013 22:35:25

Master_Sergius
Зарегистрирован: 2013-09-12
Сообщения: 271
Репутация: +  7  -
Профиль   Отправить e-mail  

вопрос по xpath

мб регулярками?



———————————————————————————
Мой блог о семействе *nix: http://nixtravelling.blogspot.com/

Офлайн

#3 Дек. 14, 2013 12:48:40

lorien
От:
Зарегистрирован: 2006-08-20
Сообщения: 755
Репутация: +  37  -
Профиль  

вопрос по xpath

Попробуйте так:

a[img or span/img]//img[...]

Отредактировано lorien (Дек. 14, 2013 12:49:39)

Офлайн

Board footer

Модераторировать

Powered by DjangoBB

Lo-Fi Version