DjangoBB LoFi version

Начало » Python для новичков » вопрос по xpath

gelius

Дек. 13, 2013 17:13:19

Собираю ссылки залинкованные с картинок вот так:

urls = urls.xpath('//img/parent::a[not(re:match(@href, "(slovo)")) ]/@href', namespaces={"re": "http://exslt.org/regular-expressions"})

Споткнулся на таком html:

<li>
<a href="/url/link.html" title="title"><span class="image"><img src="http://domain.com/1.jpg" alt="alt"></span><span class="title">title</span></a>
</li>

Видимо благодаря “<span class=”image“>”.
Какие варианты сделать наиболее универсально?

Master_Sergius

Дек. 13, 2013 22:35:25

мб регулярками?

lorien

Дек. 14, 2013 12:48:40

Попробуйте так:

a[img or span/img]//img[...]