Форум сайта python.su
0
Собираю ссылки залинкованные с картинок:
urls = lxml.html.fromstring(s) urls = urls.xpath('//img/parent::a[not(re:match(@href, "(ban)")) ]/@href', namespaces={"re": "http://exslt.org/regular-expressions"})
<a href="/url.html" title="title" target="_blank"> <span class="class"> <img src="kartinka.jpg" alt="alt"/>
<a href="/url.html" title="title" target="_blank"> <img src="kartinka.jpg" alt="alt"/>
Офлайн
7
Попробуйте заместо оси parent использовать ancestor:
//img/ancestor::a[not(re:match(@href, "(ban)"))][1]/@href
Отредактировано john123 (Июль 7, 2014 15:57:51)
Офлайн