Ctrl →

gelius · Июль 29, 2014 01:21:50

Вот пытаюсь вытянуть скрипт гуглокапчи:

<script type="text/javascript" src="https://www.google.com/recaptcha/api/challenge?k=6Ld5BuASAAAAAMAvzYwsP0HwhJmAoXTF-QfNPXEB"></script>

Так:

cap_url = url.xpath('//script[contains(@src, "recaptcha")]/@script')

Где ошибка?

py.user.next · Июль 29, 2014 04:30:07

gelius
/@script

Заменить script на src.

Отредактировано py.user.next (Июль 29, 2014 04:35:54)

lorien · Июль 30, 2014 11:24:26

@script - означает взять содержимое аттрибута “script” - думаю, это не то, что вам нужно.

gelius · Июль 31, 2014 00:11:07

Заменил:

cap_url = url.xpath('//script[contains(@src, "recaptcha")]/@src')
print cap_url

Отдает:

[]

den4ik · Июль 31, 2014 01:32:54

gelius, нужно проверить исходник страницы. Возможно (99%) на странице динамическая генерация ссылки на капчу, поэтому и не находит.

Отредактировано den4ik (Июль 31, 2014 01:33:59)

gelius · Июль 31, 2014 02:24:19

На самом деле ошибка была глупая, сделана по невнимательности.
Ссылку искал на другой странице.

Отредактировано gelius (Июль 31, 2014 02:34:49)

paraman · Авг. 7, 2014 10:36:53

Лучше используй регулярные выражения, чем xpath.

den4ik · Авг. 23, 2014 22:55:44

paraman
Лучше используй регулярные выражения, чем xpath.

Какая же регулярка будет для следующего кода?

<div class='someclass1'>
    <div class='someclass2'>
        <div class='someclass3'>
        ...
            <div class='someclassN'>
                Foo bar baz
            </div>
        ...
       </div>
    </div>
</div>

paraman · Авг. 25, 2014 21:02:10

den4ik

<div class='someclassN'>\s(.*?)\n.*?</div>

Отредактировано paraman (Авг. 25, 2014 21:02:35)

den4ik · Авг. 25, 2014 21:10:16

paraman

нуну, а как с этим будут работать?

<div class='someclass1'>
    <div class='someclass2'>
        <div class='someclass3'>
        ...
            <div class='someclassN'>Foo bar baz
            </div>
        ...
       </div>
    </div>
</div>

Отредактировано den4ik (Авг. 25, 2014 21:10:57)

Python-сообщество

Уведомления

#1 Июль 29, 2014 01:21:50

По xpath вопрос.

#2 Июль 29, 2014 04:30:07

По xpath вопрос.

#3 Июль 30, 2014 11:24:26

По xpath вопрос.

#4 Июль 31, 2014 00:11:07

По xpath вопрос.

#5 Июль 31, 2014 01:32:54

По xpath вопрос.

#6 Июль 31, 2014 02:24:19

По xpath вопрос.

#7 Авг. 7, 2014 10:36:53

По xpath вопрос.

#8 Авг. 23, 2014 22:55:44

По xpath вопрос.

#9 Авг. 25, 2014 21:02:10

По xpath вопрос.

#10 Авг. 25, 2014 21:10:16

По xpath вопрос.

Board footer