Уведомления

Группа в Telegram: @pythonsu

#1 Март 7, 2010 13:01:33

login
От:
Зарегистрирован: 2010-03-07
Сообщения: 2
Репутация: +  0  -
Профиль   Отправить e-mail  

И сновa пaрсинг стрaниц

Вообщем хочу выловить ссылку на скачку и капча-картинку. Все бы ничего но в исходнике ссылки с картинкой нет. Вместо нее есть iframe подгружающий неведомую хрень неведомо откуда. дайте пример как вытащить такую ссылку.

Собственно сама страница:
en.savefrom.net/http://www.zaycev.net/pages/6216/621634.shtml

И еще один вопрос. Что можно использовать для вылавливания текста между участками такого же текста (между тегами). Пробывал split но слишком геморно т.к бывает нужно вылавливать из тегов с кавычками.


И все это желательно без подключения специфических модулей(я на Python S60 в основном пишу и некоторых модулей с компа нет). :)



Офлайн

#2 Март 7, 2010 14:50:55

Ferroman
От:
Зарегистрирован: 2006-11-16
Сообщения: 2759
Репутация: +  1  -
Профиль   Отправить e-mail  

И сновa пaрсинг стрaниц

1. Тоже подгружать “ту хрень”. У фрейма есть урл.
2. Использовать регулярные выражения.

Офлайн

#3 Март 7, 2010 17:32:53

login
От:
Зарегистрирован: 2010-03-07
Сообщения: 2
Репутация: +  0  -
Профиль   Отправить e-mail  

И сновa пaрсинг стрaниц

Дак дело в том что Url'а нет. там есть переменная sfform если бы была я бы загрузил уже этот фрейм отдельно.



Офлайн

#4 Март 7, 2010 18:05:18

bazooka
От:
Зарегистрирован: 2009-04-12
Сообщения: 165
Репутация: +  0  -
Профиль   Отправить e-mail  

И сновa пaрсинг стрaниц

браузер же както узнает что качать, врядли через libastral



Офлайн

#5 Март 7, 2010 18:24:29

Ferroman
От:
Зарегистрирован: 2006-11-16
Сообщения: 2759
Репутация: +  1  -
Профиль   Отправить e-mail  

И сновa пaрсинг стрaниц

Джаваскипт переменная?
Ну так узнавайте как формируется значение для этой переменной.

Офлайн

Board footer

Модераторировать

Powered by DjangoBB

Lo-Fi Version