Уведомления

Группа в Telegram: @pythonsu

#1 Май 10, 2012 19:13:47

reclosedev
От: Н.Новгород
Зарегистрирован: 2012-03-29
Сообщения: 870
Репутация: +  173  -
Профиль   Отправить e-mail  

Авторизация на сайте с https: для парсинга раздела для авторизированых пользователей

ruff3d
вот сайт
Да он и так гуглится поEDZFrontOffice Кстати гляньте, много желающих его сграбить.

ruff3d
дело в том что в реализации на php получить страничку удавалось… даже по ssl причем при передаче post запросов удавалось пройти авторизацию и вернуть авторизированую страницу
Данная страница у меня загружается нормально.

И кстати, делая вот так (except:) :
try:
    something...
except:
    print "ssl"
сами себе усложняете жизнь, так-как отлавливаются абсолютно все исключения, а ошибка необязательно связана с SSL.

Kane,
Kane
Может быть не совсем то, что Вам нужно, py3k:
По редиректам ходит, страничка сохранится в файл

Зато куки не сохраняются. С помощью стандартной библиотеки это можно сделать, но кода много.

Отредактировано reclosedev (Май 10, 2012 19:26:03)

Офлайн

#2 Май 10, 2012 19:37:45

ruff3d
Зарегистрирован: 2012-05-09
Сообщения: 30
Репутация: +  0  -
Профиль   Отправить e-mail  

Авторизация на сайте с https: для парсинга раздела для авторизированых пользователей

подскажите нормальную документацию по модулю requests т.к. c офф сайта не оч понятна, возможно есть какие-нить примеры … гугл не помог((

Офлайн

#3 Май 10, 2012 19:41:04

fata1ex
От:
Зарегистрирован: 2009-07-11
Сообщения: 732
Репутация: +  52  -
Профиль   Отправить e-mail  

Авторизация на сайте с https: для парсинга раздела для авторизированых пользователей

Что конкретно непонятно в официальной документации? Более нормальной вы не найдёте. Можете разве что почитать код.



Офлайн

#4 Май 11, 2012 00:56:06

ruff3d
Зарегистрирован: 2012-05-09
Сообщения: 30
Репутация: +  0  -
Профиль   Отправить e-mail  

Авторизация на сайте с https: для парсинга раздела для авторизированых пользователей

fata1ex
Что конкретно непонятно в официальной документации? Более нормальной вы не найдёте. Можете разве что почитать код.

предоставте плз код (в смысли - пример работы с модулем), где ясно и понятно используются куки))) ну а дальше думаю я разберусь))

Отредактировано ruff3d (Май 11, 2012 00:57:48)

Офлайн

#5 Май 11, 2012 09:25:57

reclosedev
От: Н.Новгород
Зарегистрирован: 2012-03-29
Сообщения: 870
Репутация: +  173  -
Профиль   Отправить e-mail  

Авторизация на сайте с https: для парсинга раздела для авторизированых пользователей

ruff3d
предоставте плз код (в смысли - пример работы с модулем), где ясно и понятно используются куки))) ну а дальше думаю я разберусь))
Да уже 2 раза показывали:
(с куками см. Session objects)
Т.е. создается экземпляр объекта Session, в котором можно записать хедеры, начальные куки и т.п., а потом используется. При запросах будут приниматься/передаваться куки и сохранятся в экземпляре Session (ну т.е. s например), что непонятного? В документации это показано.

Вот пример с заданием начальных кук и имитацией браузера.
headers = {"User-Agent": "Mozilla/5.0 (Windows NT 6.1) AppleWebKit/535.19 (KHTML, like Gecko) Chrome/18.0.1025.162 Safari/535.19"}
s = requests.session(headers=headers, cookies={'am_i_da_grabber?': 'true!'})
r = s.get('https://somesite.com/', verify=False)
print r.cookies
r = s.post('https://somesite.com/login', verify=False, data={'login': 'login', 'password': 'qwerty'})
print r.cookies, r.content
Рекомендую все-таки прочитать документацию целиком, включая API.

Офлайн

#6 Май 11, 2012 10:04:23

ruff3d
Зарегистрирован: 2012-05-09
Сообщения: 30
Репутация: +  0  -
Профиль   Отправить e-mail  

Авторизация на сайте с https: для парсинга раздела для авторизированых пользователей

reclosedev
ruff3d
предоставте плз код (в смысли - пример работы с модулем), где ясно и понятно используются куки))) ну а дальше думаю я разберусь))
Да уже 2 раза показывали:
(с куками см. Session objects)
Т.е. создается экземпляр объекта Session, в котором можно записать хедеры, начальные куки и т.п., а потом используется. При запросах будут приниматься/передаваться куки и сохранятся в экземпляре Session (ну т.е. s например), что непонятного? В документации это показано.

Вот пример с заданием начальных кук и имитацией браузера.
headers = {"User-Agent": "Mozilla/5.0 (Windows NT 6.1) AppleWebKit/535.19 (KHTML, like Gecko) Chrome/18.0.1025.162 Safari/535.19"}
s = requests.session(headers=headers, cookies={'am_i_da_grabber?': 'true!'})
r = s.get('https://somesite.com/', verify=False)
print r.cookies
r = s.post('https://somesite.com/login', verify=False, data={'login': 'login', 'password': 'qwerty'})
print r.cookies, r.content
Рекомендую все-таки прочитать документацию целиком, включая API.

спасибо!

Офлайн

Board footer

Модераторировать

Powered by DjangoBB

Lo-Fi Version