Форум сайта python.su
0
Пробовал решать данную задачу на php cURL , авторизация проходила, но перемещаться по страничкам не могла.
Возможно есть встроенные модули для работы с cookie или еще чего? про pyCurl слышал, может есть по лучше решения, т.к. удобно было бы с модулем xmldom.
спасибо
Офлайн
25
pyCurl - он чтобы получить данные а xmldom - чтобы распарсить, вам что нужно-то?
Офлайн
0
да дело в том что под py 2.7 или 3.2 pycurl не станет. Какой в данном случаи выход?
Офлайн
25
ruff3dPython 2.7.1+ (r271:86832, Apr 11 2011, 18:05:24)
да дело в том что под py 2.7 или 3.2 pycurl не станет. Какой в данном случаи выход?
Офлайн
173
http://python-requests.org/ - всех больше нравится (с куками см. Session objects) . Вместо xmldom удобнее lxml.
Офлайн
0
reclosedev
http://python-requests.org/ - всех больше нравится (с куками см. Session objects) . Вместо xmldom удобнее lxml.
Офлайн
0
попробовал… но проблема осталась. Не возможно пройти авторизацию, вернее даже получить страницу по ssl.
пробовал так:
import requests try: r = requests.get('https://источник.ua/EDZFrontOffice/', verify=False) print r.content except: print 'SSl'
Офлайн
173
ruff3dКакая проблема то, что конкретно не работает, ошибки какие? Может сайт проверяет юзер-агента и блокирует если браузером не представиться, или он POST запрос для авторизации требует. И в коде вы используете не сессию, так куки не сохранятся.
попробовал… но проблема осталась. Не возможно пройти авторизацию, вернее даже получить страницу по ssl.
headers = {"User-Agent": "Mozilla/5.0 (Windows NT 6.1) AppleWebKit/535.19 (KHTML, like Gecko) Chrome/18.0.1025.162 Safari/535.19",} s = requests.session(headers=headers) r = s.get('https://источник.ua/EDZFrontOffice/', verify=False) print r.content
Офлайн
0
reclosedevruff3dКакая проблема то, что конкретно не работает, ошибки какие? Может сайт проверяет юзер-агента и блокирует если браузером не представиться, или он POST запрос для авторизации требует. И в коде вы используете не сессию, так куки не сохранятся.
попробовал… но проблема осталась. Не возможно пройти авторизацию, вернее даже получить страницу по ssl.
Может как-то так:headers = {"User-Agent": "Mozilla/5.0 (Windows NT 6.1) AppleWebKit/535.19 (KHTML, like Gecko) Chrome/18.0.1025.162 Safari/535.19",} s = requests.session(headers=headers) r = s.get('https://источник.ua/EDZFrontOffice/', verify=False) print r.content
Офлайн
0
Может быть не совсем то, что Вам нужно, py3k:
import urllib.request opener = urllib.request.build_opener() site = opener.open('https://tender.me.gov.ua/') data = site.read() f = open('site.html', 'wb') f.write(data) f.close()
Отредактировано Kane (Май 10, 2012 19:12:39)
Офлайн