Найти - Пользователи
Полная версия: Как пропарсить сайт, на котором нужно регистрироваться?
Начало » Python для новичков » Как пропарсить сайт, на котором нужно регистрироваться?
1
blackstone
Здравствуйте!

Подскажите пожалуйста самый простой для начинающих способ парсинга содержимого, доступного только после регистрации на сайте.

Что касается обычного парсинга, то тут понятно - берется содержимое и обрабатывается, но что делать когда существует форма регистрации, там наверно надо как-то куку передавать и т.д.


Заранее спасибо!
sypper-pit
mehanize для начала по пробуй
blackstone
sypper-pit
mehanize для начала по пробуй
mechanize - это вроде на руби штука - я ее пробовал, но сейчас интересуюсь как такое же сделать на питоне.
sypper-pit
он есть на питоне http://wwwsearch.sourceforge.net/mechanize/
blackstone
sypper-pit
он есть на питоне http://wwwsearch.sourceforge.net/mechanize/
Спасибо!
bw
Из коробки это всё делается (urllib2).
Я никакими “механизами”, когда возникала такая задача, не заморачивался, хотя пакет выглядит любопытным, надо бы найти время на ознакомление с ним.

..bw
sypper-pit
urllib2 тоже хорошо работает , только у меня с ним получилось дольше разбираться
PoshtarBoba
тут глянуть можно:
http://python.su/forum/viewtopic.php?id=5427
AlexKiriukha
Мне для форм удобнее twill
This is a "lo-fi" version of our main content. To view the full version with more information, formatting and images, please click here.
Powered by DjangoBB