Форум сайта python.su
Здравствуйте!
Подскажите пожалуйста самый простой для начинающих способ парсинга содержимого, доступного только после регистрации на сайте.
Что касается обычного парсинга, то тут понятно - берется содержимое и обрабатывается, но что делать когда существует форма регистрации, там наверно надо как-то куку передавать и т.д.
Заранее спасибо!
Офлайн
mehanize для начала по пробуй
Офлайн
sypper-pitmechanize - это вроде на руби штука - я ее пробовал, но сейчас интересуюсь как такое же сделать на питоне.
mehanize для начала по пробуй
Офлайн
он есть на питоне http://wwwsearch.sourceforge.net/mechanize/
Отредактировано (Июнь 25, 2009 22:50:47)
Офлайн
sypper-pitСпасибо!
он есть на питоне http://wwwsearch.sourceforge.net/mechanize/
Офлайн
Из коробки это всё делается (urllib2).
Я никакими “механизами”, когда возникала такая задача, не заморачивался, хотя пакет выглядит любопытным, надо бы найти время на ознакомление с ним.
..bw
Офлайн
urllib2 тоже хорошо работает , только у меня с ним получилось дольше разбираться
Офлайн
тут глянуть можно:
http://python.su/forum/viewtopic.php?id=5427
Офлайн
Мне для форм удобнее twill
Офлайн