blackstone
Июнь 25, 2009 22:31:38
Здравствуйте!
Подскажите пожалуйста самый простой для начинающих способ парсинга содержимого, доступного только после регистрации на сайте.
Что касается обычного парсинга, то тут понятно - берется содержимое и обрабатывается, но что делать когда существует форма регистрации, там наверно надо как-то куку передавать и т.д.
Заранее спасибо!
sypper-pit
Июнь 25, 2009 22:42:43
mehanize для начала по пробуй
blackstone
Июнь 25, 2009 22:47:23
sypper-pit
mehanize для начала по пробуй
mechanize - это вроде на руби штука - я ее пробовал, но сейчас интересуюсь как такое же сделать на питоне.
bw
Июнь 26, 2009 10:50:02
Из коробки это всё делается (urllib2).
Я никакими “механизами”, когда возникала такая задача, не заморачивался, хотя пакет выглядит любопытным, надо бы найти время на ознакомление с ним.
..bw
sypper-pit
Июнь 26, 2009 11:36:14
urllib2 тоже хорошо работает , только у меня с ним получилось дольше разбираться