Форум сайта python.su
Мне нужно спарсить какое-то количество страниц, но дело в том что я заранее не знаю сколько этих страниц будет. Когда пора остановиться определяется содержимым страницы в ответе от сервера. То есть нужно парсить пока содержимое != ‘stop’. В этом случае синхронный код имеет такой вид:
page = 1 while r.text != 'stop': r = request.get(url) # действия с ответом page += 1 print 'stop'
parsers = [gevent.spawn(parser, i) for i in range(1, 50)] gevent.join_all(parsers)
Отредактировано pavi (Янв. 11, 2015 17:33:08)
Офлайн
Там где действия с ответом ищите еще и вот такую ссылку (как на картинке), и спокойно переходите на след страницу.
Офлайн