Найти - Пользователи
Полная версия: Ограничение времени запросов в grab.
Начало » Data Mining » Ограничение времени запросов в grab.
1
Dr.Livsi
Доброго времени суток!
Столкнулся со следующей ситуацией. Есть спайдер, который проходит по некой главной странице сайта и берет оттуда ссылки. По каждой ссылке создает таску. И отправляет на выполнение.
Проблема в том, что если запрос к сайту идет чаще, чем раз в 3-5 секунд - таска завершается с ошибкой (403 - у хостера сайта стоит антиддос защита).
Поэтому необходимо задать определенный интервал, с которым спайдер будет запускать на выполнение таски. И если одна таска отработав 0.1 сек выдает ошибку 403 - необходимо что бы следующая таска запускалась не сразу, а не ранее, чем через N секунд.
Собственно, может плохо смотрел в документации, но такого нигде не нашел. Вопрос: как можно сие реализовать?
Singularity
Dr.Livsi
yield Task(..., delay=10)
В рассылке можно найти ответ
Dr.Livsi
спасибо, помогло.
This is a "lo-fi" version of our main content. To view the full version with more information, formatting and images, please click here.
Powered by DjangoBB