Уведомления

Группа в Telegram: @pythonsu

#1 Июнь 16, 2015 09:28:09

info
Зарегистрирован: 2015-02-28
Сообщения: 9
Репутация: +  0  -
Профиль   Отправить e-mail  

Быстрый мониторинг

Нужно примерно каждую секунду обновлять N страниц (get запрос), каждую из страниц через отдельный прокси (в случае ошибки брать другой прокси из некоторого пула), для каждой из страниц есть доп. информация, которая сравнивается с тем, что было получено со страницы, и, в случае, если найдено некоторое совпадение, отправляется дополнительный post-запрос с полученными данными со страницы.

На чем и как это грамотнее реализовать? Grab/Scrapy/Tornado/Asyncio-Aiohttp?

Офлайн

#2 Июнь 16, 2015 16:08:35

werter
Зарегистрирован: 2014-09-02
Сообщения: 19
Репутация: +  1  -
Профиль   Отправить e-mail  

Быстрый мониторинг

Решал похожую задачу, в Grab присутствует весь нужный функционал. Особенно удобно работать с прокси.
С другими фреймворками пока еще не работал, сказать ничего не могу

Офлайн

#3 Июль 12, 2015 22:07:39

Budulianin
От:
Зарегистрирован: 2011-10-18
Сообщения: 1218
Репутация: +  33  -
Профиль   Отправить e-mail  

Быстрый мониторинг

info
На чем и как это грамотнее реализовать? Grab/Scrapy/Tornado/Asyncio-Aiohttp?

На чём тебе удобнее, нужного результата можно достигнуть на всём перечисленном.
Grab/Scrapy более высокоуровневые либы, на них можно быстрее и удобнее решить подобную задачу.

Но очевидно, что Scrapy круче Grab.



Отредактировано Budulianin (Июль 12, 2015 22:08:08)

Офлайн

Board footer

Модераторировать

Powered by DjangoBB

Lo-Fi Version