Форум сайта python.su
Ищем кто сможет взяться за работу по парсингу 4-5 сайтов, примерно таких как этот - раздел Music
требуется забирать все метаданные треков, ссылки на сэмплы. количество элементов для скачивания - порядок 100 тыс. штук.
Работа должна быть выполнена профессионально - запуск в параллельном режиме в разных потоках, режимы обновления и первичного сбора, обход возможной защиты от скачивания (TOR или прокси или какое то другое решение), максимальная устойчивость к изменениям верстки реципиентов.
Возможно в дальнейшем привлечение на постоянный мониторинг\доработки.
Отредактировано Sanny (Июнь 6, 2014 05:33:58)
Офлайн
Sanny
напишите мне в скайп.
Офлайн