juche-songun
чем можно замерить эффективность?
Считать количество обработанных данных/запросов в секунду (в коде); смотреть на загруженность канала, процессора, памяти (в системе).
По опыту: асинхронный скрапер с незатратной обработкой данных на одном ядре упирается в сеть. Но это для канала до 100 Мбит/с. А если все данные находятся на одном сайте, то скорее сайт загнется, если не ограничить коннекты.
juche-songun
насколько я понял на создать 8 процессов на 8 ядер и использовать асинхронку на каждый процесс?
Если для обработки полученных данных нужно много ресурсов процессора (математика, большие html/xml) или канал большой и один процесс его не загружает, то есть смысл использовать несколько процессов (в районе количества ядер). Или сделать 1(2) процесс(а) асинхронных скраперов для сбора данных, остальные для обработки. Но тут уже может в базу/диск упереться.
juche-songun
хотел сделать через треды но урлиб и прочее очень часто выдавали ДНС ошибки или таймаут
Это наверное сайту плохо.
P.S.
Зачем еще одна
тема?