Найти - Пользователи
Полная версия: как не нагружать сервер
Начало » Network » как не нагружать сервер
1 2 3
getme
shiza
Ок. Теперь я вижу что недопонимание - у тебя.
чего я не понимаю?

лучше объясните а еще лучше покажите как по вашему должен быть скрипт который
shiza
получил страницу, обработал, выдрал с нее внешние/внутрение ссылки пошел к ним. и.тд
тогда и недопонимания не будет.
shiza
Имеет смысл:
1. Сделать очередь ссылок для обработки и set() ссылок которые уже обработаны (чтоб не обрабатывать уже обработанную страницу).
2. Чтобы кол-во ссылок не было катастрофически огромным, разделить ввнутренние и внешние сслыки. Причем внутренние урезать до домена. Если стоит задача ходить по всем ссылкам подрят - имеет смысл хранить домены во внешней БД (потому что доменов в мире слишком много чтоб держать их в памяти).
This is a "lo-fi" version of our main content. To view the full version with more information, formatting and images, please click here.
Powered by DjangoBB