getme
Дек. 14, 2008 19:55:36
shiza
Ок. Теперь я вижу что недопонимание - у тебя.
чего я не понимаю?
лучше объясните а еще лучше покажите как по вашему должен быть скрипт который
shiza
получил страницу, обработал, выдрал с нее внешние/внутрение ссылки пошел к ним. и.тд
тогда и недопонимания не будет.
shiza
Дек. 15, 2008 01:26:02
Имеет смысл:
1. Сделать очередь ссылок для обработки и set() ссылок которые уже обработаны (чтоб не обрабатывать уже обработанную страницу).
2. Чтобы кол-во ссылок не было катастрофически огромным, разделить ввнутренние и внешние сслыки. Причем внутренние урезать до домена. Если стоит задача ходить по всем ссылкам подрят - имеет смысл хранить домены во внешней БД (потому что доменов в мире слишком много чтоб держать их в памяти).