Очень нужен совет по теме ниже, с радостью заплачу 500 WMR первому кто укажет работающий код.
Суть проблемы - нужно максимально ускорить выполнение скрипта, который обходит веб-адреса по списку “domains.txt”, указывая при этом в качестве ссылающегося адреса (referer) один определенный домен. Я написал скрипт который это делает последовательно, обходя домены один за другим, теперь мне нужно многократно ускорить работу этого скрипта. Это можно сделать за счет параллельного выполнения нескольких запросов, чем больше параллельных запросов - тем лучше. По запросу “python multithreading url” google выдает кучу разных решений, но ни один из них к сожалению у меня не заработал, видимо руки из ж… растут

http://chriskiehl.com/article/parallelism-in-one-line/
https://mellowd.co.uk/ccie/?tag=multi-threading
http://stackoverflow.com/questions/16181121/python-very-simple-multithreading-parallel-url-fetching-without-queue
Мой скрипт указан ниже, он выполняется минут за 5, мне нужно максимально ускорить его работу, я предполагаю что путем распараллеливания задач можно ускорить работу минимум в 5-10 раз. (предполагаем что комп и Интернет - мощные и не вносят задержек)
import urllib2 my_ref = "http://sun-charge.com/" #zdes budem moi domen, drugoi with open("domains.txt", "r") as f: urls = f.readlines() for url in urls: url = url.strip() url = "http://" + url try: opener = urllib2.build_opener() opener.addheaders = [('Referer', my_ref)] #dlya proverki mozhno pomenyat mestami "url" i "my_ref" opener.open(url) #dlya proverki mozhno pomenyat mestami "url" i "my_ref" print "done" except: print "Unable to download"
Т.е. если в моем скрипте поменять местами переменные “my_ref” и “url” в тех строчках где указаны соответствующие комменты, но прогон будет выполняться только по домену sun-charge.com а в качестве реферера будут указаны домены из списка “domains.txt”, если в статистике по адресу http://www.sun-charge.com/bbclone/show_detailed.php вы увидели любой домен из списка “domains.txt” - значит все работает ОК.
Т.е. еще раз кратко суть - написать скрипт с тем-же смыслом что и мой вариант выше, но обходящий домены не последовательно один за одним, а параллельно выполняющий много запросов(чем больше - тем лучше) чтобы достичь минимум 5-10 кратного ускорения работы относительно моего варианта.
С меня в качестве “спасибо” 500 WMR первому, кто напишет РАБОТАЮЩИЙ код.
заранее большое спасибо !!!