Найти - Пользователи
Полная версия: Что становится с потоками по их завершении?
Начало » Python для новичков » Что становится с потоками по их завершении?
1
pasaranax
У меня есть нечто вроде следующего кода:
class CatParser(threading.Thread):
def run(self):
# что-то долго делает

class Parser(object):
def start(self):
for i in xrange(100): # типа надо спарсить 100 категорий на сайте
cp = CatParser(i)
cp.start()
while len(threading.enumerate()) > 10: # типа ограничение на 10 потоков
time.sleep(1)
while len(threading.enumerate()) > 1: # типа ждем, пока завершатся последние потоки
time.sleep(1)
print "Готово"
Возник вопрос: после того, как очередной CatParser(i) завершит свою работу, он пропадает и из threading.enumerate(), можно ли полагать, что по завершении они удаляются, и у меня не будет висеть в памяти 100 зомби или все-же каждому надо делать del? Если их надо удалять вручную, то как это сделать?

п.с. и вообще, как вы можете оценить данный архитектурный подход?
Slava
После выхода из CatParser.run поток завершит работу, никаких del делать не нужно. Насчет подхода, хорошо бы добавить возможность стопануть все потоки, например через Event() в ф-и stop. И заменить цикл c threading.enumerate, на работу с Semaphore. Да и ждать завершения работы потоков лучше через cp.join(timeout).
goblin_maks
я не профи..но вот это мне кажется не совсем правильно:
            while len(threading.enumerate()) > 10:  # типа ограничение на 10 потоков
time.sleep(1)
while len(threading.enumerate()) > 1: # типа ждем, пока завершатся последние потоки
time.sleep(1)
вроде как threading.enumerate() нельзя использовать для таких целей…правилее создать пулл для потоков, или использовать семафор на 10 позиций…len(threading.enumerate()) всегда больше 1, так как учитывает и сервисные потоки самого интерпретатора.
pasaranax
goblin_maks
len(threading.enumerate()) всегда больше 1, так как учитывает и сервисные потоки самого интерпретатора.
я в нем наблюдал только потоки которые я создал и основной поток. А можете кто-нибудь привести пример с семафорами?
Slava
C семафором примерно так:
from threading import Semaphore, Event

class CatParser(threading.Thread):
def __init__(self, sem):
super(CatParser, self).__init__()
self._sem = sem

def run(self):
try:
pass
finally:
self._sem.release()

class Parser(object):

def __init__(self):
self._sem = Semaphore(10)
self._stopEvent = Event()

def stop(self):
self._stopEvent.set()
self._sem.release()

def start(self):
threads = []
for i in xrange(100):
self._sem.acquire()
if self._stopEvent.isSet():
break
cp = CatParser(self._sem)
cp.start()
threads.append(cp)
for cp in threads:
cp.join(10)
print "Готово"
pasaranax
Круто, спасибо )
This is a "lo-fi" version of our main content. To view the full version with more information, formatting and images, please click here.
Powered by DjangoBB