from urllib.request import urlopen from bs4 import BeautifulSoup import re class Crawler: def __init__(self, url): url = urlopen(url) self.html = BeautifulSoup(url, 'lxml') self.list_of_sites = [] def run_crawling(self): result = self._crawling(self.html) return result def _crawling(self, html): k = 0 target = html.findAll('a', href=True) for url in target: checker = url['href'] compare = re.compile('http?://') if re.search(compare, checker): k += 1 self.list_of_sites.append(checker) if k > 0: return 'Done' def sites(self): return self.list_of_sites if __name__ == '__main__': obj1 = Crawler('http://www.imdb.com/') obj1.run_crawling() print(obj1.sites())
Надеюсь на конструктивную критику или же адекватное мнение. По возможности прошу оценить мою работу по 10 бальной шкале.
Заметьте, оценивать нужно только мои объектно ориентированные способы написания кода.
Прошу помощи так как не знаю кто я в ООП.