Форум сайта python.su
Всем добра! Подскажите пожалуйста, хочу спарсить выдачу сайта Закупки Москвы, для парсинга использовую bs4, но на выдачи пустые строки, никак не могу разобраться как парсить данный вид сайта
[code python]from lxml import etree import requests from bs4 import BeautifulSoup def get_html(url): headers = {'User-Agent': 'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/51.0.2704.106 Safari/537.36'} r = requests.get(url, headers=headers) return r.text def get_all_links(html): soup = BeautifulSoup(html, 'lxml') names = soup.find('div', class_='cssp_news').find_all('div', class_='col') links = [] for div in names: a = div.find('a', class_='text-17').get('href') links.append(a) return links def main(): url = 'http://zakupki.mos.ru/#/offerauction' all_links = get_all_links(get_html(url)) for i in all_links: print(i) if '__name__' == '__main__': main() [/code]
Офлайн
stekachev
Вот как вы дебажите код? У вас не выполняется ни одна функция, потому что вы зачем-то сравниваете два строковых литерала.
Вместо
if '__name__' == '__main__':
if __name__ == '__main__':
Офлайн