Форум сайта python.su
0
В коде выше и без этого работало. Может дело не в этом? разницы нет.
Офлайн
24
Тогда ищите по одному тэгу. А получается Вы в метод find_all() передаете тэг, который хотите найти, и следующим параметром атрибуты которые должны быть у этого тэга.
Вот Вам для старта, дальше сами разберетесь :
from urllib.request import urlopen from bs4 import BeautifulSoup url = "http://hh.ru/search/vacancy?clusters=true&enable_snippets=true&area=2" data = urlopen(url) soup = BeautifulSoup(data.read()) professional_area = soup("div", {"data-toggle": "professionalArea"})[0] for item in professional_area.find_next("div"): for li in item.find_all("li", class_="clusters-list__item"): print(li)
Отредактировано ayb (Авг. 29, 2015 18:05:21)
Офлайн
0
Спасибо, попробую!
Офлайн
0
Получилось более-менее, осталось всего ничего добавить список из значений в строку по столбцам в гугл таблице
import gspread from oauth2client.client import SignedJwtAssertionCredentials json_key = json.load(open('gspread-8891908f3793.json')) scope = ['https://spreadsheets.google.com/feeds'] credentials = SignedJwtAssertionCredentials(json_key['client_email'], json_key['private_key'], scope) gc = gspread.authorize(credentials) sht1 = gc.openall() val = sht1[0].cell(1, 2).value print sht1
Офлайн