Найти - Пользователи
Полная версия: html парсер количества вакансий на hh+yandex
Начало » Python для новичков » html парсер количества вакансий на hh+yandex
1 2
admon
В коде выше и без этого работало. Может дело не в этом? разницы нет.
ayb
Тогда ищите по одному тэгу. А получается Вы в метод find_all() передаете тэг, который хотите найти, и следующим параметром атрибуты которые должны быть у этого тэга.

Вот Вам для старта, дальше сами разберетесь :

from urllib.request import urlopen
from bs4 import BeautifulSoup
url = "http://hh.ru/search/vacancy?clusters=true&enable_snippets=true&area=2"
data = urlopen(url)
soup = BeautifulSoup(data.read())
professional_area = soup("div", {"data-toggle": "professionalArea"})[0]
for item in professional_area.find_next("div"):
    for li in item.find_all("li", class_="clusters-list__item"):
        print(li)

Это элементы из раздела “Профобласть”. Чтобы смотреть по другим разделам смотрите параметр data-toggle у этого раздела и меняйте его в скрипте.

PS это 3-й питон.
admon
Спасибо, попробую!
admon
Получилось более-менее, осталось всего ничего добавить список из значений в строку по столбцам в гугл таблице
import gspread
from oauth2client.client import SignedJwtAssertionCredentials
json_key = json.load(open('gspread-8891908f3793.json'))
scope = ['https://spreadsheets.google.com/feeds'] 
credentials = SignedJwtAssertionCredentials(json_key['client_email'], json_key['private_key'], scope)
gc = gspread.authorize(credentials)
sht1 = gc.openall()
val = sht1[0].cell(1, 2).value
print sht1
и снова ничего.
This is a "lo-fi" version of our main content. To view the full version with more information, formatting and images, please click here.
Powered by DjangoBB