Уведомления

Группа в Telegram: @pythonsu

#1 Дек. 4, 2017 16:10:00

Vilgelm
Зарегистрирован: 2017-10-04
Сообщения: 7
Репутация: +  -1  -
Профиль   Отправить e-mail  

Как сделать пасер сайта на Python?

Мне нужно сделать пасер на Python раздела “Афиша” на сайте yandex.ru
Вот этого раздела: https://pastenow.ru/2CIC9

Отредактировано Vilgelm (Дек. 4, 2017 16:10:17)

Офлайн

#2 Дек. 4, 2017 19:06:56

Lena13_08
Зарегистрирован: 2017-10-14
Сообщения: 26
Репутация: +  0  -
Профиль   Отправить e-mail  

Как сделать пасер сайта на Python?

Vilgelm
Мне нужно сделать пасер на Python раздела “Афиша” на сайте yandex.ruВот этого раздела: https://pastenow.ru/2CIC9

Я пользовалась этим https://www.analyticsvidhya.com/blog/2015/10/beginner-guide-web-scraping-beautiful-soup-python/
очень просто и хорошо написано

Офлайн

#3 Дек. 6, 2017 08:43:22

DamMercul
Зарегистрирован: 2017-11-26
Сообщения: 325
Репутация: +  13  -
Профиль   Отправить e-mail  

Как сделать пасер сайта на Python?

Всю программу писать не буду. Надо иметь хотя-бы минимальное представление о HTML. Без этого ты даже div-блока с температурой не найдешь…
Советую использовать requests - упрощенная версия urllib.

 import requests
from bs4 import BeautifulSoup as bs
con = requests.get("ссылка до yandex.ru погоды, забыл ...")
html_doc = con.text
read_file = bs(html_doc, "lxml")
con.close()
for div in read_file.find_all('div'):
    if div.get("a ИЛИ div") == "some_class":
        дальше сам



____________________________________________________

 # Life loop
while alive:
    if (fun > boredom) and money:
        pass_day(fun, boredom, money)
        continue
    else: break

Офлайн

Board footer

Модераторировать

Powered by DjangoBB

Lo-Fi Version