Форум сайта python.su
Всем добра!
В общем задача такая:
есть урл: тут
нужно с него спарсить текст помеченный на скрине:
пишу код:
import requests from bs4 import BeautifulSoup as bs def get_html(url): r = requests.get(url) r.encoding = 'utf-8' return r.text url = 'http://bus.gov.ru/pub/agency/8968/tasks/3472492' print(get_html(url))
Отредактировано Vigi (Фев. 21, 2017 11:29:12)
Офлайн
Какой браузер? С помощью какого инструмента обнаруживается элемент?
Офлайн
nukleaБраузер любой. В любом браузере ПКМ исследовать элемент или посмотреть код элемента (в зависимости от браузера)
Какой браузер? С помощью какого инструмента обнаруживается элемент?
Отредактировано Vigi (Фев. 21, 2017 12:42:15)
Офлайн
VigiНифига там не открывается, просто облака и всё.
есть урл: тут
Офлайн
py.user.nextстранно у меня открывается попробуйте http://bus.gov.ru
Нифига там не открывается, просто облака и всё.
Офлайн
VigiНе, облака только открывает и всё. Даже если отключить AdBlock для него. Очередной государственный говносайт, далёкий от Интернета и пользователей.
попробуйте http://bus.gov.ru
Офлайн
py.user.nextЧто-то странное у вас
Не, облака только открывает и всё. Даже если отключить AdBlock для него. Очередной государственный говносайт, далёкий от Интернета и пользователей.
Офлайн
Vigi, вы спарсили HTML, на сайте и js есть. Динамический контент, поэтому и нет его в HTML
ЗЫ так и есть, там AngularJS https://ru.wikipedia.org/wiki/AngularJS
Отредактировано vic57 (Фев. 21, 2017 17:47:58)
Прикреплённый файлы:
scr.png (116,6 KБ)
Офлайн
vic57И какие есть варианты распарсить?
Vigi, вы спарсили HTML, на сайте и js есть. Динамический контент, поэтому и нет его в HTML
ЗЫ так и есть, там AngularJS https://ru.wikipedia.org/wiki/AngularJS
Офлайн
VigiПойдет?
И какие есть варианты распарсить?
Офлайн