Форум сайта python.su
Возможно ли получить ссылки, на которые идут запросы при загрузке страницы?
Возможно ли Request url(с него подгружаются дополнительная информация на сайт) после запроса на необходимую страницу?Если возможно,то буду рад если дадите наводку. На скрине отметил что конкретно я имею ввиду.
Прикреплённый файлы: request.PNG (45,9 KБ)
Офлайн
ResistanseПолучите страницу и распарсите её получив теги нужных ссылок и извлеките сорс. В чем конкретно вопрос то? Вы вообще понимаете, что происходит при загрузке страницы?
Возможно ли получить ссылки, на которые идут запросы при загрузке страницы?
Офлайн
FishHookЯ все понимаю.Мне нужна именно эта ссылка. Распарсить не получится, т.к. там html выводится автоматически через javascript.
Прикреплённый файлы: scr.PNG (31,5 KБ)
Офлайн
ResistanseА я - ни черта не понимаю. Вы прислали не HTML, а шаблон страницы для некоего шаблонизатора. Зачем вам парсить собственную страницу?
Я все понимаю.
Офлайн
import requests from lxml import html r = requests.get('http://google.com') google = html.fromstring(r.content) print(google.xpath('//a/@href'))
['http://www.google.com/imghp?hl=en&tab=wi', 'http://maps.google.com/maps?hl=en&tab=wl', 'https://play.google.com/?hl=en&tab=w8', 'http://www.youtube.com/?gl=US&tab=w1', 'http://news.google.com/nwshp?hl=en&tab=wn', 'https://mail.google.com/mail/?tab=wm', 'https://drive.google.com/?tab=wo', 'https://www.google.com/intl/en/options/', 'http://www.google.com/history/optout?hl=en', '/preferences?hl=en', 'https://accounts.google.com/ServiceLogin?hl=en&passive=true&continue=http://www.google.com/', '/advanced_search?hl=en&authuser=0', '/language_tools?hl=en&authuser=0', '/intl/en/ads/', '/services/', 'https://plus.google.com/116899029375914044550', '/intl/en/about.html', '/intl/en/policies/privacy/', '/intl/en/policies/terms/']
Отредактировано papuas (Ноя. 26, 2017 00:11:00)
Офлайн
ResistanseНа странице может и не быть какого-то участка кода вообще. При загрузке скрипт, записанный в html-странице, заставляет браузер добавить какое-то размеченное содержимое в документ. Причём этот документ уже загружен в оперативную память браузера. Добавление кода через скрипт содержимое скачанной html-страницы никак не меняет и никак к ней не относится уже. Скачанная страница используется только один раз - чтобы построить документ в памяти и загрузить содержимое самих скриптов. А скрипты уже выполняются браузером и работают с этой памятью.
Возможно ли получить ссылки, на которые идут запросы при загрузке страницы?
Отредактировано py.user.next (Ноя. 26, 2017 03:07:27)
Офлайн
Спасибо всем за ответы,вчера нашел альтернативное решение проблемы
Офлайн