Форум сайта python.su
Всем здравствуйте, прошу помочь с одним делом.
Ситуация такая: есть книжный сайт, который по специальной подписке даёт доступ к книге через собственный viewer. Доступ именно ко всем страницам книги можно получить только если ты авторизован на сайте с подпиской, но в если в браузере вставить url по типу "http/***/page/4" и открыть, то скачается svg файл с текстом страницы.
Исходя из этого я решил написать скрипт, который бы скачивал все страницы и сшивал бы их в книгу, но когда я использую такой запрос:
import requests s = requests.Session() page = s.get('url страницы по которой идёт скачивание') with open('./page.svg', 'w') as output_file: output_file.write(page.text)
Отредактировано Pablic (Фев. 4, 2019 20:17:38)
Офлайн
возможно станица динамическая, с JS. тут реквестом не обойдешься
посмотри код страницы в браузере
Офлайн
vic57Если Вы имеете ввиду URL по которому файл спокойно скачиватся, то я не знаю как посмотреть его код в браузере. Я могу сказать точно, что после перехода по нему происходит GET запрос, который возвращает мне SVG файл со страницей. Что мешает мне со скрипта, грубо говоря, также обратиться к URL и получить файл?
возможно станица динамическая, с JS. тут реквестом не обойдешься посмотри код страницы в браузере
Отредактировано Pablic (Фев. 4, 2019 23:01:38)
Офлайн
смотрите на веб-инспекторе в браузере, вариантов что вам мешает много
Офлайн
Вероятно, что Pablic авторизован на сайте через какой-то из браузеров у себя. А авторизацию через requests не выполняет. Конечно могу и ошибаться, но исходя из представленного кода так и есть.
Офлайн
Проблема решена или еще актуальна?
Офлайн
LunnarСаму задачу решил, но использовал библиотеку selenium и тупо повторял свои действия на сайте
Проблема решена или еще актуальна?
Офлайн