Форум сайта python.su
Привет! Пишу чекер для одного сайта и есть одна проблема, сайт не пропускает авторизацию, если ты не подгрузил JS. Возможно ли как-то оформить подгрузку JS в работе с Requests?
В случае, если стоит запрет на подгрузку JS, то сайт выдаёт ошибку о том, что требуется подгрузить.
Отредактировано python13 (Июнь 23, 2022 14:14:55)
Офлайн
VANISHED
Отредактировано ntram (Окт. 13, 2022 15:37:41)
Офлайн
ntramСпасибо! Почитаю.
немного погуглил, вот что нашелhttps://stackoverflow.com/a/54056631/13473129
Офлайн
Сайт выдаёт:
Please enable JS in your browser
You may be blocking important javascript components, check that main.js is loaded or the webpage won't work.
Офлайн
python13скорее всего, проблема не в том, что вы “не подгрузили JS”. Какая сайту разница, подгрузили вы скрипт или нет? Он на то и скрипт, что подгружается один раз и застревает в кэше, браузер не качает один и тот же скрипт каждый раз при загрузке сайта. Проблема наверняка в том, что этот JS он не для красоты, он что-то делает на стороне клиента, например сообщает сайту о том, что вы загрузили страницу, чтобы сайт что-то сделал у себя на бэкенде. Сайту нужен обмен какими-то данными между браузером и бэкендом. Например, как-то так
Привет! Пишу чекер для одного сайта и есть одна проблема, сайт не пропускает авторизацию, если ты не подгрузил JS.
Офлайн
VANISHED
Отредактировано ntram (Окт. 13, 2022 15:39:37)
Офлайн
ntramЧерез Selenium уже был написан код) Я ищу более оптимальные и быстрые решения
Офлайн
FishHookПонял. Спасибо!
Офлайн
Вопрос, если что, актуален!
Офлайн
python13а в чем он состоит? Нет никакого универсального решения. Парсинг интернета задача нетривиальная. Есть набор инструментов, которые вам тут уже назвали, плюс многие другие. Как с помощью этих инструментов спарсить данные с конкретного сайта? Ну это и есть та работа, за которую люди просят деньги. Надо провести много аналитической работы, ковыряться в сорцах сайта, исследовать АПИ ресурсов к которым он обращается. Все очень индивидуально, сайты они не как матрешки все на одно лицо. Никто вам не расскажет в двух словах, как обойти ту или иную проблему, если проблема описана вот так “сайт не пропускает авторизацию, если ты не подгрузил JS”. Разберитесь сначала как сайт работает, как устроена авторизация на этом сайте, что делают те или иные скрипты, какие они данные получают, что хранится в куках и тд. Потом, когда вы узнаете, почему именно не срабатывает ваша авторизация и не сможете самостоятельно придумать, как обойти возникшую трудность, приходите с конкретным вопросом. Кстати, владельцы сайтов вовсе не хотят чтобы воровали их данные и всячески защищаются от этого, и есть вариант, что спарсить будет невозможно вообще.
Вопрос, если что, актуален!
Офлайн