Найти - Пользователи
Полная версия: Dick хуй
Начало » Python для новичков » Dick хуй
1
xeyalxx
Хуй Dick
FishHook
xeyalxx
В чём моя проблема?
Проблема в том, что вы думаете, будто структура страницы остается точно такой же, какой она была получена от сервера все время жизни страницы. Так было лет пятнадцать-двадцать назад. Сейчас клиентская часть активно использует ДжаваСкрипт, формируя разметку динамически. Это значит на практике, что получив страницу по запросу, вам надо выполнить кучу скриптов прикрепленных к этой странице, чтобы получить итоговую страницу. Вы этого не делаете, вы только получаете страницу. Таким топорным способом вы далеко не уедете и сможете парсить только очень простые сайты. Для парсинга есть специальные инструменты, нагуглить которые я вам предлагаю самостоятельно.
evp24
FishHook
топорным

может просто, как вариант, парсить RSS урл, а не страницу?
или искать “версию для печати”?
This is a "lo-fi" version of our main content. To view the full version with more information, formatting and images, please click here.
Powered by DjangoBB