Форум сайта python.su
Хуй Dick
Отредактировано xeyalxx (Май 11, 2018 22:55:54)
Прикреплённый файлы: Screenshot_1.png (34,3 KБ)
Офлайн
xeyalxxПроблема в том, что вы думаете, будто структура страницы остается точно такой же, какой она была получена от сервера все время жизни страницы. Так было лет пятнадцать-двадцать назад. Сейчас клиентская часть активно использует ДжаваСкрипт, формируя разметку динамически. Это значит на практике, что получив страницу по запросу, вам надо выполнить кучу скриптов прикрепленных к этой странице, чтобы получить итоговую страницу. Вы этого не делаете, вы только получаете страницу. Таким топорным способом вы далеко не уедете и сможете парсить только очень простые сайты. Для парсинга есть специальные инструменты, нагуглить которые я вам предлагаю самостоятельно.
В чём моя проблема?
Офлайн
FishHook
топорным
Отредактировано evp24 (Июль 27, 2017 22:39:54)
Офлайн