Найти - Пользователи
Полная версия: Использование прокси и переход на страницу без запроса.
Начало » Data Mining » Использование прокси и переход на страницу без запроса.
1
Djo0513
1.Рано или поздно блочат по IP во время парсинга. Как использовать прокси в связке Beutifual Soup'a и urllib.request?
2.На некоторых сайтах есть таблицы, переключения между страницами производится как то скрытно, я хз чё за фича вот пример https://myip.ms/browse/sites/1/ipID/23.227.38.0/ipIDii/23.227.38.255/sort/6/asc/1
Попробуйте перейте на другую страницу снизу, URl не меняется - как это парсить?


Пытался тупо вдалбивать номер страницы - сбрасывала на 1.
PooH
Открываем chrome. В нем открываем страницу. Жмем F12. Откроется панель разработчика. Выбираем закладку Network. Чекаем на значке с воронкой(Filter). Выбираем вкладку XHR. Пробуем “перейте на другую страницу снизу, URl не меняется”. Смотрим на на вкладку Network - хуйясе?! ой что это?!

ЗЫ: Следим за Request URL: https://myip.ms/ajax_table/sites/3/ipID/23.227.38.0/ipIDii/23.227.38.255/sort/6/asc/1 вот этот элемент пути менятся
Djo0513
PooH
Насчёт URL, он меняется только вручную, а при переходе там всё скрытно - поэтому я и не знал, что он меняется вообще. Чтоб не банили что делать?
PooH
Djo0513
Чтоб не банили что делать?
urllib.request.URLopener принимает параметр proxies - словарь вида {схема: url прокси}, но лучше возьми requests, это очень удобная обертка поверх urllib.request. Там тоже такой словарь передается, смотри в документации.
Djo0513
PooH
Ещё раз спасибо.
This is a "lo-fi" version of our main content. To view the full version with more information, formatting and images, please click here.
Powered by DjangoBB