Уведомления

Группа в Telegram: @pythonsu
  • Начало
  • » Data Mining
  • » Использование прокси и переход на страницу без запроса. [RSS Feed]

#1 Авг. 18, 2017 15:03:13

Djo0513
Зарегистрирован: 2016-09-02
Сообщения: 92
Репутация: +  0  -
Профиль   Отправить e-mail  

Использование прокси и переход на страницу без запроса.

1.Рано или поздно блочат по IP во время парсинга. Как использовать прокси в связке Beutifual Soup'a и urllib.request?
2.На некоторых сайтах есть таблицы, переключения между страницами производится как то скрытно, я хз чё за фича вот пример https://myip.ms/browse/sites/1/ipID/23.227.38.0/ipIDii/23.227.38.255/sort/6/asc/1
Попробуйте перейте на другую страницу снизу, URl не меняется - как это парсить?


Пытался тупо вдалбивать номер страницы - сбрасывала на 1.



Лучший учитель - это ты сам.

Отредактировано Djo0513 (Авг. 18, 2017 15:04:57)

Офлайн

#2 Авг. 18, 2017 17:34:51

PooH
От:
Зарегистрирован: 2006-12-05
Сообщения: 1948
Репутация: +  72  -
Профиль   Отправить e-mail  

Использование прокси и переход на страницу без запроса.

Открываем chrome. В нем открываем страницу. Жмем F12. Откроется панель разработчика. Выбираем закладку Network. Чекаем на значке с воронкой(Filter). Выбираем вкладку XHR. Пробуем “перейте на другую страницу снизу, URl не меняется”. Смотрим на на вкладку Network - хуйясе?! ой что это?!

ЗЫ: Следим за Request URL: https://myip.ms/ajax_table/sites/3/ipID/23.227.38.0/ipIDii/23.227.38.255/sort/6/asc/1 вот этот элемент пути менятся



Вот здесь один из первых отарков съел лаборанта. Это был такой умный отарк, что понимал даже теорию относительности. Он разговаривал с лаборантом, а потом бросился на него и загрыз…

Отредактировано PooH (Авг. 18, 2017 17:42:13)

Офлайн

#3 Авг. 18, 2017 17:50:28

Djo0513
Зарегистрирован: 2016-09-02
Сообщения: 92
Репутация: +  0  -
Профиль   Отправить e-mail  

Использование прокси и переход на страницу без запроса.

PooH
Насчёт URL, он меняется только вручную, а при переходе там всё скрытно - поэтому я и не знал, что он меняется вообще. Чтоб не банили что делать?



Лучший учитель - это ты сам.

Офлайн

#4 Авг. 19, 2017 06:50:24

PooH
От:
Зарегистрирован: 2006-12-05
Сообщения: 1948
Репутация: +  72  -
Профиль   Отправить e-mail  

Использование прокси и переход на страницу без запроса.

Djo0513
Чтоб не банили что делать?
urllib.request.URLopener принимает параметр proxies - словарь вида {схема: url прокси}, но лучше возьми requests, это очень удобная обертка поверх urllib.request. Там тоже такой словарь передается, смотри в документации.



Вот здесь один из первых отарков съел лаборанта. Это был такой умный отарк, что понимал даже теорию относительности. Он разговаривал с лаборантом, а потом бросился на него и загрыз…

Офлайн

#5 Авг. 19, 2017 16:54:12

Djo0513
Зарегистрирован: 2016-09-02
Сообщения: 92
Репутация: +  0  -
Профиль   Отправить e-mail  

Использование прокси и переход на страницу без запроса.

PooH
Ещё раз спасибо.



Лучший учитель - это ты сам.

Офлайн

  • Начало
  • » Data Mining
  • » Использование прокси и переход на страницу без запроса.[RSS Feed]

Board footer

Модераторировать

Powered by DjangoBB

Lo-Fi Version