Уведомления

Группа в Telegram: @pythonsu
  • Начало
  • » Network
  • » Многопоточная закачка через различные Socks/HTTP прокси [RSS Feed]

#1 Март 16, 2013 12:50:52

plusplus
От:
Зарегистрирован: 2009-01-05
Сообщения: 418
Репутация: +  15  -
Профиль   Отправить e-mail  

Многопоточная закачка через различные Socks/HTTP прокси

krishnarama
lorien, а почему ты не предлагаешь grab?
Дак тут его функциональность не нужна, а скорость загрузки он определять вроде как не умеет.



Офлайн

#2 Март 17, 2013 03:47:40

krishnarama
Зарегистрирован: 2013-02-27
Сообщения: 51
Репутация: +  -36  -
Профиль   Отправить e-mail  

Многопоточная закачка через различные Socks/HTTP прокси

Ну, во-первых, товарищ его абсолютно везде предлагал

Во-вторых, я не знаю, как стоит вопрос - устроит ли качать файл и смотреть на время его загрузки?

И в третьих, если можно как-то хукнуть writefunction, то с ней становится возможно все.

Вообще, такая функциональность есть в urlretrieve (сообщать коллбеку о загруженых блоках). Очень жалко, что вся стандартная библиотека кроме как через жопу с проксями не работает.

Офлайн

#3 Март 17, 2013 04:54:36

Dwarf
От:
Зарегистрирован: 2011-05-09
Сообщения: 34
Репутация: +  0  -
Профиль   Отправить e-mail  

Многопоточная закачка через различные Socks/HTTP прокси

krishnarama
Во-вторых, я не знаю, как стоит вопрос - устроит ли качать файл и смотреть на время его загрузки?
Нет, нужно отслеживать скорость в данный момент.

krishnarama
Очень жалко, что вся стандартная библиотека кроме как через жопу с проксями не работает.
Не знаете, с чем это связано и будет ли исправлено в ближайшем времени?



Офлайн

#4 Март 17, 2013 07:46:23

krishnarama
Зарегистрирован: 2013-02-27
Сообщения: 51
Репутация: +  -36  -
Профиль   Отправить e-mail  

Многопоточная закачка через различные Socks/HTTP прокси

А чем не устраивает скачать тестовый файл?

Dwarf
Не знаете, с чем это связано и будет ли исправлено в ближайшем времени?
С чем связано - хз, поддержку socks прокси все никак не могут добавить даже в requests, хотя уже и патч прислали.

Отредактировано krishnarama (Март 17, 2013 07:46:47)

Офлайн

#5 Март 17, 2013 07:51:46

Dwarf
От:
Зарегистрирован: 2011-05-09
Сообщения: 34
Репутация: +  0  -
Профиль   Отправить e-mail  

Многопоточная закачка через различные Socks/HTTP прокси

requests это же надстройка над urllib3?



Офлайн

#6 Март 17, 2013 14:39:48

plusplus
От:
Зарегистрирован: 2009-01-05
Сообщения: 418
Репутация: +  15  -
Профиль   Отправить e-mail  

Многопоточная закачка через различные Socks/HTTP прокси

krishnarama
С чем связано - хз, поддержку socks прокси все никак не могут добавить даже в requests, хотя уже и патч прислали.

А как они сделали работу с соксами, полностью с нуля написали в этом патче или сторонний модуль используют?



Офлайн

#7 Март 18, 2013 04:37:28

krishnarama
Зарегистрирован: 2013-02-27
Сообщения: 51
Репутация: +  -36  -
Профиль   Отправить e-mail  

Многопоточная закачка через различные Socks/HTTP прокси

https://github.com/kennethreitz/requests/pull/478

Вот, кстати, нужный тебе функционал: http://docs.python-requests.org/en/latest/user/advanced/#body-content-workflow

Отредактировано krishnarama (Март 18, 2013 04:42:16)

Офлайн

#8 Март 19, 2013 22:03:28

lorien
От:
Зарегистрирован: 2006-08-20
Сообщения: 755
Репутация: +  37  -
Профиль  

Многопоточная закачка через различные Socks/HTTP прокси

> не хотелось бы её использовать. Во-первых она давно не обновляется, во-вторых под Windows её надо собирать, что неудобно, ибо желательно, чтобы всё ставилось через pip.

Ну, честно говоря, я через pycurl (посредством граба) спарсил не один десяток миллионов страниц. И ещё куча народа юзает его. Да там есть баги, а где их нет? Под винду есть exe инсталляторы курлы. Мы даже под третий питон пайкурл собирали под линём и под виндой.

> lorien, а почему ты не предлагаешь grab?
Потому что я туда не прикручивал контроль скорости закачки, но вроде сам pycurl это умеет.

Ну и если очень что-то надо, а самому делать не охочется, платите деньгу и это появится в грабе очень быстро.

Офлайн

#9 Март 22, 2013 17:21:49

krishnarama
Зарегистрирован: 2013-02-27
Сообщения: 51
Репутация: +  -36  -
Профиль   Отправить e-mail  

Многопоточная закачка через различные Socks/HTTP прокси

А в grab есть keep-alive и пуникод?

Офлайн

#10 Март 22, 2013 21:42:48

lorien
От:
Зарегистрирован: 2006-08-20
Сообщения: 755
Репутация: +  37  -
Профиль  

Многопоточная закачка через различные Socks/HTTP прокси

Keep-alive - без понятия, разве что это как-то автоматически курл делает. Был бы признателен, если бы кто-то исследовал этот вопрос в грабе и написал отчёт.

Пуникод есть

>>> from grab import Grab
>>> g= Grab()
>>> g.go('http://россия.рф')
<grab.response.Response object at 0x7eff9abe6790>
>>> print g.doc.select('//title').text()
СЕРВЕР ОРГАНОВ ГОСУДАРСТВЕННОЙ ВЛАСТИ РОССИИ

Отредактировано lorien (Март 22, 2013 21:43:19)

Офлайн

  • Начало
  • » Network
  • » Многопоточная закачка через различные Socks/HTTP прокси[RSS Feed]

Board footer

Модераторировать

Powered by DjangoBB

Lo-Fi Version