Python-сообщество

smoke853 · Фев. 21, 2013 07:00:17

Вообщем возник такой вопрос:
Допустим мне нужно с какого-то сайта скачать набор каких-нибудь файлов (аудио, фото, видео, текстовые файлы, таблицы excel к примеру, pdf файлы и т.д.). Собственно что мне для этого нужно и можно ли такое сделать на Python? какие модули поставить, может какие-нибудь статьи есть на эту тему. Просто что касается web я в этом полный 0, т.е. тупо даже не знаю с чего начать и про что гуглить

P.S. пишу на python 3.3.0.

—
Clojure, Plain and Simple…

Отредактировано smoke853 (Фев. 21, 2013 07:11:24)

GaiveR · Фев. 21, 2013 10:01:33

Вопрос-то в чём, как скачать файл зная его url? Или надо спарсить с сайта ссылки на файлы и все их выкачать?

smoke853 · Фев. 21, 2013 10:09:21

GaiveR, например: есть сайт goodfon.ru, и мне надо скачать обои из раздела текстуры допустим за вчерашний день, при этом обои должны быть только 1920х1080.
P.S. как и я написал выше я в этом полный 0, что такое спарсить ссылки я не знаю, может нужно и спарсить

P.S. готовый скрипт мне не нужен, мне нужна помощь именно в том с чего начать, документацию каких модулей почитать и т.д. Просто я вообще не представляю как это делается, и в какую сторону капать.

—
Clojure, Plain and Simple…

Отредактировано smoke853 (Фев. 21, 2013 10:11:30)

mks · Фев. 21, 2013 13:22:12

Посмотрите эти уроки о применении библиотеки Grab. Правда она насколько я помню для 2-го питона.

GaiveR · Фев. 21, 2013 13:41:53

smoke853 гуглите на тему парсинга сайтов.
В начале я бы рекомендовал спарсить что-нибудь без узкоспециализированных библиотек вроде grab. Когда будет базовое понимание того как это происходит, можно знакомиться с специализированными библиотеками.

Краткий алгоритм такой:
1. Получить страницу с данными (requests, urllib)
2. Разобрать её (lxml, в некоторых случаях достаточно re)
3. Выкачать/сохранить на диск необходимую информацию.
4. Получить очередную страницу с данными.

Отредактировано GaiveR (Фев. 21, 2013 16:08:56)

smoke853 · Фев. 21, 2013 13:50:50

mks, GaiveR и FishHook большое спасибо, буду изучать

—
Clojure, Plain and Simple…

Отредактировано smoke853 (Фев. 21, 2013 13:53:43)

FishHook · Фев. 21, 2013 13:51:57

smoke853
Просто я вообще не представляю как это делается, и в какую сторону капать.

Минимально освоить HTML и HTTP для начала. Литературы - океан.

Python-сообщество

Уведомления

#1 Фев. 21, 2013 07:00:17

Не знаю с чего начать.

#2 Фев. 21, 2013 10:01:33

Не знаю с чего начать.

#3 Фев. 21, 2013 10:09:21

Не знаю с чего начать.

#4 Фев. 21, 2013 13:22:12

Не знаю с чего начать.

#5 Фев. 21, 2013 13:41:53

Не знаю с чего начать.

#6 Фев. 21, 2013 13:50:50

Не знаю с чего начать.

#7 Фев. 21, 2013 13:51:57

Не знаю с чего начать.

Board footer