Уведомления

Группа в Telegram: @pythonsu

#1 Фев. 25, 2014 18:50:58

ingfa_1981
Зарегистрирован: 2014-01-25
Сообщения: 200
Репутация: +  1  -
Профиль   Адрес электронной почты  

Выкачать лекции по ссылке

http://www.intuit.ru/studies/courses/49/49/lecture/1471 подскажите как выкачать лекции с этой ссылки что бы научиться?
половину сохранил вручную и вспомнил, что можно выкачать автоматически.

Офлайн

#2 Фев. 25, 2014 19:29:52

alexsis
Зарегистрирован: 2013-07-26
Сообщения: 148
Репутация: +  9  -
Профиль   Отправить e-mail  

Выкачать лекции по ссылке

Вот на скорую руку скачивание частей пятой лекции.

from urllib import urlopen
url = 'http://www.intuit.ru/studies/courses/49/49/lecture/1471?page='
url_list = [url + str(x) for x in range(1,6)]
for i, url in enumerate(url_list):
    out = open(str(i) + '.htm', 'w')
    out.write(urlopen(url).read())
    out.close()

Офлайн

#3 Фев. 25, 2014 19:33:35

PanovSergey
От: Екатеринбург
Зарегистрирован: 2013-12-29
Сообщения: 269
Репутация: +  19  -
Профиль   Адрес электронной почты  

Выкачать лекции по ссылке

ingfa_1981
http://www.intuit.ru/studies/courses/49/49/lecture/1471 подскажите как выкачать лекции с этой ссылки что бы научиться?половину сохранил вручную и вспомнил, что можно выкачать автоматически.

А то то тема как скачать и как парсить хтмл сто раз обсосана вас не смущает?
-1

Отредактировано PanovSergey (Фев. 25, 2014 19:36:39)

Офлайн

#4 Фев. 25, 2014 21:38:21

ingfa_1981
Зарегистрирован: 2014-01-25
Сообщения: 200
Репутация: +  1  -
Профиль   Адрес электронной почты  

Выкачать лекции по ссылке

Я сейчас как слепой котенок, хожу туда сюда бьюсь головой, и не знаю чего изучать. Потому что я прочитал лишь одну книгу Лутца за месяц. Конечно же понял не все.

Офлайн

#5 Фев. 25, 2014 21:45:08

ingfa_1981
Зарегистрирован: 2014-01-25
Сообщения: 200
Репутация: +  1  -
Профиль   Адрес электронной почты  

Выкачать лекции по ссылке

А почему у меня ошибка?

from urllib import urlopen
ImportError: cannot import name urlopen

Офлайн

#6 Фев. 25, 2014 22:12:26

alexsis
Зарегистрирован: 2013-07-26
Сообщения: 148
Репутация: +  9  -
Профиль   Отправить e-mail  

Выкачать лекции по ссылке

ingfa_1981
А почему у меня ошибка?
для питона третьей ветки надо так:
from urllib.request import urlopen
ingfa_1981
Я сейчас как слепой котенок, хожу туда сюда бьюсь головой, и не знаю чего изучать. Потому что я прочитал лишь одну книгу Лутца за месяц. Конечно же понял не все.
У Марка Лутца есть еще двухтомник “Программирование на Python”. Там разбирается написание скриптов на python.

Отредактировано alexsis (Фев. 25, 2014 22:13:05)

Офлайн

#7 Фев. 26, 2014 15:27:09

ingfa_1981
Зарегистрирован: 2014-01-25
Сообщения: 200
Репутация: +  1  -
Профиль   Адрес электронной почты  

Выкачать лекции по ссылке

Traceback (most recent call last):
  File "/home/yura/Документы/python/progi/телефонистки.py", line 7, in <module>
    out.write(urlopen(url).read())
TypeError: must be str, not bytes

теперь такая ошибка

Офлайн

#8 Фев. 26, 2014 15:28:03

ingfa_1981
Зарегистрирован: 2014-01-25
Сообщения: 200
Репутация: +  1  -
Профиль   Адрес электронной почты  

Выкачать лекции по ссылке

необходима строка а не байты, так переводится?

Офлайн

#9 Фев. 26, 2014 16:58:22

alexsis
Зарегистрирован: 2013-07-26
Сообщения: 148
Репутация: +  9  -
Профиль   Отправить e-mail  

Выкачать лекции по ссылке

Строчку, в которой открывается файл, измените на

out = open(str(i) + '.htm', 'wb')

Офлайн

Board footer

Модераторировать

Powered by DjangoBB

Lo-Fi Version