Уведомления

Группа в Telegram: @pythonsu

#1 Дек. 25, 2011 13:20:39

murdoc
От:
Зарегистрирован: 2011-11-03
Сообщения: 23
Репутация: +  0  -
Профиль   Отправить e-mail  

urllib urllib2 Помогите пожалуйста

такс, столкнулся со следующей задачей, есть сайт с кучей ссылок, мне нужно считать эти все ссылки в список, в дальнейшем планирую делать скачивание файла по одной из этих ссылок
как это можно организовать?



Отредактировано (Дек. 25, 2011 13:22:25)

Офлайн

#2 Дек. 25, 2011 22:23:35

iBiZoNiX
От: Пирятин
Зарегистрирован: 2011-07-05
Сообщения: 28
Репутация: +  0  -
Профиль   Отправить e-mail  

urllib urllib2 Помогите пожалуйста

А что у Вас собственно не выходит?
Используйте модуль urllib для открытия страниц и скачки файлов, а модуль re для парсинга ссылок.



Офлайн

#3 Дек. 25, 2011 22:50:58

murdoc
От:
Зарегистрирован: 2011-11-03
Сообщения: 23
Репутация: +  0  -
Профиль   Отправить e-mail  

urllib urllib2 Помогите пожалуйста

собсна хотелось бы подробней узнать что конкретно использовать из модулей urllib и re



Офлайн

#4 Дек. 26, 2011 16:00:25

iBiZoNiX
От: Пирятин
Зарегистрирован: 2011-07-05
Сообщения: 28
Репутация: +  0  -
Профиль   Отправить e-mail  

urllib urllib2 Помогите пожалуйста

Ищите информацию по этих модулях.За Вас программу никто не напишет.
Python 3
Пример открытия страницы:

from urllib import urlopen
site = urlopen('http://python.su')
data = site.read() #html код
Пример скачки и сохранения файла:
from urllib import urlopen
site = urlopen('http://site.ru/music.mp3')
file = site.read()
save = open('music.mp3','wb')
save.write(file)
save.close()
Парсим ссылки:
from urllib import urlopen
import re
site = urlopen('http://site.ru')
html = site.read()
links = re.findall('<a href=['|"](.+?)['|"]>',html)



Офлайн

#5 Дек. 27, 2011 08:02:47

py.user.next
От:
Зарегистрирован: 2010-04-29
Сообщения: 9849
Репутация: +  853  -
Профиль   Отправить e-mail  

urllib urllib2 Помогите пожалуйста

murdoc
собсна хотелось бы подробней узнать что конкретно использовать из модулей urllib и re
есть ещё модуль html (htmllib) для разбора тегов



Отредактировано (Дек. 27, 2011 08:03:08)

Офлайн

#6 Дек. 27, 2011 20:52:25

murdoc
От:
Зарегистрирован: 2011-11-03
Сообщения: 23
Репутация: +  0  -
Профиль   Отправить e-mail  

urllib urllib2 Помогите пожалуйста

спасибо, буду разбираться :)



Офлайн

Board footer

Модераторировать

Powered by DjangoBB

Lo-Fi Version