Python-сообщество

murdoc · Дек. 25, 2011 13:20:39

такс, столкнулся со следующей задачей, есть сайт с кучей ссылок, мне нужно считать эти все ссылки в список, в дальнейшем планирую делать скачивание файла по одной из этих ссылок
как это можно организовать?

Отредактировано (Дек. 25, 2011 13:22:25)

iBiZoNiX · Дек. 25, 2011 22:23:35

А что у Вас собственно не выходит?
Используйте модуль urllib для открытия страниц и скачки файлов, а модуль re для парсинга ссылок.

murdoc · Дек. 25, 2011 22:50:58

собсна хотелось бы подробней узнать что конкретно использовать из модулей urllib и re

iBiZoNiX · Дек. 26, 2011 16:00:25

Ищите информацию по этих модулях.За Вас программу никто не напишет.
Python 3
Пример открытия страницы:

from urllib import urlopen
site = urlopen('http://python.su')
data = site.read() #html код

Пример скачки и сохранения файла:

from urllib import urlopen
site = urlopen('http://site.ru/music.mp3')
file = site.read()
save = open('music.mp3','wb')
save.write(file)
save.close()

Парсим ссылки:

from urllib import urlopen
import re
site = urlopen('http://site.ru')
html = site.read()
links = re.findall('<a href=['|"](.+?)['|"]>',html)

py.user.next · Дек. 27, 2011 08:02:47

murdoc
собсна хотелось бы подробней узнать что конкретно использовать из модулей urllib и re

есть ещё модуль html (htmllib) для разбора тегов

Отредактировано (Дек. 27, 2011 08:03:08)

murdoc · Дек. 27, 2011 20:52:25

спасибо, буду разбираться :)

Python-сообщество

Уведомления

#1 Дек. 25, 2011 13:20:39

urllib urllib2 Помогите пожалуйста

#2 Дек. 25, 2011 22:23:35

urllib urllib2 Помогите пожалуйста

#3 Дек. 25, 2011 22:50:58

urllib urllib2 Помогите пожалуйста

#4 Дек. 26, 2011 16:00:25

urllib urllib2 Помогите пожалуйста

#5 Дек. 27, 2011 08:02:47

urllib urllib2 Помогите пожалуйста

#6 Дек. 27, 2011 20:52:25

urllib urllib2 Помогите пожалуйста

Board footer