DjangoBB LoFi version

Полная версия: urllib urllib2 Помогите пожалуйста

Начало » Web » urllib urllib2 Помогите пожалуйста

murdoc

Дек. 25, 2011 13:20:39

такс, столкнулся со следующей задачей, есть сайт с кучей ссылок, мне нужно считать эти все ссылки в список, в дальнейшем планирую делать скачивание файла по одной из этих ссылок
как это можно организовать?

iBiZoNiX

Дек. 25, 2011 22:23:35

А что у Вас собственно не выходит?
Используйте модуль urllib для открытия страниц и скачки файлов, а модуль re для парсинга ссылок.

murdoc

Дек. 25, 2011 22:50:58

собсна хотелось бы подробней узнать что конкретно использовать из модулей urllib и re

iBiZoNiX

Дек. 26, 2011 16:00:25

Ищите информацию по этих модулях.За Вас программу никто не напишет.
Python 3
Пример открытия страницы:

from urllib import urlopen
site = urlopen('http://python.su')
data = site.read() #html код

Пример скачки и сохранения файла:

from urllib import urlopen
site = urlopen('http://site.ru/music.mp3')
file = site.read()
save = open('music.mp3','wb')
save.write(file)
save.close()

Парсим ссылки:

from urllib import urlopen
import re
site = urlopen('http://site.ru')
html = site.read()
links = re.findall('<a href=['|"](.+?)['|"]>',html)

py.user.next

Дек. 27, 2011 08:02:47

murdoc
собсна хотелось бы подробней узнать что конкретно использовать из модулей urllib и re

есть ещё модуль html (htmllib) для разбора тегов

murdoc

Дек. 27, 2011 20:52:25

спасибо, буду разбираться :)