Найти - Пользователи
Полная версия: urllib urllib2 Помогите пожалуйста
Начало » Web » urllib urllib2 Помогите пожалуйста
1
murdoc
такс, столкнулся со следующей задачей, есть сайт с кучей ссылок, мне нужно считать эти все ссылки в список, в дальнейшем планирую делать скачивание файла по одной из этих ссылок
как это можно организовать?
iBiZoNiX
А что у Вас собственно не выходит?
Используйте модуль urllib для открытия страниц и скачки файлов, а модуль re для парсинга ссылок.
murdoc
собсна хотелось бы подробней узнать что конкретно использовать из модулей urllib и re
iBiZoNiX
Ищите информацию по этих модулях.За Вас программу никто не напишет.
Python 3
Пример открытия страницы:
from urllib import urlopen
site = urlopen('http://python.su')
data = site.read() #html код
Пример скачки и сохранения файла:
from urllib import urlopen
site = urlopen('http://site.ru/music.mp3')
file = site.read()
save = open('music.mp3','wb')
save.write(file)
save.close()
Парсим ссылки:
from urllib import urlopen
import re
site = urlopen('http://site.ru')
html = site.read()
links = re.findall('<a href=['|"](.+?)['|"]>',html)
py.user.next
murdoc
собсна хотелось бы подробней узнать что конкретно использовать из модулей urllib и re
есть ещё модуль html (htmllib) для разбора тегов
murdoc
спасибо, буду разбираться :)
This is a "lo-fi" version of our main content. To view the full version with more information, formatting and images, please click here.
Powered by DjangoBB