Форум сайта python.su
0
Решил автоматизировать закачку любимых сериалов, но уперся в проблему закачки страницы.
В общем код:
from grab import Grab from grab.tools.logs import default_logging from grab.tools import rex import re default_logging('/home/user/webgrab/my_log.txt') g = Grab(log_file='/home/user/webgrab/grab.txt') g.go('http://www.lostfilm.tv/rssdd.xml') f=open('/home/user/webgrab/grab.txt').read() links = rex.rex_text_list(f, '<link>(http:.+?720p.+?\.torrent)<\/link>') # Тут все гуд, на выходе получаем ссылки типа: # http://lostfilm.tv/download.php?id=4668&Castle.S04E20.720p.rus.LostFilm.TV.torrent # и это не торрент файл, а html страница. g2 = Grab(log_dir='/home/user/webgrab/', log_file='/home/user/webgrab/grab2.txt', nobody=False, hammer_mode=True, debug_post=True) g2.setup(reuse_cookies=True, userpwd='my_user_name:my_password', charset='windows-1251') my_url=links[0] g2.go('my_url)
Отредактировано nauman (Апрель 11, 2012 14:37:21)
Офлайн
15
nauman
Response:
HTTP/1.1 200 OK
Server: nginx
Date: Wed, 11 Apr 2012 11:32:48 GMT
Content-Type: text/html; charset=windows-1251
Transfer-Encoding: chunked
Connection: keep-alive
Keep-Alive: timeout=10
Vary: Accept-Encoding
X-Powered-By: PHP/5.3.10
Refresh: 0; url=/details.php?id=4668
Content-Encoding: gzip
Офлайн
0
plusplushttp://lostfilm.tv/download.php?id=4668, пробовал вручную эффект тотже, страница в текстовый файл не загружается.
Парси эту строчку вручную из заголовков и переходи по ней.
Отредактировано nauman (Апрель 11, 2012 18:52:01)
Офлайн
15
naumanplusplushttp://lostfilm.tv/download.php?id=4668, пробовал вручную эффект тотже, страница в текстовый файл не
Парси эту строчку вручную из заголовков и переходи по ней.
g = Grab()
url = "http://lostfilm.tv/details.php?id=4668"
g.go(url)
print g.response.body
Офлайн
0
Вы правы, если через print, то работает. Через log_file не работает.
Сдедующий затык, грубо говоря, ссылка на всплывающее окно, джава скрипт, с которого можно скачать торрент: <a href="javascript:{}
Вот тут наверное понадобится загрузка через webkit. Как можно сделать вывод в файл, вместо графического отображения?
Спасибо.
Отредактировано nauman (Апрель 11, 2012 20:36:34)
Офлайн
1
nauman
запустите какой-нибудь firebug или webkit developer tools (в хроме) и посмотрите, куда, какие запросы шлются. Javascript наверняка ходит по известному урлу и отсылает какие-то данные со страницы, которые вы также можете достать и отправить
Офлайн