Найти - Пользователи
Полная версия: как скачать страницу http://www.gismeteo.ru/ и указать откуда пришли.
Начало » Network » как скачать страницу http://www.gismeteo.ru/ и указать откуда пришли.
1 2
qman
Всем привет!
если со страницы
http://www.gismeteo.ru/city/legacy/?city=4478&shift=2
открыть версию для печати
http://www.gismeteo.ru/ajax/print/4478/short/2
то все ок.
но если wget ом скачать
http://www.gismeteo.ru/ajax/print/4478/short/2
то получаю
Sorry, print page aviable only from gismeteo web-site!
Подскажите можно с помощью питона как то попробовать обойти такую проверку?
Можно ли в urllib2 указать адрес откуда пришли?
Или посоветуйте другой путь.
Всем спасибо
dartNNN
Я ща точно не скажу, но однозначно видел в википедии, что можно в заголовке HTTP указать откуда был переход (т.е. с gismeteo web-site в данном случае). Можно покопать в этом направлении
igor.kaist
эээ… API у gismeteo.ru не хватает?
Отдает погоду в XML, сам этим пользуюсь…
truporez
qman
Можно ли в urllib2 указать адрес откуда пришли?
Это называется Referer и его надо добавлять в заголовок запроса. Смотрите в сторону urllib2.build_opener, addheaders.
qman
dartNNN
И зачем я дурак на 3-ем питоне пишу?
да, кстати посвятите как там на третьем питоне работается?
qman
igor.kaist
эээ… API у gismeteo.ru не хватает?
Отдает погоду в XML, сам этим пользуюсь…
спасибо за наводку на XML, но я раньше wget качал еще картинки! А в XML не нашел ссылок на картинки! Или я чего то не до понимаю.
igor.kaist
qman
А в XML не нашел ссылок на картинки! Или я чего то не до понимаю.
ну обрабатывайте xml и делайте с данными все что хочется, можете и сами эти картинки нарисовать (с помощью PIL, например).
dartNNN
qman
да, кстати посвятите как там на третьем питоне работается?
Ну как сказать, многие вещи очень интересны и удобны.
Работа со строками (полный переход на юникод - путь в светлое будущее :))
По новому можно создавать словари. Не критично, но удобно.
Вобщем много мелочей, мне лично нравится, но вот с модулями проблема большая. Так под убунту так и не смог завести PyQt, про другие модули вообще молчу. Думал попробовать создание сайтов попрактиковать, посмотрел на Django, как на самый популярный вариант, а он только для второго питона. Вобщем грустно… Но к тому времни как более менее изучу питон, надеюсь ситуация уже изменится
qman
Для тех кому интересно
import urllib2
proxy_support = urllib2.ProxyHandler({'http' : 'http://proxy:5865/'})
opener = urllib2.build_opener(proxy_support)
opener.addheaders = [('Referer', 'http://www.gismeteo.ru/')]
w0id
Или вот так:

import urllib2

req = urllib2.Request("http://www.gismeteo.ru/ajax/print/4478/short/2")
req.add_header("Referer", "http://www.gismeteo.ru/")
source = urllib2.urlopen(req).read()
This is a "lo-fi" version of our main content. To view the full version with more information, formatting and images, please click here.
Powered by DjangoBB