Уведомления

Группа в Telegram: @pythonsu

#1 Авг. 11, 2006 10:03:59

Mielofon
От:
Зарегистрирован: 2006-08-08
Сообщения: 5
Репутация: +  0  -
Профиль   Отправить e-mail  

HTTPS в Python 2.4 под WinXP

slivlen
Mielofon

Мне надо залогинится на странице URL0 и последовательно скачать 2 страницы URL1 и URL2.
А оно в результате постоянно redirectit :-( :
skip
Если честно, то доконца не вникал в твой код, поэтому могу ошибаться, но в предпоследнем ответе сервер выдает тебе куки с идентификатором сессии, при следующем запросе попробуй отослать этот куки ему обратно.
Оно самое.. Спасибо..

Следующий вопрос: чем парсить полученый HTML? Или просто RE использовать?



Офлайн

#2 Авг. 11, 2006 11:54:05

slav0nic
Команда
От: dp.ua
Зарегистрирован: 2006-05-07
Сообщения: 2260
Репутация: +  41  -
Профиль   Отправить e-mail  

HTTPS в Python 2.4 под WinXP

htmllib

Офлайн

#3 Авг. 12, 2006 14:27:31

j2a
От:
Зарегистрирован: 2006-06-29
Сообщения: 869
Репутация: +  1  -
Профиль   Отправить e-mail  

HTTPS в Python 2.4 под WinXP

Зависит от задачи. htmllib уже советовали. Можно еще pullparser и beautifulsoup посмотреть.

А вообще, неужели ты сам не можешь набрать в гугле python html parser, посмотреть первые 10 ссылок и выбрать подходящее? Вот если бы ты задал вопрос не “Чем можно html парсить?”, а “Мне из html взять такие-то данные, пример html лежит вон там. Я посмотрел htmllib, pullparser и beautifulsoup, но не знаю, что подойдет больше к такой задаче. Подскажите пожалуйста” и создал бы в отдельной ветке, то сразу было бы видно, что человек изучил вопрос, но ему нужно помочь определиться с выбором. А так… возникает впечатление, что ты не читал стандартной документации и не использовал гугл. Ну и ответы были бы, конечно, совсем другие…

P.S. Ну и тема “распарсить hmtl” весьма слабо связана с названием темы…



Отредактировано (Авг. 12, 2006 14:38:13)

Офлайн

Board footer

Модераторировать

Powered by DjangoBB

Lo-Fi Version