← Сtrl

Mielofon · Авг. 11, 2006 10:03:59

slivlen
Mielofon
…
Мне надо залогинится на странице URL0 и последовательно скачать 2 страницы URL1 и URL2.
А оно в результате постоянно redirectit :-( :
skip
Если честно, то доконца не вникал в твой код, поэтому могу ошибаться, но в предпоследнем ответе сервер выдает тебе куки с идентификатором сессии, при следующем запросе попробуй отослать этот куки ему обратно.

Оно самое.. Спасибо..

Следующий вопрос: чем парсить полученый HTML? Или просто RE использовать?

slav0nic · Авг. 11, 2006 11:54:05

htmllib

tg : https://t.me/slav0nic

j2a · Авг. 12, 2006 14:27:31

Зависит от задачи. htmllib уже советовали. Можно еще pullparser и beautifulsoup посмотреть.

А вообще, неужели ты сам не можешь набрать в гугле python html parser, посмотреть первые 10 ссылок и выбрать подходящее? Вот если бы ты задал вопрос не “Чем можно html парсить?”, а “Мне из html взять такие-то данные, пример html лежит вон там. Я посмотрел htmllib, pullparser и beautifulsoup, но не знаю, что подойдет больше к такой задаче. Подскажите пожалуйста” и создал бы в отдельной ветке, то сразу было бы видно, что человек изучил вопрос, но ему нужно помочь определиться с выбором. А так… возникает впечатление, что ты не читал стандартной документации и не использовал гугл. Ну и ответы были бы, конечно, совсем другие…

P.S. Ну и тема “распарсить hmtl” весьма слабо связана с названием темы…

Отредактировано (Авг. 12, 2006 14:38:13)

Python-сообщество

Уведомления

#1 Авг. 11, 2006 10:03:59

HTTPS в Python 2.4 под WinXP

#2 Авг. 11, 2006 11:54:05

HTTPS в Python 2.4 под WinXP

#3 Авг. 12, 2006 14:27:31

HTTPS в Python 2.4 под WinXP

Board footer