Форум сайта python.su
slivlenОно самое.. Спасибо..MielofonЕсли честно, то доконца не вникал в твой код, поэтому могу ошибаться, но в предпоследнем ответе сервер выдает тебе куки с идентификатором сессии, при следующем запросе попробуй отослать этот куки ему обратно.
…
Мне надо залогинится на странице URL0 и последовательно скачать 2 страницы URL1 и URL2.
А оно в результате постоянно redirectit :-( :
skip
Офлайн
htmllib
Офлайн
Зависит от задачи. htmllib уже советовали. Можно еще pullparser и beautifulsoup посмотреть.
А вообще, неужели ты сам не можешь набрать в гугле python html parser, посмотреть первые 10 ссылок и выбрать подходящее? Вот если бы ты задал вопрос не “Чем можно html парсить?”, а “Мне из html взять такие-то данные, пример html лежит вон там. Я посмотрел htmllib, pullparser и beautifulsoup, но не знаю, что подойдет больше к такой задаче. Подскажите пожалуйста” и создал бы в отдельной ветке, то сразу было бы видно, что человек изучил вопрос, но ему нужно помочь определиться с выбором. А так… возникает впечатление, что ты не читал стандартной документации и не использовал гугл. Ну и ответы были бы, конечно, совсем другие…
P.S. Ну и тема “распарсить hmtl” весьма слабо связана с названием темы…
Отредактировано (Авг. 12, 2006 14:38:13)
Офлайн