Форум сайта python.su
Здравствуйте!
Подскажите пожалуйста метод реализации парсера заполняющего вот эту форму где поле hidden проверяется сервером.
Как сохранить сессию при написании парсера.
если можно примеры кода.
Обычные сайты получается парсить без проблем.
form action="/voterlist/search" method="get"> <ul> <li> <label for="first_name">фамилия:*</label> <input type="text" name="query[first_name]" id="first_name" value="" /> </li> <li> <label for="last_name">имя:</label> <input type="text" name="query[last_name]" id="last_name" value="" /> </li> <li> <label for="middle_name">отчество:</label> <input type="text" name="query[middle_name]" id="middle_name" value="" /> </li> <li> <label for="region_id">область/город:</label> <select name="filters[region_id]" id="region_id"> <option value="">все регионы</option> </select> </li> <li> <label for="tec_id"><abbr title="UIK">ITN</abbr>:</label> <select name="filters[tec_id]" id="tec_id"></select> </li> <li> <label for="pec_id"><abbr title="IT">IT</abbr>:</label> <select name="filters[pec_id]" id="pec_id"></select> </li> <li class="small"> <small>* Поле должно быть заполнено</small> </li> <li> <button type="submit" class="" title="искать">ПОИСК</button> </li> <li> </li> </ul> <div class="clear"></div> <input type="hidden" name="filters[token]" value="95327126348ee87e381557363217cf9a4d55895d" /> </form>
Офлайн
В чем именно проблема? В получении значения hidden?
Его несложно вытащить используя регулярные выражения. Можно использовать lxml и html5lib, но если я правильно понял твой вопрос, то это избыточные средства.
Офлайн