Уведомления

Группа в Telegram: @pythonsu

#1 Апрель 21, 2015 10:10:43

zerocool
Зарегистрирован: 2015-04-21
Сообщения: 1
Репутация: +  0  -
Профиль   Отправить e-mail  

Парсер web сервера

Здравствуйте!
Подскажите пожалуйста метод реализации парсера заполняющего вот эту форму где поле hidden проверяется сервером.
Как сохранить сессию при написании парсера.
если можно примеры кода.
Обычные сайты получается парсить без проблем.

form action="/voterlist/search" method="get">
      <ul>
         <li>
            <label for="first_name">фамилия:*</label>
            <input type="text" name="query[first_name]" id="first_name" value="" />
         </li>
         <li>
            <label for="last_name">имя:</label>
            <input type="text" name="query[last_name]" id="last_name" value="" />
         </li>
         <li>
            <label for="middle_name">отчество:</label>
            <input type="text" name="query[middle_name]" id="middle_name" value="" />
         </li>
         <li>
            <label for="region_id">область/город:</label>
            <select name="filters[region_id]" id="region_id">
               <option value="">все регионы</option>
                          
                        </select>
         </li>
         <li>
            <label for="tec_id"><abbr title="UIK">ITN</abbr>:</label>
            <select name="filters[tec_id]" id="tec_id"></select>
         </li>
         <li>
            <label for="pec_id"><abbr title="IT">IT</abbr>:</label>
            <select name="filters[pec_id]" id="pec_id"></select>
         </li>
         <li class="small">
            <small>* Поле должно быть заполнено</small>
         </li>
         <li>
            <button type="submit" class="" title="искать">ПОИСК</button>
         </li>
         <li>&nbsp;</li>
      </ul>
      <div class="clear"></div>
      <input type="hidden" name="filters[token]" value="95327126348ee87e381557363217cf9a4d55895d" />
   </form>

Офлайн

#2 Апрель 25, 2015 18:52:52

Psixo
От:
Зарегистрирован: 2007-09-12
Сообщения: 113
Репутация: +  0  -
Профиль   Отправить e-mail  

Парсер web сервера

В чем именно проблема? В получении значения hidden?

Его несложно вытащить используя регулярные выражения. Можно использовать lxml и html5lib, но если я правильно понял твой вопрос, то это избыточные средства.



Офлайн

Board footer

Модераторировать

Powered by DjangoBB

Lo-Fi Version