целевой юрл site
и записать в файл
файл в формате:
номер в реестре БГ;Наименование заказчика-бенефициара;дата размещения;сумма
Пример:
Номер БГ
<a href="/epz/bankguarantee/guaranteeCard/generalInformation.html?guaranteeId=756371" target="_blank">05W1253616473416006402</a>
Как можно спарсить анкор ссылки по маске ="/epz/bankguarantee/guaranteeCard/generalInformation.html?guaranteeId*?
Наименование заказчика-бенефициара
<dd> Наименование заказчика-бенефициара: </dd> <dd> <a href="http://old.zakupki.gov.ru/controls/public/action/organization/view?source=epz&organizationCode=03201000316" onclick="window.open(this.href); return false;" target="_blank" title="ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ КАЗЕННОЕ УЧРЕЖДЕНИЕ "ПОГРАНИЧНОЕ УПРАВЛЕНИЕ ФЕДЕРАЛЬНОЙ СЛУЖБЫ БЕЗОПАСНОСТИ РОССИЙСКОЙ ФЕДЕРАЦИИ ПО ПРИМОРСКОМУ КРАЮ""> ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ КАЗЕННОЕ УЧРЕЖДЕНИЕ "ПОГРАНИЧНОЕ УПРАВЛЕНИЕ ФЕДЕРАЛЬНОЙ СЛУЖБЫ БЕЗОПАСНОСТИ РОССИЙСКОЙ ФЕДЕРАЦИИ ПО ПРИМОРСКОМУ КРАЮ" </a> </dd>
Тут я не пойму как можно однозначно определить
ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ КАЗЕННОЕ УЧРЕЖДЕНИЕ “ПОГРАНИЧНОЕ УПРАВЛЕНИЕ ФЕДЕРАЛЬНОЙ СЛУЖБЫ БЕЗОПАСНОСТИ РОССИЙСКОЙ ФЕДЕРАЦИИ ПО ПРИМОРСКОМУ КРАЮ”
дата размещения
Блок с датой
<td colspan="2" class="publishingTd"> <ul class="publishing"> <li>Обновлено:</li> <li class="publishingDate">13.09.2016</li> <li>Размещено:</li> <li class="publishingDate">13.09.2016</li> </ul> </td>
Как мне вытащить 13.09.2016?
Сумма находится в блоке
<td class="amountTenderTd"> <p> <a style="text-decoration:none;" href="/epz/bankguarantee/printForm/view.html?printFormId=102343" target="_blank"> <span class="printBtn"></span> </a> <a href="/epz/bankguarantee/signview/list.html?printFormId=102343" class="linkPopUp ezp addBtn"></a> <a href="/epz/bankguarantee/extract/view.html?guaranteeId=72149" target="_blank"> <span class="orderingBtn"></span> </a> </p> <dl> <dt> 441 000,00 </dt> <dd>Российский рубль</dd> </dl>
Тут тоже пока нету мыслей, как спарсить ее