Найти - Пользователи
Полная версия: Извлечь определённый текст из тега
Начало » Data Mining » Извлечь определённый текст из тега
1
Endlessnonstop
Имеется:
 [<ul class="item-params-list">
<li class="item-params-list-item">
<span class="item-params-label">Коробка передач: </span>механика
 </li>
<li class="item-params-list-item">
<span class="item-params-label">VIN или номер кузова: </span>XWB4A11E*DA****16
 </li>
<li class="item-params-list-item">
<span class="item-params-label">Пробег: </span>42900 км
 </li>
<li class="item-params-list-item">
<span class="item-params-label">Мощность двигателя: </span>50 л.с.
 </li>
<li class="item-params-list-item">
<span class="item-params-label">Количество дверей: </span>5
 </li>
<li class="item-params-list-item">
<span class="item-params-label">Владельцев по ПТС: </span>1
 </li>
<li class="item-params-list-item">
<span class="item-params-label">Состояние: </span>не битый
 </li>
<li class="item-params-list-item">
<span class="item-params-label">Тип двигателя: </span>бензин
 </li>
<li class="item-params-list-item">
<span class="item-params-label">Руль: </span>левый
 </li>
<li class="item-params-list-item">
<span class="item-params-label">Привод: </span>передний
 </li>
<li class="item-params-list-item">
<span class="item-params-label">Цвет: </span>серебряный
 </li>
<li class="item-params-list-item">
<span class="item-params-label">Объём двигателя: </span>0.8
 </li>
<li class="item-params-list-item">
<span class="item-params-label">Модель: </span>Matiz
 </li>
<li class="item-params-list-item">
<span class="item-params-label">Марка: </span>Daewoo
 </li>
<li class="item-params-list-item">
<span class="item-params-label">Год выпуска: </span>2012
 </li>
<li class="item-params-list-item">
<span class="item-params-label">Тип кузова: </span>хетчбэк
 </li>
</ul>]
Необходимо извлечь текст li с определённым span.Например, значение пробега. Как осуществить средствами BeautifulSoup? Всю голову уже сломал.
py.user.next
Сначала надо очистить всё от тегов, а потом уже разбирать. То есть в два этапа делаешь: сначала чистишь от тегов; затем полученный текст парсишь.
This is a "lo-fi" version of our main content. To view the full version with more information, formatting and images, please click here.
Powered by DjangoBB