Форум сайта python.su
0
Есть вот такой HTML:
<div class="char c0 first "> <div class="characteristic">Серия </div> <div class="value"> ProLiant </div> <div class="clear"/> </div> <div class="char c1 "> <div class="characteristic">Тип корпуса </div> <div class="value"> Rack </div> <div class="clear"/> </div> <div class="char c0 "> <div class="characteristic">Монтаж в стойку </div> <div class="value"> 2U </div> <div class="clear"/> </div> <div class="char c1 "> <div class="characteristic">Для процессоров </div> <div class="value"> Intel </div> <div class="clear"/> </div> <div class="char c0 "> <div class="characteristic">Серия процессора </div> <div class="value"> Xeon </div> <div class="clear"/> </div>
Офлайн
857
Напрямую через value
>>> import lxml.html >>> >>> s = """ ... <div class="char c0 first "> ... <div class="characteristic">Серия </div> ... <div class="value"> ProLiant </div> ... <div class="clear"/> ... </div> ... <div class="char c1 "> ... <div class="characteristic">Тип корпуса </div> ... <div class="value"> Rack </div> ... <div class="clear"/> ... </div> ... <div class="char c0 "> ... <div class="characteristic">Монтаж в стойку </div> ... <div class="value"> 2U </div> ... <div class="clear"/> ... </div> ... <div class="char c1 "> ... <div class="characteristic">Для процессоров </div> ... <div class="value"> Intel </div> ... <div class="clear"/> ... </div> ... <div class="char c0 "> ... <div class="characteristic">Серия процессора </div> ... <div class="value"> Xeon </div> ... <div class="clear"/> ... </div> ... """ >>> >>> doc = lxml.html.fromstring(s) >>> lst = doc.xpath(r'//div[@class="value"]/text()') >>> lst [' ProLiant ', ' Rack ', ' 2U ', ' Intel ', ' Xeon '] >>>
>>> import lxml.html >>> >>> s = """ ... <div class="char c0 first "> ... <div class="characteristic">Серия </div> ... <div class="value"> ProLiant </div> ... <div class="clear"/> ... </div> ... <div class="char c1 "> ... <div class="characteristic">Тип корпуса </div> ... <div class="value"> Rack </div> ... <div class="clear"/> ... </div> ... <div class="char c0 "> ... <div class="characteristic">Монтаж в стойку </div> ... <div class="value"> 2U </div> ... <div class="clear"/> ... </div> ... <div class="char c1 "> ... <div class="characteristic">Для процессоров </div> ... <div class="value"> Intel </div> ... <div class="clear"/> ... </div> ... <div class="char c0 "> ... <div class="characteristic">Серия процессора </div> ... <div class="value"> Xeon </div> ... <div class="clear"/> ... </div> ... """ >>> >>> doc = lxml.html.fromstring(s) >>> lst = doc.xpath(r'//div[@class="characteristic"]/following-sibling::div/text()') >>> lst [' ProLiant ', ' Rack ', ' 2U ', ' Intel ', ' Xeon '] >>>
Отредактировано py.user.next (Март 11, 2016 13:33:00)
Офлайн