Форум сайта python.su
grapefruit_oceanимхо XPath проще и быстрее
Справилась таким образом:
from lxml import html,etree doc=''' <html> <body> <span lang = "az"> ... </span> <div> … </div> <table><tr><td>11</td><td>12</td><td>13</td></tr></table> <table><tr><td>21</td><td>22</td><td>23</td></tr></table> <span lang = "en"> … </span> <table><tr><td>31</td><td>32</td><td>33</td></tr></table> <table></table> </body> </html> ''' def get_html(file_name): return html.fromstring(file_name) def get_tags(tree,tag): return tree.xpath(tag) tree = get_html(doc) tags = get_tags(tree,'//table[position() < 3]/tr') for i in tags: for j in i: print '\t',j.text, print
Отредактировано vic57 (Май 20, 2017 22:31:28)
Офлайн
grapefruit_ocean1. Нужно зайти в родительский элемент.
Мне нужно извлечь таблицу (или таблицы, если их несколько), которые находятся между двумя тегами <span>. Все теги находятся на одном уровне.
Подскажите, пожалуйста, как это сделать?
Офлайн