Найти - Пользователи
Полная версия: Парсинг html
Начало » Python для новичков » Парсинг html
1
asilyator
Чем парсить сабж? Слышал, что можно через парсер xml.
certanista
BeautifulSoup, lxml.
asilyator
А пример можно?
certanista
Смотри доки к ним.
mrzaggi
Советую отдать предпочтение lxml - лучше справляется с невалидным html.
asilyator
Че-то я совсем запутался. Как внутри документа повытаскивать из таблицы нужные поля?
Alex977
1. Пример файла (хотя бы фрагмент) не помешал бы
2. Критерии, по которым можно отличить “нужные” поля от “ненужных”
Александр Кошелев
Парсить html надо через html5lib.
asilyator
Пример - http://www.wcg.com/6th/replay/replay_list_2010.asp?dbcodeno=0&evtno=2010&itemno=G100308101&natno=0&entryno=0 . Нужны как минимум первая и ссылки из последней колонки (которые javascript:winOpens();)
This is a "lo-fi" version of our main content. To view the full version with more information, formatting and images, please click here.
Powered by DjangoBB