Форум сайта python.su
Чем парсить сабж? Слышал, что можно через парсер xml.
Офлайн
BeautifulSoup, lxml.
Офлайн
А пример можно?
Офлайн
Смотри доки к ним.
Офлайн
Советую отдать предпочтение lxml - лучше справляется с невалидным html.
Офлайн
Че-то я совсем запутался. Как внутри документа повытаскивать из таблицы нужные поля?
Офлайн
1. Пример файла (хотя бы фрагмент) не помешал бы
2. Критерии, по которым можно отличить “нужные” поля от “ненужных”
Офлайн
Парсить html надо через html5lib.
Офлайн
Пример - http://www.wcg.com/6th/replay/replay_list_2010.asp?dbcodeno=0&evtno=2010&itemno=G100308101&natno=0&entryno=0 . Нужны как минимум первая и ссылки из последней колонки (которые javascript:winOpens();)
Отредактировано (Окт. 30, 2010 13:03:20)
Офлайн