Форум сайта python.su
Привет, есть такая задача, взять html страничку и распарсить ее по тэгам.
на выходе например массив с индексом из найденного тэга и его содердимое.
<html>
data
</html>
<title>
data
</title>
…
подскажите пожалуйста с поощью чего это можно сделать быстрее, пока я разглядываю HTMLParser.
вот еще на BeautifulSoup наткнулся…
и еще html5lib
кто что посоветует из этого?
Отредактировано (Июль 11, 2009 06:31:24)
Офлайн
Офлайн
anyNeTя гуглил уже спасибо…
Офлайн
Вообще-то это был ответ.
Офлайн
понятно…
там еще вторая часть вопроса была
HTMLParser
BeautifulSoup
html5lib
кто что скажет про них, какие впечатления?
Офлайн
Офлайн
Андрей Светловспасибо, это именно то что я искал
Офлайн
в Zope есть модули для парсинга
Офлайн