derevo
Июль 11, 2009 05:27:31
Привет, есть такая задача, взять html страничку и распарсить ее по тэгам.
на выходе например массив с индексом из найденного тэга и его содердимое.
<html>
data
</html>
<title>
data
</title>
…
подскажите пожалуйста с поощью чего это можно сделать быстрее, пока я разглядываю HTMLParser.
вот еще на BeautifulSoup наткнулся…
и еще html5lib
кто что посоветует из этого?
derevo
Июль 11, 2009 10:12:25
anyNeT
я гуглил уже спасибо…
все это читал, хочу мнение живого человека услышать
derevo
Июль 11, 2009 14:25:19
понятно…
там еще вторая часть вопроса была
HTMLParser
BeautifulSoup
html5lib
кто что скажет про них, какие впечатления?
derevo
Июль 12, 2009 06:32:35
Андрей Светлов
спасибо, это именно то что я искал
sypper-pit
Июль 13, 2009 20:09:15
в Zope есть модули для парсинга