Найти - Пользователи
Полная версия: Html parser
Начало » Python для новичков » Html parser
1
derevo
Привет, есть такая задача, взять html страничку и распарсить ее по тэгам.


на выходе например массив с индексом из найденного тэга и его содердимое.

<html>
data
</html>

<title>
data
</title>



подскажите пожалуйста с поощью чего это можно сделать быстрее, пока я разглядываю HTMLParser.

вот еще на BeautifulSoup наткнулся…

и еще html5lib

кто что посоветует из этого?
anyNeT
http://docs.python.org/library/htmllib.html
derevo
anyNeT
я гуглил уже спасибо…

все это читал, хочу мнение живого человека услышать
Ferroman
Вообще-то это был ответ.
derevo
понятно…

там еще вторая часть вопроса была

HTMLParser
BeautifulSoup
html5lib

кто что скажет про них, какие впечатления?
derevo
Андрей Светлов
спасибо, это именно то что я искал
sypper-pit
в Zope есть модули для парсинга
This is a "lo-fi" version of our main content. To view the full version with more information, formatting and images, please click here.
Powered by DjangoBB