Форум сайта python.su
							
  0  
								
								Привет, есть такая задача, взять html страничку и распарсить ее по тэгам.
на выходе например массив с индексом из найденного тэга и его содердимое. 
<html>
data
</html>
<title>
data
</title>
…
подскажите пожалуйста с поощью чего это можно сделать быстрее, пока я разглядываю HTMLParser.
вот еще на BeautifulSoup наткнулся…
и еще html5lib 
кто что посоветует из этого?
Отредактировано (Июль 11, 2009 06:31:24)
Офлайн
							
  0  
								
								Офлайн
							
  0  
								
								anyNeTя гуглил уже спасибо…
Офлайн
							
  1  
								
								Вообще-то это был ответ.
Офлайн
							
  0  
								
								понятно…
там еще вторая часть вопроса была
HTMLParser
BeautifulSoup
html5lib
кто что скажет про них, какие впечатления?
Офлайн
							
  14  
								
								Офлайн
							
  0  
								
								Андрей Светловспасибо, это именно то что я искал
Офлайн
							
  6  
								
								в Zope есть модули для парсинга
Офлайн