Уведомления

Группа в Telegram: @pythonsu

#1 Июль 11, 2009 05:27:31

derevo
От:
Зарегистрирован: 2009-07-11
Сообщения: 5
Репутация: +  0  -
Профиль   Отправить e-mail  

Html parser

Привет, есть такая задача, взять html страничку и распарсить ее по тэгам.


на выходе например массив с индексом из найденного тэга и его содердимое.

<html>
data
</html>

<title>
data
</title>



подскажите пожалуйста с поощью чего это можно сделать быстрее, пока я разглядываю HTMLParser.

вот еще на BeautifulSoup наткнулся…

и еще html5lib

кто что посоветует из этого?



Отредактировано (Июль 11, 2009 06:31:24)

Офлайн

#2 Июль 11, 2009 08:59:47

anyNeT
От:
Зарегистрирован: 2009-05-11
Сообщения: 39
Репутация: +  0  -
Профиль   Отправить e-mail  

Офлайн

#3 Июль 11, 2009 10:12:25

derevo
От:
Зарегистрирован: 2009-07-11
Сообщения: 5
Репутация: +  0  -
Профиль   Отправить e-mail  

Html parser

anyNeT
я гуглил уже спасибо…

все это читал, хочу мнение живого человека услышать



Офлайн

#4 Июль 11, 2009 12:40:31

Ferroman
От:
Зарегистрирован: 2006-11-16
Сообщения: 2759
Репутация: +  1  -
Профиль   Отправить e-mail  

Html parser

Вообще-то это был ответ.

Офлайн

#5 Июль 11, 2009 14:25:19

derevo
От:
Зарегистрирован: 2009-07-11
Сообщения: 5
Репутация: +  0  -
Профиль   Отправить e-mail  

Html parser

понятно…

там еще вторая часть вопроса была

HTMLParser
BeautifulSoup
html5lib

кто что скажет про них, какие впечатления?



Офлайн

#6 Июль 11, 2009 15:45:07

Андрей Светлов
От:
Зарегистрирован: 2007-05-15
Сообщения: 3137
Репутация: +  14  -
Профиль   Адрес электронной почты  

Офлайн

#7 Июль 12, 2009 06:32:35

derevo
От:
Зарегистрирован: 2009-07-11
Сообщения: 5
Репутация: +  0  -
Профиль   Отправить e-mail  

Html parser

Андрей Светлов
спасибо, это именно то что я искал



Офлайн

#8 Июль 13, 2009 20:09:15

sypper-pit
От: Ulan-Ude(msk)
Зарегистрирован: 2009-01-30
Сообщения: 1102
Репутация: +  6  -
Профиль   Отправить e-mail  

Html parser

в Zope есть модули для парсинга

Офлайн

Board footer

Модераторировать

Powered by DjangoBB

Lo-Fi Version