Уведомления

Группа в Telegram: @pythonsu

#1 Июнь 2, 2009 12:54:26

Newbie
От:
Зарегистрирован: 2009-03-02
Сообщения: 19
Репутация: +  0  -
Профиль   Отправить e-mail  

Beautiful Soup и позиционные проверки

Как организовать что-то типа позиционной проверки в Beautiful Soup? Мне нужно инфу между уникальными html тегами выдернуть с веб-страницы. И еще, может кто знает где хороший справочник по Beautiful Soup найти? Очень надо.



Офлайн

#2 Июнь 2, 2009 14:06:03

Ferroman
От:
Зарегистрирован: 2006-11-16
Сообщения: 2759
Репутация: +  1  -
Профиль   Отправить e-mail  

Beautiful Soup и позиционные проверки

Можно использовать регекспы.
Но можно и через суп:
Пример

from BeautifulSoup import BeautifulSoup
import re
hello = "Hello! <!--I've got to be nice to get what I want.-->"
commentSoup = BeautifulSoup(hello)
comment = commentSoup.find(text=re.compile("nice"))

comment.__class__
# <class 'BeautifulSoup.Comment'>
comment
# u"I've got to be nice to get what I want."
comment.previousSibling
# u'Hello! '

str(comment)
# "<!--I've got to be nice to get what I want.-->"
print commentSoup
# Hello! <!--I've got to be nice to get what I want.-->

Офлайн

#3 Июнь 5, 2009 14:02:04

Yurietc
От:
Зарегистрирован: 2007-07-18
Сообщения: 112
Репутация: +  0  -
Профиль   Отправить e-mail  

Beautiful Soup и позиционные проверки

Можно так :

>>> from BeautifulSoup import BeautifulSoup as BS
>>> s='<html><body>qwqe<some_tag>what we want</some_tag>qweqweqsdsvdv</body></html>'
>>> so=BS(s)
>>> print so.some_tag
<some_tag>what we want</some_tag>
Документацию я находил только эту : http://www.crummy.com/software/BeautifulSoup/documentation.html



Офлайн

Board footer

Модераторировать

Powered by DjangoBB

Lo-Fi Version