Уведомления

Группа в Telegram: @pythonsu

#1 Июнь 19, 2012 00:25:21

Noober
Зарегистрирован: 2012-06-19
Сообщения: 1
Репутация: +  0  -
Профиль   Отправить e-mail  

Как извлечь текст из тегов с помощью ElementTree

Есть у меня XML-файл:

<class id="1" name="good/bad">
    <verb>
        <token>like</token>
        <token>feel</token>
    </verb>
    <mess>This is <sugg>not</sugg> text</mess>
    <id type="incorrect">I'm glad to <marker>unsee you</marker>.</id>
    <id type="correct">I'm glad to see you.</id>
</class>
Мне нужно извлечь текст из определенных тэгов. На http://effbot.org как-то примеров негусто и вообще документация бедная. Может, есть где-то хорошие примеры? И как мне реализовать текст в одинаковых тегах (token) как отдельные объекты? Спасибо заранее! Результат примерно должно быть следующим:
(like) feel > not #This is not text

Отредактировано Noober (Июнь 19, 2012 00:37:20)

Офлайн

#2 Июнь 19, 2012 05:49:47

fata1ex
От:
Зарегистрирован: 2009-07-11
Сообщения: 732
Репутация: +  52  -
Профиль   Отправить e-mail  

Как извлечь текст из тегов с помощью ElementTree

Чем неугодила официальная документация? Или это, или это. Можете попробовать lxml.



Отредактировано fata1ex (Июнь 19, 2012 05:54:08)

Офлайн

#3 Июнь 19, 2012 08:32:37

lorien
От:
Зарегистрирован: 2006-08-20
Сообщения: 755
Репутация: +  37  -
Профиль  

Как извлечь текст из тегов с помощью ElementTree

lxml:
tree.xpath('//mess').text_content()

ElementTreee:
''.join(tree.xpath('//mess//text()'))

Офлайн

Board footer

Модераторировать

Powered by DjangoBB

Lo-Fi Version