Найти - Пользователи
Полная версия: Как извлечь текст из тегов с помощью ElementTree
Начало » Python для новичков » Как извлечь текст из тегов с помощью ElementTree
1
Noober
Есть у меня XML-файл:
<class id="1" name="good/bad">
    <verb>
        <token>like</token>
        <token>feel</token>
    </verb>
    <mess>This is <sugg>not</sugg> text</mess>
    <id type="incorrect">I'm glad to <marker>unsee you</marker>.</id>
    <id type="correct">I'm glad to see you.</id>
</class>
Мне нужно извлечь текст из определенных тэгов. На http://effbot.org как-то примеров негусто и вообще документация бедная. Может, есть где-то хорошие примеры? И как мне реализовать текст в одинаковых тегах (token) как отдельные объекты? Спасибо заранее! Результат примерно должно быть следующим:
(like) feel > not #This is not text
fata1ex
Чем неугодила официальная документация? Или это, или это. Можете попробовать lxml.
lorien
lxml:
tree.xpath('//mess').text_content()

ElementTreee:
''.join(tree.xpath('//mess//text()'))
This is a "lo-fi" version of our main content. To view the full version with more information, formatting and images, please click here.
Powered by DjangoBB