Уведомления

Группа в Telegram: @pythonsu

#1 Янв. 22, 2013 11:22:20

svas
От:
Зарегистрирован: 2010-01-27
Сообщения: 239
Репутация: +  9  -
Профиль   Отправить e-mail  

BeautifulSoup, xml, не парсится файл в кодировке windows-1251

Код

from bs4 import BeautifulSoup as BS
xmldata = open('test.xml').read()
bs = BS(xmldata, 'xml')
print bs

Выводит только
<?xml version="1.0" encoding="utf-8"?>

Понять не могу почему. Xml вроде валидный.



Прикреплённый файлы:
attachment test.xml (171 байт)

Офлайн

#2 Янв. 23, 2013 22:32:07

lorien
От:
Зарегистрирован: 2006-08-20
Сообщения: 755
Репутация: +  37  -
Профиль  

BeautifulSoup, xml, не парсится файл в кодировке windows-1251

Выкинуть суп, использовать lxml + xpath

Офлайн

Board footer

Модераторировать

Powered by DjangoBB

Lo-Fi Version