Берем текст из xml и получаем вот такую бяку
u'\u0422\u0435\u043c\u0430
когда делаем
text.encode('cp1251')
получаем такое:
\xd2\xe5\xec\xe0
как достать текст с кодировкой cp1251 ?
Dimka665а как сделать из него читабельный текст?
это и есть текст в кодировке cp1251.
просто \xd2\xe5\xec\xe0 - представление текста ascii-символами.
>>> i = u'\u0422\u0435\u043c\u0430'
>>> print i
Тема
expeeа как если текст находиться в переменной?>>> i = u'\u0422\u0435\u043c\u0430'
>>> print i
Тема
SergeyА в моем коде он в чем находится?
а как если текст находиться в переменной?
expeeсорри за школьные вопросы, но все жеSergeyА в моем коде он в чем находится?
а как если текст находиться в переменной?
response = urllib.urlopen(url)
element = ET.XML(response.read())
info = []
for subelement in element:
if subelement.tag=="tcy":
info.append(subelement.attrib["value"])
print info
Sergeyесли у вас выходит
Берем текст из xml и получаем вот такую бяку
u'\u0422\u0435\u043c\u0430
когда делаем
text.encode('cp1251')
получаем такое:
\xd2\xe5\xec\xe0
как достать текст с кодировкой cp1251 ?
u'\u0422\u0435\u043c\u0430
'
>>> info = '\xd2\xe5\xec\xe0'
>>> print info.decode('cp1251')
Тема
>>> info = u'\u0422\u0435\u043c\u0430'
>>> print info
Тема
>>> print info.encode('cp1251')
╥хьр
>>> poi = info.encode('cp1251')
>>> poi.decode('cp1251')
u'\u0422\u0435\u043c\u0430'
>>> print poi.decode('cp1251')
Тема
>>>