Форум сайта python.su
0
У меня есть xml, в котором есть русские символы. Когда я вывожу его на экран print xml русские символы не отображаются, вместо них печатается, что-то непонятное. Как это побороть?
Офлайн
14
Может выложишь, что именно тебе выводится, а то телепаты в отпуске.
Офлайн
0
odnochlen
Может выложишь, что именно тебе выводится, а то телепаты в отпуске.
Офлайн
61
Извечная проблема Виндаус и кодировки в терминале!
Смените кодировку в файле ХМЛ на cp866 и будет вам счастие.
Ну и погуглите на ту же тему !
Офлайн
14
В xml текст в кодировке utf8. Не знаю, зачем тебе его в читаемом виде выводить в консоль, но попробуй print xml.decode('utf8')
Офлайн
0
odnochlenЯ в дальнейшем его обрабатываю. Те поля, что по английски работают, а те, что с русскими символами - сбоят.
В xml текст в кодировке utf8. Не знаю, зачем тебе его в читаемом виде выводить в консоль, но попробуй print xml.decode('utf8')
import xml.dom.minidom import urllib f = urllib.urlopen('http://samstar.ucoz.ru/news/rss/') st= f.read() print f.read() print ">>>", st.decode('utf8') f.close()
Офлайн
14
В юникодной строке есть символы, которые не могут быть декодированы в кодировку консоли (cp866)
print st.decode('utf8').encode('cp866', 'ignore') # или так print unicode(st, 'utf8').encode('cp866', 'ignore')
Отредактировано odnochlen (Ноя. 2, 2012 14:31:16)
Офлайн
0
odnochlenСпасибо. На печать русские буквы выводятся. Но дальнейшее использование хмл
В юникодной строке есть символы, которые не могут быть декодированы в кодировку консоли (cp866)
import xml.dom.minidom import urllib f = urllib.urlopen('http://samstar.ucoz.ru/news/rss/') st= f.read().decode('utf8').encode('cp866', 'ignore') print st #print ">>>", st.decode('utf8').encode('cp866', 'ignore') par1 = xml.dom.minidom.parseString(st) data = par1.getElementsByTagName('title') n= -1 for e in data: for t in e.childNodes: n = n +1 if (n > 0): print t.data.decode('utf8') f.close()
Офлайн
14
Кодировать в cp866 нужно только для сосноли, для парсера это не надо.
Офлайн
-1
простите, а что такое xml??
я видел файлы с таким фарматом. это както связано?
и чо такое парсер?
Отредактировано pellon (Ноя. 6, 2012 15:46:58)
Офлайн