Столкнулся вот с такой проблемой: Имеется хмл файл, открываю его на чтение, извлекаю по тегу значение, оно имеет вид: “Баба-Яга”
и вот тут я спотыкаюсь, не могу конвертировать его в utf8 строку.
Тоже самое:
text = u'Баба-Яга'.encode("ascii", "xmlcharrefreplace") print text.decode('ascii','xmlcharrefreplace')
