Форум сайта python.su
0
Добрый вечер всем!
Стоит задача конвертировать docx-файл в html. Все бы хорошо, но при попытке вывести в выходной файл русские символы, выдается ошибка: UnicodeEncodeError: ‘ascii’ codec can't encode character u'XXXX' in position X: ordinal not in range (128)
В начале программы стоит # -*- coding: ‘utf-8’ -*-
xml парсил с помощью xml.dom.minidom.parse()
Ошибка вылезает при выводе информации в файл, была мысль, что, возможно, следует создавать выходной файл с какими-то специальными параметрами.
Заранее спасибо за помощь :)
Офлайн
2
.encode('utf-8')
Офлайн
0
zheromo
спасибо за совет)
помогло это:
# -*- coding: 'utf-16' -*-
import codecs
import unicodedata
f = codecs.open('ХХХ', encoding = 'utf-16', mode = 'w')
Офлайн
14
Простите, а за какой надобностью вы пишите
# -*- coding: ‘utf-16’ -*-
???
Офлайн
0
Это, видимо, от прошлых попыток осталось… Действительно, без этой строчки тоже все работает.
Офлайн