Форум сайта python.su
Добрый вечер всем!
Стоит задача конвертировать docx-файл в html. Все бы хорошо, но при попытке вывести в выходной файл русские символы, выдается ошибка: UnicodeEncodeError: ‘ascii’ codec can't encode character u'XXXX' in position X: ordinal not in range (128)
В начале программы стоит # -*- coding: ‘utf-8’ -*-
xml парсил с помощью xml.dom.minidom.parse()
Ошибка вылезает при выводе информации в файл, была мысль, что, возможно, следует создавать выходной файл с какими-то специальными параметрами.
Заранее спасибо за помощь :)
Офлайн
.encode('utf-8')
Офлайн
zheromo
спасибо за совет)
помогло это:
# -*- coding: 'utf-16' -*-
import codecs
import unicodedata
f = codecs.open('ХХХ', encoding = 'utf-16', mode = 'w')
Офлайн
Простите, а за какой надобностью вы пишите
# -*- coding: ‘utf-16’ -*-
???
Офлайн
Это, видимо, от прошлых попыток осталось… Действительно, без этой строчки тоже все работает.
Офлайн