Найти - Пользователи
Полная версия: docx to html, проблемы с кодировкой
Начало » Python для новичков » docx to html, проблемы с кодировкой
1
kurono_kun
Добрый вечер всем!
Стоит задача конвертировать docx-файл в html. Все бы хорошо, но при попытке вывести в выходной файл русские символы, выдается ошибка: UnicodeEncodeError: ‘ascii’ codec can't encode character u'XXXX' in position X: ordinal not in range (128)
В начале программы стоит # -*- coding: ‘utf-8’ -*-
xml парсил с помощью xml.dom.minidom.parse()
Ошибка вылезает при выводе информации в файл, была мысль, что, возможно, следует создавать выходной файл с какими-то специальными параметрами.
Заранее спасибо за помощь :)
zheromo
.encode('utf-8')
kurono_kun
zheromo
спасибо за совет)

помогло это:
# -*- coding: 'utf-16' -*- 
import codecs
import unicodedata
f = codecs.open('ХХХ', encoding = 'utf-16', mode = 'w')
Андрей Светлов
Простите, а за какой надобностью вы пишите
# -*- coding: ‘utf-16’ -*-
???
kurono_kun
Это, видимо, от прошлых попыток осталось… Действительно, без этой строчки тоже все работает.
This is a "lo-fi" version of our main content. To view the full version with more information, formatting and images, please click here.
Powered by DjangoBB