Найти - Пользователи
Полная версия: Кодек «utf-8» и BOM. Трудность
Начало » Python для новичков » Кодек «utf-8» и BOM. Трудность
1
BBBug
Используя кодек «utf-8» пытаюсь создать юникодный файл.

f = codecs.open( ‘foo.txt’, encoding=’utf-8’, mode='w')
f.write( unichr(0x85) )
f.close()

Получаю ANSI

Бандитский кодек, в противоположность «utf-16» и «utf-32» не записывает BOM в новый файл. А ещё читает BOM как первый символ при чтении данных из файла. Но нужен именно он.
Подскажите, пожалуйста, что делать?
Спасибо

Система: WinXP
Питон: 2.6.1 от 04-Dec-2008
shiza
# -*- coding: UTF-8 -*-
import codecs
f = codecs.open( 'foo.txt', encoding='utf_8_sig', mode='w')
f.write( u'мама мыла раму' )
f.close()
ключево слово здесь: ‘utf_8_sig’

Подробнее см. доку: http://docs.python.org/library/codecs.html
BBBug
Красота!
This is a "lo-fi" version of our main content. To view the full version with more information, formatting and images, please click here.
Powered by DjangoBB