Python-сообщество

Игнат · Июль 1, 2011 08:58:46

использую python 3.2 как cgi с апач

если выводить кириллицу стандартным print получаем - Traceback (most recent call last): File “/home/user/python3/config_editor.py”, line 46, in cnf.print_rows() File “/home/user/python3/config_editor_class.py”, line 39, in print_rows print(self.sections) UnicodeEncodeError: ‘ascii’ codec can't encode characters in position 2-7: ordinal not in range(128)

вывожу вот так:

def _print(text):
sys.stdout.buffer.write(text.encode('utf8'))
sys.stdout.flush()

и пока все ок

проблема в том, что нельзя быстро распечатать тот же словарь, если в нем есть кириллица - получаю этот эксепшен

можно ли как-то сказать принту, чтобы он все выводимые строки декодировал перед выводом?

o7412369815963 · Июль 1, 2011 16:20:17

в начале файла указать
# coding: utf-8
тогда будет кодировать в utf8 при выводе.
а ещё можно сам принт подемнить

Запуск программ из Python
Кодировки в python
Мой блог

Андрей Светлов · Июль 1, 2011 16:32:50

o7412369815963
в начале файла указать
# coding: utf-8
тогда будет кодировать в utf8 при выводе.

Это не верно. «# coding» никак не влияет на кодировку, используемую при I/O.

o7412369815963 · Июль 1, 2011 16:46:44

Андрей Светлов
o7412369815963
в начале файла указать
# coding: utf-8
тогда будет кодировать в utf8 при выводе.
Это не верно. «# coding» никак не влияет на кодировку, используемую при I/O.

# coding: cp1251

print u'Привет'

Результат:

$ python 1.py 
РџСЂРёРІРµС‚

————————————

# coding: utf8

print u'Привет'

Результат:

$ python 1.py 
Привет

Ubuntu 11.04, py 2.7.1

Запуск программ из Python
Кодировки в python
Мой блог

Отредактировано (Июль 1, 2011 16:47:15)

Андрей Светлов · Июль 1, 2011 17:15:08

Кодировка, используемая для print — это sys.stdout.encoding. На Ubuntu будет ‘UTF-8’
Та кодировка, которая указывается в начале модуля, будет влиять на кодировку строковых констант, используемых в этом самом модуле — и ни на что больше.
Естественно, если в вашем примере объявили что строка записана в 1251, а на самом деле использовали utf-8 — получили мусор. И не только при print.

o7412369815963 · Июль 1, 2011 21:07:37

Андрей Светлов
Кодировка, используемая для print — это sys.stdout.encoding. На Ubuntu будет ‘UTF-8’
Та кодировка, которая указывается в начале модуля, будет влиять на кодировку строковых констант, используемых в этом самом модуле — и ни на что больше.
Естественно, если в вашем примере объявили что строка записана в 1251, а на самом деле использовали utf-8 — получили мусор. И не только при print.

Да, точно.

Запуск программ из Python
Кодировки в python
Мой блог

Андрей Светлов · Июль 1, 2011 22:32:38

Укажите это в вашей статье http://www.py-my.ru/post/4bfb3c6a1d41c846bc00009b , если не трудно
И reload(sys) мне категорически не нравится. Лучше объяснить, как сделать правильный sys.stdout/sys.stderr

o7412369815963 · Июль 5, 2011 22:00:14

Порыскал по инету, предлагают:

sys.stdout = codecs.getwriter('utf8')(sys.stdout)

Но при таком решении не возможно вывести байтовую строку: print ‘привет’

Запуск программ из Python
Кодировки в python
Мой блог

Отредактировано (Июль 5, 2011 22:04:17)

Андрей Светлов · Июль 6, 2011 12:31:46

Наверное, нужно писать свой file-like object. В котором на write перебрасывать str без изменений, а для unicode делать конвертацию в нужную кодировку.
Я всегда так поступал — и ни разу не ломалось.

Python-сообщество

Уведомления

#1 Июль 1, 2011 08:58:46

можно ли заставить print декодировать вывод?

#2 Июль 1, 2011 16:20:17

можно ли заставить print декодировать вывод?

#3 Июль 1, 2011 16:32:50

можно ли заставить print декодировать вывод?

#4 Июль 1, 2011 16:46:44

можно ли заставить print декодировать вывод?

#5 Июль 1, 2011 17:15:08

можно ли заставить print декодировать вывод?

#6 Июль 1, 2011 21:07:37

можно ли заставить print декодировать вывод?

#7 Июль 1, 2011 22:32:38

можно ли заставить print декодировать вывод?

#8 Июль 5, 2011 22:00:14

можно ли заставить print декодировать вывод?

#9 Июль 6, 2011 12:31:46

можно ли заставить print декодировать вывод?

Board footer