Стас Агарков
Июнь 24, 2010 17:29:01
Как на python перекодировать строку \u0435\u0440 в utf-8? В строке именно стоит в начале \, потом английская буква u, и далее цифры. То есть один символ занимает 6 байтов.
В таком виде хранится .properties в java, а мне нужно просматривать их diff в trac, который написан на python.
Александр Кошелев
Июнь 24, 2010 18:53:55
u'\u0435\u0440'.encode('utf-8')
Ну а вообще код не машало бы ваш показать.
bw
Июнь 24, 2010 18:56:30
>>> ‘\u0435\u0440’.decode('unicode_escape')
u'\u0435\u0440'
>>> _.encode('utf-8')
'\xd0\xb5\xd1\x80'
>>> print _
ер
..bw
Стас Агарков
Июнь 24, 2010 19:14:25
Спасибо.
А чем отличается unicode_escape от raw_unicode_escape?
bw
Июнь 25, 2010 06:29:54
Посмотри сорцы, это быстрее чем ждать пока я освобожусь, посмотрю код (или погуглю) и сообщу тебе.
..bw
Стас Агарков
Июнь 25, 2010 10:24:54
bw
Июнь 25, 2010 15:00:59
Не смешно :-).
Посмотри здесь по форуму, по слову raw-unicode-escape, был случай, когда требовался именно raw, но при кодировании (unicode->str). Я не стал вникать в суть, просто использовал этот кодек.
..bw