Форум сайта python.su
0
Добрый день!
Не знаю, может, этот вопрос уже и поднимался, но несколько часов гугления мне нормально ответа так и не дали.
Проблема следующего характера: я получаю от какой-то библиотеки строку, которая изначально была в utf-8, но выглядит она как обычная ascii-шная строка с кучей символов, записанных в виде
\xd0\xa3\xd0\xba\xd0\xb0\xd0\xb6
codecs.utf_8_encode
>>> a = 'привет' >>> a '\xaf\xe0\xa8\xa2\xa5\xe2' >>> print a привет
Офлайн
Вот ваша строка
>>> print '\xd0\xa3\xd0\xba\xd0\xb0\xd0\xb6' Укаж >>>
Офлайн
0
У меня то же самое выглядит следующим образом:
>>> print '\xd0\xa3\xd0\xba\xd0\xb0\xd0\xb6' ╨г╨║╨░╨╢
UnicodeEncodeError: 'charmap' codec can't encode character u'\u2013' in position 422: character maps to <undefined>
Офлайн
эта строка в utf-8. Переведите в кодировку вашей консоли
print '\xd0\xa3\xd0\xba\xd0\xb0\xd0\xb6'.decode("utf-8").encode(ваша кодировка)
Офлайн