Уведомления

Группа в Telegram: @pythonsu

#1 Июль 25, 2011 23:04:54

UBX
От:
Зарегистрирован: 2011-03-07
Сообщения: 4
Репутация: +  0  -
Профиль   Отправить e-mail  

Итерация по UTF-8 строке.

Нужно пройти по строке UTF-8 (циклом for). Столкнулся с проблемой - Python считает два байта кириллических символов отдельными символами. Что делать?



Офлайн

#2 Июль 26, 2011 01:57:16

dimabest
От:
Зарегистрирован: 2009-02-12
Сообщения: 253
Репутация: +  0  -
Профиль   Отправить e-mail  

Итерация по UTF-8 строке.

# coding: utf8

string = 'дима'

for symbol in string.decode('utf8'):
print symbol



Офлайн

#3 Июль 26, 2011 10:23:26

UBX
От:
Зарегистрирован: 2011-03-07
Сообщения: 4
Репутация: +  0  -
Профиль   Отправить e-mail  

Итерация по UTF-8 строке.

Я нашёл подходящий способ

text = unicode(text,'utf-8') #Конвертируем в Unicode
...
sys.stdout.write(self.scr[j][i].encode('utf-8')) #При выводе на терминал, возвращаем в UTF-8
Тему можно закрывать.



Офлайн

Board footer

Модераторировать

Powered by DjangoBB

Lo-Fi Version