Уведомления

Группа в Telegram: @pythonsu

#1 Дек. 12, 2008 00:13:31

De-visible
От:
Зарегистрирован: 2008-11-17
Сообщения: 23
Репутация: +  0  -
Профиль   Отправить e-mail  

Кодировка.

>>> text="<efweewfewумтрцмлвыидмлыв>иыиавы<fewfewfваиыавыwe>dиваыаивvsdv"
>>> txt_=re.findall(r"<.*?>",text)
>>> print txt_
['<efweewfew\xf3\xec\xf2\xf0\xf6\xec\xeb\xe2\xfb\xe8\xe4\xec\xeb\xfb\xe2>', '<fewfewf\xe2\xe0\xe8\xfb\xe0\xe2\xfbwe>']
Вопрос почему вместо русских букв выводится китайская азбука… Как это исправить?



Офлайн

#2 Дек. 12, 2008 01:38:56

Ferroman
От:
Зарегистрирован: 2006-11-16
Сообщения: 2759
Репутация: +  1  -
Профиль   Отправить e-mail  

Кодировка.

Потому что шумерская писменность.

Отредактировано (Дек. 12, 2008 02:45:22)

Офлайн

#3 Дек. 12, 2008 01:57:53

Cleric
От:
Зарегистрирован: 2007-06-26
Сообщения: 87
Репутация: +  0  -
Профиль   Отправить e-mail  

Кодировка.

Товарищ De-visible, вы не правы, это не китайсткая письменность, а алфавит индейцев суахили



Офлайн

#4 Дек. 12, 2008 07:03:23

ZZZ
От: Москва
Зарегистрирован: 2008-04-03
Сообщения: 2161
Репутация: +  26  -
Профиль   Адрес электронной почты  

Кодировка.

Ferroman и Cleric – жжёте! :-)))

De-visible, найди в доке по питону, ответ на вопрос, чему равна длина строки “\x00” и почему, а только тогда берись за изучения регулярных выражений.
Ну и вообще, полазай по форуму, здесь это столько раз обсуждалось, что никто пятьсот пятьдесят пятый раз повторять не будет.

P.S. Админы, перенесите тему к новичкам.
P.P.S. Или сразу во флейм? :-)



Офлайн

#5 Дек. 12, 2008 07:05:55

shiza
От:
Зарегистрирован: 2007-07-03
Сообщения: 1073
Репутация: +  0  -
Профиль   Отправить e-mail  

Кодировка.

Ferroman +1



Офлайн

#6 Дек. 12, 2008 09:07:59

bw
От:
Зарегистрирован: 2007-09-26
Сообщения: 938
Репутация: +  20  -
Профиль   Адрес электронной почты  

Кодировка.

De-visible, а что выводит print txt_?

..bw



Офлайн

#7 Дек. 12, 2008 09:37:24

balu
От:
Зарегистрирован: 2006-05-24
Сообщения: 521
Репутация: +  0  -
Профиль   Отправить e-mail  

Кодировка.

Cleric
алфавит индейцев суахили
Вы тоже не правы. Суахили это Африка. А у индейцев разные виды письменности были ;)



Офлайн

#8 Дек. 12, 2008 15:04:04

pythonwin
От:
Зарегистрирован: 2006-07-18
Сообщения: 1294
Репутация: +  0  -
Профиль   Отправить e-mail  

Кодировка.

to De-visible, читать обязательно
http://www.rupy.ru/member/5/#paper-6
http://www.rupy.ru/static/files/07/02/12/rupyru2007-yurevich-unicode.pdf
http://www.rupy.ru/static/files/07/02/12/rupyru2007-yurevich-unicode-thesis.pdf
PS я понимаю что иногда нужно что-то быстро “наваять” на языке только начал изучать, но с основами прошу ознакомится.



Отредактировано (Дек. 12, 2008 15:38:54)

Офлайн

#9 Дек. 12, 2008 19:48:52

De-visible
От:
Зарегистрирован: 2008-11-17
Сообщения: 23
Репутация: +  0  -
Профиль   Отправить e-mail  

Кодировка.

pythonwin
PS я понимаю что иногда нужно что-то быстро “наваять” на языке только начал изучать, но с основами прошу ознакомится.
Благодарю.
Ferroman
Потому что шумерская писменность.

Отредактированно Ferroman (Сегодня 03:45:22)
А ты можешь обходить мои темы?



Офлайн

#10 Дек. 13, 2008 00:31:14

Ferroman
От:
Зарегистрирован: 2006-11-16
Сообщения: 2759
Репутация: +  1  -
Профиль   Отправить e-mail  

Кодировка.

нет

Офлайн

Board footer

Модераторировать

Powered by DjangoBB

Lo-Fi Version