Уведомления

Группа в Telegram: @pythonsu

#1 Янв. 9, 2009 16:16:57

shiza
От:
Зарегистрирован: 2007-07-03
Сообщения: 1073
Репутация: +  0  -
Профиль   Отправить e-mail  

Проблема с кодировкой

The gray Cardinal
Вот, например, разложившийся труп: http://www.opennet.ru/
OpenNet практически в том-же виде, в каком он есть сейчас (кроме некоторой косметики) - я помню еще в 2000 году =)



Офлайн

#2 Янв. 9, 2009 16:20:53

Ferroman
От:
Зарегистрирован: 2006-11-16
Сообщения: 2759
Репутация: +  1  -
Профиль   Отправить e-mail  

Проблема с кодировкой

кодировок стало просто больше, соответственно всеобщий бардак только усилился
Есть предложение не усиливать бардак ещё больше и использовать utf-8.

Офлайн

#3 Янв. 9, 2009 17:00:42

The gray Cardinal
От:
Зарегистрирован: 2007-03-07
Сообщения: 422
Репутация: +  0  -
Профиль   Отправить e-mail  

Проблема с кодировкой

shiza
OpenNet практически в том-же виде, в каком он есть сейчас (кроме некоторой косметики) - я помню еще в 2000 году
Это да, но он отнюдь не мёртв ;).
Ferroman
Есть предложение не усиливать бардак ещё больше и использовать utf-8.
Отличное предложение, я только за :lol:. Только это ничего не изменит ;).
Это всё равно, что попытаться внедрить XHTML во всём Интернете. Несмотря ни на что, все ведущие браузеры поддерживают самую разнузданную разметку, а половина Интернета этой самой разнузданной разметкой интенсивно пользуется. И так будет ещё долгие годы (если вообще не всегда). А cp1251 — это Кащей бессмертный, с которым ты не справишься, пока жива Windows. И так будет ещё долгие годы (если, опять-таки, вообще не всегда :)).



Отредактировано (Янв. 9, 2009 17:02:12)

Офлайн

#4 Янв. 9, 2009 17:12:17

Ferroman
От:
Зарегистрирован: 2006-11-16
Сообщения: 2759
Репутация: +  1  -
Профиль   Отправить e-mail  

Проблема с кодировкой

Честно говоря странно - у меня в Win никогда не было проблем с utf-8.
Тут не совсем уместно сравнивать с провалом xhtml - причины его провала специфические. Лично для меня использование юникода делает так, что про многие проблемы я просто никогда не узнаю.

Офлайн

#5 Янв. 9, 2009 17:17:41

The gray Cardinal
От:
Зарегистрирован: 2007-03-07
Сообщения: 422
Репутация: +  0  -
Профиль   Отправить e-mail  

Проблема с кодировкой

Ferroman
Лично для меня использование юникода делает так, что про многие проблемы я просто никогда не узнаю.
Насколько я понимаю, эта фраза верна только для Linux (может, и для Мак, но не суть). Под Windows ты узнаешь все проблемы в любом случае :). Так что под Windows у UTF-8 для исходника на данном этапе практически нет реальных преимуществ (для русскоязычного пользователя Python).



Офлайн

#6 Янв. 9, 2009 18:03:03

Ferroman
От:
Зарегистрирован: 2006-11-16
Сообщения: 2759
Репутация: +  1  -
Профиль   Отправить e-mail  

Проблема с кодировкой

Но и нет особых недостатков. За то я даром получаю отсутствие проблем в линуксе.

Офлайн

#7 Янв. 9, 2009 23:58:17

ZZZ
От: Москва
Зарегистрирован: 2008-04-03
Сообщения: 2161
Репутация: +  26  -
Профиль   Адрес электронной почты  

Проблема с кодировкой

shiza
у UTF-16 есть еще один минус. Английские буквы занимают в ней по 2 байта, в отличие от UTF-8, в которой они по одному байту. Поэтому исходники в ней весят в 2 раза больше %)
ИМХО, это не большой минус, с сегодняшними средствами связи… /и это говорит человек, сидящий на gprs…/
Но есть и плюсы… Ты никогда не пробовал писать обработчик UTF-8? В UTF-16 можно просто читать по два байта…

The gray Cardinal
Это особенность мака?
Нет, это особенность всех нормальных редакторов, которые открывают текст как UTF-8.

В MacOS X, кстати, хрен поймёшь, что с кодировками – но MacCirillic, то явно какой-то уникод. Но все нормальные редакторы (TextMate, TextWrangler…) замечательно работают с UTF-8.
Но в тоже время в терминалке…
 ttys000 /Users/zzz $ locale                                            [0:52]
LANG="ru_RU.UTF-8"
LC_COLLATE="ru_RU.UTF-8"
LC_CTYPE="ru_RU.UTF-8"
LC_MESSAGES="ru_RU.UTF-8"
LC_MONETARY="ru_RU.UTF-8"
LC_NUMERIC="ru_RU.UTF-8"
LC_TIME="ru_RU.UTF-8"
LC_ALL=
Здесь слишком разделены графика и система. Но в тоже время в общем система куда логичнее любого никса. /про маздай я вообще молчу…/



Офлайн

#8 Янв. 10, 2009 05:01:13

kvazar
От:
Зарегистрирован: 2009-01-05
Сообщения: 25
Репутация: +  0  -
Профиль   Отправить e-mail  

Проблема с кодировкой

Здравствуйте, Многоуважаемые. У меня опять проблема -(
Никак я не могу всё догнать…
В python 3.0 исходник в utf8 русские буквы прекрасно выводятся. Всё хорошо.
Но при попытке прочесть текстовый файл в кодировке utf8, выводятся кракозябры.
Похоже он его читает, как cp1251. Что делать?.. Почему он не читает файл в исходной кодировке?..
——-Добавлено
Соображения есть, что строка это последовательность байтов, которая не хранит данных о кодировке и поэтому питон берёт кодировку из локали, но непонятно почему, если изначально в исходнике скрипта строка в utf или ansi, то и при выводе она той же кодировки?..
——-
Пролистав интернет я так и не понял можно ли установить локаль utf8 на веб -сервер(денвер) для питона под Win Vista?
И ещё вопрос, который меня по прежнему мучает..
Я никак не могу точно осмыслить, что же такое юникод и как его понимается в питоне.
Я конечно читал, что стандарт кодирования, но многие юникодом называют кодировки utf.
В питоне, как я это понимаю юникод это непосредственно коды из стандарта?
Тоесть пофиг дым в какой кодировке у меня строка(utf,ansi), она будет преобразована в код стандарта юникод(в 3.0)?
Но тогда я не понимаю почему после преобразования в юникод при выводе текст выдаётся в исходной кодировке, а не согласно локали…
Одно понимаю, что пишу много ахинеи, но больше обратиться некуда, а закрыть глаза и писать на ощупь не хочу.
на всякий случай код:
——-
#!/usr/local/bin/python
# -*- coding: utf-8 -*-
print(“Content-type: text/html; charset: utf-8\n\n”)
import cgitb; cgitb.enable()
f = open(“test.txt”,“r”)
print(f.read())
f.close()



Отредактировано (Янв. 10, 2009 05:13:48)

Офлайн

#9 Янв. 12, 2009 02:28:52

kvazar
От:
Зарегистрирован: 2009-01-05
Сообщения: 25
Репутация: +  0  -
Профиль   Отправить e-mail  

Проблема с кодировкой

А в ответ тишина -)
Неужели больше никому это не интересно?



Офлайн

#10 Янв. 12, 2009 11:56:31

The gray Cardinal
От:
Зарегистрирован: 2007-03-07
Сообщения: 422
Репутация: +  0  -
Профиль   Отправить e-mail  

Проблема с кодировкой

Офлайн

Board footer

Модераторировать

Powered by DjangoBB

Lo-Fi Version