Форум сайта python.su
Поставил python 3.0
Проблемы с кодировками пропали.
Но вот интересно, как там всё работает кто-нибудь знает точно?
Вот у меня исходник в utf-8.
При выводе текст выводится print() в utf-8. Но если произвести допустим срез строки, то при выводе кодировка уже cp1251.
Мои выводы.
Если над строкой не производить никаких действий, то она хранится в исходной кодировке, а не unicode…
Если произвести скажем срез, то текст переводится в unicode и уже при выводе текст переводится в кодировку согласно локали.
Поправьте меня, кто знает..
Офлайн
В 3.0 нет строк, насколько я знаю, только UNICODE, естественно нет и проблем.
..bw
Офлайн
The gray Cardinal написал, согласись, что юникод куда лучше старых восмибитных кодировок. Может он и менее удобен, если работать в “блокноте” винды, но это единственный реальный минус.
Вот, например, меня раздражает, что для того, чтобы посмотреть код с русскими комментариями, я должен перекодировать его в UTF-8. Мне кажется, что сегодня писать в cp1251, это просто неуважение к людям, которые могут этот код читать. Как сказал Shiza, нужно вырабатывать хорошие привычки, а от себя добавлю, что нужно ещё и стремиться к лучшему.
ВСЕ нормальные IDE замечательно умеют работать UTF-8 и я просто не понимаю происхождение вопроса.
Мне, кстати, больше нравится UTF-16. У “восмёрки” один плюс – обратная совместимость с ASCII, но мне кажется, что этот “обратный багаж” только геморрою добавляет. Это как cp866 в винде…
Отредактировано (Янв. 9, 2009 05:05:44)
Офлайн
ZZZу UTF-16 есть еще один минус. Английские буквы занимают в ней по 2 байта, в отличие от UTF-8, в которой они по одному байту. Поэтому исходники в ней весят в 2 раза больше %)
Мне, кстати, больше нравится UTF-16
Офлайн
ZZZПосмотри в исходный код странички, которую сейчас читаешь (charset=windows-1251) ;).
Мне кажется, что сегодня писать в cp1251, это просто неуважение к людям, которые могут этот код читать.
ZZZЭто особенность мака?
для того, чтобы посмотреть код с русскими комментариями, я должен перекодировать его в UTF-8
Офлайн
The gray Cardinalладно хоть не koi8-r, которая была когда то популярна в рунете :) Сейчас в инете, все больше стало utf. Плюс cp1251 в меньшем объеме трафика, что более важно для инета.
Посмотри в исходный код странички, которую сейчас читаешь (charset=windows-1251) ;).
Офлайн
The gray CardinalУ этого форумного движка и у php в частности - тяжелая наследственность.
Посмотри в исходный код странички, которую сейчас читаешь (charset=windows-1251)
igor.kaistНе настолько важно. Сейчас почти любой сервер отдает в gzip
Плюс cp1251 в меньшем объеме трафика, что более важно для инета.
Отредактировано (Янв. 9, 2009 13:36:58)
Офлайн
Да всё понятно, utf-8 лучше :). Просто cp1251 ещё очень долго не будет экзотикой, поэтому писать в ней — вовсе не преступление. Кстати, сайтов в koi-8 тоже полно, и долго ещё будет полно :).
Кто-то сказал, что Юникод изобрели, чтобы убрать проблемы с национальными кодировками. Однако, промахнулись — кодировок стало просто больше, соответственно всеобщий бардак только усилился :lol:.
Офлайн
The gray CardinalДа наоборот больше порядка, мира и спокойствия :)
Однако, промахнулись — кодировок стало просто больше, соответственно всеобщий бардак только усилился :lol:.
The gray CardinalВ основном это “мертвые” сайты, которые создавались в эпоху появления интернета в россии…
Кстати, сайтов в koi-8 тоже полно, и долго ещё будет полно :).
Офлайн
igor.kaistВот, например, разложившийся труп: http://www.opennet.ru/ ;).
В основном это “мертвые” сайты, которые создавались в эпоху появления интернета в россии…
Офлайн