Найти - Пользователи
Полная версия: Как узнать кодировку?
Начало » Python для новичков » Как узнать кодировку?
1 2 3
slav0nic
tabajara, русский язык господа “зi Львова” прекрасно понимают, так что не надо ;)

а по теме, во всех исходниках которые я видел, это делается через try except те последовательно перебирают кодировки, если перекодировалось - то кодировка определена, если нет - пробуют перекодировать с параметром ignore
alafin
tabajara, если хочешь пиши на украинском, тебе никто не запрещает, тем более что я и другие с Украины знают прекрасно этот язык. А потому как мы все с exUSSR то все мы знаем русский. Поэтому в конце было бы не плохо добавлять еще и перевод на русский(если хочешь то можешь добавить еще и польский). Если исходить из твоих соображений тогда нужно и на беларусий и казахский переводить+ латышкий и болгарский.
philosof
slav0nic
а по теме, во всех исходниках которые я видел, это делается через try except те последовательно перебирают кодировки, если перекодировалось - то кодировка определена, если нет - пробуют перекодировать с параметром ignore
Покажи на примере, для наглядности.
OlDer
slivlen
Если в теге мета кодировка не переопределена, то ее можно узнать из http заголовка(поле Content-Type) возвращенного сервером.
Наоборот. В первую очередь нужно смотреть в заголовок и только потом в meta: http://www.w3.org/TR/REC-html40/charset.html#h-5.2.2
conforming user agents must observe the following priorities when determining a document's character encoding (from highest priority to lowest):
1. An HTTP "charset" parameter in a "Content-Type" field.
2. A META declaration with "http-equiv" set to "Content-Type" and a value set for "charset".
3. The charset attribute set on an element that designates an external resource.
А автору топика - вот ссылка: http://chardet.feedparser.org/
OlDer
alafin
tabajara, прости, отредоктировал твой пост я без объяснения. Но есть просьба, можешь добавлять сам еще к тексту написанном на украинском еще и русский? Примерно как сделал я.
Позволю себе и я высказать мнение. Я считаю - нельзя этого требовать, если это не оговорено в правилах форума (а этого там нет). И, тем более, недопустимо редактировать чужие посты. Хочешь перевести - ну и перевел бы отдельным постом.
alafin
Потому как на форуме задают вопросы люди, возможно, не знающие украинский.
Хуже того - тут задают вопросы люди, не знающие python. Но мы ведь не будем для них примеры переводить на basic? ;)
Человек который не понимает украинского может спокойно проигнорировать этот ответ.
slivlen
OlDer
Наоборот. В первую очередь нужно смотреть в заголовок и только потом в meta: http://www.w3.org/TR/REC-html40/charset.html#h-5.2.2
Если следовать стандарту, то да, но в действительности все немного не так. Веб сервер выдает в заголовке настроенную кодировку, которая может отличаться от реальной кодировки документа указанной в meta, поэтому я считаю, что лучше сначала искать кодировку в документе(правда есть еще Rassian Apache, который умеет перекодировать документы на лету).
alafin
OlDer
Я считаю - нельзя этого требовать, если это не оговорено в правилах форума (а этого там нет).
OlDer, я не могу понять, где я упоминул слова требую? Кажется я сказал “просьба”. Перечитываю уже 10 раз не могу понять с чего ты взял что требуют? А в правила уже добавил.
OlDer
Человек который не понимает украинского может спокойно проигнорировать этот ответ.
И что будет? Форум превратиться в безмерное количество постов в которых, возможно, не будет ответов. Кому такое нужно? Все проблемы должны решать все вместе.
OlDer
Хуже того - тут задают вопросы люди, не знающие python. Но мы ведь не будем для них примеры переводить на basic?
Можно было бы перевести на basic если бы это был форум не по питону, а скажем - по программированию.

Если кому-то не нравиться русский язык могут написать на украинском и в конце добавить перевод на английский. Думаю так будет лучше.
Или вы все хотите чтобы было 2 форума? Я создам если надо. Один для украинского/английского другой для русского.
alafin
Предлагаю не засорять дальше эту тему, которую уже благополучно засорили. А предлагаю дальше обсудить новый форум котороый будет чисто на украинском или еще и на английском. Милости просим http://python.com.ua/forum/viewtopic.php?pid=4998
philosof
Вставлю свои пьять коп.
Сюда на форум меня заставили прийти непонимание некоторых моментов python-а (и вообще), когда я регистрировался то исскал помощь, по сути.
Украински форум это хорошо, я за.
Сам всю жизнь разговариваю на украинском и где-бы я не был не забуду его никогда.
Но здесь суть это язык python.

И очень благодарен OlDer , как раз то что доктор прописал. А то я свою ф-ю уже написал, будем выбирать оптимальний вариант.
alafin
philosof, поэтому и собираемся делать еще один форум , потому как одни в повседневной жизни используют украинский другие русский. А вторая причина чтобы не нагнетать хаос.
philosof, пожалуйста, выскажись в той теме которая про новый форум.
This is a "lo-fi" version of our main content. To view the full version with more information, formatting and images, please click here.
Powered by DjangoBB