Найти - Пользователи
Полная версия: Определение кодировки строки
Начало » Python для экспертов » Определение кодировки строки
1
prof-alex
Решаю сейчас задачу по написанию простенького майлфорвардера. Задача описана тут http://www.linux.org.ru/view-message.jsp?msgid=1491635

В общем все уже работает, но возможны ситуации когда майлер создает письма плюя на стандарты, т. е. в поле to: есть фио получателя но нет информации о кодировке в которой это записано.
Вместо:
To: =?koi8-r?B?J+zFwsXEyc7Ty8nKIOHMxcvTwc7E0iDhzsHUz8zYxdfJ3ic=?= <isp@mail.com>
Может стоять:
To: Лебединский Александр Анатольевич <isp@mail.com>
'Потрошу' письма я посредством email, email.Header.decode_header прекрасно парсит адреса в первом варианте, и пасует во втором.
Чем в пайтоне можно “угадывать” кодировку строки?
j2a
Кхм. Что-то неладное в датском королевстве. Писал один пост - оказалось два. Отредактировал один - отредактировались оба.

По вопросу:

http://chardet.feedparser.org/
http://trific.ath.cx/resources/python/pyenca/

P.S. http://www.google.com/search?q=python+detect+encoding
This is a "lo-fi" version of our main content. To view the full version with more information, formatting and images, please click here.
Powered by DjangoBB