Уведомления

Группа в Telegram: @pythonsu

#1 Авг. 4, 2006 13:19:10

prof-alex
От:
Зарегистрирован: 2006-08-03
Сообщения: 4
Репутация: +  0  -
Профиль   Отправить e-mail  

Определение кодировки строки

Решаю сейчас задачу по написанию простенького майлфорвардера. Задача описана тут http://www.linux.org.ru/view-message.jsp?msgid=1491635

В общем все уже работает, но возможны ситуации когда майлер создает письма плюя на стандарты, т. е. в поле to: есть фио получателя но нет информации о кодировке в которой это записано.
Вместо:

To: =?koi8-r?B?J+zFwsXEyc7Ty8nKIOHMxcvTwc7E0iDhzsHUz8zYxdfJ3ic=?= <isp@mail.com>
Может стоять:
To: Лебединский Александр Анатольевич <isp@mail.com>
'Потрошу' письма я посредством email, email.Header.decode_header прекрасно парсит адреса в первом варианте, и пасует во втором.
Чем в пайтоне можно “угадывать” кодировку строки?



Офлайн

#2 Авг. 4, 2006 15:23:08

j2a
От:
Зарегистрирован: 2006-06-29
Сообщения: 869
Репутация: +  1  -
Профиль   Отправить e-mail  

Определение кодировки строки

Кхм. Что-то неладное в датском королевстве. Писал один пост - оказалось два. Отредактировал один - отредактировались оба.

По вопросу:

http://chardet.feedparser.org/
http://trific.ath.cx/resources/python/pyenca/

P.S. http://www.google.com/search?q=python+detect+encoding



Отредактировано (Авг. 4, 2006 21:16:23)

Офлайн

Board footer

Модераторировать

Powered by DjangoBB

Lo-Fi Version