на python(е) я их обрабатываю (отправляю на smpp шлюз), все было хорошо пока не стали появляться сообщения на кириллице
, пользователям приходило сообщение в вида Trouble - Количество СЃРІРѕР±РѕРґРЅРѕРіРѕ места РЅР° РґРёСЃРєРµ ${VolumeDescription}попробовал тупо все сообщение открывать в utf8 - тогда при сообщениях на латинице скрипт вылетал с Traceback
UnicodeDecodeError: ‘utf-8’ codec can't decode byte 0xef in position 6: invalid continuation byteт.е. надо как то обработать обе вида сообщения…
думаю можно вот так
import os, codecs try: f = open('C:\\sms.txt', 'r', encoding='utf8') text1 = f.read() except UnicodeDecodeError: f = open('C:\\sms.txt', 'r', encoding='cp1251') text1 = f.read() print(text1)
чувствую это костыль
есть более правильные способы считывания текста с не известной кодировкой ?
прилагаю примеры текстовых сообщений:
