с хтмл-страницы считывается строка, результат сохраняется в переменную
при выводе через print первый раз текст выходит в cp1251 ( РҐСѓРґРѕР¶РЅРёРє ), последующие выводы - в utf-8 ( \xd0\xa5\xd1\x83\xd0\xb4\xd0\xbe\xd0\xb6\xd0\xbd\xd0\xb8\xd0\xba )
пробовал сначала записать файл, потом считать оттуда - запись идет нормально, только если в файл передается одна переменная. Если переменная + текст - опять вылезают кракозябры вместо значения переменной.
И самое странное - пару раз на вывод все-таки попадал нормальный русский текст, но это было всего 2-3 раза из сотни попыток. Закономерностей не обнаружил.
В связи этим вопрос - главное окошко IDLE русскую кодировку вообще поддерживает? Если да - то как?
Различные варианты с %name%.decode ('utf-8') я пробовал, безрезультатно. Впрочем, если я все верно понимаю, в любом случае в cp1251 русские символы должны выводится корректно.
# -*- coding: cp1251 -*- так же присутствует в нужном месте.
так же пробовал вставлять в начало нижеследующее:
import sys
reload(sys)
sys.setdefaultencoding('cp1251')
А вот, собственно, и проблемная переменная:
aut = j.__getslice__ (j.find ('<h1>')+4, j.find ('</h1>'))