Форум сайта python.su
Хмм… вообщем изначально предполагалось как работа с текстом) а как тест шли строки… То есть для работы с большим текстом можно разбивать текст на куски, определенной длинны и прогонять их в функции по очередности?
Добавил туда функцию брать текст из файла, опять проблема с кодировкой)) Дело в том, что берется из файла где одна кодировка, а запускается все в консоли, где cp866. В shelle все работает норм, а вот как перекодировать под консоль не понял. Попробовал unicode с выбраной кодировкой и encoding() - не помогло:(. Почитал про base64 модуль, но как я понял он не для того сущствует. Если не трудно - напишите, а то запускать в консоле удобней, чем в шеле.
И ведь можно же сделать автоопределение кодировки? А то писать два варианта программы и для консоли и для шела это изврат.
Отредактировано (Июль 7, 2008 23:28:40)
Офлайн
Moonbite2006
“Использование Unicode в Python”
почитай тезисы.
Офлайн
AndityПочитал… Посмотрел и т.д. Как я понял в программе изначально все надо делать в юникоде, а уже потом декодировать в нужную кодировку? А также существует проблема не явного декодирования.
Moonbite2006
“Использование Unicode в Python”
почитай тезисы.
document.decode("cp866")
temp_st.decode("cp866")
Офлайн
import codecs document = codecs.open('<имя файла>', 'r', 'cp1251').read() #вместо cp1251 укажи кодировку файла #теперь document у тебя в unicode #но лучше обрабатывать построчно for s in codecs.open('<имя файла>', 'r', 'cp1251'): #здесь работаем с s, s - в unicode #тут я не помню, вроде питон сам должен преобразовать вывод к кодировке консоли #во всяком случае у меня он это делает #но можешь и сам преобразовать print s.encode('cp866', 'replace') # 'replace' - для того, чтобы при перекодировке #заменять на заполнитель символы, которых нет в cp866
Отредактировано (Июль 8, 2008 06:10:10)
Офлайн
Пух, благодарю) Неужели существует 1000 и 1 способ поменять кодировку? и еще не везде все и работает:( Не очень понял для чего указывать кодировку файла при открытии документа, ведь он читает строки в той кодировке, в какой написан файл, независимо от того что я ему напишу…
Офлайн
Moonbite2006советую не почитать тезисы а посмотреть видео, глядя в пдф к нему.
Пух, благодарю) Неужели существует 1000 и 1 способ поменять кодировку? и еще не везде все и работает:( Не очень понял для чего указывать кодировку файла при открытии документа, ведь он читает строки в той кодировке, в какой написан файл, независимо от того что я ему напишу…
Офлайн