Форум сайта python.su
Проверил у себя - после сортировки теряется один символ (в файле он самый первый), он же отображается у меня двума точками (Linux + UTF8 основная кодировка), есть подозрение что что-то не так с кодировкой этих символов.
Офлайн
Но вопрос в чем именно там проблема. Придется копаться серьезно, как будет время.
В таком случае могу я попросить об одолжении выложить файл - результат выполнения скрипта на тех файлах с символами и словами, что я давал в предыдущем посте? Вы же сказали что у вас получилось все нормально с символами. Просто неизвестно сколько еще придется возиться с этой проблемой, а результат мне нужный, вроде как у вас уже есть.
Офлайн
В архиве мой скрипт и результат его работы по вашим данным
http://rghost.ru/download/private/15917071/b5fe39ae7cae0d37bfa2afd6803fab64/bccabfc7940eb9b8c6f28a956f8f1c084f03359f/dict_test.tar.gz
Офлайн
Скачал третью ветку Python'а.
Там уже конкретно ссылается на ошибку, а не пропускает.
Traceback (most recent call last):
File "C:\test.py", line 3, in <module>
lines = open('E:/words.txt').readlines()
File "C:\Python32\lib\encodings\cp1251.py", line 23, in decode
return codecs.charmap_decode(input,self.errors,decoding_table)[0]
UnicodeDecodeError: 'charmap' codec can't decode byte 0x98 in position 4525: character maps to <undefined>
Отредактировано (Июль 28, 2011 15:04:02)
Офлайн
начинайте ваши скрипты со строчки ‘# -*- coding: utf-8 -*-’ (без кавычек) и все у вас будет хорошо )
Отредактировано (Июль 28, 2011 15:37:12)
Офлайн
s0rgНу это я делал - не помогало.
начинайте ваши скрипты со строчки ‘# -*- coding: utf-8 -*-’ (без кавычек) и все у вас будет хорошо )
Отредактировано (Июль 28, 2011 16:57:20)
Офлайн
При открытии файла указывайте кодировку:
f = open('file2.txt', 'r', encoding='utf-8')
Офлайн