Форум сайта python.su
Вопрос в следующем посде того как файл спарсен и с ним начинаеться работа, возникает следующая ошибка:
'charmap' codec can't encode character ‘\xfc’
файл читал в UTF
open(pathToFile, 'r', encoding='utf-8')
Офлайн
кстати падает скрипт вот на таком слове “schreitmüller”
Офлайн
>>> 'schreitmüller'.encode('cp1251') Traceback (most recent call last): File "<stdin>", line 1, in <module> File "/usr/lib/python3.3/encodings/cp1251.py", line 12, in encode return codecs.charmap_encode(input,errors,encoding_table) UnicodeEncodeError: 'charmap' codec can't encode character '\xfc' in position 8: character maps to <undefined> >>>
Отредактировано py.user.next (Июнь 1, 2015 13:31:18)
Офлайн
py.user.nextя смоделирую ситуацию, есть список слов, я их прохожу циклом и делаю с ними какие нибудь преоброзвания, и во время этого валиться цикл, из за ошибки кодировки.
to_return = [] for word in words: try: print(word ) to_return.append(word ) except Exception as e: pass
Отредактировано 2ur1st (Июнь 1, 2015 13:53:00)
Офлайн
Попробуйте так прочитать:
with open("filename") as file: content = file.readlines()
Офлайн
codersedдело не в чтение файла, а в том как обработать эту ошибку
Попробуйте так прочитать:
Офлайн
2ur1st
а сделать как то более красиво
try:
...
... encode(sys.stdout.encoding)
Офлайн
Shamanхочу донести до вас, что проблема не в выводе этого слова, а в том что я хочу это слово извлечь из списка, что бы последющая обработка, на падала на ошибка кодироки.
Отредактировано 2ur1st (Июнь 1, 2015 15:08:49)
Офлайн
2ur1stА я гдо-то вывожу слово?!
хочу донести до вас, что проблема не в выводе этого слова
Офлайн
Shamanнет, но при таком преобразование, косяк не вспывет, а просто будет в юникоде, и в том виде в котором будет это строка меня не устраивает, точнее я просто не знаю что мне дельше с ней делать, как только потребуеться производить расчеты со строками?
Офлайн