Форум сайта python.su
0
Продолжаю мучать себя и свои выгрузки в csv.
Надо подкорректировать csv-файл определённым образом, но не могу это сделать ни регулярками, ни эксельными библиотеками из-за проблем с кодировкой.
Если открываю файл через open и вывожу в консоль print'ом через цикл, то русские символы выводятся корректно. То же самое при записи того же файла через file.write().
Однако регулярки не цепляют строки в файле и при выводе через функции xlrd/xlwt выводит абракадабру типа
'\xc0\xe3\xe5\xe5\xe2 \xd1.\xc2.;19.08.2016 12:51:30;20.08.2016 11:48:07;\n'
а должно быть ‘Агеев С.В.;19.08.2016 12:51:30;20.08.2016 11:48:07;’
Соответственно, если вывожу файл print'ом в цикле через repr выводится такая же фигня.
Разные сервисы определения кодировки дают разные варианты, многие не могут перевести это вообще.
Как мне определить что за зверь?
Офлайн
857
Здесь doza_and писал уже тебе, как открывать файл.
У тебя кодировка cp1251 в файле.
Офлайн
0
py.user.next
Дык не сработало, ничего не изменилось в выводе :с
Офлайн
857
Код приведи.
Офлайн
61
И файл кусочек…
Офлайн