Найти - Пользователи
Полная версия: Определение кодировки в CSV
Начало » Python для новичков » Определение кодировки в CSV
1
coffe4wolf
Продолжаю мучать себя и свои выгрузки в csv.
Надо подкорректировать csv-файл определённым образом, но не могу это сделать ни регулярками, ни эксельными библиотеками из-за проблем с кодировкой.
Если открываю файл через open и вывожу в консоль print'ом через цикл, то русские символы выводятся корректно. То же самое при записи того же файла через file.write().
Однако регулярки не цепляют строки в файле и при выводе через функции xlrd/xlwt выводит абракадабру типа
'\xc0\xe3\xe5\xe5\xe2 \xd1.\xc2.;19.08.2016 12:51:30;20.08.2016 11:48:07;\n'
а должно быть ‘Агеев С.В.;19.08.2016 12:51:30;20.08.2016 11:48:07;’
Соответственно, если вывожу файл print'ом в цикле через repr выводится такая же фигня.
Разные сервисы определения кодировки дают разные варианты, многие не могут перевести это вообще.
Как мне определить что за зверь?
py.user.next
Здесь doza_and писал уже тебе, как открывать файл.
У тебя кодировка cp1251 в файле.
coffe4wolf
py.user.next

Дык не сработало, ничего не изменилось в выводе :с
py.user.next
Код приведи.
ZerG
И файл кусочек…
This is a "lo-fi" version of our main content. To view the full version with more information, formatting and images, please click here.
Powered by DjangoBB