Уведомления

Группа в Telegram: @pythonsu

#1 Авг. 29, 2016 11:26:33

coffe4wolf
Зарегистрирован: 2016-04-21
Сообщения: 34
Репутация: +  0  -
Профиль   Отправить e-mail  

Определение кодировки в CSV

Продолжаю мучать себя и свои выгрузки в csv.
Надо подкорректировать csv-файл определённым образом, но не могу это сделать ни регулярками, ни эксельными библиотеками из-за проблем с кодировкой.
Если открываю файл через open и вывожу в консоль print'ом через цикл, то русские символы выводятся корректно. То же самое при записи того же файла через file.write().
Однако регулярки не цепляют строки в файле и при выводе через функции xlrd/xlwt выводит абракадабру типа
'\xc0\xe3\xe5\xe5\xe2 \xd1.\xc2.;19.08.2016 12:51:30;20.08.2016 11:48:07;\n'
а должно быть ‘Агеев С.В.;19.08.2016 12:51:30;20.08.2016 11:48:07;’
Соответственно, если вывожу файл print'ом в цикле через repr выводится такая же фигня.
Разные сервисы определения кодировки дают разные варианты, многие не могут перевести это вообще.
Как мне определить что за зверь?

Офлайн

#2 Авг. 29, 2016 11:50:53

py.user.next
От:
Зарегистрирован: 2010-04-29
Сообщения: 10010
Репутация: +  857  -
Профиль   Отправить e-mail  

Определение кодировки в CSV

Здесь doza_and писал уже тебе, как открывать файл.
У тебя кодировка cp1251 в файле.



Офлайн

#3 Авг. 29, 2016 12:12:13

coffe4wolf
Зарегистрирован: 2016-04-21
Сообщения: 34
Репутация: +  0  -
Профиль   Отправить e-mail  

Определение кодировки в CSV

py.user.next

Дык не сработало, ничего не изменилось в выводе :с

Офлайн

#4 Авг. 29, 2016 13:22:02

py.user.next
От:
Зарегистрирован: 2010-04-29
Сообщения: 10010
Репутация: +  857  -
Профиль   Отправить e-mail  

Определение кодировки в CSV

Код приведи.



Офлайн

#5 Авг. 29, 2016 13:28:12

ZerG
Зарегистрирован: 2012-04-05
Сообщения: 2627
Репутация: +  61  -
Профиль   Отправить e-mail  

Определение кодировки в CSV

И файл кусочек…



Влодение рускай арфаграфией - это как владение кунг-фу: настаящие мастира не преминяют ево бес ниабхадимости

Офлайн

Board footer

Модераторировать

Powered by DjangoBB

Lo-Fi Version