Уведомления

Группа в Telegram: @pythonsu

#1 Сен. 9, 2018 01:05:44

polin11
Зарегистрирован: 2013-05-02
Сообщения: 58
Репутация: +  0  -
Профиль   Отправить e-mail  

Опять проблема с кодировкой в файле

Есть файл на Консультант+ http://www.consultant.ru/cons/cgi/online.cgi?req=doc&base=LAW&n=289183&fld=134&dst=1000000001,0&rnd=0.9977910511104866#07047858508556943
Скаченный как файл Unicode (часть файла прикрепил)
пытаюсь вывести в консоль содержимое файла, возникает проблема с кодировкой, перепробовал всевозможные варианты кодировок, наиболее подходящий:

 f=open("1.txt", "r")
for i in f:
   print(i.encode().decode('utf_16_be', 'ignore'))
f.close()

Некоторых букв не хватает, кроме русских букв, остаются иероглифы, как побороть проблему?

Отредактировано polin11 (Сен. 9, 2018 01:07:00)

Прикреплённый файлы:
attachment Приказ Росприроднадзора от 22.05.2017 N 242 (ред. от 28.11.2-u (2).txt (8,8 KБ)

Офлайн

#2 Сен. 9, 2018 04:15:08

py.user.next
От:
Зарегистрирован: 2010-04-29
Сообщения: 10022
Репутация: +  857  -
Профиль   Отправить e-mail  

Опять проблема с кодировкой в файле

  
>>> with open('prik.txt', 'r', encoding='utf-16le') as fin:
...   data = fin.read()
... 
>>> print(data[:100])
Приказ Росприроднадзора от 22.05.2017 N 242
(ред. от 28.11.2017)
"Об утверждении Федерального класс
>>>



Офлайн

Board footer

Модераторировать

Powered by DjangoBB

Lo-Fi Version