Уведомления

Группа в Telegram: @pythonsu

#1 Июнь 20, 2009 21:38:31

sypper-pit
От: Ulan-Ude(msk)
Зарегистрирован: 2009-01-30
Сообщения: 1102
Репутация: +  6  -
Профиль   Отправить e-mail  

Проблемы с кодировкой в текстовом файле

Офлайн

#2 Июнь 21, 2009 12:49:48

xs13
От:
Зарегистрирован: 2008-09-06
Сообщения: 36
Репутация: +  0  -
Профиль   Отправить e-mail  

Проблемы с кодировкой в текстовом файле

первая ссылка не работает
по второй я ничего не понял



Офлайн

#3 Июнь 21, 2009 14:27:23

sypper-pit
От: Ulan-Ude(msk)
Зарегистрирован: 2009-01-30
Сообщения: 1102
Репутация: +  6  -
Профиль   Отправить e-mail  

Проблемы с кодировкой в текстовом файле

сделай поиск по ключевой фразе “r(”

Офлайн

#4 Июнь 21, 2009 14:31:26

xs13
От:
Зарегистрирован: 2008-09-06
Сообщения: 36
Репутация: +  0  -
Профиль   Отправить e-mail  

Проблемы с кодировкой в текстовом файле

искал, ничего нет
вобщем буду дальше курить доки



Офлайн

#5 Июнь 21, 2009 14:36:58

sypper-pit
От: Ulan-Ude(msk)
Зарегистрирован: 2009-01-30
Сообщения: 1102
Репутация: +  6  -
Профиль   Отправить e-mail  

Проблемы с кодировкой в текстовом файле

а вообще было б не плохо получить полный код твоего редактора , тогда может что получится

Офлайн

#6 Июнь 21, 2009 14:45:05

xs13
От:
Зарегистрирован: 2008-09-06
Сообщения: 36
Репутация: +  0  -
Профиль   Отправить e-mail  

Проблемы с кодировкой в текстовом файле

Сделал вот так

import codecs

file=codecs.open( “data.txt”, “r”, “utf-8” )
u = file.read()
for line in u:
wordslist=line.split()
elements=
теперь выдает ошибку в codecs.py

если делаю вот так:

import codecs

file=codecs.open( “data.txt”, “r”, “cp1251” )
u = file.read()
for line in u:
wordslist=line.split()
elements=
то программа запускается, но выдает в списке слово в другой кодировке, не то что нужно



Отредактировано (Июнь 21, 2009 14:48:17)

Офлайн

#7 Июнь 21, 2009 14:56:28

sypper-pit
От: Ulan-Ude(msk)
Зарегистрирован: 2009-01-30
Сообщения: 1102
Репутация: +  6  -
Профиль   Отправить e-mail  

Проблемы с кодировкой в текстовом файле

попробуй заменить переменную u на что то другое
“”"Для конвертирования Unicode-строки в 8-битовую строку с использованием желаемой
кодировки, объекты Unicode предоставляют метод encode(), принимающий
единственный аргумент — название кодировки. Предпочитаются названия записанные
в нижнем регистре.

>>> u"äöü".encode('utf-8')
'\xc3\xa4\xc3\xb6\xc3\xbc'
“”"(с)

Офлайн

#8 Июнь 21, 2009 15:02:12

xs13
От:
Зарегистрирован: 2008-09-06
Сообщения: 36
Репутация: +  0  -
Профиль   Отправить e-mail  

Проблемы с кодировкой в текстовом файле

Короче я только что сделал так и все заработало:

file=codecs.open( “data.txt”, “r”, “cp1251” )
u = file.readlines()

for i in u:
list.insert(0,i)
Сейчас вопрос в другом
в файле data.txt текст представлен в виде строк
мне нужно чтобы в программе в окне списка выводились первые два слова из каждой строки

догадываюсь, что это будут значения 0:1, но вот как это правильно оформить не знаю.



Отредактировано (Июнь 21, 2009 17:27:56)

Офлайн

#9 Июнь 21, 2009 19:24:35

sypper-pit
От: Ulan-Ude(msk)
Зарегистрирован: 2009-01-30
Сообщения: 1102
Репутация: +  6  -
Профиль   Отправить e-mail  

Проблемы с кодировкой в текстовом файле

xs13
Сейчас вопрос в другом
в файле data.txt текст представлен в виде строк
мне нужно чтобы в программе в окне списка выводились первые два слова из каждой строки

догадываюсь, что это будут значения 0:1, но вот как это правильно оформить не знаю.
import re
xs13
Как мне это перевести в нормальный русский шрифт?
Форумы читал, codecs, encode, decode перепробовал, прошу помощи тут.
Заранее спасибо.
просто я не пойму у тебя же типа не получалось и ты просил не использовать codecs

Отредактировано (Июнь 21, 2009 19:31:15)

Офлайн

#10 Июнь 21, 2009 23:27:39

ZZZ
От: Москва
Зарегистрирован: 2008-04-03
Сообщения: 2161
Репутация: +  26  -
Профиль   Адрес электронной почты  

Проблемы с кодировкой в текстовом файле

sypper-pit
Предпочитаются названия записанные
в нижнем регистре.
А я всегда автоматом пишу .encode('UTF-8') :-)

sypper-pit
import re
Зачем? Почитайте про второй аргумент метода .split у строк.

P.S. xs13, вместо тега quote для кода используй тег code.



Офлайн

Board footer

Модераторировать

Powered by DjangoBB

Lo-Fi Version