Найти - Пользователи
Полная версия: Проблемы с кодировкой в текстовом файле
Начало » Python для новичков » Проблемы с кодировкой в текстовом файле
1 2 3 4
xs13
первая ссылка не работает
по второй я ничего не понял
sypper-pit
сделай поиск по ключевой фразе “r(”
xs13
искал, ничего нет
вобщем буду дальше курить доки
sypper-pit
а вообще было б не плохо получить полный код твоего редактора , тогда может что получится
xs13
Сделал вот так

import codecs

file=codecs.open( “data.txt”, “r”, “utf-8” )
u = file.read()
for line in u:
wordslist=line.split()
elements=
теперь выдает ошибку в codecs.py

если делаю вот так:

import codecs

file=codecs.open( “data.txt”, “r”, “cp1251” )
u = file.read()
for line in u:
wordslist=line.split()
elements=
то программа запускается, но выдает в списке слово в другой кодировке, не то что нужно
sypper-pit
попробуй заменить переменную u на что то другое
“”"Для конвертирования Unicode-строки в 8-битовую строку с использованием желаемой
кодировки, объекты Unicode предоставляют метод encode(), принимающий
единственный аргумент — название кодировки. Предпочитаются названия записанные
в нижнем регистре.
>>> u"äöü".encode('utf-8')
'\xc3\xa4\xc3\xb6\xc3\xbc'
“”"(с)
xs13
Короче я только что сделал так и все заработало:

file=codecs.open( “data.txt”, “r”, “cp1251” )
u = file.readlines()

for i in u:
list.insert(0,i)
Сейчас вопрос в другом
в файле data.txt текст представлен в виде строк
мне нужно чтобы в программе в окне списка выводились первые два слова из каждой строки

догадываюсь, что это будут значения 0:1, но вот как это правильно оформить не знаю.
sypper-pit
xs13
Сейчас вопрос в другом
в файле data.txt текст представлен в виде строк
мне нужно чтобы в программе в окне списка выводились первые два слова из каждой строки

догадываюсь, что это будут значения 0:1, но вот как это правильно оформить не знаю.
import re
xs13
Как мне это перевести в нормальный русский шрифт?
Форумы читал, codecs, encode, decode перепробовал, прошу помощи тут.
Заранее спасибо.
просто я не пойму у тебя же типа не получалось и ты просил не использовать codecs
ZZZ
sypper-pit
Предпочитаются названия записанные
в нижнем регистре.
А я всегда автоматом пишу .encode('UTF-8') :-)

sypper-pit
import re
Зачем? Почитайте про второй аргумент метода .split у строк.

P.S. xs13, вместо тега quote для кода используй тег code.
This is a "lo-fi" version of our main content. To view the full version with more information, formatting and images, please click here.
Powered by DjangoBB