Коллеги, добрый день!
Python не понимает массив из слов на кириллице…
При выводе в ipython notebook он заменяет символы кодами.
Есть ли возможность корректной работы с русскими текстами?
Спасибо!
AlexModestov
Коллеги, добрый день!Python не понимает массив из слов на кириллице…При выводе в ipython notebook он заменяет символы кодами.Есть ли возможность корректной работы с русскими текстами?Спасибо!
AlexModestovPython3
Есть ли возможность корректной работы с русскими текстами?
>>> x = 'Кириллический текст' >>> x 'Кириллический текст' >>> x = ['Слово', 'Серебро', 'Молчание', 'Золото'] >>> x ['Слово', 'Серебро', 'Молчание', 'Золото']
J.R.Спасибо!
>>> x = 'Слушай меня внимательно' >>> y = x.decode('utf-8') >>> x '\xd0\xa1\xd0\xbb\xd1\x83\xd1\x88\xd0\xb0\xd0\xb9 \xd0\xbc\xd0\xb5\xd0\xbd\xd1\x8f \xd0\xb2\xd0\xbd\xd0\xb8\xd0\xbc\xd0\xb0\xd1\x82\xd0\xb5\xd0\xbb\xd1\x8c\xd0\xbd\xd0\xbe' >>> y u'\u0421\u043b\u0443\u0448\u0430\u0439 \u043c\u0435\u043d\u044f \u0432\u043d\u0438\u043c\u0430\u0442\u0435\u043b\u044c\u043d\u043e' >>>
>>> print y Слушай меня внимательно >>> print x Слушай меня внимательно >>>
J.R.На отладке-то я понимаю, print помогает.
AlexModestovЯ только ответил на ваш вопрос.Что касается второго питона, у него в дефолте кодировка ASCII, поэтому кириллический текст вы будете в интерпретаторе видеть либо в виде байт-кода, либо в виде юникод-строк.
J.R.Вот кусок кода:
AlexModestovТогда показывайте свой код. Что пишете в файл, и что получаете.
)AlexModestovКак она (строка с названием песни) попадает в ваш словарь?
Рекомендация как и выше по переписке: “Слушай меня внимательно” (всего лишь название песни)
AlexModestovА файл с кодом в какой кодировке?
Указываю в коде:
# -*- coding: utf-8 -*-
J.R.Есть таблица в csv, все это загружаю в датафрейм, потом делаю работу с датафреймом, через groupby и потом столбец с песнями преобразую в массив np.array() и верхнюю выборку по песням сохраняю в файл.
Как она (строка с названием песни) попадает в ваш словарь?
J.R.признаюсь честно… не знаю… не так много работаю с python.
А файл с кодом в какой кодировке?