Я новичок в программировании. Python начал изучать только недавно. Прошу у Вас помощи для написания приложения, поскольку сталкиваюсь с трудностями, в которых не помогает даже google. Код, который написал по мануалам:
# -*- coding: cp1251 -*- imp0rt = open('d:\Основные определения из теории систем.txt') #импортирую из файла текст spisok = imp0rt.read() #присваиваю переменной импортированный текст massiv = spisok.split() #создаю список из импортированного текста, с разделителем " " (пробел) print(massiv) #вывод текста массива на экран
1. Выводится на экран только юникод, сам русский текст где-то теряется.
2. При помощи словаря NTLK 2.0 пробовал извлечь корень из русского слова “приветственный”, столкнулся с ошибкой:
UnicodeDecodeError: ‘ascii’ codec can't decode byte 0xc4 in position 0: ordinal not in range(128)
Сам код:
#coding: utf-8 from nltk.stem import SnowballStemmer russian_stemmer = SnowballStemmer('russian') russian_stemmer.stem('приветственный')