Найти - Пользователи
Полная версия: UnicodeDecodeError: 'ascii' codec can't decode byte 0x80 in position
Начало » Python для экспертов » UnicodeDecodeError: 'ascii' codec can't decode byte 0x80 in position
1 2
bismigalis
#coding: <здесь кодировка твоего файла, по дефолту ascii>
from nltk.stem import SnowballStemmer
russian_stemmer = SnowballStemmer('russian')
russian_stemmer.stem(u'приветственный')

название кодировки смотреть тут http://docs.python.org/2/library/codecs.html#standard-encodings

PS вообще лучше использовать редактор который поддерживает сохранение в utf-8 и использовать её (в python3 по дефолту)
dm1tri1
Вот так получилось:
#coding=utf-8
from nltk.stem import SnowballStemmer           #подключение словаря и импорт SnowballStemmer
russian_stemmer = SnowballStemmer('russian')    #выбор русского языка для извлечения корня
print (russian_stemmer.stem(u'приветственный')) #вывод на экран корня слова
This is a "lo-fi" version of our main content. To view the full version with more information, formatting and images, please click here.
Powered by DjangoBB