Уведомления

Группа в Telegram: @pythonsu

#1 Апрель 24, 2013 17:30:09

bismigalis
Зарегистрирован: 2010-10-02
Сообщения: 449
Репутация: +  47  -
Профиль   Отправить e-mail  

UnicodeDecodeError: 'ascii' codec can't decode byte 0x80 in position

#coding: <здесь кодировка твоего файла, по дефолту ascii>
from nltk.stem import SnowballStemmer
russian_stemmer = SnowballStemmer('russian')
russian_stemmer.stem(u'приветственный')

название кодировки смотреть тут http://docs.python.org/2/library/codecs.html#standard-encodings

PS вообще лучше использовать редактор который поддерживает сохранение в utf-8 и использовать её (в python3 по дефолту)

Отредактировано bismigalis (Апрель 24, 2013 17:35:33)

Офлайн

#2 Апрель 30, 2013 18:05:00

dm1tri1
От: Санкт-Петербург
Зарегистрирован: 2013-04-24
Сообщения: 8
Репутация: +  0  -
Профиль   Отправить e-mail  

UnicodeDecodeError: 'ascii' codec can't decode byte 0x80 in position

Вот так получилось:

#coding=utf-8
from nltk.stem import SnowballStemmer           #подключение словаря и импорт SnowballStemmer
russian_stemmer = SnowballStemmer('russian')    #выбор русского языка для извлечения корня
print (russian_stemmer.stem(u'приветственный')) #вывод на экран корня слова

Офлайн

Board footer

Модераторировать

Powered by DjangoBB

Lo-Fi Version