Форум сайта python.su
857
lorienне, это просто набор общих слов
Так это и есть конкретный пример
lorienне надо учитывать сложность задачи, пока она не описана, иначе можно учесть сложность совсем не той задачи
Учитывая сложность задачи
Офлайн
4
Это стандартная задача для машинного обучения. Можно использовать библиотеку scikit-learn; там в документации есть несколько примеров про классификацию текстов:
Офлайн
7
Еще рекомендую почитать про корпусную лингвистику, а также про законы Зипфа (Ципфа).
Пользуясь случаем kmike'у шлю благодарности за его прекрасную либу pymorphy
ТС - Вам эта библиотека, кстати, тоже может пригодиться.
Офлайн