Форум сайта python.su
lorienне, это просто набор общих слов
Так это и есть конкретный пример
lorienне надо учитывать сложность задачи, пока она не описана, иначе можно учесть сложность совсем не той задачи
Учитывая сложность задачи
Офлайн
Это стандартная задача для машинного обучения. Можно использовать библиотеку scikit-learn; там в документации есть несколько примеров про классификацию текстов:
Офлайн
Еще рекомендую почитать про корпусную лингвистику, а также про законы Зипфа (Ципфа).
Пользуясь случаем kmike'у шлю благодарности за его прекрасную либу pymorphy ТС - Вам эта библиотека, кстати, тоже может пригодиться.
Офлайн