Друзья, помогите справиться с такой задачей. я хочу провести кластеризацию семантически близких фраз запросов по услугам IT .
Для кластеризации наиболее часто используют K-means.
https://ru.wikipedia.org/wiki/K-means .
Есть с десяток готовых библиотек уже реализовавших этот алгоритм, например scipy.cluster.vq .
для этой задачи у меня есть куча ключевых слов
Если я правильно понял вопрос, это уже не кластеризация, а классификация. А значит Байес, SVM, kNN, нейронки и т.п.