Уведомления

Группа в Telegram: @pythonsu

#1 Авг. 5, 2014 00:30:50

Kontox
Зарегистрирован: 2013-03-15
Сообщения: 6
Репутация: +  0  -
Профиль   Отправить e-mail  

кластеризация текстовой информации в python

Друзья, помогите справиться с такой задачей. я хочу провести кластеризацию семантически близких фраз запросов по услугам IT . для этой задачи у меня есть куча ключевых слов и для каждого 50 снипетов страниц от яндекса, хотя ряд из них будет удален. Как можно этот алгорити реализовать на python?

Офлайн

#2 Авг. 12, 2014 21:20:46

Alen
Зарегистрирован: 2013-08-01
Сообщения: 373
Репутация: +  49  -
Профиль   Отправить e-mail  

кластеризация текстовой информации в python

Друзья, помогите справиться с такой задачей. я хочу провести кластеризацию семантически близких фраз запросов по услугам IT .

Для кластеризации наиболее часто используют K-means. https://ru.wikipedia.org/wiki/K-means .

Есть с десяток готовых библиотек уже реализовавших этот алгоритм, например scipy.cluster.vq .

для этой задачи у меня есть куча ключевых слов

Если я правильно понял вопрос, это уже не кластеризация, а классификация. А значит Байес, SVM, kNN, нейронки и т.п.

Офлайн

Board footer

Модераторировать

Powered by DjangoBB

Lo-Fi Version