Уведомления

Группа в Telegram: @pythonsu

#1 Июнь 6, 2012 16:50:59

Ksenon2611
Зарегистрирован: 2012-06-06
Сообщения: 5
Репутация: +  0  -
Профиль   Отправить e-mail  

Срочно нужна помощь в реализации классификации текстов

Всем доброго дня,

Мне нужно реализовать алгоритм ,который бы классифицировал считанный мною текстовый файл к какой либо тематики(политика,спорт,медицина и т.д.).
В целом представление есть,хочу реализовать алгоритм с помощью метода опорных векторов(SVM).
Не могли бы подсказать,в каком наилучшем виде должны быть текстовые файлы ,один из которых представляет собой каталог тематики(медицина,спорт и тд) и текстовый файл,у которого будет программа определять тематику.

Я плохо знаком с языком Python ,поэтому хотелось бы чтобы кто-нибудь подсказал направление,либо реализовал алгоритм за невысокую плату.

Офлайн

#2 Июнь 6, 2012 17:54:01

Cryo
Зарегистрирован: 2012-06-01
Сообщения: 12
Репутация: +  0  -
Профиль   Отправить e-mail  

Срочно нужна помощь в реализации классификации текстов

Вот, посмотрите, подобное уже пытались реализовать, только на примере текста из сайтов. Но чтобы написать подобное, нужно неплохо знать сам язык и знать, что такое нейронные сети.
P.S
Даже самому интересно стало…

Отредактировано Cryo (Июнь 6, 2012 18:00:25)

Офлайн

#3 Июнь 7, 2012 07:06:39

lavrton
От:
Зарегистрирован: 2010-11-13
Сообщения: 35
Репутация: +  1  -
Профиль   Адрес электронной почты  

Срочно нужна помощь в реализации классификации текстов

У меня дипломная работа на тему классификации текста. Акцент сделан на классификацию по УДК. Но легко можно классифицировать и по другому - достаточно изменить обучающую бд. Планирую написать об этом статьи.
http://python.su/forum/topic/14465/



Офлайн

#4 Июнь 7, 2012 14:42:21

Nata
От:
Зарегистрирован: 2010-10-02
Сообщения: 87
Репутация: +  6  -
Профиль   Отправить e-mail  

Срочно нужна помощь в реализации классификации текстов

Если проблема в реализации на питоне, посмотрите сюда. Необязательно читать текст, посмотрите на примеры, какие структуры данных используют авторы



Офлайн

#5 Июнь 8, 2012 01:56:15

Ksenon2611
Зарегистрирован: 2012-06-06
Сообщения: 5
Репутация: +  0  -
Профиль   Отправить e-mail  

Срочно нужна помощь в реализации классификации текстов

Nata,
lavrton,
Спасибо Вам Огромное!


Офлайн

Board footer

Модераторировать

Powered by DjangoBB

Lo-Fi Version