Python-сообщество

lavrton · Апрель 28, 2012 17:18:27

Добрый день. Написал небольшие модули для обработки текста на русском языке.
Основное:

Получение списка: “слово, вес слова”. (поиск ключевых слов)
Нахождение ключевых словосочетаний.
Математическое представление текста (в виде точки/вектора).
Работа с полученным представлением. (сравнение текстов между собой - нахождение коэффициента подобия и т.п.)

Интересна ли данная тематика кому-нибудь еще? Стоит ли выкладывать исходники, писать статьи?

Отредактировано lavrton (Апрель 28, 2012 17:19:37)

slav0nic · Апрель 28, 2012 20:31:42

я бы почитал)
а статью конечно надо В)) а то никак времени на контент не найдём

tg : https://t.me/slav0nic

Андрей Светлов · Апрель 28, 2012 23:36:19

Пишите. Лучше — в своем блоге. Если нет — сделайте. Потом опубликуйте ссылку. Выкладывайте исходники на github или где вам удобней.

ziro · Май 3, 2012 09:20:50

Хм.. а NLTK - http://text-processing.com/ - не оно? или Вы хотите статьи по использованию NLTK написать?

Nata · Май 7, 2012 17:58:17

lavrton
Математическое представление текста (в виде точки/вектора).
Работа с полученным представлением. (сравнение текстов между собой - нахождение коэффициента подобия и т.п.)

Этого в nltk нет; очень пригодилось бы тем кто работает в области “information retrieval”…

lavrton
Получение списка: “слово, вес слова”. (поиск ключевых слов)
Нахождение ключевых словосочетаний.

а это есть (FreqDist(), collocations())

lavrton · Окт. 4, 2012 15:30:44

Открыл git репозиторий https://github.com/lavrton/textAnalyzer. Туда буду кидать оформленные наработки по обработки текста. Если кому-то интересно, жду обратной связи.

Отредактировано lavrton (Окт. 4, 2012 15:31:26)

TrashSR · Фев. 22, 2013 10:56:06

Данные скрипты могут извлечь n-gram'ы произвольного порядка из подаваемой коллекции текстов?

lavrton · Фев. 23, 2013 17:45:37

Нет и не планируется.

Python-сообщество

Уведомления

#1 Апрель 28, 2012 17:18:27

Интересна ли тема анализа текста?

#2 Апрель 28, 2012 20:31:42

Интересна ли тема анализа текста?

#3 Апрель 28, 2012 23:36:19

Интересна ли тема анализа текста?

#4 Май 3, 2012 09:20:50

Интересна ли тема анализа текста?

#5 Май 7, 2012 17:58:17

Интересна ли тема анализа текста?

#6 Окт. 4, 2012 15:30:44

Интересна ли тема анализа текста?

#7 Фев. 22, 2013 10:56:06

Интересна ли тема анализа текста?

#8 Фев. 23, 2013 17:45:37

Интересна ли тема анализа текста?

Board footer