Уведомления

Группа в Telegram: @pythonsu

#1 Фев. 22, 2013 11:07:57

TrashSR
Зарегистрирован: 2013-02-21
Сообщения: 2
Репутация: +  0  -
Профиль   Отправить e-mail  

Создание n-gram'ного частотного словаря по коллекции текстов

Всем доброго дня!
У меня возникла задача создания n-gram'ного частотного словаря по коллекции текстов. На вход будет подаваться текстовый файл содержащий текстовую коллекцию, на выходе нужно получить отсортированный по убыванию частоты n-gram'ы(би, три или четыре грамы) частотный словарь.
Если есть у кого-то подобный скрипт и им не жалко поделиться - буду благодарен.

На форуме нашел тему http://python.su/forum/topic/14465/ . Мои небольшие знания python не позволяют мне понять способны ли те скрипты выполнять нужную мне задачу. Если не сложно подскажите могут ли те скрипты решить мою задачу? Если да, то за помощь в запуске скриптов(можно через Team Viewer) готов материально отблагодарить.

Офлайн

#2 Фев. 23, 2013 00:09:06

Isem
От:
Зарегистрирован: 2010-08-27
Сообщения: 447
Репутация: +  7  -
Профиль   Отправить e-mail  

Создание n-gram'ного частотного словаря по коллекции текстов

Это называется не скрипт, а алгоритм, к тому же достаточно простой. Знания в питоне к этому не имеют никакого отношения.

Не в питоне, а питона.



Отредактировано Isem (Фев. 23, 2013 00:10:10)

Офлайн

Board footer

Модераторировать

Powered by DjangoBB

Lo-Fi Version