Найти - Пользователи
Полная версия: Создание n-gram'ного частотного словаря по коллекции текстов
Начало » Центр помощи » Создание n-gram'ного частотного словаря по коллекции текстов
1
TrashSR
Всем доброго дня!
У меня возникла задача создания n-gram'ного частотного словаря по коллекции текстов. На вход будет подаваться текстовый файл содержащий текстовую коллекцию, на выходе нужно получить отсортированный по убыванию частоты n-gram'ы(би, три или четыре грамы) частотный словарь.
Если есть у кого-то подобный скрипт и им не жалко поделиться - буду благодарен.

На форуме нашел тему http://python.su/forum/topic/14465/ . Мои небольшие знания python не позволяют мне понять способны ли те скрипты выполнять нужную мне задачу. Если не сложно подскажите могут ли те скрипты решить мою задачу? Если да, то за помощь в запуске скриптов(можно через Team Viewer) готов материально отблагодарить.
Isem
Это называется не скрипт, а алгоритм, к тому же достаточно простой. Знания в питоне к этому не имеют никакого отношения.

Не в питоне, а питона.
This is a "lo-fi" version of our main content. To view the full version with more information, formatting and images, please click here.
Powered by DjangoBB