Найти - Пользователи
Полная версия: Индексирование книг
Начало » Python для новичков » Индексирование книг
1 2
Pytonist
Все здравствуйте! Задача у меня следующая, нужно проиндексировать библиотеку книг и прикрутить туда еще поиск. Посоветуйте пожалуйста чем лучше реалиовать подобное.
Спасибо.
4kpt_III
Библиотека понятие растяжимое…
Sphinx
Elastic Search
Pytonist
4kpt_III
Библиотека понятие растяжимое…
В плане что есть много книг в формате txt запакованные в zip. Нужно сделать индексирование по титулах(названиях книжек) + прикрутить поиск.
Спасибо за ссылки, буду смотреть.
doza_and
Из наших продуктов есть программа Архивариус
http://www.likasoft.com/ru/document-search/
ihorgorobets
doza_and
Полностью поддерживается уникод.

гг
4kpt_III
Pytonist
Тогда это не подходит. Это для индексирования БД и полнотекстового поиска…
Pytonist
doza_and
Из наших продуктов есть программа Архивариус
Спасибо за наводку, но такой вариант не подходит. Нужно закодить своими ручками.

4kpt_III
Тогда это не подходит. Это для индексирования БД и полнотекстового поиска…
Что тогда подходит под мои задачи?
Смотрел что вроде как подходит PyLucene. Но он уже скис … Последняя версия была в октябре 2014 и там нет потдержки Python 3.


Pytonist
Нету ни укого никаких идей? Никто с подобным не сталкивался? Кроме PyLucene ничего подобного не существует? Мне не нужен готовый код. Я сам попытаюсь это сделать.
balalay12
Может будет полезно (оригинал)
doza_and
Pytonist
Нету ни укого никаких идей?
Pytonist
Я сам попытаюсь это сделать.
А какие тут могут быть идеи? Ну возьмем вашу библиотеку и пихнем ее в MySQL или postgress, по полям сделаем индекс для полнотекстового поиска. Самому это делать? Так с такой работы пожалуй даже и ничему не научишься. Банальный импорт, ну еще распаковка из архивов. Постарайтесь более четко сформулировать чем вас не устраивают существующие средства (кроме того что они не вами написаны). Более того поисковый движок windows осуществляет такую индексацию (включая архивы) если ее не запретить. Те ваша задача решается нажатием кнопки поиск. В Unix ну например первое что дает поисковик
http://www.lesbonscomptes.com/recoll/features.html. Уверен есть еще миллион таких проектов.
This is a "lo-fi" version of our main content. To view the full version with more information, formatting and images, please click here.
Powered by DjangoBB