Уведомления

Группа в Telegram: @pythonsu

#1 Ноя. 12, 2015 01:32:26

Pytonist
Зарегистрирован: 2015-05-27
Сообщения: 36
Репутация: +  1  -
Профиль   Отправить e-mail  

Индексирование книг

Все здравствуйте! Задача у меня следующая, нужно проиндексировать библиотеку книг и прикрутить туда еще поиск. Посоветуйте пожалуйста чем лучше реалиовать подобное.
Спасибо.

Офлайн

#2 Ноя. 12, 2015 02:44:37

4kpt_III
Зарегистрирован: 2014-12-22
Сообщения: 999
Репутация: +  39  -
Профиль   Отправить e-mail  

Индексирование книг

Библиотека понятие растяжимое…
Sphinx
Elastic Search

Офлайн

#3 Ноя. 12, 2015 02:52:05

Pytonist
Зарегистрирован: 2015-05-27
Сообщения: 36
Репутация: +  1  -
Профиль   Отправить e-mail  

Индексирование книг

4kpt_III
Библиотека понятие растяжимое…
В плане что есть много книг в формате txt запакованные в zip. Нужно сделать индексирование по титулах(названиях книжек) + прикрутить поиск.
Спасибо за ссылки, буду смотреть.

Отредактировано Pytonist (Ноя. 13, 2015 02:17:56)

Офлайн

#4 Ноя. 12, 2015 08:02:52

doza_and
От:
Зарегистрирован: 2010-08-15
Сообщения: 4138
Репутация: +  253  -
Профиль   Отправить e-mail  

Индексирование книг

Из наших продуктов есть программа Архивариус
http://www.likasoft.com/ru/document-search/



Офлайн

#5 Ноя. 12, 2015 13:31:12

ihorgorobets
Зарегистрирован: 2015-11-01
Сообщения: 11
Репутация: +  -1  -
Профиль   Отправить e-mail  

Индексирование книг

doza_and
Полностью поддерживается уникод.

гг



Second France is best France

Офлайн

#6 Ноя. 12, 2015 13:52:59

4kpt_III
Зарегистрирован: 2014-12-22
Сообщения: 999
Репутация: +  39  -
Профиль   Отправить e-mail  

Индексирование книг

Pytonist
Тогда это не подходит. Это для индексирования БД и полнотекстового поиска…

Офлайн

#7 Ноя. 12, 2015 19:11:00

Pytonist
Зарегистрирован: 2015-05-27
Сообщения: 36
Репутация: +  1  -
Профиль   Отправить e-mail  

Индексирование книг

doza_and
Из наших продуктов есть программа Архивариус
Спасибо за наводку, но такой вариант не подходит. Нужно закодить своими ручками.

4kpt_III
Тогда это не подходит. Это для индексирования БД и полнотекстового поиска…
Что тогда подходит под мои задачи?
Смотрел что вроде как подходит PyLucene. Но он уже скис … Последняя версия была в октябре 2014 и там нет потдержки Python 3.


Отредактировано Pytonist (Ноя. 12, 2015 19:17:37)

Офлайн

#8 Ноя. 14, 2015 15:50:40

Pytonist
Зарегистрирован: 2015-05-27
Сообщения: 36
Репутация: +  1  -
Профиль   Отправить e-mail  

Индексирование книг

Нету ни укого никаких идей? Никто с подобным не сталкивался? Кроме PyLucene ничего подобного не существует? Мне не нужен готовый код. Я сам попытаюсь это сделать.

Офлайн

#9 Ноя. 14, 2015 17:25:56

balalay12
Зарегистрирован: 2014-07-28
Сообщения: 92
Репутация: +  4  -
Профиль   Адрес электронной почты  

Индексирование книг

Офлайн

#10 Ноя. 14, 2015 19:57:15

doza_and
От:
Зарегистрирован: 2010-08-15
Сообщения: 4138
Репутация: +  253  -
Профиль   Отправить e-mail  

Индексирование книг

Pytonist
Нету ни укого никаких идей?
Pytonist
Я сам попытаюсь это сделать.
А какие тут могут быть идеи? Ну возьмем вашу библиотеку и пихнем ее в MySQL или postgress, по полям сделаем индекс для полнотекстового поиска. Самому это делать? Так с такой работы пожалуй даже и ничему не научишься. Банальный импорт, ну еще распаковка из архивов. Постарайтесь более четко сформулировать чем вас не устраивают существующие средства (кроме того что они не вами написаны). Более того поисковый движок windows осуществляет такую индексацию (включая архивы) если ее не запретить. Те ваша задача решается нажатием кнопки поиск. В Unix ну например первое что дает поисковик
http://www.lesbonscomptes.com/recoll/features.html. Уверен есть еще миллион таких проектов.



Отредактировано doza_and (Ноя. 14, 2015 20:05:07)

Офлайн

Board footer

Модераторировать

Powered by DjangoBB

Lo-Fi Version