Уведомления

Группа в Telegram: @pythonsu

#1 Июль 14, 2011 17:44:35

vlad0405
От:
Зарегистрирован: 2011-07-14
Сообщения: 16
Репутация: +  0  -
Профиль   Отправить e-mail  

подскажите хранилище для многопоточной обработки документов

Доброго времени суток,

в Питоне очень мало.
Гуглил на темы хранилищ для Питона: Redis, CouchDB, MongoDB, Tokyo и так далее.
Но после всего прочитанного каша в голове, опыт только с MySQL и немного SQLite.

У меня следующая задача.
Надо в 1000 - 2000 потоков обрабатывать текстовые документы (после обработки останется примерно 100 кб в каждом документе) и складывать их в какое-нибудь хранилище.

Подскажите пожалуйста какое хранилище лучше всего для этого подойдет в Python3.



Офлайн

#2 Июль 14, 2011 19:01:57

o7412369815963
От:
Зарегистрирован: 2009-06-17
Сообщения: 1986
Репутация: +  32  -
Профиль   Отправить e-mail  

подскажите хранилище для многопоточной обработки документов

в файликах хранить.
можно ещё глянуть на mongoFS (или типа того)

Офлайн

#3 Июль 14, 2011 23:49:38

vlad0405
От:
Зарегистрирован: 2011-07-14
Сообщения: 16
Репутация: +  0  -
Профиль   Отправить e-mail  

подскажите хранилище для многопоточной обработки документов

Каждым потоком открывать отдельный файл?
Или сначала в словарь, а потом результат всех потоков в один файл, а потом уже когда потребуется разбирать этот файл?
Как лучше?



Офлайн

#4 Июль 15, 2011 21:16:00

kachayev
От:
Зарегистрирован: 2011-07-08
Сообщения: 40
Репутация: +  0  -
Профиль   Отправить e-mail  

подскажите хранилище для многопоточной обработки документов

2000 файлов по 100 кб это не большая нагрузка: ни на оперативную память, ни на фс. Можно в thread-ах обрабатывать файлы и писать в один открытый. Если уже припечет по скорости записи или чтения в “итоговом” хранилище, то возьми redis и пиши данные list (по одному item на строку, например).



Офлайн

#5 Июль 15, 2011 21:51:55

vlad0405
От:
Зарегистрирован: 2011-07-14
Сообщения: 16
Репутация: +  0  -
Профиль   Отправить e-mail  

подскажите хранилище для многопоточной обработки документов

Спасибо!



Офлайн

Board footer

Модераторировать

Powered by DjangoBB

Lo-Fi Version