Найти - Пользователи
Полная версия: теги
Начало » Python для экспертов » теги
1 2 3 4 5 6
o7412369815963
ога, так и планирую. Multikeys наверно и делали в основном из-за тегов :)
Ed
А мне почему-то приходит в голову всякий NoSQL и map reduce. Не?
o7412369815963
Ed
А мне почему-то приходит в голову всякий NoSQL и map reduce. Не?
оно
o7412369815963
добавил 200К объектов:
db.events.save({ ‘data’:uuid.uuid1(), ‘tags’:random.sample(tt,5) }) в цикле

выборка 100 элементов идет быстро 0,016 сек
db.events.find({ ‘tags’: { ‘$all’: } }).limit(100)

а вот быстрый выбор тегов не придумал, пока сделал тормазнутый мап-редьюс (9сек):
def get_tags():
from pymongo.code import Code
map = Code(""" function() {
var ok = 0;
for(var i in this.tags) {
if(this.tags[i]=='a') ok += 1;
if(this.tags[i]=='b') ok += 1;
};
if(ok==2)
this.tags.forEach(
function(x) {
emit(x, 1);
}
);
}""")

reduce = Code("""function (key, values) {
var total = 0;
for(var i in values) total += values[i];
return total;
}""")
tags = db.events.map_reduce(map, reduce)
tags = list(tags.find().sort('value',DESCENDING).limit(100))
наверно нужно подготавливать какую-нибудь структуру…
Ed
список тэгов можно хранить отдельно
Ed
я бы еще на redis посмотрео. у него есть поддержка сетов и всякие операции с ними. к тому же он зело шустр.
o7412369815963
Ed
список тэгов можно хранить отдельно
можно, есть идеи?

редиса гляну
Ed
o7412369815963
Ed
список тэгов можно хранить отдельно
можно, есть идеи?
Идей море :)
можно, например, хранить их в той же базе в виде tag:<tag name> - количество оттеженых документов и обновлять при любом изменении. Получим практически моментальную статистику по тэгам в обмен на усложнение обработки.
o7412369815963
Ed
можно, например, хранить их в той же базе в виде tag:<tag name> - количество оттеженых документов и обновлять при любом изменении. Получим практически моментальную статистику по тэгам в обмен на усложнение обработки.
данный алгоритм не даст требуемого результата.
Ed
Если хотите помощи, то объясняйте свои … мнэ … выводы? догмы?.
This is a "lo-fi" version of our main content. To view the full version with more information, formatting and images, please click here.
Powered by DjangoBB