Уведомления

Группа в Telegram: @pythonsu

#1 Авг. 18, 2009 13:36:13

test157
От:
Зарегистрирован: 2009-02-25
Сообщения: 54
Репутация: +  0  -
Профиль   Отправить e-mail  

Что быстрее, tuple или sqlite?

все понятно спасибо огромное ))

но это не все! кто кто может объяснить почему в строке -

if l[bisect.bisect_left(l, v)] == v:
у меня ИНОГДА вылетает ошибка
if l == v:
IndexError: list index out of range
вот сам код целиком
import bisect
import random
import time

chars = u'qwertyuiopasdfghjklzxcvbnm_01234567890'

def create_word():
w = ''
for n in range(10):
w += random.choice(chars)
return w

def create_list_of_words(count_of_words):
l = []
for i in xrange(count_of_words):
bisect.insort(l, create_word())
return l

def create_list_of_words2(count_of_words):
l = []
for i in xrange(count_of_words):
l.append(create_word())
return l

t = time.time()
l = create_list_of_words(30000)
print '\nQTY1_:%s' % len(l)
print time.time() - t

ls = create_list_of_words2(30000)
print '\nQTY2_:%s' % len(ls)

t = time.time()
for v in ls:
if l[bisect.bisect_left(l, v)] == v:
pass
print time.time() - t
и как с этим бороться? и я вобще правильно сделал поиск самого элемента?



Отредактировано (Авг. 18, 2009 13:37:48)

Офлайн

#2 Авг. 18, 2009 14:08:45

PooH
От:
Зарегистрирован: 2006-12-05
Сообщения: 1948
Репутация: +  72  -
Профиль   Отправить e-mail  

Что быстрее, tuple или sqlite?

test157
все понятно спасибо огромное ))

но это не все! кто кто может объяснить почему в строке -
if l[bisect.bisect_left(l, v)] == v:
у меня ИНОГДА вылетает ошибка
Элемент не найден и должен быть вставлен в конец списка, возвращается индекс за пределами списка
test157
и как с этим бороться? и я вобще правильно сделал поиск самого элемента?
ну вот так можно
def in_list(ls, item):
try:
return ls[bisect.bisect_left(ls, item)] == item
except IndexError:
return False



Вот здесь один из первых отарков съел лаборанта. Это был такой умный отарк, что понимал даже теорию относительности. Он разговаривал с лаборантом, а потом бросился на него и загрыз…

Отредактировано (Авг. 18, 2009 14:09:48)

Офлайн

#3 Авг. 18, 2009 14:08:50

NSkrypnik
От:
Зарегистрирован: 2009-08-17
Сообщения: 39
Репутация: +  0  -
Профиль   Отправить e-mail  

Что быстрее, tuple или sqlite?

Да речь действительно шла о трехстах, четырехстах словах =). Просто количество слов, которыее я проверяю на вхождение в эти 300-400 слов измеряется десятками тысяч, поэтому и спросил - что в этом случае будет быстрее, и будет ли вообще существенная разница.
Но все-таки решил использовать sqlite, по условию задачи некоторые слова должны добавляться в словарь контрольных слов и использоваться в дальнейшем =). Поэтому без базы никак.



Офлайн

#4 Авг. 18, 2009 14:12:14

PooH
От:
Зарегистрирован: 2006-12-05
Сообщения: 1948
Репутация: +  72  -
Профиль   Отправить e-mail  

Что быстрее, tuple или sqlite?

NSkrypnik
Но все-таки решил использовать sqlite, по условию задачи некоторые слова должны добавляться в словарь контрольных слов и использоваться в дальнейшем =). Поэтому без базы никак.
А что мешает загрузить слова в словарь из базы? или сохранить словарь в файл через pickle? Используя базу вы сильно потеряете в скорости



Вот здесь один из первых отарков съел лаборанта. Это был такой умный отарк, что понимал даже теорию относительности. Он разговаривал с лаборантом, а потом бросился на него и загрыз…

Офлайн

#5 Авг. 18, 2009 14:26:42

NSkrypnik
От:
Зарегистрирован: 2009-08-17
Сообщения: 39
Репутация: +  0  -
Профиль   Отправить e-mail  

Что быстрее, tuple или sqlite?

Ок, спасибо. Наверно так и сделаю. Т.е. все-таки обращение к API базы медленнее, чем допустим использование dict(я имею в виду если слово искать на вхождение не оператором in, а допустим has_key?).



Офлайн

#6 Авг. 18, 2009 14:27:41

test157
От:
Зарегистрирован: 2009-02-25
Сообщения: 54
Репутация: +  0  -
Профиль   Отправить e-mail  

Что быстрее, tuple или sqlite?

ну все - разобрался. чтобы окончательно закрыть вопрос, небольшое сравнение по скорости PHP/Python List/Python Bisect

QTY1_30000 - это означает время затраченное на создание массива из 30 тысяч элементов.
QTY2_30000 - это означает время затраченное на 30 тысяч поисков в созданном массиве, которые берутся из другого массива.
ПАМЯТЬ: сколько весит приложение с массивом в 30 тысяч строк - длина элемента в массиве 101 байт.
======================================================================
значения для PHP 5.2.6-1+lenny3 with Suhosin-Patch 0.9.6.2 (cli)

ПАМЯТЬ: 66136K

QTY_1:30000
2.0054268837

QTY_2:30000
104.426306009
$chars = 'qwertyuiopasdfghjklzxcvbnm_01234567890';

function create_word(){
global $chars;
$w = '';
for ($i = 0; $i <= 100; $i++) {
$w .= $chars{rand(0, 37)};
}
return $w;
}

function create_list_of_words($count_of_words) {
$l = array();
for ($i = 0; $i < $count_of_words; $i++) {
$l[] = create_word();
}
return $l;
}

$t = microtime(true);
$l = create_list_of_words(30000);
print "\nQTY_1:".count($l)."\n";
print microtime(true) - $t;

$ls = create_list_of_words(30000);
print "\nQTY_2:".count($ls)."\n";

$t = microtime(true);
foreach ($ls as $v) {
if (in_array($v, $l)) {
true;
}
}
print "\n" . (microtime(true) - $t);
======================================================================
значения для Python 2.5.2 (работа с листами)
ПАМЯТЬ: 19060K
QTY1_:30000
3.97967195511

QTY2_:30000
41.5297501087
import bisect
import random
import time

chars = u'qwertyuiopasdfghjklzxcvbnm_01234567890'

def create_word():
w = ''
for n in range(101):
w += random.choice(chars)
return w

def create_list_of_words(count_of_words):
l = []
for i in xrange(count_of_words):
l.append(create_word())
return l

t = time.time()
l = create_list_of_words(30000)
print '\nQTY1_:%s' % len(l)
print time.time() - t

ls = create_list_of_words(30000)
print '\nQTY2_:%s' % len(ls)

t = time.time()
for v in ls:
if v in l:
pass
print time.time() - t
======================================================================
значения для Python 2.5.2 (работа с bisect)
ПАМЯТЬ: 19028K

QTY1_:30000
4.41841101646

QTY2_:30000
0.0710809230804 !!!!!!!!
import bisect
import random
import time

chars = u'qwertyuiopasdfghjklzxcvbnm_01234567890'

def create_word():
w = ''
for n in range(101):
w += random.choice(chars)
return w

def create_list_of_words(count_of_words):
l = []
for i in xrange(count_of_words):
bisect.insort(l, create_word())
return l

def create_list_of_words2(count_of_words):
l = []
for i in xrange(count_of_words):
l.append(create_word())
return l

t = time.time()
l = create_list_of_words(30000)
print '\nQTY1_:%s' % len(l)
print time.time() - t

ls = create_list_of_words2(30000)
print '\nQTY2_:%s' % len(ls)

t = time.time()
for v in ls:
try:
if l[bisect.bisect_left(l, v)] == v:
pass
except:
pass
print time.time() - t
питон на высоте, даже с обычными листами - он обходит ПХП. как у меня раньше получалось иначе - не понимаю, такчто PooH - вы были правы на 100% извиняюсь за дэзу

и еще раз всем спасибо, открыл да себя реально полезную вещицу )



Отредактировано (Авг. 18, 2009 14:29:08)

Офлайн

#7 Авг. 18, 2009 14:56:55

test157
От:
Зарегистрирован: 2009-02-25
Сообщения: 54
Репутация: +  0  -
Профиль   Отправить e-mail  

Что быстрее, tuple или sqlite?

NSkrypnik
через bisect можно эмулировать работу словаря. последний пример тут: http://docs.python.org/library/bisect.html как раз об этом. такчто можешь смело использовать бисект он ОЧЕНЬ БЫСТРЫЙ, за основу можешь взять мой код с бенчмарком. и чуть изменить его на основе коода из документации по питону.



Офлайн

Board footer

Модераторировать

Powered by DjangoBB

Lo-Fi Version