Lexanderтак вроде разговор о двоичном файле. или я чего то пропустил?erlВ файле не латиница есть? Может быть просто с кодировками проблема, а не с массивом.
теперь из массива не могу нормальные данные достать, все перековеркалось.
Lexanderтак вроде разговор о двоичном файле. или я чего то пропустил?erlВ файле не латиница есть? Может быть просто с кодировками проблема, а не с массивом.
теперь из массива не могу нормальные данные достать, все перековеркалось.
PooHСпасибо, ваш код работает, но улучшений не много с 7 минут до 4 минут.
Я по быстрому накидал сегодня, времени особенно не было, но там ошибка. Завтра, если будет время, доведу до ума. Может сами доделаете.
Это у меня тестовые данные генерятся
http://pastebin.com/rnkvLZiR
А вот проход по записям
http://pastebin.com/GJPWVigW
erlМожно код получения отдельных записей вынести в расширение на С, а обрабатывать уже на питоне. Все зависит от ваших требований к задаче.
И скорее всего ни чего с этим уже поделать нельзя.
erlХмм. С чего это им быть медленными, если там все на Си написано?
Идея классная, код меня поразил, спасибо, но вот операции ввода-вывода у Python очень медленные.
И скорее всего ни чего с этим уже поделать нельзя.Вы пробовали?
EdЯ уверен все это можно сильно ускорить. И кстати, там по моему где-то ошибка. Просто я сейчас реально могу этому делу выделить где-то три раза в день по десять минут, а соображаю я довольно медленно.
PS: Если будет время сегодня из дому попробую нагенерить 500 метров данных и попрофилировать. А то ‘за державу обидно’ :)
$ time ./test70.py out
real 0m54.015s
user 0m28.642s
sys 0m5.236s
for rno, record in gen_record(inf):
outf.write("%d %d\n" % (rno, len(record)))
$ time ./test70.py out
real 0m22.812s
user 0m20.954s
sys 0m1.015s