Уведомления

Группа в Telegram: @pythonsu

#1 Май 20, 2011 09:28:01

doza_and
От:
Зарегистрирован: 2010-08-15
Сообщения: 4138
Репутация: +  253  -
Профиль   Отправить e-mail  

Существует gzip + быстрый seek

gzip определяет для объекта метод seek. Я сотворил файл на 15GB и стал сикать в разные места.
Время выполнения Линейно растет с увеличением позиции seek. После 4 GB резкий провал производительности.

Впечатление что просто декомпрессор последовательно идет по потоку данных.

Вопрос - может кто знает модули архивации с быстрым поиском позиции при извлечении данных?
Или может у gzip есть секретные опции.

Конечно можно и ZipFile сотворить, но:
1 Я не знаю как падает время поиска с увеличением количества файлов
2 файлы пишутся целиком (одним куском), что не очень удобно
3 при извлечении тоже надо целиком дергать seek отсутствует.



Отредактировано (Май 20, 2011 09:29:55)

Офлайн

#2 Май 20, 2011 15:35:50

Андрей Светлов
От:
Зарегистрирован: 2007-05-15
Сообщения: 3137
Репутация: +  14  -
Профиль   Адрес электронной почты  

Существует gzip + быстрый seek

У ZipFile по потоку на файл. Таблица — в конце.
Оба архиватора — поточные. Индексов не содержат, «прыгнуть» в середину не позволяют.



Офлайн

Board footer

Модераторировать

Powered by DjangoBB

Lo-Fi Version