dememax | Entries tagged with compress

Исходный пост 2008-го года: https://mpd.livejournal.com/5302.html или https://dememax.dreamwidth.org/4730.html

Отправная мысль проста (в исходном посте это выражено по-другому):

Архиватор должен найти повторяющиеся последовательности.
А что, если они очень далеко?
А что, если очень велики?

Т.к. предложенный метод для простоты оперирует одним файлом, который дублируется, то в нашем случае 2 и 3 — величины одного и того же порядка, рассматривается более конкретный случай.
Производительность и эффективное использование ресурсов (память, процессор, использование всех ядер процессора, место на диске, и т.д., и т.п.) — нас не интересует вообще, исключительно факт сжатия очевидного повторения в исходном потоке.

Размер: в прошлый раз я брал файл 8'677'260 байт, в этот раз (всё ж таки 12 лет прошло!) - 94'883'920 байт (некий ELF 64-bit LSB shared object, x86-64, dynamically linked, stripped).

В результате: получилось определить первый пункт с новым файлом только с помощью zstd.

Теперь подробнее.( Read more... )

Вторая часть: https://dememax.dreamwidth.org/163615.html

К сожалению, не для всех интуитивно понятно, что потоковые архиваторы не такие уж и крутые в плане сжатия, что можно сжимать ещё лучше, что есть ещё "место подвигу".
Недавно был в гостях у

itman, где один из гостей был удивлён этой мыслью (не знаю, насколько серьёзно).
( А доказать сей факт очень просто... )
Обратные ссылки: http://v-shabanoff.livejournal.com/13612.html
Дайджест всего блога '11

S	M	T	W	T	F	S
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30	31

Живой Журнал Максима Дементьева

Все записи открытые. Комментировать может любой. Не стесняйтесь! :-)

Entries tagged with compress

Арифметика потоковых архиваторов - 2

Арифметика потоковых архиваторов.

Profile

May 2023

Syndicate

Most Popular Tags

Page Summary

Style Credit

Expand Cut Tags