Алгоритм поиска соответствия LZ4 (быстрое сканирование)

Я реализовал алгоритм сжатия на основе LZ77/LZ4 (без энтропийного кодирования), основанный на хеш-цепочках бесконечной глубины. Работает хорошо, скорость приемлемая, но степень сжатия близка к LZ4. Читая документацию и просматривая исходный код проекта LZ4, я понимаю, что он использует хэш-цепочку с глубиной 1, но если я установлю глубину своей реализации на 1, LZ4 превзойдет ее.

Я не могу понять, как работает алгоритм поиска соответствия LZ4 (быстрое сканирование). Может ли кто-нибудь объяснить это?

Спасибо.

compression lz4 lossless-compression

user3368561 20.12.2014 источник

Ответы (1)

arrow_upward
0
arrow_downward

В процессе сканирования используется поиск по хешу. как следующее:

Старые байты--------------анкор-------------Новые байты----текущие
ч = хэш [int4]
reference=hash.get(h)
hash.put(h,current) for later matching
int(ссылка)==int(текущий)? обрабатывать совпадения: повторить попытку
обрабатывать спички

Переменная seachMatchNb — это способ пропуска для быстрого сопоставления, но может быть совпадение минут с потерями или нет.

Хэш-таблица представляет собой JIT-стиль, в котором сохраняются только смещения. Функция readIntEquals выполняет сопоставление ключей.

Просто игнорируйте его в режиме обучения.

qinxian 21.08.2017

Алгоритм поиска соответствия LZ4 (быстрое сканирование)

Ответы (1)

Вопросы по теме