shedevr.org.ru

gottax

Нужен сабж, 8-битовый RLE (с двухбайтовым окном). Подойдёт исходник на языках Си, Бейсик или Паскаль. В сети что-то ничего подходящего не нашёл.
Уже третий день бьюсь над своим пакером, но не могу добиться полноценного результата. Он сжимает чуть хуже, чем оригинальный алгоритм.
Да, ещё забыл упомянуть, что это не простой RLE - кроме цепочек из повторяющихся байтов, кодируются и цепочки из последовательных байтов (05h 06h 07h 08h и т. п.).
Может у кого-нибудь есть старые наработки? Буду очень признателен.

АнС · RRC2008 Зарегистрирован: 08.11.2003 Сообщения: 2818

Ну ты приколист, конечно. Shocked

А в темпе посмотреть? У Рефреша мой пример уже несколько лет лежит. Хотя у тебя случай более продвинутый, так что вряд ли поможет, надо разбираться (сам знаешь где - в Асе! Wink

)

Djinn

Код упаковщика для Beetlejuice.
Извиняюсь, комментарии не пишу.

Shiru

gottax

Djinn

gottax

I did it!

Хотя конечный пакер сжимает хуже оригинального на 1-2%, мне этого более чем достаточно (изменённые данные будут сжиматься лучше). Пришлось здорово поломать голову над реализацией этого чёртового "flexible parsing" Twisted Evil

Даже полностью переписал весь код с нуля. Но результат стоит того:)

Что любопытно, этот алгоритм сжимает свои данные (тайловые карты) даже лучше, чем хвалёные RAR и 7z Cool

АнС · RRC2008 Зарегистрирован: 08.11.2003 Сообщения: 2818

CaH4e3 · Зарегистрирован: 21.01.2004 Сообщения: 195

Интересно, что же все-таки копает gottax ;))))

На счет "flexible" парсинга (если это можно тут так назвать ;)), тупой алгоритм RLE собирает все повторы и чередует их прямым копированием байтов. Но на участках где короткие серии повторов чередуются с короткими сериями разных байтов, при двухбайтовой схеме кодирования, происходят утечки.

Например, последовательность взятая отбалды:

АнС · RRC2008 Зарегистрирован: 08.11.2003 Сообщения: 2818

Выходит, в любом виде RLE-алгоритма flexible parsing не нужен? Confused

gottax

CaH4e3 · Зарегистрирован: 21.01.2004 Сообщения: 195

Flexible parsing тут все-таки не совсем применимый термин. Он скорее относится преимущественно к lz77 алгоритмам, где опять же, вместо тупого собирания повторов, кодер перебирает несколько ближайших вариантов длин кодируемого участка данных, тем самым выбирая не всегда очевидные более выгодные последовательности. ;)

АнС · RRC2008 Зарегистрирован: 08.11.2003 Сообщения: 2818

Ну а мы, похоже, называем этим термином все случаи, где необходимо неким образом модифицировать алгоритм упаковки, который сжимает данные "в лоб" - модифицировать так, чтобы он периодически пытался отказаться от сжатия следующего байта/ряда байт, желая в перспективе сжать следующие байты гораздо лучше, чтобы в итоге вышел более выгодный вариант по сравнению со сжатием "в лоб".