Algoritmus és adatszerkezet Tavaszi félév Tóth Norbert1
Az LZW algoritmus nem elemzi a bejövő adatokat. A kódtábla első 256 kódját alapértelmezés szerint hozzárendelt szabványos kódlap. A ASCII kód az 1 byte-os karakterekre vonatkoznak, míg a stringeket közötti kódok jelölik.
A kódoló csak szótárbeli indexet küld. A szótár dinamikusan bővül, kiinduló állapotban az összes egybetűs szimbólumot tartalmazza. A kódolás elve: Az aktuális pozíciótól kezdve addig kell a szimbólumokat beolvasni, amíg a sorozat szerepel a szótárban. Ezután elküldjük ezen sorozat indexét, a szótárba felvesszük kiegészítve a következő szimbólummal, és az algoritmust ettől a szimbólumtól folytatjuk.
ABACABAD tömörítése: Az egybetűs szimbólumokhoz kódot rendelünk: A #0, B #1, C #2, D #3 Ezeket a következő módon egészítjük ki a következő szimbólummal: AB #4, BA #5, AC #6, CA #7, ABA #8, AD #9
#0 #1 #0 #2 #4 #0 #3
Veszteségmentes tömörítés Radikális fájlméret csökkenés (képek, pl: GIF)
Túl sok bitet tárol Mindenképp szükség van egy szótárra Csak angol karakterkészletre vonatkozik