Készítette: Mester Tamás METRABI.ELTE.  Egy bemeneten kapott szöveg(karakter sorozat) méretét csökkenteni, minél kisebb méretűre minél hatékonyabb algoritmussal.

Slides:



Advertisements
Hasonló előadás
Készítette: Kosztyán Zsolt Tibor
Advertisements

KÉSZÍTETTE: Takács Sándor
Kódelmélet.
Matematika és Tánc Felkészítő tanár: Komáromi Annamária
Az adatábrázolás, adattárolás módja a számítógépekben
Készítette: Major Máté
Matematika II. 4. előadás Geodézia szakmérnöki szak 2010/2011. tanév Műszaki térinformatika ágazat tavaszi félév.
Sándor Laki (C) Számítógépes hálózatok I. 1 Számítógépes hálózatok 3.gyakorlat Fizikai réteg Kódolások, moduláció, CDMA Laki Sándor
 Veszteségmentes kódolás  Visszafejtése egyértelmű  Egyik kódszó sem lehet része semelyik másiknak  Lépések:  1.: Statisztika a kódolandó anyagról.
Tóth István Algoritmusok és adatszerkezetek 2.
Készítette: Lakos Péter
Algoritmus és adatszerkezet Tavaszi félév Tóth Norbert1.
Algoritmusok és adatszerkezetek 2 Újvári Zsuzsanna.
Szélességi bejárás Párhuzamosítása.
Az összehasonlító rendezések
Sztringek.
7. Óra Tömörítés, csomagolás, kicsomagolás
Prefix egyszerűen Miről is beszélek?. Részlet egy szoba beszélgetéséből.
Forrás kódolás Feladat: -az információ tömörítése.
Kommunikációs Rendszerek
Miskolci Egyetem Informatikai Intézet Általános Informatikai Tanszé k Pance Miklós Adatstruktúrák, algoritmusok előadásvázlat Miskolc, 2004 Technikai közreműködő:
AVL fák.
A digitális számítás elmélete
A digitális számítás elmélete
Számoljuk meg rekurzív függvénnyel egy bináris fa leveleit!
Huffman Kódolás.
Miskolci Egyetem Informatikai Intézet Általános Informatikai Tanszé k Pance Miklós Adatstruktúrák, algoritmusok előadásvázlat Miskolc, 2004 Technikai közreműködő:
Készítette: Lakos Péter.  Adott egy élsúlyozott, véges gráf  Negatív élsúlyokat nem tartalmaz  Lehet irányított vagy irányítatlan  Továbbá adott egy.
Algoritmusok II. Gyakorlat 3. Feladat Pup Márton.
Klikk az ENTER-re a továbblépéshez.
A háromszög Torricelli-pontja
Alapismeretek Számítógépes adatábrázolás
Szintaktikai, szemantikai szabályok
1.4. Fordítás, szerkesztés, az objektumkönyvtár használata.
I276 Antal János Benjamin 12. osztály Nyíregyháza, Széchenyi I. Közg. Szki. Huffman kódolás.
Készítette: Mester Tamás METRABI.ELTE.  Adott egy G=(V,E) élsúlyozott, irányított vagy irányítás nélküli, negatív élsúlyokat nem tartalmazó, véges gráf.
Karakter kódolás Összeállította: Kovács Nándor Felhasznált irodalom:
A Dijkstra algoritmus.
Készítette: Hanics Anikó. Az algoritmus elve: Kezdetben legyen n db kék fa, azaz a gráf minden csúcsa egy-egy (egy pontból álló) kék fa, és legyen minden.
A Huffman féle tömörítő algoritmus
1 Szélességi Bejárás Györgyi Tamás – GYTNAAI.ELTE 2007 Március 22 Algoritmusok És Adatszerkezetek 2 Gráfalgoritmus S b a d e f h g c.
Alapfogalmak, módszerek, szoftverek
Alapismeretek Számítógépes adatábrázolás
Példa kettő-három fa felépítésére - törlés művelet Készítette : Krizsai Petra
Adattömörítés.
Nagy Szilvia 13. Konvolúciós kódolás
Háló- (gráf-) algoritmusok
Business Mathematics A legrövidebb út.
2005. Információelmélet Nagy Szilvia 3. Forráskódolási módszerek.
Hibajavító kódok.
HEFOP 3.3.1–P /1.0A projekt az Európai Unió társfinanszírozásával, az Európa terv keretében valósul meg. 1 Számítógép architektúrák dr. Kovács.
Készítette : Giligor Dávid Neptun : HSYGGS
„RADIX előre „ Készítette : Giligor Dávid Neptun: HSYGGS.
Huffman kód.
A Huffman féle tömörítő algoritmus Huffman Kód. Az Algoritmus Alapelvei Karakterek hossza különböző A karakter hossza sűrűsége határozza meg: Minél több.
Quick-Search algoritmus. Bevezet ő Az eljárás működése során két esetet különböztetünk meg: A szöveg minta utáni első karaktere nem fordul elő a mintában.
LZW (Lempel-Ziv-Welch) tömörítő algoritmus
Huffman tömörítés.
LZW tömörítés Akopjan Alex Algoritmusok és adatszerkezetek 2.
Huffman algoritmus Gráf-algoritmusok Algoritmusok és adatszerkezetek II. Gergály Gábor WZBNCH1.
TÁMOP /1-2F Informatikai gyakorlatok 11. évfolyam Alapvető programozási tételek megvalósítása Czigléczky Gábor 2009.
PRÜFER KÓD. Fák kódolása számsorozatokkal Prüfer-kód: n csúcsú fa ↔ n-2 db szám Minden szám 1 és n közötti lehet Kölcsönösen egyértelmű: n csúcsú fák.
A Dijkstra algoritmus.
27. óra Kódolás, Dekódolás.
Titkosítás.
Algoritmusok és Adatszerkezetek I.
Informatikai gyakorlatok 11. évfolyam
INFOÉRA 2006 Szövegfeldolgozás III.
Algoritmusok és Adatszerkezetek I.
Szövegfeldolgozás II. INFOÉRA perc kell még hozzá
Előadás másolata:

Készítette: Mester Tamás METRABI.ELTE

 Egy bemeneten kapott szöveg(karakter sorozat) méretét csökkenteni, minél kisebb méretűre minél hatékonyabb algoritmussal.  Különböző tömörítési eljárások ugyanazon bemeneten különböző méreteket eredményezhetnek.

 Adott egy ábécé és egy ezen ábécé feletti szöveg.  Példa input KAKUKKMADARAMNAK ábécé: {K, A, U, M, D, R, N}  Az algoritmus alapelve: Karakterek változó kódhossza, a szövegbeli gyakoriságuknak megfelelően. Pl.: ‚e’ vs. ‚w’ ; ebben az esetben az ‚e’ betű egy gyakori betű, míg a ‚w’ ritka. Ennek megfelelően az ‚e’ betűnek egy rövid kódhosszat kell választani, míg a ‚w’ kódja lehet hosszabb.

 Egy olyan algoritmus a kód előállítására, hogy az eredmény optimális legyen, azaz optimális legrövidebb kódolást alkotó algoritmust adjunk.  A példában 7 karakter szerepel, uniform módon (3 biten ) kódoljuk őket.  16 karakter * 3 bit = 48 bit, ezen kellene javítani  Alapvető nehézség lenne a kódolt szöveg visszafejtésében a következő. Tfh.: K 10, A 101 és a kódolt szöveg Ebben az esetben nem lenne visszakódolható a szöveg, ezért ne engedjük meg azt,hogy egyik betű kódja a másik valódi prefixuma legyen!

 Egy prefixmentes-kód  Ha minden karaktert ábrázolunk, akkor megkapjuk a kódfát. Ebben a fában minden belső pontnak 2 gyereke van.  A betűk a leveleken jelentkeznek, kódjuk a gyökér -> levél útvonal 0/1 szelektorainak sorozata.

 Az algoritmus inputja: betűk és gyakoriságaik (tehát először kell egy végigolvasás a statisztika elkészítéséhez)  Az algoritmus egy fát épít fel alulról-felfelé, kezdve a ritka betűkkel (karakterekkel) fokozatosan bekapcsolva a gyakoribbakat.  Minden lépésben két csúcsot „fogunk össze”, a két gyakoriság összegével.  Miután végeztük a Huffmann-kód tábláját is átkell adni a dekódoló félnek!

N 1 R 1 D 1 U 1 M 2 K 5 A 5 input: K-5, A-5, U-1, M-2, D-1, R-1, N-1

N 1 R 1 D 1 U 1 M 2 K 5 A

N 1 R 1 D 1 U 1 M 2 K 5 A

N 1 R 1 D 1 U 1 M 2 K 5 A

N 1 R 1 D 1 U 1 M K 5 A

N 1 R 1 D 1 U 1 M K 5 A

 Karakterek kódtáblája: KarakterKarakter kódja A00 K01 M10 U1100 D1101 R1110 N1111  Kódolt karaktersorozat hossza: 5*2+5*2+2*2+4*4 = 40 bit, ami jobb, mint az eredeti 48 bit!