Az előadás letöltése folymat van. Kérjük, várjon

Az előadás letöltése folymat van. Kérjük, várjon

2005. Információelmélet Nagy Szilvia 4. A gyakorlatban használt tömörítő eljárások.

Hasonló előadás


Az előadások a következő témára: "2005. Információelmélet Nagy Szilvia 4. A gyakorlatban használt tömörítő eljárások."— Előadás másolata:

1 2005. Információelmélet Nagy Szilvia 4. A gyakorlatban használt tömörítő eljárások

2 Széchenyi István Egyetem 2 Ha a forrás által kibocsátott jel folytonos, és digitálisan szeretnénk kezelni, át kell alakítani időben és amplitúdóban diszkrét jelekké. Mintavételezés : a jelet időben diszkrét sorozattá alakítjuk: y ( t ) → y ( t 0 +nT ), n = 0, 1, 2, … Az így kapott sorozat elemei tetszőleges számok lehetnek. Mintavételezés és kvantálás Információelmélet – Gyakorlati tömörítő eljárások Gyakorlatban használt tömörítő eljárások Mintavételezés és kvantálás Hangok tömörítése Képek tömörítése Mozgóképek tömörítése

3 Széchenyi István Egyetem 3 Ha a forrás által kibocsátott jel folytonos, és digitálisan szeretnénk kezelni, át kell alakítani időben és amplitúdóban diszkrét jelekké. Kvantálás : Az y ( t 0 +nT ) sorozat minden egyes elemét egy véges halmazból választott számmal közelítjük, azaz amplitúdóban is diszkrétté tesszük a jelet. Egy Q ( y ) kvantáló függvénnyel y ( t 0 +nT ) → Q ( y ( t 0 +nT )), n = 0, 1, 2, … Mintavételezés és kvantálás Gyakorlatban használt tömörítő eljárások Mintavételezés és kvantálás Hangok tömörítése Képek tömörítése Mozgóképek tömörítése Információelmélet – Gyakorlati tömörítő eljárások

4 Széchenyi István Egyetem 4 A mintavételezési tétel szerint egy B sávra kor- látozott jelet legalább (1/  )  B frekvenciá- val kell mintavételezni, azaz a mintavéte- lezési időre igaz, hogy Legyen egy B sávra korlátozott jelünk. (Spektrumának összetevői az 1/(2  )[−B, B ] frekvenciasávon kívül nullának tekinthetők ) Mintavételezési tétel Gyakorlatban használt tömörítő eljárások Mintavételezés és kvantálás Hangok tömörítése Képek tömörítése Mozgóképek tömörítése Információelmélet – Gyakorlati tömörítő eljárások

5 Széchenyi István Egyetem 5 A mintavételezési tétel szerint egy B sávra korlátozott jelet legalább (1/  )  B frekvenciával kell mintavételezni, azaz a mintavételezési időre igaz, hogy Gyakorlatban használt tömörítő eljárások Mintavételezés és kvantálás Hangok tömörítése Képek tömörítése Mozgóképek tömörítése Információelmélet – Gyakorlati tömörítő eljárások Mintavételezési tétel

6 Széchenyi István Egyetem 6 Gyakorlatban használt tömörítő eljárások Mintavételezés és kvantálás Hangok tömörítése Képek tömörítése Mozgóképek tömörítése Információelmélet – Gyakorlati tömörítő eljárások A mintavételezési tétel szerint egy B sávra korlátozott jelet legalább (1/  )  B frekvenciával kell mintavételezni, azaz a mintavételezési időre igaz, hogy Mintavételezési tétel

7 Széchenyi István Egyetem 7 Gyakorlatban használt tömörítő eljárások Mintavételezés és kvantálás Hangok tömörítése Képek tömörítése Mozgóképek tömörítése Információelmélet – Gyakorlati tömörítő eljárások A mintavételezési tétel szerint egy B sávra korlátozott jelet legalább (1/  )  B frekvenciával kell mintavételezni, azaz a mintavételezési időre igaz, hogy Mintavételezési tétel

8 Széchenyi István Egyetem 8 A Q( y ) kvantálók felbontják y ( t 0 +nT ) értékkészletét nem átfedő intervallumokra, minden intervallumhoz hozzárendelnek egy számot, az egyes intervallumok minden eleméhez az intervallum számát rendelik hozzá. Leírhatók az értékkészlet részhalmazaival és a hozzájuk rendelt számokkal, vagy függvényekkel. Kvantálás Gyakorlatban használt tömörítő eljárások Mintavételezés és kvantálás Hangok tömörítése Képek tömörítése Mozgóképek tömörítése Információelmélet – Gyakorlati tömörítő eljárások

9 Széchenyi István Egyetem 9 A Q( y ) kvantálók általában jól jellemezhetők lépcsősfüggvényekkel: Kvantálás egyenletes lineáris kvantáló nemlineáris kvantáló Gyakorlatban használt tömörítő eljárások Mintavételezés és kvantálás Hangok tömörítése Képek tömörítése Mozgóképek tömörítése Információelmélet – Gyakorlati tömörítő eljárások

10 Széchenyi István Egyetem 10 A Q( y ) kvantálók jól jellemezhetők négyzetes torzítás ukkal: Gyakorlatban használt tömörítő eljárások Mintavételezés és kvantálás Hangok tömörítése Képek tömörítése Mozgóképek tömörítése Információelmélet – Gyakorlati tömörítő eljárások Kvantálás

11 Széchenyi István Egyetem 11 Kvantálás Gyakran a kvantálás előtt a feladathoz illeszkedő transzformációt hajtanak végre a mintavételezett jelen kvantálás előtt. Jól megválasztott mintavételezési idővel és kvantáló folyamattal igen nagy arányú tömörítés érhető el. Gyakorlatban használt tömörítő eljárások Mintavételezés és kvantálás Hangok tömörítése Képek tömörítése Mozgóképek tömörítése Információelmélet – Gyakorlati tömörítő eljárások

12 Széchenyi István Egyetem 12 Az emberek 20 Hz és 20 kHz között hallanak, de a legérzékenyebb a fül 2 és 4 kHz között  a kvantáló itt finomabb fel- bontású, a hallható frekvenciatartomány széle felé egyre durvább. Egy nagy intenzitású hang maszkolja a vele egyszerre megszólaló frekvenciában hozzá közeli, kisebb intenzitásúakat  az elfedett hangok elhagyhatók. A maszkolás a nagy intenzitású hang meg- szólalási idején túlnyúlik: a megszólalása előtti kb. 2 ms-os és elhallgatása utáni kb. 15 ms-os időszakra is kiterjed  ezek az elfedett hangok is elhagyhatók. Hangok tömörítése Gyakorlatban használt tömörítő eljárások Mintavételezés és kvantálás Hangok tömörítése Képek tömörítése Mozgóképek tömörítése Információelmélet – Gyakorlati tömörítő eljárások

13 Széchenyi István Egyetem 13 CD: nem használja ki ezeket a lehetőségeket, az MPEG hangkódolói (MP1, MP2, MP3) igen. A CD a 2 (sztereó), 4 (kvadrofón), 5, … hangcsatorna mindegyikének a jeleit 44,1 kHz frekvenciával mintavételezi, 2 bájtra kvantálja és további tömörítés nélkül rögzíti. Hangok tömörítése Gyakorlatban használt tömörítő eljárások Mintavételezés és kvantálás Hangok tömörítése Képek tömörítése Mozgóképek tömörítése Információelmélet – Gyakorlati tömörítő eljárások

14 Széchenyi István Egyetem 14 Az MPEG Layer 1, 2, és 3 algoritmusai: A filmek hangjait 32; 44,1; vagy 48 kHz frekvenciával mintavételezik, A teljes frekvenciasávot 32 részsávra bontják. Minden részsávban elvégeznek egy a maszkolásokat figyelembe vevő transzformációt – a különböző részsávokban különbözőket –, A részsávnak megfelelő finomsággal kvantálnak. Gyakorlatban használt tömörítő eljárások Mintavételezés és kvantálás Hangok tömörítése Képek tömörítése Mozgóképek tömörítése Információelmélet – Gyakorlati tömörítő eljárások Hangok tömörítése

15 Széchenyi István Egyetem 15 A fejlettebb algoritmusok (például az MP3) a részsávokat tovább bontják, a maszkolást jobban figyelembe vevő transzformációkat használnak, a lineáris kvantáló helyett a feladathoz jobban illeszkedőt alkalmaznak, a kimeneti jeleket még egy általános forráskódolási eljárással (Huffman- kóddal) tömörítik is. Gyakorlatban használt tömörítő eljárások Mintavételezés és kvantálás Hangok tömörítése Képek tömörítése Mozgóképek tömörítése Információelmélet – Gyakorlati tömörítő eljárások Hangok tömörítése

16 Széchenyi István Egyetem 16 A képek digitális feldolgozásakor az első lépés a kép területének apró kockákra, pixel ekre, való felbontása. Ha a képek mozgókép részei, akkor a pixelek száma meghatározott (720  480, az NTSC szabvány szerint, illetve 768  576 a PAL szerint), egyébként tetszőleges lehet. Mozgóképeknél szükséges adat a képfrissítési frekvencia is. 1.Fekete-fehér képeknél az egyes pixelekhez csak egy adatot rendelnek hozzá: a képpont világosságát. Képek tömörítése: színek Gyakorlatban használt tömörítő eljárások Mintavételezés és kvantálás Hangok tömörítése Képek tömörítése Mozgóképek tömörítése Információelmélet – Gyakorlati tömörítő eljárások

17 Széchenyi István Egyetem 17 2.Színes képeknél (néhány eset kivételével) több értéket is: a vörös, zöld és kék színek intenzitását (RGB) az adott pontban, vagy a világosságot (Y) (luminancia) és még két színkoordináta értékét (C r és C b ) (krominancia). A színtérben való kvantálást a színmélység jellemzi, amely azt mondja meg, hogy egy pixel leírására hány bitet használunk. Általában 8 vagy 24 bit szokott lenni a színmélység. Képek tömörítése: színek Gyakorlatban használt tömörítő eljárások Mintavételezés és kvantálás Hangok tömörítése Képek tömörítése Mozgóképek tömörítése Információelmélet – Gyakorlati tömörítő eljárások

18 Széchenyi István Egyetem 18 Az emberi szemben található receptorok (csapok és pálcikák) a 360 nm és 830 nm közötti hullámhosszú fényre érzékenyek. A három különböző hullámhossz- tartományú fényre érzékeny háromféle receptor (csap) alakítja ki főként a látást, mindegyiknek az intenzitásra való érzékenysége közel lineáris (legalábbis egy tartományon belül). A szem a fény intenzitására érzékenyebb, mint a színre, a C r és C b krominanciák kvantálásakor nagyobb torzítást engedhetünk meg, mint az Y-nal jelölt luminanciánál. Gyakorlatban használt tömörítő eljárások Mintavételezés és kvantálás Hangok tömörítése Képek tömörítése Mozgóképek tömörítése Információelmélet – Gyakorlati tömörítő eljárások Képek tömörítése: színek

19 Széchenyi István Egyetem 19 A különböző térbeli frekvenciával rendelkező képösszetevőkre nem egyforma a szem érzékenysége: könnyebben észreveszünk egy halványabb mintázatot, hogyha az ritkább, mintha sűrűbb. Sok helyen ezt ki is használják, a nagyobb térbeli frekvenciájú komponenseket elhagyják, főleg, ha például filmben csak rövid ideig jelenik meg. Gyakorlatban használt tömörítő eljárások Mintavételezés és kvantálás Hangok tömörítése Képek tömörítése Mozgóképek tömörítése Információelmélet – Gyakorlati tömörítő eljárások Képek tömörítése: színek

20 Széchenyi István Egyetem 20 A GIF szabvány nem hagy el részleteket a képből, a soronként letapogatott, mintavételezett, kvantált jelsorozatot tömöríti egy Lempel—Ziv-algoritmussal. A színeket indexelt tárolással kezeli: a színér- tékekből (azok RGB koordinátáiból) táblázatot – palettát – alakít ki, és az egyes képpontokhoz csak a megfelelő elem címkéjét kell eltárolni. Az így kapott szimbólumsorozatot tömörítik LZW algoritmussal. Képek tömörítése: GIF Gyakorlatban használt tömörítő eljárások Mintavételezés és kvantálás Hangok tömörítése Képek tömörítése Mozgóképek tömörítése Információelmélet – Gyakorlati tömörítő eljárások

21 Széchenyi István Egyetem 21 Mivel a palettát és a LZW-kód szótárát el kell raktározni, a tömörítés csak kellően nagy képeknél tud kifizetődni, főleg ha kevés színt használ a kép, illetve egy színt nagyobb felületeken alkalmaz. Képek tömörítése: GIF Gyakorlatban használt tömörítő eljárások Mintavételezés és kvantálás Hangok tömörítése Képek tömörítése Mozgóképek tömörítése Információelmélet – Gyakorlati tömörítő eljárások

22 Széchenyi István Egyetem 22 A JPEG teljesen elszeparálva kezeli a három képsíkot, a három színt: egy színes kép helyett három egyszínűt tömörít. A veszteségmentes tömörítési eljárásuk egy prediktív kódolás, amely az egy kép- ponthoz tartozó intenzitásértékek helyett csak azoknak egy az intenzitást becslő értéktől való kis eltérését tárolja el. Ha elég jó az ezekből származtatott becslés, akkor igen kicsi eltérést kell eltárolni, ami természetesen kevesebb tárat igényel. A kapott eltéréseket aritmetikai kódolással tömörítik. Képek tömörítése: JPEG Gyakorlatban használt tömörítő eljárások Mintavételezés és kvantálás Hangok tömörítése Képek tömörítése Mozgóképek tömörítése Információelmélet – Gyakorlati tömörítő eljárások

23 Széchenyi István Egyetem 23 A becsült értéket mindig már meglévő szomszédos képpontok intenzitásaiból állítja elő – például ezek közül néhány számtani közepeként. A képnél egy pixel már meglévő három szomszédos képpontja a fölötte, az előtte és az előtte átlósan felfelé lévő pont. Képek tömörítése: JPEG Gyakorlatban használt tömörítő eljárások Mintavételezés és kvantálás Hangok tömörítése Képek tömörítése Mozgóképek tömörítése Információelmélet – Gyakorlati tömörítő eljárások

24 Széchenyi István Egyetem 24 Felbontja a képeket 8×8 pixeles négyzetekre, úgynevezett csempék re (tile). minden csempét diszkrét koszinusz transzformációnak vet alá. Így kap a frekvenciatartományban egy valós számokból álló sorozatot. A kapott valós számsorozatot újfent kvantálja, hogy egész értékei legyenek. A kvantáló egyenletes, de a lépésköze a csempe minden elemére (a csempében található különböző frekvenciájú tagokra) más és más lehet. Gyakorlatban használt tömörítő eljárások Mintavételezés és kvantálás Hangok tömörítése Képek tömörítése Mozgóképek tömörítése Információelmélet – Gyakorlati tömörítő eljárások JPEG – veszteséges tömörítés

25 Széchenyi István Egyetem 25 A csempe elemei úgy helyezkednek el, hogy kisebb frekvenciás tagok – amelyekre a szem érzékenyebb – a bal felső sarokba kerülnek, őket szokás kisebb lépésközzel kvantálni. A nagyobb frekvenciás, jobb alsó elemeket nagy lépésközzel kvantálják. Az egyes elemekre vonatkozó kvantálási lépésközöket is el kell tárolni egy táblázatban. A nagyfrekvenciás, majdnem nulla elemeket a csempében elhagyja a tömörítő eljárás. Így tehát a csempe jobb alsó sarkában szinte csak nulla van. Gyakorlatban használt tömörítő eljárások Mintavételezés és kvantálás Hangok tömörítése Képek tömörítése Mozgóképek tömörítése Információelmélet – Gyakorlati tömörítő eljárások JPEG – veszteséges tömörítés

26 Széchenyi István Egyetem 26 A csempe jobb alsó sarkában szinte csak nulla van. Annak érdekében, hogy ezek egy hosszú nullákból álló sorozatot alkossanak, a JPEG a következő kiolvasási sorrendet használja: 00 000 000 Gyakorlatban használt tömörítő eljárások Mintavételezés és kvantálás Hangok tömörítése Képek tömörítése Mozgóképek tömörítése Információelmélet – Gyakorlati tömörítő eljárások JPEG – veszteséges tömörítés

27 Széchenyi István Egyetem 27 futamhossz-kódolás során a kapott, sok nullát tartalmazó sorozatot úgy bontjuk részekre, hogy minden részsorozat valamennyi (lehet nulla is) nullával kezdődjön, és egyetlen nem nulla elemmel végződjön: … 0 0 0 31 0 0 17 0 0 0 0 0 0 445 11 0 0 4 0 … Egy ilyen részsorozathoz hozzárendel a kód három számot: a nullák számát, a nem nulla elem leírásához használt bitek számát és a nem nulla elem értékét. Gyakorlatban használt tömörítő eljárások Mintavételezés és kvantálás Hangok tömörítése Képek tömörítése Mozgóképek tömörítése Információelmélet – Gyakorlati tömörítő eljárások JPEG – veszteséges tömörítés

28 Széchenyi István Egyetem 28 Végül Huffman-kóddal tömöríti a kapott számhármasokból az első két-két elemet. A Huffman-kódot nem lehet megválasztani, az rögzített a szabványban. Későbbi verziókban aritmetikai kódolás is lehetséges. Gyakorlatban használt tömörítő eljárások Mintavételezés és kvantálás Hangok tömörítése Képek tömörítése Mozgóképek tömörítése Információelmélet – Gyakorlati tömörítő eljárások JPEG – veszteséges tömörítés

29 Széchenyi István Egyetem 29 Egy film videoszekvenciá kból áll, amelynek a fejléce tartalmazza a képméretet, képsebességet és a képsorozat fontos paramétereit. A videoszekvencia képcsoport okból áll. Egy képcsoport több, egymás utáni kép. Minden képcsoportot külön, egymástól függetlenül kódolnak. A kép eknek három típusát különbözteti meg a szabvány, ezeket a típusokat I- vel, P-vel és B-vel jelöli. Mozgóképek tömörítése: MPEG Gyakorlatban használt tömörítő eljárások Mintavételezés és kvantálás Hangok tömörítése Képek tömörítése Mozgóképek tömörítése Információelmélet – Gyakorlati tömörítő eljárások

30 Széchenyi István Egyetem 30 A képek sáv okból állnak, és a sávok elején mindig ugyanaz a bitsorozat található, hogy ha valamilyen adatátviteli hiba lép fel, akkor is tudja a dekódoló, hogy hol vagyunk, azaz képes legyen a jellel szinkronizálódni. Mozgóképek tömörítése: MPEG kép sáv Gyakorlatban használt tömörítő eljárások Mintavételezés és kvantálás Hangok tömörítése Képek tömörítése Mozgóképek tömörítése Információelmélet – Gyakorlati tömörítő eljárások

31 Széchenyi István Egyetem 31 Mozgóképek tömörítése: MPEG Egy sáv 16 makroblokk ból épül fel, egy- egy makroblokk 16×16 képpont leírására szolgál. A makroblokkok mindegyike 6 blokk együttese. Minden blokk 8×8-as mátrix. Két blokk írja le a két krominanciát, a maradék négy a luminanciát, amelyet kétszer finomabb térbeli felbontással kezel a kód. makroblokk sáv blokkok makro -blokk Gyakorlatban használt tömörítő eljárások Mintavételezés és kvantálás Hangok tömörítése Képek tömörítése Mozgóképek tömörítése Információelmélet – Gyakorlati tömörítő eljárások

32 Széchenyi István Egyetem 32 Mozgóképek tömörítése: MPEG Egy mozgóképben általában az egymást követő képek csak kis mértékben térnek el egymástól, így elegendő csak a hasonló képek közül az elsőt tárolni, és aztán a többinek csak az ettől való eltérését. A különbség kódolása a gyakorlatban úgy történik meg, hogy az egyes makroblokkokhoz megkeresik az előző és esetleg a következő képeken a rá leginkább hasonló részletet, Gyakorlatban használt tömörítő eljárások Mintavételezés és kvantálás Hangok tömörítése Képek tömörítése Mozgóképek tömörítése Információelmélet – Gyakorlati tömörítő eljárások

33 Széchenyi István Egyetem 33 Mozgóképek tömörítése: MPEG megjegyzik, hogy a vizsgált makroblokk mennyire van eltolva azokhoz képest, és hogy a makroblokk mennyiben tér el az azokból becsült értéktől. Minden – nem vágás utáni – kép egy makroblokkjának kódolásához tehát hat különbségekből álló kis méretű blokk és két mozgásvektor tartozik. A blokkokat aztán lehet a JPEG-hez hasonlóan tömöríteni. Gyakorlatban használt tömörítő eljárások Mintavételezés és kvantálás Hangok tömörítése Képek tömörítése Mozgóképek tömörítése Információelmélet – Gyakorlati tömörítő eljárások

34 Széchenyi István Egyetem 34 Hogy bárhol el lehessen kezdeni nézni a mozgóképet, bizonyos lépésközönként a teljes képkockát meghagyják, és azt tömörítik a JPEG-hez hasonló módon. Az ilyen képkockákat jelölik I-vel, és a két I típusú filmkocka közötti képek alkotják a képcsoportokat. Minden harmadik elemet csak az azt há- rommal megelőző képből származtatják. Ezek a P típusú képek, és csak egyetlen, (vagy P-, vagy I-) képből eredeztethetők Gyakorlatban használt tömörítő eljárások Mintavételezés és kvantálás Hangok tömörítése Képek tömörítése Mozgóképek tömörítése Információelmélet – Gyakorlati tömörítő eljárások Mozgóképek tömörítése: MPEG

35 Széchenyi István Egyetem 35 A többi képet az időben eggyel előttük és az eggyel utánuk lévő P vagy I filmkockából származtatják, ezek a B- képek. A B típust nem használják fel másik B-kép kódolásakor, mert úgy előfordulhatna, hogy oda-vissza utal a két kocka egymásra, és nem lehetne dekódolni. Gyakorlatban használt tömörítő eljárások Mintavételezés és kvantálás Hangok tömörítése Képek tömörítése Mozgóképek tömörítése Információelmélet – Gyakorlati tömörítő eljárások Mozgóképek tömörítése: MPEG


Letölteni ppt "2005. Információelmélet Nagy Szilvia 4. A gyakorlatban használt tömörítő eljárások."

Hasonló előadás


Google Hirdetések