Különböző médiumok feldolgozása Készítette: Kosztyán Zsolt kzst@almos.vein.hu kzst@ond.vein.hu
Tömörítés - alapfogalmak Redundancia: Egy adathalmaz redundáns, ha mennyisége több, mint amennyi az információ hordozásához és megjelenítéséhez szükséges lenne. Kódolási redundancia Képi redundancia Pszichovizuális redundancia Pszichoakusztikus redundancia
Tömörítés - alapfogalmak Kódolási redundancia: Az információt hordozó adathalmazban az adatkódoknak kevesebb variációja fordul elő, mint amennyit a kódok mérete lehetővé tenne. Pl. Egy CD biztonságosabb letapogatása érdekében 8 bitből álló kódot 14 biten jelenítenek meg. 14 bitnek 16384 variációja van, amiből a CD-technika csak 256–ot használ.
Tömörítéssel szemben támasztott elvárások A tömörített és az eredeti adathalmaz mennyiségének hányadosa (a tömörítési arány) a lehető legkisebb legyen! A tömörítő algoritmus használja ki a tömörítendő adathalmaz belső szerkezetének sajátosságait!
Tömörítéssel szemben támasztott elvárások A tömörítő algoritmus legyen hatékony! Az algoritmus illeszkedjék a már meglévő rendszerekhez! Az információveszteség legyen minimális vagy nulla!
Tömörítés A tömörítési eljárások fajtái: Veszteségmentes Veszteséges Pl. Entrópia kódolás Veszteséges Pl. JPEG, MPEG
Veszteségmentes tömörítés Egyszerű veszteségmentes tömörítések Futamhossz kódolás Különbségi kódolás Változó hosszúságú kodolás Huffmann kódolás Statikus Globálisan adaptív Lokálisan adaptív Aritmetikai kodolás Entrópia: Az átlagos kódhossz: Tehát értékét érdemes -nak választani.
Veszteségmentes tömörítés Bitsík kódolás Homogén foltok kódolása Határoló vonal kódolás Futamhossz-kódolás Kontúrkövetés Előrebecsléses kódolás Alkalmazás: pl. kép (.GIF, .PCX) kódolása
Veszteséges tömörítés Előrebecslésen alapuló eljárások Matematikai transzformáción alapuló módszerek Karhumen-Loeve transzformáció Diszkrét Fourier transzformáció Wals-Hadamart transzformáció Diszkrét koszinusz transzformáció Wavelet transzformáció
Képtömörítés - legelterjedtebb képi formátumok BMP (BitMapped Picture) Kódolás nélkül, vagy veszteségmentes RLE kódolással tárolt képi formátum GIF (Graphic Interchange Format) Helyettesítési (veszteségmentes) eljáráson alapuló maximum 256 színmélységű képet megjeleníteni képes képformátum Ha a kép viszonylag homogén, és max 256 színt tartalmaz, akkor célszerű ebben a formátumban tárolni. (Egy továbbfejlesztett változata a PNG, de ez még nem nagyon terjedt el.)
Legelterjedtebb képi formátumok JPEG (Joint Photographic Expert Group) Veszteséges és veszteségmentes (nagy hatékonyságú pszichovizuális és kódolási redundanciát kiküszöbölő) tömörítést alkalmaz Akár 1:5 (fekete fehér képeknél), 1:10 (színes képeknél) tömörítési arányt is képes produkálni számottevő (észrevehető) minőségromlás nélkül
JPEG Képtömörítés A tömörítés lépései: RGB => YUV szín-koordinátarendszerbe transzformál Elválasztja a világosság- és színkódokat (elsősorban a színi információk mennyiségét csökkenti) 8 x 8 –as tagból álló makró blokkokra bontja, majd a blokkokra egy diszkrét koszinusz transzformáció segítségével kiszámítja a blokkokat alkotó frekvencia- komponensek amplitúdóját. Az eljárás elhagyja azokat a frekvencia- komponenseket, melyek amplitúdói egy előre definiált paraméter alatt vannak. A megmaradt képi információkat Huffmann-kódolással tömöríti. MEGJEGYZÉS: A JPEG 2000, DCT transzformáció helyett diszkrét Wavelet transzformációt használ
Hangtömörítés Pszichoakusztikus redundancia: Az ember nem hallja a nagy hangerejű hangfrekvenciákhoz közeli zajfrekvenciát. (Ez azonban csak egy szűk frekvenciasávra érvényes.) Az ember hallását zavarják azok a zajok, melyeknek frekvenciája közelében nincs hangfrekvencia. A pszichoakusztikus tömörítő eljárások részsávokra bontják a hallható hangfrekvenciasávot, és elemzik az egyes részsávok tartalmát.
Hangtömörítési eljárások Alapjuk a pszichoakusztikus redundancia csökkentése MPEG Audio (Layer 1, Layer 2, Layer 3) MPEG 2 AAC MPEG 4 Dolby eljárások Dolby Stereo Digital Dolby Surround Pro Logic
Videoállományok tömörítése Tömörítés/kibontás szempontjai Hatékonyság Sebesség Tömörítési arány Minőség A tömörítés során csökkenteni kell: Pszichovizuális Pszichoakusztikus Kódolási redundanciát Az egyes képkockák nem függetlenek egymástól, hanem közöttük kapcsolat (korreláció) van
Feladat - Képfeldolgozás Egy színes képet tartalmazó fotót (8”x12”) digitalizálunk 1200x1200-as dpi mintavételezéssel 24 bites színmélységben. Ezután tömörítjük a képet JPEG-eljárás segítségével. A tömörítési arány 1:8. Mekkora lesz a tömörített kép? Lesz-e észrevehető minőségromlás? Indokolja válaszát! Egy festő megkér bennünket, hogy ezt egy vászonra nyomtassuk ki neki, melyet ő majd mint alapot használ, és később majd erre fest, illetve ezt a képet egészíti ki. A vászon mérete 50 cm x 70 cm (egy ” = 2,54 cm). Milyen torzulások léphetnek fel a nyomtatás során? Ezek hogyan küszöbölhetők ki?
Megoldás A digitalizált kép mérete: 1200 x 1200 x 8 x 12 x 24 = 3317760000 bit = 414720000 B = 395,5078125 MB A tömörített kép mérete: 49,4384765625 MB Valószínűleg nem vehető észrevehető a minőségromlás mivel általában 1:8 tömörítési arány színes képek esetén még nem jár számottevő minőségromlással. A minőségromlás nyomtatáskor: Színtorzulás, nagyításból eredő hibák stb.
Feladat - Hangfeldolgozás Egy Dolby Digital hangrendszer segítségével (5 csatorna) rögzítettünk egy 3 perc, 51 másodperces zeneszámot. A mintavételezés 48 kHz. A kvantálási hossz 24 bit. Ezután tömörítettük MPEG 2 AAC segítségével az egyes csatornákat 96 kbps sűrűségűre. Mekkora az eredeti fájl mérete? Mekkora a tömörítési arány? Mekkora a tömörített fájl mérete?
Megoldás A digitalizált hangállomány mérete: (3 x 60 + 51) x 5 x 24 x 48000 = 1330560000 bit = 166320000 B = 158,6151123046875 MB A tömörített hangállomány mérete: (3 x 60 + 51) x 5 x 96 x 1024 = 113541120 bit = 14192640 B = 13,53515625 MB A tömörítési arány: 1:11,71875
Feladat – Videófeldolgozás Egy internetes újság a következőkkel bíz meg bennünket: egy közéleti személyiség beszédét (39 perc 37 másodperc 320 x 240 –es felbontásban 16 bites színmélység mellett) kell az Interneten keresztül elérhetővé tenni mindenki számára. Főnökünk azt szeretné, ha olyanok is letölthetnék, illetve folyamatosan nézhetnék, akiknek csak modemjük van, és csak 40 kbps sávszélességet tudnak átlagban kihasználni. Továbbá közli velünk, hogy maximum csak 19 MB–ot tud számunkra biztosítani. A videóanyagot PAL rendszerű SVHS kazettára vették fel. Melyet először digitalizálunk tömörítés nélkül (564x768 képkocka x 24 bites színmélység 25 kép/s, a hangot sztereó hangminőségben 44,1 kHz-en 16 bites kvantálási hosszal)
Feladat – Videófeldolgozás Mekkora a tömörítetlen file hossza? Mekkorának kell legalább lenni a tömörítési aránynak, hogy a fenti feltételeknek megfelelő, minimális minőségromlással járó videóanyagot kapjon? Megoldható-e a fenti feladat? Indokolja állítását! Amennyiben a feladat megoldható, úgy részletesen írja le a megoldás menetét (használjon ki minden lehetséges tömörítési lehetőséget, pl. beszéd tömörítéséhez szükséges kvantálási hossz, megjeleníteni kívánt videó-ablakméret, kép/sec, tömörítési eljárás stb.)!
Megoldás A tömörítetlen file hossza: (39x60+37)x(564x768x24x25+44100x16x2)= = 2377x(259891200+1411200) = 621115804800 bit = 77639475600 B = = 74042,7738189697265625 MB = 72,30739630758762359619140625 GB A tömörítési arány: A folyamatosság miatt a file mérete maximum: 40x1024x(39x60+37)= 97361920 bit = 12170240 B = 11,6064453125 MB < 19 MB, tehát ezt a file-méretet kell alapul venni! A teljes tömörítési arány tehát: 97361920:621115804800=1:6379,453125 –nak kellene lennie.
Megoldás A kívánt tömörítési arányt el lehet érni a következőképpen: Felbontás színmélység, kvantálási hossz, mintavételezési frekvencia csökkentése: A kívánt videó-állomány jellemzői: (320x240x16x16 + 11025x8)x(39x60+37)= 46943373000 bit ez 1:13,231171198541698313838675375968 tömörítés Ez után MPEG 4 eljárással kódoljuk a videó-anyagot, mely kódolás kihasználja, hogy egy beszéd esetén nincs túl sok mozgás. Hangot is csak egy szűk tartományba kell kódolni.
Irodalom CSÁNKY LAJOS: Multimédia PC-s környezetben, LSI Oktatóközpont, Budapest, 1996. RALF STEINMETZ: Multimédia Springer Hungarica Kiadó Kft., Budapest
Irodalom - folyóiratok Vége Csapó Ennyi, Digitális Videó Eszközök. CHIP Magazin XII. évfolyam 8.szám. 2000. augusztus Lame az enyém MP3. CHIP Magazin XIV. évfolyam 7. szám 2002. július Tippek és Tanácsok 23. Hogyan készíthetünk videoanyagokat PC-n, PC Word melléklet. 2001/10. október Digitális Videó És Számítástechnika, VIDEO praktika V. évfolyam 8-9 szám. 1999.
Irodalom - Internet http://www.adobe.com http://www.matrox.com/mga http://www.sysopt.com/reviews/matrox-g450 http://www.fontolo.hu/magazin/digivideo/digivideo.html http://www.mpeg.org/MPEG/audio.html http://www.fraunhoffer.iis http://www.intermedia.c3.hu/oktanyag/video/videotechgyak http://www.movie-collage.de
Köszönöm a figyelmet!