Különböző médiaelemek feldolgozása Összeállította: Kosztyán Zsolt Tibor e-mail: kzst@almos.vein.hu, kzst@vision.vein.hu, kzst@ond.vein.hu, honlap: http://vision.vein.hu/~kzst
Médiumok Szöveg Kép Hang Videó Animáció
Szöveg bevitele Hagyományos módon – begépeléssel Már korábban elkészült szöveg beszerkesztése OCR (karakterfelismerő program segítségével)
OCR karakterfelismerő algoritmusok Összehasonlítás Körvonalelemzés
Szövegfelismerés lépései Feldolgozandó kép elérése A kép előfeldolgozása Felbontás, zónázás Felismerés Ellenőrzés, tanítás Mentés
Szöveg elhelyezése a képernyőn Legyen a szöveg megfelelően nagy méretű Ne legyen túl sok betűtípus a képernyőn Ne legyen túl sok szöveg egy képernyőn
Színmetrika - alapfogalmak Az elektromágneses sugárzás 1 nm és 1 mm közé eső részét hívjuk optikai sugárzásnak, ennek része a látható sugárzás. A színinger a látható színképtartományban sugárzott teljesítmény.
A szem szerkezete
A szem szerkezete
Színlátási rendellenességek a protanópia, vagy vörös gyengeség. Ezen személyek a vörös színeket sötét árnyalatúnak látják „vörös” színészleletük nincs. Valószínű oka, hogy az L fotopigmensük hiányzik (vagy nincsenek L csapjaik, vagy az M csapokra jellemző fotopigmens van ezen csapokban is. a deuteranópia, vagy zöld gyengeség. Deuteranopok a zöld színeket látják viszonylag sötéteknek, ez a leggyakoribb színtéveszési forma. Valószínű oka, hogy az M fotopigmensük hiányzik (vagy nincsenek M csapjaik, vagy az L csapokra jellemző fotopigmens van ezen csapokban is. tritanópia, vagy kék-vakság: tritanopok a kék színeket nem látják (igen ritkán fordul elő, valószínű oka az S-csappigmens hiánya).
Színlátási rendellenességek
Láthatósági függvény
Színingermetrika – színinger egyeztetés
Színmetrika – Grasmann törvények Szimmetria törvény: Ha A stimulus megfelel B stimulussal, akkor B stimulus is megfelel A stimulussal. Transitivitás törvénye: Ha A megfelel B-vel és B megfelel C-vel, akkor A is megfelel C-vel. Proporcionalitás törvénye: Ha A megfelel B-vel, akkor aA megfelel aB-vel, ahol a tetszésszerinti pozitív tényező. Additivitás törvénye: Ha A, B, C, D négy színinger, akkor ha bármely két egyenlőség az alábbiak közül fennáll A B, C D, (A +C) (B + D) akkor fennáll a következő egyenlőség is (A +D) (B + C)
Színképi érzékenység L = 1,0000R + 4,5907G + 0,0601B.
CIE XYZ színingertér olyan színingerösszetevő függvényekhez vezet, melyeknek csak pozitív értékei vannak, melynél az egyik alapszíninger megegyezik a V()-függvénnyel (az ezzel meghatározott színingerösszetevő fotometriai adatot szolgáltat), az equienergetikus színinger mindhárom színingerösszetevője azonos, és a lehető legszorosabban veszi közre a valós színinger vektorok által meghatározott színtérrészt
CIE XYZ színingertér
CIE (x,y,Y) diagram
MacAdam ellipszisek
CIE LUV
CIE LUV
CIE LUV huv = arctg[(v' - v'n) / (u' - u'n)] = arctg (v* / u*) (színezeti szög) suv = 13[(u' - u'n)2 + (v' - v'n)2]1/2 (telítettség)
CIA LAB
További szín-koordinátarendszerek YUV szín-koordinátarendszer (PAL-SECAM) Y = 0,3 R +0,59G + 0,11 B (luminancia) U = (B-Y) x 0,493 (krominancia) V = (R-Y) x 0,877 (krominancia)
További szín-koordinátarendszerek YIQ szín-koordinátarendszer (NTSC) Y = 0,30 R + 0,59 G + 0,11 B I = 0,60 R – 0,28 G – 0,32 B Q = 0,21 R – 0,52 G + 0,31 B HSB szín-koordinátarendszer Brightness = Y Hue = arctg((R-Y)/(B-Y)) Saturation = 1 – min {R, G, B}/Y
Számítógépes grafika Vektorgrafika A program egy láthatatlan hálóra rajzolja ki a készülő grafikát A grafikát utasítások halmazaként tárolja. (pl. pont, vonal, kör stb. helyét esetleg irányítását) Megjelenítéskor ezek az utasítások hajtódnak végre Előny: Kis méret (általában) Hátrány: Bonyolult (foto-realisztikus) ábrákat nem, vagy nagyon nehezen lehet leírni vektorgrafikus állományként Alkalmazás: pl. CAD/CAM
Számítógépes grafika Bittérképes grafika Kép függőleges és vízszintes irányban pontokra (pixel) van felosztva Megjelenítéskor a képernyő pontjaiban megjelennek az adott pontról tárolt színinformációk Előnye: Foto-realisztikus képek egyszerű megjelenítése Hátránya: Nagyobb méret. Nem vagy nehezen lehet műveleteket végezni a képeken lévő alakzatokkal Megjegyzés: Vektorgrafikus=>Bittérképes konverzió egyszerű, Bittérképes=>Vektorgrafikus konverzió nagyon bonyolult
Képek jellemzői – színmélység Színinfromáció-mennyiség képpontonként Megjeneíthető színek száma 4 bit 16 8 bit 256 16 bit 65 536 24, 32 bit (True Color), 48 bit 16 777 216
Képek jellemzői - színmélység
Képek jellemzői - méret A képállomány mértét meghatározza: Vízszintes felbontás Függőleges felbontás Színmélység Leggyakoribb monitorfelbontások (általában 4:3) 320 x 200, 320 x 240 640 x 480 800 x 600 1024 x 768 1240 x 1024 1600 x 1240 Pl. 800 x 600 x 24 bit = 1 440 000 Byte
Képek digitalizálása Lapolvasók fajtái: A kép digitalizálás folyamata: Kézi szkenner Asztali (lap) szkenner A kép digitalizálás folyamata: Analóg kép (pl. fénykép) Kvantálás (dpi=dot per inch) Digitális kép Pl. 3 inch (7,62 cm) x 300 dpi x 2 inch (5,08) x 300 dpi x 24 bit = 540 000 képpont x 3 Byte = 1 620 000 Byte
Képek digitalizálása - szempontok Felbontás: Kép esetén általában 100-300 dpi elég. Ha túl magas dpi-n mintavételezünk, akkor egyrészt túl nagy lesz a kép másrészt a képen túl sok zaj jelenhet meg. Szövegfelismerés esetén kb. 400 dpi Színmélység: Lehető legmagasabb színmélységben mintavételezzünk, és ha szükséges a színek számát csak később a digitalizálás után redukáljuk.
Képek jellemzése - hisztogram Hisztogram: Adott színből (gradációs fokozatból) mennyit tartalmaz
Képfeldolgozás – különböző digitalizálási hibák kijavítása Leggyakrabban előforduló hibák Nem megfelelő (relatív) világosság Nem megfelelő kontraszt Nem megfelelő élesség Különböző zajok megjelenése a képen Kicsinyítésből és nagyításból eredő hibák
(Relatív) világosság, kontraszt változtatása
Gamma karakterisztika, hisztogram kiegyenlítése
Elmosás, élkiemelés, éldetektálás – Diszkrét konvolúció segítségével
Különböző zajok szűrése a képen Átlag (mean): Szórásnégyzet (variance): Mean Square Error (MSE) Jel-zaj arány (signal to noise ratio - SNR)
Nagyításból és kicsinyítésből eredő hibák kiküszöbölése Elvesznek élek Információ vesztés Nagyításból eredő hibák „pixelesség”
Színes képek manipulálása A képfeldolgozó program esetében szükséges egy belső színtér, mely legyen: Egyenlő közű Legyen értelmezve rajta a: Világosság Színezet, vagy színezeti szög Telítettség, vagy a króma
Irodalom CSÁNKY LAJOS: Multimédia PC-s környezetben, LSI Oktatóközpont, Budapest, 1996. RALF STEINMETZ: Multimédia Springer Hungarica Kiadó Kft., Budapest
Irodalom - Internet http://www.adobe.com http://www.matrox.com/mga http://www.sysopt.com/reviews/matrox-g450 http://www.fontolo.hu/magazin/digivideo/digivideo.html http://www.mpeg.org/MPEG/audio.html http://www.fraunhoffer.iis http://www.intermedia.c3.hu/oktanyag/video/videotechgyak http://www.movie-collage.de
Köszönöm a figyelmet!