Az előadás letöltése folymat van. Kérjük, várjon

Az előadás letöltése folymat van. Kérjük, várjon

2006.02.18 Multimédia alkalmazások alkotórészei Szöveg Hang Grafika Video.

Hasonló előadás


Az előadások a következő témára: "2006.02.18 Multimédia alkalmazások alkotórészei Szöveg Hang Grafika Video."— Előadás másolata:

1 Multimédia alkalmazások alkotórészei Szöveg Hang Grafika Video

2 Multimédia Menete: Gépelés, vagy egyéb bevitel Formázás Átadás az alkalma- zásnak Problémák: Mennyi szöveg fér el egy oldalra Esztétikus megjelenés Bevitel módja A dokumentumot „mi- ként” mentsük (Save as) Szöveges alkalmazások

3 Multimédia Új szöveg: Begépelés Formázás Átadás az alkalma- zásnak Kész szöveg: Mintha új lenne Konvertálás Képformátum (nem tekinthető szövegnek) Karakter felismerés Szöveges alkalmazások Bevitel

4 Multimédia Lapolvasóval való beolvasás: Szöveges alkalmazások Karakter felismerés (OCR:Optical Character Recognition) X: dpi (dot per inch) 1 inch=25.4 mm Fekete/fehér esetén kb. 1 MB (300dpi)

5 Multimédia Az OCR programok csoportosítása: Összehasonlító: Bittérképes minták alapján dolgozik, tehát betűtípus és betűméret függő Körvonal elemző: arányokat figyel, tehát független Szöveges alkalmazások Karakter felismerés

6 Multimédia Az OCR fázisai: Feldolgozandó kép elérése (file  memória) A kép előfeldolgozása (ferdeség, tájolás) Felbontás, zónázás (kép és szöveg elválasztása, táblázat, képlet. Kézzel vagy automatikusan) Felismerés (Kép-szöveg. Tárolja az esetleges stílust, méretet, stb.-t is) Szöveges alkalmazások

7 Multimédia Az OCR fázisai: Ellenőrzés, tanítás: Az alkalmazó kijavítja a szöveget, a fel nem ismert karaktereket beírja. A program a munkát segítheti tanulással és helyesírás ellenőrzővel. (Legalább 96%-os felismerési aránytól mondjuk jónak a szöveget, prg-t.) Mentés:Konvertálás, általában a stílust is visszük Szöveges alkalmazások

8 Multimédia Szöveges alkalmazások

9 Multimédia Szöveg stílusok –NE HASZNÁLJUNK CSUPA NAGY BETŰT! –Félkövérrel emeljünk ki –Használjunk árnyékolás –Keretezés, táblázat –K a r a k t e r k ö z ö k k e l i s l e h e t –Vagy színnel Szöveges alkalmazások

10 Multimédia Szöveges alkalmazások Háttér –Meghatározza a szöveg hangulatát. A kép elvonhatja a figyelmet a szövegről! Színek –Színkombinációknál figyeljünk a beolvadásra –Ízlés határai –Ne legyen túl sok szín –Kerüljük a vörös-zöld kombinációt

11 Multimédia Hang: mechanikus rezgés hullám. Sebesség Frekvencia (Hz) = hangmagasság Amplitúdó (db vagy watt) = hangerő Sávszélesség, burkológörbe, amplitúdó és fázis viszonyok=hangszín Emberi hallás 16Hz…20kHz 0 db…120db Hang alkalmazások

12 Multimédia Analóg rögzítés és lejátszás: Elektromechanikai –Mikrofon  elektromos jel  erősítő  vágófej  lemez  hangszedő  erősítő  elektromos jel  hangszóró Mágneses –Mikrofon  elektromos jel  erősítő  mágnesfej  szalag  lejátszófej  erősítő  elektromos jel  hangszóró Hang alkalmazások

13 Multimédia Digitális rögzítés és lejátszás Csak a rögzítés elvében különböznek mintavételzés  az impulzusok amplitúdói- nak kvantálása  diszkrét minták sorozata Szabvány: PCM (Pulse Code Modulation) A mintavételezési frekvencia legyen legalább kétszerese a legnagyobb frekvenciának, így hibamentes a digitalizálás. Hang alkalmazások

14 Multimédia Digitális rögzítés és lejátszás Kvantálási hossz: A frekvenciák pontossága ill. hangerő (8 bit:72 dB, 16 bit: 96 dB). A hibát változó nagyságú kvantálási lépcsőfo- kokkal csökkentik. Méret: Hang alkalmazások

15 Multimédia Digitális rögzítés és lejátszás Megoldás A mintavételezési frekvencia és/vagy a kvantálási hossz csökkentése. Tömörítő algoritmusok (lsd később) Hang alkalmazások

16 Multimédia Hangkártyákból eredő „de facto” szabványok Adlib: Nem tud rögzíteni, FM szintézissel állítja elő a MIDI hangot Soundblaster: Digitálisan rögzít, hullámtáblázat szintézissel állítja elő a MIDI hangot Roland MT-32: 256db mintavételezett alaphang a hangkártya ROM-jában (Játékokhoz főleg) PCI hangkártyák: Soundblaster kompatibilisek, „DVD minőség”, 32 csatorna, nincs ISA 8MB/s korlát Hang alkalmazások

17 Multimédia FM (frekvencia moduláció) szintézis Egy tiszta szinuszos jelet modulálnak egy másik hullámformával. Adlib: 18 operátor (azaz hullámforma), az ütős hangszerek egy operandusúak, egyéb hangszerek két operandusúak, azaz:18+18*17=324 alaphang Hullámtábla szintézis Valódi hangszerek digitalizált mintái, egy hangszerből több minta is lehet 44.1kHz, 16 bit; SoundBlaster: 170 minta--1 MB Hang alkalmazások

18 Multimédia Tömörítés MPEG 1 Audio--pszichoakusztikus redundancia –veszteséges –1:12 esetén is CD minőség –WAV helyett kódolt állomány –kihagyja a zajokat (részsáv kódolás) –általános tömörítés –3 réteg Layer kb/s felett Layer kb/s körül Layer kb/s körül Hang alkalmazások

19 Multimédia ‘97.04:MPEG 2 Advanced Audio Coding (AAC) ISO+Sony+Dolby: legalább 5 hangszóró MP3 továbbfejlesztése –f m = 8kHz--96kHz –részsávok 1-48 –szűrőbank helyett módosított diszkrét koszinusz transzformáció (MDCT) –Temporaly Noise Shaping (TNS)=Ideiglenes zaj alakítás: a kvantálási zajt elosztja a frekvencia tartomány szerint –Előrejelzés: Beszéd esetén bizonyos hangoknál –Kvantálási lépcsőfokok kisebbek – A bitfolyamnak entrópia kódolással csökkentik a redundanciáját –WAV helyett kódolt állomány –kihagyja a zajokat (részsáv kódolás) –általános tömörítés –3 réteg Layer kb/s felett Layer kb/s körül Layer kb/s körül Hang alkalmazások

20 Multimédia MPEG 4 nincs korlátozás a felhasználásában nem csak tömörítésre való –változtatható bitsebesség (2-64 kb/s) –objektum orientált megvalósítás –szerzői jogvédelem több tömörítési algoritmus –parametrikus hangkódolás –szintetikus kódolás –beszéd kódolás –sávok szerinti kódolás nagyobb hibatűrés 3D Audio Hang alkalmazások

21 Multimédia Környezeti hangtér 1978 körül a Dolby Laboratories ötlete sztereo helyett: Bal, közép, jobb+2 ugyanolyan környezeti Analóg rendszerek a fentiek szerint: Dolby Stereo (mozik) Dolby Surround (házi) Elterjedése a VHS-nek köszönhető (Video Home System) Hang alkalmazások

22 Multimédia Környezeti hangtér 1992: Dolby Stereo Digital (mozi)/Dolby Digital (házi) –digitális –bal, közép, jobb –a két környezeti független –mélysugárzó Hang alkalmazások

23 Multimédia A Dolby eljárás Dolby Stereo Digital –4 analógból 2 digitális adatfolyam úgy, hogy sztereo, mono és Dolby Surround kompatibilis. A dekódolási eljárás neve Pro Logic: L,C,R,2*S Dolby 5.1 –Mono+Stereo+Dolby Stereo+Dolby Stereo Digital Mélysugárzó: –20Hz-120Hz-ig, LFE: Low Frequency Effects –a többi 20Hz-20kHz Hang alkalmazások

24 Multimédia Egy percnyi hanganyag A megoldás a Dolby Audio Coding-3 (AC-3) Pszichoakusztikus maszkolás (egy adott hang elnyom több más hangot) 32 frekvenciasáv, csend esetén zaj elnyomás, ekkor a több hangot tartalmazó sávok több bitet kapnak, tehát dinamikus sávkiosztással operál Hang alkalmazások

25 Multimédia MIDI Tömörebb, mint a wav (1%), mivel utasítások vannak benne hangok (és egyebek) helyett Az utasítás 2 (fény, stb) v. 3 bájtos (zene) –1. Byte: parancs(4 bit)+csatorna szám(4bit) –2. Byte: Hang esetén: Hz| Szinti esetén: parancs kód –3. Byte: Dinamika|Utasítások Hang alkalmazások

26 Multimédia General MIDI (GM) A MIDI továbbfejlesztése, a zeneeszközök kiválasztásának egyesítése azon célból, hogy eszközfüggetlen legyen 128 hangszer+dob készlet 24 szólamot tud egyszerre Hang alkalmazások

27 Multimédia Emberi tényezők Felbontás: 2’ Színfelismerés: 10’ Képarány: 4:3, a rövidebbik oldal 20  látószögben Mozgóképhez 20-30Hz, villogás mentesen 50Hz Látható fény: nm 3 szín=összes szín=RGB (felbontás>színfelism.) Grafikai alkalmazások

28 Multimédia Színkoordináta rendszerek RGB –additív keverés –R+G+B=1fehér –R+G+B=0fekete YUV –Y=0.3R+0.51G+0.11BLuminancia –U=(B-Y)*0.493Krominancia –V=(R-Y)*0.877Krominancia –PAL, SECAM, JPEG, MPEG –Y miatt lehet fekete/fehérbe egyszerűen konvertálni Grafikai alkalmazások

29 Multimédia Színkoordináta rendszerek YIQ –Y=0.3R+0.59G+0.11BLuminancia –I=0.6R-0.28G-0.32BKrominancia –Q=0.21R-0.52G-0.31B Krominancia –NTSC CIE –Y=0.3R+0.59G+0.11BLuminancia –X=0.61R+0.17G+0.20BKrominancia –Z=0R+0.1G+1.12B Krominancia Grafikai alkalmazások

30 Multimédia Színkoordináta rendszerek HSB –H=arctg((R-Y)/(B-Y))Színezet (Hue) –S=1-min{R,G,B}/YTelítettség (Saturation) –B=Y Világosság (Brightness) Állókép létrehozása –rajzprogram –konvertálás –scanner –videoszalag Grafikai alkalmazások

31 Multimédia Vektorgrafika (cdr, eps) Az állományban a képelemeket rajzoló utasítások vannak eltárolva Pl. az elem típusa (pont, szakasz, kör, stb..), hely, irány, méret, színek, stb. Gyors transzformációs lehetőségek Nagy rajzolt képek esetén kisebb az állomány Bonyolult ábránál nem ok (fotó) Grafikai alkalmazások

32 Multimédia Bittérképesgrafika (bmp, jpg, gif, dib, ico..) Pontonként ábrázolja a képet Rosszul transzformálható Nagy a mérete Szép, pontos képek Egyszerűbb szerkezet Könnyű módosítás Nagyon gyors feldolgozás (kirajzolás) Méret=x*y*színmélység/8 Grafikai alkalmazások

33 Multimédia A kép kiválasztásának szempontjai Alkalmazkodjon a megjeleníthető színmélységhez és felbontáshoz Hangulatilag illeszkedjen Ne legyen túl nagy fizikai mérete Bittérképes formátumú legyen Grafikai alkalmazások

34 Multimédia A kép fajtái BMP (Bit Map Plan) veszteségmentes tömörítetlen GIF (Graphic Interchange Format) –veszteségmentes tömörített –16 bitig ingyenes (Ingyenes a PNG) –Unisys tulajdona –Mintatáblázattal dolgozik –Ismétlődő színektől függ a tömörítés mértéke –10-80% Grafikai alkalmazások

35 Multimédia A kép fajtái JPEG –Érzékelésen alapszik (biometriai tömörítés, a világosságra érzékenyebb a szem, mint a színre) –10% alatt nem észlelhető a tömörítés –Fekete/fehérnél nem érdemes használni –Skálázható Grafikai alkalmazások

36 Multimédia A JPEG elve 1. RGB-ből átrakja YUV-be 2. Törli a mellette lévő pont(ok) színkódjait –4:2:2=a mellette lévőt csak, azaz 48 bitből 32 lesz –4:1:1=a mellette lévőket, azaz 96 bitből 48 lesz 3. Szétvágva 8x8-as makroblokkokra DCT-vel kiszámolja a blokkalkotó frekvenciakomponen- sek amplitúdóját (itt paraméterezhető) 4. Huffmann tömörítés Grafikai alkalmazások

37 Multimédia NTSC (National Television Standard Committee) USA, Hz 525 sor váltósoros 4:3 Video alkalmazások

38 Multimédia SECAM (SÉquential Couleur Avec Memoire ) Francia, 1957 (Magyarország) 25Hz 625 sor váltósoros 4:3 Video alkalmazások

39 Multimédia PAL (Phase Alternation Line) NSZK, 1961 (MTV, 1996) 25Hz 625 sor váltósoros 4:3 Video alkalmazások

40 Multimédia Video állományok mérete 1 s hosszú: a hang +170kB Video alkalmazások

41 Multimédia Video állományok tömörítése delta keret: csak a „lényegesen” megváltozott részletet tároljuk referencia képkocka –minden 15., különben nagyon elromlana –ha a kép teljesen megváltozott Video alkalmazások

42 Multimédia AVI (Audio Video Interleaved) RIFF (Resource Interchange File Format) egy fajtája (Microsoft+IBM) Kép és hang felváltva Tömörítetlen kép –DIB(Device Independent Bitmap) Tömörített –MS Video 1 –MS RLE (Run Length Encoding) –Intel Indeo vagy CinePack Video alkalmazások

43 Multimédia MPEG (Moving Picture Experts Group) Jobb minőségű, mint az AVI vagy Indeo Tömörebb, mint az AVI vagy Indeo –MPEG 1: 1.5 Mb/s –MPEG 2: 3Mb/s…40Gb/s –MPEG 3: HDTV (High Definition TeleVision) számára fejlesztették, de elég volt az MPEG 2, nem készült el véglelsűgesen –MPEG 4: 4.8…64kb/s (internet, hálózat) –M-JPEG csak videot tömörít Video alkalmazások

44 Multimédia Indeo Algoritmusa a DVI (Digital Video Interaktive) Intel fejlesztése Ingyenes Állítható az ablakméret Állítható a képváltási frekvencia Figyelembe veszi a hardver erősségét Video alkalmazások


Letölteni ppt "2006.02.18 Multimédia alkalmazások alkotórészei Szöveg Hang Grafika Video."

Hasonló előadás


Google Hirdetések