1 Digitális hang, kép és videóállományok Kiss Attila Információs Rendszerek Tanszék

Slides:



Advertisements
Hasonló előadás
Összetett kísérleti tervek és kiértékelésük:
Advertisements

Tömörítés.
Készítette: Nagy Balázs
Minden amit tudni akartál de soha sem merted megkérdezni
„Esélyteremtés és értékalakulás” Konferencia Megyeháza Kaposvár, 2009
Számítógép grafika.
Monitorok csoportosítása, működésük, jellemzői
Jelátalakítás és kódolás
Informatikai alapismeretek Hardver
Színformátumok és színmodellek
Hang- és videotechnika Bevezetés
Gábor Dénes Főiskola Informatikai Rendszerek Intézete Informatikai Alkalmazások Tanszék Infokommunikáció Beszédjelek Házman DIGITÁLIS BESZÉDJEL ÁTVITEL.
MI 2003/ A következőkben más megközelítés: nem közvetlenül az eloszlásokból indulunk ki, hanem a diszkriminancia függvényeket keressük. Legegyszerűbb:
Digitális képanalízis
Készítette: Kecskés Imre
Alhálózat számítás Osztályok Kezdő Kezdete Vége Alapértelmezett CIDR bitek alhálózati maszk megfelelője A /8 B
Mintavételezési frekvencia
MI 2003/ Alakfelismerés - még egy megközelítés: még kevesebbet tudunk. Csak a mintánk adott, de címkék nélkül. Csoportosítás (klaszterezés, clustering).
Prototípuskészítés Verilog nyelven Screen Saver Készítette: Mészáros Péter.
Multimédiás technikák 1. kérdés Melyik diszkrét médium? a)hang b)videó c)animáció d)kép.
Multimédiás technikák 1. kérdés A homogén foltok kódolása milyen tömörítést valósít meg? a)veszteséges b)káros c)veszteségmentes d)redundáns.
Analóg jelek digitalizálása
1. A digitális fényképezőgép felépítése
Az információ és kódolása Kovácsné Lakatos Szilvia
Beszédfelismerés és beszédszintézis Spektrális módszerek a beszédfeldolgozásban Takács György 3. előadás Beszedfelism és szint
Pázmány - híres perek Pázmány híres perek.
Vámossy Zoltán 2004 (Mubarak Shah, Gonzales-Woods anyagai alapján)
Vámossy Zoltán 2006 Gonzales-Woods, SzTE (Kató Zoltán) anyagok alapján
Valós számok Def. Egy algebrai struktúra rendezett test, ha test és rendezett integritási tartomány. Def. Egy (T; +,  ;  ) rendezett test felső határ.
6. Előadás Merevítő rendszerek típusok, szerepük a tervezésben
2007 december Szuhay Péter SPECTRIS Components Kft
Gútai Magyar Tannyelvű Magán Szakközépiskola, Szlovákia
Lineáris egyenletrendszerek (Az evolúciótól a megoldáshalmaz szerkezetéig) dr. Szalkai István Pannon Egyetem, Veszprém /' /
dr. Szalkai István Pannon Egyetem, Veszprém
Képszerkesztési alapfogalmak
Készítette: Vámossy Zoltán (Bebis anyagai alapján) 2004 (Stanford, Berkeley, CMU, Birmingham, ELTE, SZTAKI, SzTE anyagok alapján) Képfeldolgozás, alapok.
TÖRTÉNETI ÁTTEKINTÉS TÁVIRATOZÁS A TÁVBESZÉLÉS KEZDETEI
Gábor Dénes Főiskola Informatikai Rendszerek Intézete Informatikai Alkalmazások Tanszék Infokommunikáció Beszédjelek Spisák 1. példa Beszéd 4,5 s hosszú.
Matematikai alapok és valószínűségszámítás
szakmérnök hallgatók számára
Fejmozgás alapú gesztusok felismerése Bertók Kornél, Fazekas Attila Debreceni Egyetem, Informatikai Kar Debreceni Képfeldolgozó Csoport KÉPAF 2013, Bakonybél.
Készítette: Horváth Zoltán (2012)
Monitorok.
Pixel műveletek, képek Szirmay-Kalos László.
Alapsokaság (populáció)
Kézmozdulat felismerő rendszer
Képek feldolgozása 7. osztály.
Analóg digitális átalakítás
Mi az RGB? Red Green Blue, a képernyős szín-megjelenítés modellje. Ha mindhárom alapszín teljes intenzitással világít, fehér színt kapunk. Ha mindhárom.
Határozatlan integrál
Informatikai alapismeretek Hardver
Grafika alapfogalmak.
A hang digitalizálása.
Kommunikációs Rendszerek
Egy operációs rendszer könyvtárszerkezete (tárolórendszere)
Adattömörítés.
Mikroökonómia gyakorlat
Adatátvitel elméleti alapjai
Crt Monitor. Általános  a televízióhoz hasonló  elektronsugár futja végig  a sorok és képek váltásának időpillanatait a vízszintes és függőleges sorszinkron.
előadások, konzultációk
FARKAS VIVIEN. MINTAVÉTELEZÉSI FREKVENCIA  A digitalizálás során használt legfontosabb minőségi tényező a mintavételezési frekvencia, vagy mintavételezési.
TÁMOP /1-2F Modern informatikai eszközök Multimédia az interneten Papp Szabolcs 2009.
A színes képek ábrázolása. A szín A szín egy érzet, amely az agy reakciója a fényre. Az elektromágneses sugárzás emberi szem által látható tartományba.
Monitorok Készítette: Orosz Kristóf 6/b.
Multimédia.
Adat- tárolás.
Informatikai alapismeretek Hardver
HANG Multimédia tananyag Huszár István.
A digitális kép bevezetés.
A hang digitalizálása.
Előadás másolata:

1 Digitális hang, kép és videóállományok Kiss Attila Információs Rendszerek Tanszék

2 Digitális médiaállományok  A számítógép számára a hang, kép, videó ugyanolyan állomány mint egy közönséges szöveges állomány. Általában az állomány kiterjesztése utal a média típusára.  Képek nevének kiterjesztése: –BMP, JPG, GIF, TIF, PNG, PPM, …  Hanganyagok nevének kiterjesztése –WAV, MP3, …  Viedók nevének kiterjesztése: –AVI, MOV, …

3 Egy képállomány tartalma  Szövegszerkesztővel megnyitva egy képállományt értelmes és értelmetlen sorozatokat kapunk: P6: (Portable Pixel Map - ppm kép) Felbontás: 512x512 Színek száma: 255

4 A képállomány tartalma hexadecimálisan Általában egy fejlécben leíró információkat találunk.

5 Multimédia állományok forrásai  Multimédia állományok sokféle eszköz használatával keletkezhetnek: –digitális fényképezőgép, képolvasó, –digitális hang, vagy filmfelvevő, –digitális kamera.  Ezeknek a következő feladatokat kell végrehajtaniuk: –Mintavételezés: A folytonos jelekből véges sok mintát választunk ki. –Digitalizálás: A folytonos mintát véges számsorozattá alakítják. –Tömörítjük a számsorozatot.

6 Egy hang audiójele  A hang audiójele megjeleníthető, nagyítható, szerkeszthető, transzformálható (erősíthető, halkítható, lemezkattogás eltávolítható, stb.)

7 A folytonos audiójelből szabályos időközönként mintákat veszünk Mintaperiódus Ts, fs =1/Ts Jelperiódus: T, f = 1/T T >= 2Ts kell, hogy legyen.

8 fs = 2.5f fs = 1.67f Eredeti jel Egy másik jel A minta alapján nem különböztet- hetők meg. Torzítást eredményez.

9 fs = 2f Végtelen sok szinuszhullámot lehet a pontokra illeszteni.

10 A frekvencia felbontása  A folytonos jelet véges vagy végtelen sok szinusz hullám összegeként lehet előállítani.  A szinusz komponenseket “Fourier-transz- formációval” lehet előállítani.  A felbontást és a továbbiakat tetszőleges jelre (nem csak audióra, hanem képekre, videóra) lehet alkalmazni.  Ha a jel frekvenciakomponensei {f1 < f2 < f3 … < fn}, akkor milyen minimális mintafrekvenciát kell használni?

11 Nyquist tétele  Nyquist tétel –Ahhoz, hogy a folytonos jel visszaállítható legyen a mintából, teljesülnie kell a következőnek fs > 2f max ahol f max a jel komponensei közül a legnagyobb frekvenciájú jel frekvenciája. –Ha a jel komponenseinek frekvenciái [f1, f2] intervallumba esnek, akkor a visszaállíthatósághoz annak kell teljesülnie, hogy fs >2 (f2-f1).

12 Képek mintavételezése  A mintavételezési tétel 2D jelekre (képekre) is alkalmazható. Mintavételezés rácspontokon. Milyen sűrű legyen a rács?

13 Az eredeti kép

14 A rossz mintavételezés miatt torzulás keletkezik Homályosabb a kép, és a kendő és nadrág csíkjaiban furcsa interferálás látható.

15 Digitalizálás  A mintavételezéssel kapott jel még folytonos, végtelen sok lehetséges értéket tartalmazhat.  A digitalizálás sorám ezt a végtelen sok értéket akarjuk fix számú számmal leírni, közelíteni.  N szám leírásához log 2 N bitre van szükségünk.  Mi határozza meg, hogy egy hang vagy kép esetén hány bittel kódoljuk a mintát?

16 Audiójelek digitalizálása  Mit jelent, hogy egy audiójel 16bites és 44kHz-es?  A 44KHz a mintavételezési frekvencia. A zenékben általában magasabb frekvenciakomponensek fordulnak elő mint a beszédben. A 8kHz mintavételezés a telefonminőségű beszéd rögzítéséhez szükséges mintavételezés.  16bit azt jelenti, hogy minden mintát 16bites egészként ábrázolunk.  Arra is gondolni, kell, hogy a digitális audiójelek több csatornát is tartalmazhatnak.

17 Digitális képek Egy kép mintavételezése pixelenként történik. A pixelek mátrixot alkotnak.

18 A digitális képek típusai  Szürkeárnyalatos (Grayscale) kép –Általában 256 szintje lehet a pixeleknek. Így minden pixelt 8 bittel tudunk megadni. –Az MRI orvosi képek 16 bittel írnak le egy pixelt.

19  Bináris kép A bináris kép csak 1 bitet használ pixelenként (0 vagy 1). A bináris képeknek fontos szerepük van a képelemzésekben, objektumok felismerésében.

20 Bitsíkok [ b7 b6 b5 b4 b3 b2 b1 b0] MSBLSB A 8 bit komponensei alapján 8 bináris képet (bitsíkot) kapunk. MSB – legszignifikánsabb bit az első LSB – legkevésbé szignifikáns bit az utolsó

21 Összemosás (Dithering)  Szürkeárnyalatos képet bináris képpel is reprezentálhatunk. 0  1  2  3  Maredékos osztással a 256 érték 4 értékre konvertáljuk: I’ = floor(I/64)

22 Dithering mátrix  Egy Dithering mátrixszal reprezentáljuk a 4 szintet. Kevesebb színnel érjük el az eredeti hatást. 0  1  2  3  A mátrix ebben az esetben: Hasonlóan csak piros és kék váltakozása lila színt eredményez, ha elég kicsik a pontok.

23 A színes képek felbontása r g b RGB – piros, zöld, kék Más színsémák: YUV, HSV. 24 bit image 3 színkomponensre bontjuk a képet. Mindegyik szín intenzitása egy szürkeárnyalatos képet definiál.

24 Színtábla 256 színt használó kép r g b Színklaszterek Kevesebb szín használata is elég, ha klaszterezéssel meghatározzuk a képen az azonos színű csoportokat.

25 Az emberi szem érzékelése A szemben kétféle fényérzékelő sejt működik: a csapok és pálcikák. A pálcikák a fekete-fehér látványt érzékelik. A csapok a színeket érzékelik. Háromféle csap érzékeli a háromféle színt. Színinger-összetevők előállítása színinger- megfeleltető függvények és E sugárzáseloszlás alapján: R = s E( ) S r ( )d G = s E( ) S g ( )d B = s E( ) S b ( )d

26 A színek A színösszetevők meghatározása kísérlettel.

27 A Gamma korrekció  A képernyők fényessége I’ nem lineáris az input kép I fényességéhez viszonyítva. I’ = I    Hatványozással korrigáljuk a fényességet: (I’) 1/ = I  Például CRT esetén a  2.2 körüli érték. 0,5 fényességű képet csak 0,218 fényességűnek mutat a képernyő.

28 A Gamma korrekció Lineárisan változó fényesség Gamma korrekció nélkül nem lesz egyenletes. Lineárisan változó fényesség Gamma korrekcióval már egyenletes lesz.

29 Videójelek  Analóg videójelek Páros framePáratlan frame 52.7us 10.9us 0v fehér fekete

30 Digitalális videó N. Frame 0. Frame idő A digitális videó egy 3D függvénnyel írható le: f(x,y,t)

31 Színes videók (PAL)  YUV színsémát használ a PAL rendszer.  Az YUV és RGB közti transzformáció a következő:  Y a fényességi komponens Y = R G B  U és V két színkomponens. U = B – Y V = R - Y Y U V

32 Színes videók (NTSC)  YIQ az NTSC sémája  YCbCr: A JPEG-ben használt színséma I Q