Előadást letölteni
Az előadás letöltése folymat van. Kérjük, várjon
KiadtaHenrik Németh Megváltozta több, mint 10 éve
1
T.Gy. Beszedfelism es szint. 2009.03.03. 1 Beszédfelismerés és beszédszintézis Beszédjelek lineáris predikciója Takács György 4. előadás 2009. 3. 3.
2
T.Gy. Beszedfelism es szint. 2009.03.03. 2 Tartalom Ismétlés A lineáris predikció alapelvei
3
T.Gy. Beszedfelism es szint. 2009.03.03. 3 A beszédhangok folytonos és diszkrét természete
4
T.Gy. Beszedfelism es szint. 2009.03.03. 4 A beszéd szerkezete A beszéd egymástól megkülönböztethető elemek szervezett időbeni egymásutánisága – soros szerkezet. Elem lehet egy összefüggő mondanivaló, egy hosszabb szünetekkel elhatárolt beszédrész, egy mondat, egy szó, egy beszédhang. Egy ötven beszédhangból álló nyelvben (leszámítva, hogy nem minden hang mondható egymás után) kb. egymillió különböző tíz hangból álló szó képezhető. A beszéd szerkezete felülről gyakorlatilag nyitott, alulról zárt.
5
T.Gy. Beszedfelism es szint. 2009.03.03. 5
6
6 válasz Gerjesztések különböző helyeken Időben változó toldalékcső lineáris idővariáns rendszer H g(t)v(t)
7
T.Gy. Beszedfelism es szint. 2009.03.03. 7
8
8
9
9
10
10
11
T.Gy. Beszedfelism es szint. 2009.03.03. 11
12
T.Gy. Beszedfelism es szint. 2009.03.03. 12
13
T.Gy. Beszedfelism es szint. 2009.03.03. 13
14
T.Gy. Beszedfelism es szint. 2009.03.03. 14 Beszédjel spektrális jellemzésének nehézségei Kezelhető periodikus függvényeknél a Fourier-sor, Egyszeri folyamatoknál a Fourier-integrál, stacionárius sztochasztikus folyamatoknál a spektrális sűrűség (az autokorrelációs függvény Fourier-transzformáltja A beszédjelnek csak rövid szakaszai sorolható be a fenti függvénytípusok valamelyikébe! Nem tudjuk hogyan csinálja a fül!!!! Bizonyosan végez valamifajta spektrális elemzést – bizonyíték volt a szerdai előadássorozatban a télen….. Csak véges szakaszok feldolgozása lehetséges gépi úton. A periódusidő meghatározása nehéz.
15
T.Gy. Beszedfelism es szint. 2009.03.03. 15
16
T.Gy. Beszedfelism es szint. 2009.03.03. 16
17
T.Gy. Beszedfelism es szint. 2009.03.03. 17
18
T.Gy. Beszedfelism es szint. 2009.03.03. 18
19
T.Gy. Beszedfelism es szint. 2009.03.03. 19
20
T.Gy. Beszedfelism es szint. 2009.03.03. 20
21
T.Gy. Beszedfelism es szint. 2009.03.03. 21 Lineári predikció alapok A beszédjel n-edik mintája becsülhető a megelőző p beszédminta lineáris kombinációjával ahol az α i lineáris predikciós együtthatók hordozzák a jelenségre vonatkozó előismereteket, tapasztalatokat. p -- a prediktor fokszáma
22
T.Gy. Beszedfelism es szint. 2009.03.03. 22 A predikció pontatlanságát jellemzi az predikciós hiba A predikciós hiba általában mintáról mintára változik! Gyakorlati feladatoknál a predikálandó jelenséget időszakaszokra bontjuk és egy-egy szakaszban úgy határozzuk meg az α i értékeket, hogy a predikciós hiba négyzetösszege minimális legyen.
23
T.Gy. Beszedfelism es szint. 2009.03.03. 23 Ez a négyzetes hiba az [n 0, n 1 ] tartományra vonatkozik! A z eredeti jel, predikált jel, hibajel értelmezhető úgy is, mint a predikciós együtthatókkal leírt fizikai rendszerek be- és kimeneti jelei.
24
T.Gy. Beszedfelism es szint. 2009.03.03. 24 Ebben a modellben bemenet az eredeti beszédminták sorozata és kimenő jel a predikált beszédminták sorozata.
25
T.Gy. Beszedfelism es szint. 2009.03.03. 25 Ebben a modellben bemenet az eredeti beszédminták sorozata és kimenő jel a predikciós hibaminták sorozata.
26
T.Gy. Beszedfelism es szint. 2009.03.03. 26 Ebben a modellben bemenet a pedikciós hibaminták sorozata és kimenő jel az eredeti beszédjel-minták sorozata.
27
T.Gy. Beszedfelism es szint. 2009.03.03. 27 Tegyük fel, hogy tudunk a beszédjelre „jó” prediktort csinálni, azaz a hibaminták energiája sokkal kisebb, mint az eredeti beszédminták energiája A predikciós együtthatók és a hibaminták együtt teljes pontossággal leírják a beszédjelet. A predikciós együtthatókat és a hibamintákat kvantálva és kódolva tömörített beszédátvitel vagy beszédjel-tárolás lehetséges. A predikciós együtthatók és a hibajel jellemzői tömören és jól leírják a beszédfolyamatot és a beszédszervek működését. Melyik állítás igaz?
28
T.Gy. Beszedfelism es szint. 2009.03.03. 28 Ezt az elvet használják a GSM és a VoIP rendszerekben!!
29
T.Gy. Beszedfelism es szint. 2009.03.03. 29 Ezt az elvet használják beszédfelismerőkben, beszédszintetizátorokban
30
T.Gy. Beszedfelism es szint. 2009.03.03. 30 A predikciós együtthatók kiszámolása a beszédjel mintákból Adva van a beszédminták sorozata s(0), s(1), ……s(N-1), összesen tehát N minta Keressük predikciós egyenletben szereplő α 1, α 2, ….. α p predikciós együtthatók olyan értékét, hogy az E négyzetes predikciós hiba minimális legyen
31
T.Gy. Beszedfelism es szint. 2009.03.03. 31 Emlékezzünk a hibajel képletére!
32
T.Gy. Beszedfelism es szint. 2009.03.03. 32
33
T.Gy. Beszedfelism es szint. 2009.03.03. 33
34
T.Gy. Beszedfelism es szint. 2009.03.03. 34
35
T.Gy. Beszedfelism es szint. 2009.03.03. 35
36
T.Gy. Beszedfelism es szint. 2009.03.03. 36 Kovarianciamódszer A predikciótól azt kívánjuk meg, hogy az n 0 =p és n 1 =N-1 határok között legyen jó! Tehát az első p elemet nem kell jól becsülnie!
37
T.Gy. Beszedfelism es szint. 2009.03.03. 37 Autokorrelációs módszer A 0≤n≤N-1 indextartományon kívüli jelemeket zérusnak tételezi fel és a hibát n 0 = - ∞ és n 1 = + ∞ között értelmezi, A megoldandó egyenletrendszer mátrixa szimmetrikus, a főátlóval párhuzamos átlókban azonos elemet tartalmaz, Az egyenletrendszer felírásához is csak p+1 darab együtthatót kell meghatározni
38
T.Gy. Beszedfelism es szint. 2009.03.03. 38
39
T.Gy. Beszedfelism es szint. 2009.03.03. 39
40
T.Gy. Beszedfelism es szint. 2009.03.03. 40
41
T.Gy. Beszedfelism es szint. 2009.03.03. 41
42
T.Gy. Beszedfelism es szint. 2009.03.03. 42
Hasonló előadás
© 2024 SlidePlayer.hu Inc.
All rights reserved.