Az előadás letöltése folymat van. Kérjük, várjon

Az előadás letöltése folymat van. Kérjük, várjon

T.Gy. Beszedfelism es szint. 2010.03.09. 1 Beszédfelismerés és beszédszintézis Beszédjelek lineáris predikciója PARCOR módszerrel és a beszédképzés akusztikus.

Hasonló előadás


Az előadások a következő témára: "T.Gy. Beszedfelism es szint. 2010.03.09. 1 Beszédfelismerés és beszédszintézis Beszédjelek lineáris predikciója PARCOR módszerrel és a beszédképzés akusztikus."— Előadás másolata:

1 T.Gy. Beszedfelism es szint Beszédfelismerés és beszédszintézis Beszédjelek lineáris predikciója PARCOR módszerrel és a beszédképzés akusztikus csőmodellje Takács György 5. előadás

2 T.Gy. Beszedfelism es szint Tartalom Ismétlés A lineáris predikció fejlett formái Akusztikus csőmodell

3 T.Gy. Beszedfelism es szint

4 4

5 5

6 6

7 7 Lineári predikció alapok A beszédjel n-edik mintája becsülhető a megelőző p beszédminta lineáris kombinációjával ahol az α i lineáris predikciós együtthatók hordozzák a jelenségre vonatkozó előismereteket, tapasztalatokat. p -- a prediktor fokszáma

8 T.Gy. Beszedfelism es szint A predikció pontatlanságát jellemzi az predikciós hiba A predikciós hiba általában mintáról mintára változik! Gyakorlati feladatoknál a predikálandó jelenséget időszakaszokra bontjuk és egy-egy szakaszban úgy határozzuk meg az α i értékeket, hogy a predikciós hiba négyzetösszege minimális legyen.

9 T.Gy. Beszedfelism es szint Ebben a modellben bemenet az eredeti beszédminták sorozata és kimenő jel a predikciós hibaminták sorozata.

10 T.Gy. Beszedfelism es szint Ebben a modellben bemenet a pedikciós hibaminták sorozata és kimenő jel az eredeti beszédjel-minták sorozata.

11 T.Gy. Beszedfelism es szint

12 T.Gy. Beszedfelism es szint Kovarianciamódszer A predikciótól azt kívánjuk meg, hogy az n 0 =p és n 1 =N-1 határok között legyen jó! Tehát az első p elemet nem kell jól becsülnie!

13 T.Gy. Beszedfelism es szint Autokorrelációs módszer A 0≤n≤N-1 indextartományon kívüli jelemeket zérusnak tételezi fel és a hibát n 0 = - ∞ és n 1 = + ∞ között értelmezi, A megoldandó egyenletrendszer mátrixa szimmetrikus, a főátlóval párhuzamos átlókban azonos elemet tartalmaz, Az egyenletrendszer felírásához is csak p+1 darab együtthatót kell meghatározni

14 T.Gy. Beszedfelism es szint

15 T.Gy. Beszedfelism es szint

16 T.Gy. Beszedfelism es szint A PARCOR eljárás

17 T.Gy. Beszedfelism es szint

18 T.Gy. Beszedfelism es szint A minimalizálandó visszairányú hiba: Összevetve az előre irányú hiba egyenleteivel látható, hogy

19 T.Gy. Beszedfelism es szint Az előre irányú predikciónál használt összefüggés

20 T.Gy. Beszedfelism es szint Saito és Itakura gondolata volt bevezetni az előre és visszairányú hibára együttesen jellemző Wp értéket

21 T.Gy. Beszedfelism es szint Az egyenleteket rendezgetve egy rekurzív formula nyerhető: Bevezetve az új k változót Tehát nem nagy mátrix-egyenleteket kell megoldani, hanem α értékei rekurzív formulával számolhatók!

22 T.Gy. Beszedfelism es szint

23 T.Gy. Beszedfelism es szint Először kiszámoljuk k 1 -et minden n-re Majd e 1 (n) és f 1 (n) értékeit minden n-re és ez hasonlóan tovább ismételhető Fontos!!! | k i |≤1

24 T.Gy. Beszedfelism es szint A szintézismodell stabil, ha | k i |≤1

25 T.Gy. Beszedfelism es szint A beszédkeltés akusztikus csőmodellje Közelítő feltevések: –A csőben a hullámok csak tengelyirányban terjednek (a keresztmetszeti méretek a hullámhosszhoz képest kicsik), –A hanghullám visszaverődése a csőfalról veszteségmentes, –A toldalékcső csatolásmentes, –A csőfalak merevek.

26 T.Gy. Beszedfelism es szint Állóhullámú minták egy egyenes csőben: negyedhullámú rezonátorok A cső zárt a bal végén és nyitott a jobb végén

27 T.Gy. Beszedfelism es szint Állóhullámú minták egy egyenes csőben: félhullámú rezonátorok A cső zárt mindkét végén A cső nyitott mindkét végén

28 T.Gy. Beszedfelism es szint

29 T.Gy. Beszedfelism es szint Negyedhullámú rezonátor: Ahol: c - a hang terjedési sebessége (340 m/s) l - a cső hossza (0,17m átlagos férfinél) F1=500, F2=1500, F3=2500

30 T.Gy. Beszedfelism es szint Félhullámú rezonátor: Ahol: c - a hang terjedési sebessége (340 m/s) l - a cső hossza (0,17m átlagos férfinél) F1=0, F2=1000, F3=2000

31 T.Gy. Beszedfelism es szint

32 T.Gy. Beszedfelism es szint A közelítő feltételek után a csőben terjedő hanghullámokat leíró egyenletek: Ahol: p – hangnyomás, u -- térfogatsebesség ρ – a levegő sűrűsége c – a levegőben terjedő hang sebessége

33 T.Gy. Beszedfelism es szint További egyszerűsítés a megoldhatóság érdekében: A(x,t)=A 0 Emlékezzünk a sodrott érpárakat leíró egyenletek alakjára

34 T.Gy. Beszedfelism es szint Egy keresztmetszetváltás és a csatlakozó csőszakaszok viszonyai

35 T.Gy. Beszedfelism es szint Egy állandó keresztmetszetű szakaszon a haladó hullámok csak késleltetést szenvednek, ezért A keresztmetszetváltásnál felírható a folytonossági egyenlet Bevezetve a reflexiós tényezőt:

36 T.Gy. Beszedfelism es szint Egy keresztmetszetváltás és a hozzá kapcsolódó szakaszok térfogatsebesség viszonyai folyamatábrában

37 T.Gy. Beszedfelism es szint Térfogatsebesség viszonyok a cső végén

38 T.Gy. Beszedfelism es szint Térfogatsebesség viszonyok a cső elején

39 T.Gy. Beszedfelism es szint (a) The vocal tract, modeled as a single one-dimensional acoustic tube of varying cross-sectional area and (b) an eight tube model suitable for discretization

40 T.Gy. Beszedfelism es szint A toldalékcső modellje egyenletesen felosztott, állandó keresztmetszetű csőszakaszokkal

41 T.Gy. Beszedfelism es szint Belátható, hogy az alábbi rács struktúrák ekvivalensek… Ezért a csőmodell azonos a PARCOR szintézis modellel, ha r i = ─ k i

42 T.Gy. Beszedfelism es szint A PARCOR eljárás olyan beszédfeldolgozási eszköz, amely 6-20 együtthatóval leírja a beszédjel egy szakaszát, Az együtthatók rekurzív képlettel meghatározhatók, A modell stabilitása garantálható, Az együtthatókból és valamilyen hibajelből a beszédjel előállítható, A csőmodellen keresztül fizikai tartalom rendelhető a modellhez, A csőmodell paraméterei magából a beszédjelből meghatározhatók!!!!!


Letölteni ppt "T.Gy. Beszedfelism es szint. 2010.03.09. 1 Beszédfelismerés és beszédszintézis Beszédjelek lineáris predikciója PARCOR módszerrel és a beszédképzés akusztikus."

Hasonló előadás


Google Hirdetések