Beszédfelismerés és beszédszintézis Beszédjelek lineáris predikciója, PARCOR módszer, akusztikus csőmodell Takács György 4. előadás 2016. 2. 23. Beszedfelism.

Slides:



Advertisements
Hasonló előadás
Lineáris egyenletrendszerek
Advertisements

Lineáris egyenletrendszerek megoldása Gauss elimináció, Cramer-szabály Dr. Kovács Sándor DE GVK Gazdaságelemzési és Statiszikai Tanszék.
Környezeti és Műszaki Áramlástan II. (Transzportfolyamatok II.)
Takács György 15. előadás Készítette Feldhoffer Gergely
Kvantitatív Módszerek
Függvények Egyenlőre csak valós-valós függvényekkel foglalkozunk.
Kötelező alapkérdések
Kalman-féle rendszer definíció
Diszkrét idejű bemenet kimenet modellek
Híranyagok tömörítése
Számítógépes algebrai problémák a geodéziában
A beszéd.
Síkhullámok visszaverődése és törése
4. VÉGES HALMAZOK 4.1 Alaptulajdonságok
Hullámoptika.
1.) Egy lineáris, kauzális, invariáns DI rendszer
Dr. Szalka Éva, Ph.D.1 Statisztika II. IX.. Dr. Szalka Éva, Ph.D.2 Idősorok elemzése.
Dr. Szalka Éva, Ph.D.1 Statisztika II. IX.. Dr. Szalka Éva, Ph.D.2 Idősorok elemzése.
T.Gy. Beszedfelism es szint Beszédfelismerés és beszédszintézis Beszédfelismerés alapjai, izolált szavas kötöttszótárú felismerők Takács.
Beszédfelismerés és beszédszintézis Beszédfelismerés alapjai, izolált szavas kötöttszótárú felismerők Takács György 14. előadás Beszedf
T.Gy. Beszedfelism es szint Beszédfelismerés és beszédszintézis Beszédfelismerés neurális hálózatokkal Takács György 13. előadás 2012.
T.Gy. Beszedfelism es szint Beszédfelismerés és beszédszintézis Beszédjelek lineáris predikciója, PARCOR módszer, akusztikus csőmodell Takács.
T.Gy. Beszedfelism es szint Beszédfelismerés és beszédszintézis Internetes médiakommunikáció Közös előadás Beszédjel-tömörítés Takács.
T.Gy. Beszedfelism es szint Beszédfelismerés és beszédszintézis Beszédfelismerés alapjai, izolált szavas kötöttszótárú felismerők Takács.
T.Gy. Beszedfelism es szint Beszédfelismerés és beszédszintézis Beszédjelek lineáris predikciója, PARCOR módszer, akusztikus csőmodell Takács.
T.Gy. Beszedfel Beszédfelismerés és beszédszintézis Beszédjel-tömörítés Takács György 7. előadás.
T.Gy. Beszedfelism es szint Beszédfelismerés és beszédszintézis Beszédjelek lineáris predikciója Takács György 4. előadás
Beszédfelismerés és beszédszintézis Spektrális módszerek a beszédfeldolgozásban Takács György 3. előadás Beszedfelism és szint
T.Gy. Beszedfelism es szint Beszédfelismerés és beszédszintézis Beszédjelek lineáris predikciója PARCOR módszerrel és a beszédképzés akusztikus.
Deformálható testek mechanikája - Rezgések és hullámok
III. előadás.
Differenciál számítás
Lineáris algebra Mátrixok, determinánsok, lineáris egyenletrendszerek
KÖZMŰ INFORMATIKA NUMERIKUS MÓDSZEREK I.
Regresszióanalízis 10. gyakorlat.
Dinamikus klaszterközelítés Átlagtér illetve párközelítés kiterjesztése N játékos egy rácson helyezkedik el (periodikus határfeltétel) szimmetriák: transzlációs,
Az Alakfelismerés és gépi tanulás ELEMEI
Folytonos jelek Fourier transzformációja
Rendszerek sajátfüggvényei és azok tulajdonságai Folytonos (FT) rendszerekkel foglalkozunk,de az eredmények átvihetők diszkrét rendszerekre is. kt)kt)
Lineáris algebra.
Összefüggések modelleken belül Budapesti Műszaki Főiskola Neumann János Informatikai Főiskolai Kar A Műszaki Tervezés Rendszerei 2000/2001 tanév, I. félév.
Kvantitatív Módszerek
Minőségtechnikák I. (Megbízhatóság)
Idősor elemzés Idősor : időben ekvidisztáns elemekből álló sorozat
T.Gy. Beszedfelism es szint
Lineáris algebra.
Szabályozási Rendszerek 2014/2015 őszi szemeszter Előadás Automatizálási tanszék.
Műveletek, függvények és tulajdonságaik Mátrix struktúrák:
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Regresszió-számítás március 30. Dr. Varga Beatrix egyetemi.
A mozgás egy E irányú egyenletesen gyorsuló mozgás és a B-re merőleges síkban lezajló ciklois mozgás szuperpoziciója. Ennek igazolására először a nagyobb.
Valószínűségszámítás II.
Többdimenziós valószínűségi eloszlások
Szimuláció.
Hibaszámítás Gräff József 2014 MechatrSzim.
Földstatikai feladatok megoldási módszerei
Mechanikai hullámok.
A villamos és a mágneses tér kapcsolata
Internetes médiakommunkáció TGY 1. előadás intmedkom02_09 1 Internetes médiakommunikáció Beszédfeldolgozás február 25. Takács György.
Szimuláció. Mi a szimuláció? A szimuláció a legáltalánosabb értelemben a megismerés egyik fajtája A megismerés a tudás megszerzése vagy annak folyamata.
Gazdaságstatisztika Gazdaságstatisztika Korreláció- és regressziószámítás II.
Mediánok és rendezett minták
Áramlástani alapok évfolyam
Beszédfelismerés és beszédszintézis Beszédfelismerés alapjai, izolált szavas kötöttszótárú felismerők Takács György 13. előadás Beszedf
Lineáris egyenletrendszerek megoldása Gauss elimináció, Cramer-szabály Dr. Kovács Sándor DE GVK Gazdaságelemzési és Statiszikai Tanszék.
Kockázat és megbízhatóság
Numerikus differenciálás és integrálás
III. előadás.
A Box-Jenkins féle modellek
Készletek – Állandó felhasználási mennyiség (folyamatos)
Dr. Varga Beatrix egyetemi docens
Előadás másolata:

Beszédfelismerés és beszédszintézis Beszédjelek lineáris predikciója, PARCOR módszer, akusztikus csőmodell Takács György 4. előadás 2016. 2. 23. Beszedfelism és szint. 2016.02.23.

Tartalom Ismétlés A lineáris predikció alapelvei PARCOR módszer a lineáris predikció speciális formája Akusztikus csőmodell Az akusztikus csőmodell és a lineáris predikció kapcsolata Beszedfelism és szint. 2016.02.23.

A beszédhangok folytonos és diszkrét természete Beszedfelism és szint. 2016.02.23.

A beszéd szerkezete A beszéd egymástól megkülönböztethető elemek szervezett időbeni egymásutánisága – soros szerkezet. Elem lehet egy összefüggő mondanivaló, egy hosszabb szünetekkel elhatárolt beszédrész, egy mondat, egy szó, egy beszédhang. Egy ötven beszédhangból álló nyelvben (leszámítva, hogy nem minden hang mondható egymás után) kb. egymillió különböző tíz hangból álló szó képezhető. A beszéd szerkezete felülről gyakorlatilag nyitott, alulról zárt. Beszedfelism és szint. 2016.02.23.

Beszedfelism és szint. 2016.02.23.

Gerjesztések különböző helyeken Időben változó toldalékcső válasz Gerjesztések különböző helyeken Időben változó toldalékcső H g(t) v(t) lineáris idővariáns rendszer Beszedfelism és szint. 2016.02.23.

Beszédjel spektrális jellemzésének nehézségei Kezelhető periodikus függvényeknél a Fourier-sor, Egyszeri folyamatoknál a Fourier-integrál, stacionárius sztochasztikus folyamatoknál a spektrális sűrűség (az autokorrelációs függvény Fourier-transzformáltja A beszédjelnek csak rövid szakaszai sorolható be a fenti függvénytípusok valamelyikébe! Nem tudjuk hogyan csinálja a fül!!!! Bizonyosan végez valamifajta spektrális elemzést Csak véges szakaszok feldolgozása lehetséges gépi úton. A periódusidő meghatározása nehéz. Beszedfelism és szint. 2016.02.23.

Beszedfelism és szint. 2016.02.23.

Beszedfelism és szint. 2016.02.23.

Beszedfelism és szint. 2016.02.23.

Beszedfelism és szint. 2016.02.23.

Beszedfelism és szint. 2016.02.23.

Beszedfelism és szint. 2016.02.23.

Lineári predikció alapok A beszédjel n-edik mintája becsülhető a megelőző p beszédminta lineáris kombinációjával ahol az αi lineáris predikciós együtthatók hordozzák a jelenségre vonatkozó előismereteket, tapasztalatokat. p -- a prediktor fokszáma Beszedfelism és szint. 2016.02.23.

T.Gy. Beszedfelism es szint. 2011.03.01. válasz Gerjesztések különböző helyeken Időben változó toldalékcső H g(t) v(t) lineáris idővariáns rendszer T.Gy. Beszedfelism es szint. 2011.03.01. Beszedfelism és szint. 2016.02.23. 15

A predikció pontatlanságát jellemzi az predikciós hiba A predikciós hiba általában mintáról mintára változik! Gyakorlati feladatoknál a predikálandó jelenséget időszakaszokra bontjuk és egy-egy szakaszban úgy határozzuk meg az αi értékeket, hogy a predikciós hiba négyzetösszege minimális legyen. Beszedfelism és szint. 2016.02.23.

Ez a négyzetes hiba az [n0, n1] tartományra vonatkozik! A z eredeti jel, predikált jel, hibajel értelmezhető úgy is, mint a predikciós együtthatókkal leírt fizikai rendszerek be- és kimeneti jelei. Beszedfelism és szint. 2016.02.23.

Ebben a modellben bemenet az eredeti beszédminták sorozata és kimenő jel a predikált beszédminták sorozata. Beszedfelism és szint. 2016.02.23.

Ebben a modellben bemenet az eredeti beszédminták sorozata és kimenő jel a predikciós hibaminták sorozata. Beszedfelism és szint. 2016.02.23.

Ebben a modellben bemenet a pedikciós hibaminták sorozata és kimenő jel az eredeti beszédjel-minták sorozata. Beszedfelism és szint. 2016.02.23.

T.Gy. Beszedfelism es szint. 2011.03.01. válasz Gerjesztések különböző helyeken Időben változó toldalékcső H g(t) v(t) lineáris idővariáns rendszer T.Gy. Beszedfelism es szint. 2011.03.01. Beszedfelism és szint. 2016.02.23. 21

Tegyük fel, hogy tudunk a beszédjelre „jó” prediktort csinálni, azaz a hibaminták energiája sokkal kisebb, mint az eredeti beszédminták energiája Melyik állítás igaz? A predikciós együtthatók és a hibaminták együtt teljes pontossággal leírják a beszédjelet. A predikciós együtthatókat és a hibamintákat kvantálva és kódolva tömörített beszédátvitel vagy beszédjel-tárolás lehetséges. A predikciós együtthatók és a hibajel jellemzői tömören és jól leírják a beszédfolyamatot és a beszédszervek működését. Beszedfelism és szint. 2016.02.23.

Ezt az elvet használják a GSM és a VoIP rendszerekben!! Beszedfelism és szint. 2016.02.23.

Ezt az elvet használják beszédfelismerőkben, beszédszintetizátorokban Beszedfelism és szint. 2016.02.23.

A predikciós együtthatók kiszámolása a beszédjel mintákból Adva van a beszédminták sorozata s(0), s(1), ……s(N-1), összesen tehát N minta Keressük predikciós egyenletben szereplő α1, α2, ….. αp predikciós együtthatók olyan értékét, hogy az E négyzetes predikciós hiba minimális legyen Beszedfelism és szint. 2016.02.23.

Emlékezzünk a hibajel képletére! Beszedfelism és szint. 2016.02.23.

Beszedfelism és szint. 2016.02.23.

Beszedfelism és szint. 2016.02.23.

Beszedfelism és szint. 2016.02.23.

Beszedfelism és szint. 2016.02.23.

Kovarianciamódszer A predikciótól azt kívánjuk meg, hogy az n0=p és n1=N-1 határok között legyen jó! Tehát az első p elemet nem kell jól becsülnie! Beszedfelism és szint. 2016.02.23.

Autokorrelációs módszer A 0≤n≤N-1 indextartományon kívüli jelemeket zérusnak tételezi fel és a hibát n0= - ∞ és n1= + ∞ között értelmezi, A megoldandó egyenletrendszer mátrixa szimmetrikus, a főátlóval párhuzamos átlókban azonos elemet tartalmaz, Az egyenletrendszer felírásához is csak p+1 darab együtthatót kell meghatározni Beszedfelism és szint. 2016.02.23.

Beszedfelism és szint. 2016.02.23.

Beszedfelism és szint. 2016.02.23.

Beszedfelism és szint. 2016.02.23.

Beszedfelism és szint. 2016.02.23.

Beszedfelism és szint. 2016.02.23.

A PARCOR eljárás Beszedfelism és szint. 2016.02.23.

Beszedfelism és szint. 2016.02.23.

A minimalizálandó visszairányú hiba: Összevetve az előre irányú hiba egyenleteivel látható, hogy Beszedfelism és szint. 2016.02.23.

Az előre irányú predikciónál használt összefüggés Beszedfelism és szint. 2016.02.23.

Saito és Itakura gondolata volt bevezetni az előre és visszairányú hibára együttesen jellemző Wp értéket Beszedfelism és szint. 2016.02.23.

Az egyenleteket rendezgetve egy rekurzív formula nyerhető: Bevezetve az új k változót Az egyenleteket rendezgetve egy rekurzív formula nyerhető: Tehát nem nagy mátrix-egyenleteket kell megoldani, hanem α értékei rekurzív formulával számolhatók! Beszedfelism és szint. 2016.02.23.

Beszedfelism és szint. 2016.02.23.

Először kiszámoljuk k1-et minden n-re Majd e1(n) és f1(n) értékeit minden n-re és ez hasonlóan tovább ismételhető Fontos!!! | ki |≤1 Beszedfelism és szint. 2016.02.23.

A szintézismodell stabil, ha | ki |≤1 Beszedfelism és szint. 2016.02.23.

Állóhullámú minták egy egyenes csőben: negyedhullámú rezonátorok A cső zárt a bal végén és nyitott a jobb végén Beszedfelism és szint. 2016.02.23.

Állóhullámú minták egy egyenes csőben: félhullámú rezonátorok A cső zárt mindkét végén A cső nyitott mindkét végén Beszedfelism és szint. 2016.02.23.

Beszedfelism és szint. 2016.02.23.

Negyedhullámú rezonátor: Ahol: c - a hang terjedési sebessége (340 m/s) l - a cső hossza (0,17m átlagos férfinél) F1=500, F2=1500, F3=2500 Beszedfelism és szint. 2016.02.23.

Félhullámú rezonátor: Ahol: c - a hang terjedési sebessége (340 m/s) l - a cső hossza (0,17m átlagos férfinél) F1=0, F2=1000, F3=2000 Beszedfelism és szint. 2016.02.23.

A beszédkeltés akusztikus csőmodellje Közelítő feltevések: A csőben a hullámok csak tengelyirányban terjednek (a keresztmetszeti méretek a hullámhosszhoz képest kicsik), A hanghullám visszaverődése a csőfalról veszteségmentes, A toldalékcső csatolásmentes, A csőfalak merevek. Beszedfelism és szint. 2016.02.23.

Beszedfelism és szint. 2016.02.23.

A közelítő feltételek után a csőben terjedő hanghullámokat leíró egyenletek: Ahol: p – hangnyomás, u -- térfogatsebesség ρ – a levegő sűrűsége c – a levegőben terjedő hang sebessége Beszedfelism és szint. 2016.02.23.

További egyszerűsítés a megoldhatóság érdekében: A(x,t)=A0 Emlékezzünk a sodrott érpárakat leíró egyenletek alakjára Beszedfelism és szint. 2016.02.23.

Egy keresztmetszetváltás és a csatlakozó csőszakaszok viszonyai Beszedfelism és szint. 2016.02.23.

Egy állandó keresztmetszetű szakaszon a haladó hullámok csak késleltetést szenvednek, ezért A keresztmetszetváltásnál felírható a folytonossági egyenlet Bevezetve a reflexiós tényezőt: Beszedfelism és szint. 2016.02.23.

Egy keresztmetszetváltás és a hozzá kapcsolódó szakaszok térfogatsebesség viszonyai folyamatábrában Beszedfelism és szint. 2016.02.23.

Térfogatsebesség viszonyok a cső végén Beszedfelism és szint. 2016.02.23.

Térfogatsebesség viszonyok a cső elején Beszedfelism és szint. 2016.02.23.

(a) The vocal tract, modeled as a single one-dimensional acoustic tube of varying cross-sectional area and (b) an eight tube model suitable for discretization Beszedfelism és szint. 2016.02.23.

A toldalékcső modellje egyenletesen felosztott, állandó keresztmetszetű csőszakaszokkal Beszedfelism és szint. 2016.02.23.

Belátható, hogy az alábbi rács struktúrák ekvivalensek… Ezért a csőmodell azonos a PARCOR szintézis modellel, ha ri = ─ ki Beszedfelism és szint. 2016.02.23.

A PARCOR eljárás olyan beszédfeldolgozási eszköz, amely 6-20 együtthatóval leírja a beszédjel egy szakaszát, Az együtthatók rekurzív képlettel meghatározhatók, A modell stabilitása garantálható, Az együtthatókból és valamilyen hibajelből a beszédjel előállítható, A csőmodellen keresztül fizikai tartalom rendelhető a modellhez, A csőmodell paraméterei magából a beszédjelből meghatározhatók!!!!! Beszedfelism és szint. 2016.02.23.