T.Gy. Beszedfelism es szint. 2013.02.27. 1 Beszédfelismerés és beszédszintézis Beszédjelek lineáris predikciója, PARCOR módszer, akusztikus csőmodell Takács.

Slides:



Advertisements
Hasonló előadás
Tamás Kincső, OSZK, Analitikus Feldolgozó Osztály, osztályvezető A részdokumentumok szolgáltatása az ELDORADO-ban ELDORADO konferencia a partnerkönyvtárakkal.
Advertisements


Kamarai prezentáció sablon
„Esélyteremtés és értékalakulás” Konferencia Megyeháza Kaposvár, 2009
Készítette: Boros Erzsi
A társadalmi tényezők hatása a tanulásra
Kvantitatív Módszerek
Erőállóképesség mérése Találjanak teszteket az irodalomban
MATEMATIKA Év eleji felmérés 3. évfolyam
Humánkineziológia szak
Mellár János 5. óra Március 12. v
Műveletek logaritmussal
Elektromos mennyiségek mérése
Az új történelem érettségiről és eredményeiről augusztus Kaposi József.
Koordináta transzformációk
Híranyagok tömörítése
Utófeszített vasbeton lemez statikai számítása Részletes számítás
4. VÉGES HALMAZOK 4.1 Alaptulajdonságok
A tételek eljuttatása az iskolákba
Elektronikai Áramkörök Tervezése és Megvalósítása
Elektronikai Áramkörök Tervezése és Megvalósítása
VÁLOGATÁS ISKOLÁNK ÉLETÉBŐL KÉPEKBEN.
Műszaki ábrázolás alapjai
Védőgázas hegesztések
1. IS2PRI2 02/96 B.Könyv SIKER A KÖNYVELÉSHEZ. 2. IS2PRI2 02/96 Mi a B.Könyv KönyvelésMérlegEredményAdóAnalitikaForintDevizaKönyvelésMérlegEredményAdóAnalitikaForintDeviza.
T.Gy. Beszedfelism es szint Beszédfelismerés és beszédszintézis Internetes médiakommunikáció Közös előadás Beszédjel-tömörítés Takács.
T.Gy. Beszedfelism es szint Beszédfelismerés és beszédszintézis Beszédjelek lineáris predikciója, PARCOR módszer, akusztikus csőmodell Takács.
T.Gy. Beszedfel Beszédfelismerés és beszédszintézis Beszédjel-tömörítés Takács György 7. előadás.
T.Gy. Beszedfelism es szint Beszédfelismerés és beszédszintézis Beszédjelek lineáris predikciója Takács György 4. előadás
Beszédfelismerés és beszédszintézis Spektrális módszerek a beszédfeldolgozásban Takács György 3. előadás Beszedfelism és szint
T.Gy. Beszedfelism es szint Beszédfelismerés és beszédszintézis Beszédjelek lineáris predikciója PARCOR módszerrel és a beszédképzés akusztikus.
A TERMÉSZETTUDOMÁNYOK ALAPJAI 1. Matematika
KÖZMŰ INFORMATIKA NUMERIKUS MÓDSZEREK I.
Szerkezeti elemek teherbírásvizsgálata összetett terhelés esetén:
Darupályák tervezésének alapjai
2007 december Szuhay Péter SPECTRIS Components Kft
Sárgarépa piaca hasonlóságelemzéssel Gazdaság- és Társadalomtudományi kar Gazdasági és vidékfejlesztési agrármérnök I. évfolyam Fekete AlexanderKozma Richárd.
NOVÁK TAMÁS Nemzetközi Gazdaságtan
DRAGON BALL GT dbzgtlink féle változat! Illesztett, ráégetett, sárga felirattal! Japan és Angol Navigáláshoz használd a bal oldali léptető elemeket ! Verzio.
Lineáris egyenletrendszerek (Az evolúciótól a megoldáshalmaz szerkezetéig) dr. Szalkai István Pannon Egyetem, Veszprém /' /
dr. Szalkai István Pannon Egyetem, Veszprém
Matematikai alapok és valószínűségszámítás
szakmérnök hallgatók számára
2. A KVANTUMMECHANIKA AXIÓMÁI 1. Erwin Schrödinger: Quantisierung als Eigenwertproblem (1926) 2.
Exponenciális egyenletek
Logikai szita Izsó Tímea 9.B.
Az LPQI rész a Partner Az LPQI-VES társfinanszírozója: Dr. Dán András Az MTA doktora, BME VET Meddőenergia kompenzálás elmélete és alkalmazása.
3. A HIDROGÉNATOM SZERKEZETE
LENDÜLETBEN AZ ORSZÁG A Magyar Köztársaság kormánya.
2007. május 22. Debrecen Digitalizálás és elektronikus hozzáférés 1 DEA: a Debreceni Egyetem elektronikus Archívuma Karácsony Gyöngyi DE Egyetemi és Nemzeti.
Idősor elemzés Idősor : időben ekvidisztáns elemekből álló sorozat
7. Házi feladat megoldása
A pneumatika alapjai A pneumatikában alkalmazott építőelemek és működésük vezérlő elemek (szelepek)
HÍDÉPÍTÉS Acélszerkezetek
Csurik Magda Országos Tisztifőorvosi Hivatal
A klinikai transzfúziós tevékenység Ápolás szakmai ellenőrzése
2006. Peer-to-Peer (P2P) hálózatok Távközlési és Médiainformatikai Tanszék.
Nyitott Kapuk 2010 Beiskolázási kérdőívek értékelése.
QualcoDuna interkalibráció Talaj- és levegövizsgálati körmérések évi értékelése (2007.) Dr. Biliczkiné Gaál Piroska VITUKI Kht. Minőségbiztosítási és Ellenőrzési.
Ágazati GDP előrejelző modell Foglalkoztatási és makro előrejelzés Vincze János Szirák, november 10.
1. Melyik jármű haladhat tovább elsőként az ábrán látható forgalmi helyzetben? a) A "V" jelű villamos. b) Az "M" jelű munkagép. c) Az "R" jelű rendőrségi.
Virtuális Méréstechnika Sub-VI és grafikonok 1 Makan Gergely, Vadai Gergely v
Mérés és adatgyűjtés laboratóriumi gyakorlat - levelező Sub-VI és grafikonok 1 Mingesz Róbert V
Kvantitatív módszerek
> aspnet_regiis -i 8 9 TIPP: Az „Alap” telepítés gyors, nem kérdez, de később korlátozhat.
A KÖVETKEZŐKBEN SZÁMOZOTT KÉRDÉSEKET VAGY KÉPEKET LÁT SZÁMOZOTT KÉPLETEKKEL. ÍRJA A SZÁMOZOTT KÉRDÉSRE ADOTT VÁLASZT, VAGY A SZÁMOZOTT KÉPLET NEVÉT A VÁLASZÍV.
1 Az igazság ideát van? Montskó Éva, mtv. 2 Célcsoport Az alábbi célcsoportokra vonatkozóan mutatjuk be az adatokat: 4-12 évesek,1.
Internetes médiakommunkáció TGY 1. előadás intmedkom02_09 1 Internetes médiakommunikáció Beszédfeldolgozás február 25. Takács György.
Beszédfelismerés és beszédszintézis Beszédjelek lineáris predikciója, PARCOR módszer, akusztikus csőmodell Takács György 4. előadás Beszedfelism.
Előadás másolata:

T.Gy. Beszedfelism es szint Beszédfelismerés és beszédszintézis Beszédjelek lineáris predikciója, PARCOR módszer, akusztikus csőmodell Takács György 4. előadás

T.Gy. Beszedfelism es szint Tartalom Ismétlés A lineáris predikció alapelvei PARCOR módszer a lineáris predikció speciális formája Akusztikus csőmodell Az akusztikus csőmodell és a lineáris predikció kapcsolata

T.Gy. Beszedfelism es szint A beszédhangok folytonos és diszkrét természete

T.Gy. Beszedfelism es szint A beszéd szerkezete A beszéd egymástól megkülönböztethető elemek szervezett időbeni egymásutánisága – soros szerkezet. Elem lehet egy összefüggő mondanivaló, egy hosszabb szünetekkel elhatárolt beszédrész, egy mondat, egy szó, egy beszédhang. Egy ötven beszédhangból álló nyelvben (leszámítva, hogy nem minden hang mondható egymás után) kb. egymillió különböző tíz hangból álló szó képezhető. A beszéd szerkezete felülről gyakorlatilag nyitott, alulról zárt.

T.Gy. Beszedfelism es szint

6 válasz Gerjesztések különböző helyeken Időben változó toldalékcső lineáris idővariáns rendszer H g(t)v(t)

T.Gy. Beszedfelism es szint Beszédjel spektrális jellemzésének nehézségei Kezelhető periodikus függvényeknél a Fourier-sor, Egyszeri folyamatoknál a Fourier-integrál, stacionárius sztochasztikus folyamatoknál a spektrális sűrűség (az autokorrelációs függvény Fourier-transzformáltja A beszédjelnek csak rövid szakaszai sorolható be a fenti függvénytípusok valamelyikébe! Nem tudjuk hogyan csinálja a fül!!!! Bizonyosan végez valamifajta spektrális elemzést Csak véges szakaszok feldolgozása lehetséges gépi úton. A periódusidő meghatározása nehéz.

T.Gy. Beszedfelism es szint

9

10

T.Gy. Beszedfelism es szint

T.Gy. Beszedfelism es szint

T.Gy. Beszedfelism es szint

T.Gy. Beszedfelism es szint Lineári predikció alapok A beszédjel n-edik mintája becsülhető a megelőző p beszédminta lineáris kombinációjával ahol az α i lineáris predikciós együtthatók hordozzák a jelenségre vonatkozó előismereteket, tapasztalatokat. p -- a prediktor fokszáma

T.Gy. Beszedfelism es szint válasz Gerjesztések különböző helyeken Időben változó toldalékcső lineáris idővariáns rendszer H g(t)v(t) T.Gy. Beszedfelism es szint

T.Gy. Beszedfelism es szint A predikció pontatlanságát jellemzi az predikciós hiba A predikciós hiba általában mintáról mintára változik! Gyakorlati feladatoknál a predikálandó jelenséget időszakaszokra bontjuk és egy-egy szakaszban úgy határozzuk meg az α i értékeket, hogy a predikciós hiba négyzetösszege minimális legyen.

T.Gy. Beszedfelism es szint Ez a négyzetes hiba az [n 0, n 1 ] tartományra vonatkozik! A z eredeti jel, predikált jel, hibajel értelmezhető úgy is, mint a predikciós együtthatókkal leírt fizikai rendszerek be- és kimeneti jelei.

T.Gy. Beszedfelism es szint Ebben a modellben bemenet az eredeti beszédminták sorozata és kimenő jel a predikált beszédminták sorozata.

T.Gy. Beszedfelism es szint Ebben a modellben bemenet az eredeti beszédminták sorozata és kimenő jel a predikciós hibaminták sorozata.

T.Gy. Beszedfelism es szint Ebben a modellben bemenet a pedikciós hibaminták sorozata és kimenő jel az eredeti beszédjel-minták sorozata.

T.Gy. Beszedfelism es szint válasz Gerjesztések különböző helyeken Időben változó toldalékcső lineáris idővariáns rendszer H g(t)v(t) T.Gy. Beszedfelism es szint

T.Gy. Beszedfelism es szint Tegyük fel, hogy tudunk a beszédjelre „jó” prediktort csinálni, azaz a hibaminták energiája sokkal kisebb, mint az eredeti beszédminták energiája A predikciós együtthatók és a hibaminták együtt teljes pontossággal leírják a beszédjelet. A predikciós együtthatókat és a hibamintákat kvantálva és kódolva tömörített beszédátvitel vagy beszédjel-tárolás lehetséges. A predikciós együtthatók és a hibajel jellemzői tömören és jól leírják a beszédfolyamatot és a beszédszervek működését. Melyik állítás igaz?

T.Gy. Beszedfelism es szint Ezt az elvet használják a GSM és a VoIP rendszerekben!!

T.Gy. Beszedfelism es szint Ezt az elvet használják beszédfelismerőkben, beszédszintetizátorokban

T.Gy. Beszedfelism es szint A predikciós együtthatók kiszámolása a beszédjel mintákból Adva van a beszédminták sorozata s(0), s(1), ……s(N-1), összesen tehát N minta Keressük predikciós egyenletben szereplő α 1, α 2, ….. α p predikciós együtthatók olyan értékét, hogy az E négyzetes predikciós hiba minimális legyen

T.Gy. Beszedfelism es szint Emlékezzünk a hibajel képletére!

T.Gy. Beszedfelism es szint

T.Gy. Beszedfelism es szint

T.Gy. Beszedfelism es szint

T.Gy. Beszedfelism es szint

T.Gy. Beszedfelism es szint Kovarianciamódszer A predikciótól azt kívánjuk meg, hogy az n 0 =p és n 1 =N-1 határok között legyen jó! Tehát az első p elemet nem kell jól becsülnie!

T.Gy. Beszedfelism es szint Autokorrelációs módszer A 0≤n≤N-1 indextartományon kívüli jelemeket zérusnak tételezi fel és a hibát n 0 = - ∞ és n 1 = + ∞ között értelmezi, A megoldandó egyenletrendszer mátrixa szimmetrikus, a főátlóval párhuzamos átlókban azonos elemet tartalmaz, Az egyenletrendszer felírásához is csak p+1 darab együtthatót kell meghatározni

T.Gy. Beszedfelism es szint

T.Gy. Beszedfelism es szint

T.Gy. Beszedfelism es szint

T.Gy. Beszedfelism es szint

T.Gy. Beszedfelism es szint

A PARCOR eljárás T.Gy. Beszedfelism es szint

T.Gy. Beszedfelism es szint

A minimalizálandó visszairányú hiba: Összevetve az előre irányú hiba egyenleteivel látható, hogy T.Gy. Beszedfelism es szint

Az előre irányú predikciónál használt összefüggés T.Gy. Beszedfelism es szint

Saito és Itakura gondolata volt bevezetni az előre és visszairányú hibára együttesen jellemző Wp értéket T.Gy. Beszedfelism es szint

Az egyenleteket rendezgetve egy rekurzív formula nyerhető: Bevezetve az új k változót Tehát nem nagy mátrix-egyenleteket kell megoldani, hanem α értékei rekurzív formulával számolhatók! T.Gy. Beszedfelism es szint

T.Gy. Beszedfelism es szint

Először kiszámoljuk k 1 -et minden n-re Majd e 1 (n) és f 1 (n) értékeit minden n-re és ez hasonlóan tovább ismételhető Fontos!!! | k i |≤1 T.Gy. Beszedfelism es szint

A szintézismodell stabil, ha | k i |≤1 T.Gy. Beszedfelism es szint

Állóhullámú minták egy egyenes csőben: negyedhullámú rezonátorok A cső zárt a bal végén és nyitott a jobb végén T.Gy. Beszedfelism es szint

Állóhullámú minták egy egyenes csőben: félhullámú rezonátorok A cső zárt mindkét végén A cső nyitott mindkét végén T.Gy. Beszedfelism es szint

T.Gy. Beszedfelism es szint

Negyedhullámú rezonátor: Ahol: c - a hang terjedési sebessége (340 m/s) l - a cső hossza (0,17m átlagos férfinél) F1=500, F2=1500, F3=2500 T.Gy. Beszedfelism es szint

Félhullámú rezonátor: Ahol: c - a hang terjedési sebessége (340 m/s) l - a cső hossza (0,17m átlagos férfinél) F1=0, F2=1000, F3=2000 T.Gy. Beszedfelism es szint

A beszédkeltés akusztikus csőmodellje Közelítő feltevések: –A csőben a hullámok csak tengelyirányban terjednek (a keresztmetszeti méretek a hullámhosszhoz képest kicsik), –A hanghullám visszaverődése a csőfalról veszteségmentes, –A toldalékcső csatolásmentes, –A csőfalak merevek. T.Gy. Beszedfelism es szint

T.Gy. Beszedfelism es szint

A közelítő feltételek után a csőben terjedő hanghullámokat leíró egyenletek: Ahol: p – hangnyomás, u -- térfogatsebesség ρ – a levegő sűrűsége c – a levegőben terjedő hang sebessége T.Gy. Beszedfelism es szint

További egyszerűsítés a megoldhatóság érdekében: A(x,t)=A 0 Emlékezzünk a sodrott érpárakat leíró egyenletek alakjára T.Gy. Beszedfelism es szint

Egy keresztmetszetváltás és a csatlakozó csőszakaszok viszonyai T.Gy. Beszedfelism es szint

Egy állandó keresztmetszetű szakaszon a haladó hullámok csak késleltetést szenvednek, ezért A keresztmetszetváltásnál felírható a folytonossági egyenlet Bevezetve a reflexiós tényezőt: T.Gy. Beszedfelism es szint

Egy keresztmetszetváltás és a hozzá kapcsolódó szakaszok térfogatsebesség viszonyai folyamatábrában T.Gy. Beszedfelism es szint

Térfogatsebesség viszonyok a cső végén T.Gy. Beszedfelism es szint

Térfogatsebesség viszonyok a cső elején T.Gy. Beszedfelism es szint

(a) The vocal tract, modeled as a single one-dimensional acoustic tube of varying cross-sectional area and (b) an eight tube model suitable for discretization T.Gy. Beszedfelism es szint

A toldalékcső modellje egyenletesen felosztott, állandó keresztmetszetű csőszakaszokkal T.Gy. Beszedfelism es szint

Belátható, hogy az alábbi rács struktúrák ekvivalensek… Ezért a csőmodell azonos a PARCOR szintézis modellel, ha r i = ─ k i T.Gy. Beszedfelism es szint

A PARCOR eljárás olyan beszédfeldolgozási eszköz, amely 6-20 együtthatóval leírja a beszédjel egy szakaszát, Az együtthatók rekurzív képlettel meghatározhatók, A modell stabilitása garantálható, Az együtthatókból és valamilyen hibajelből a beszédjel előállítható, A csőmodellen keresztül fizikai tartalom rendelhető a modellhez, A csőmodell paraméterei magából a beszédjelből meghatározhatók!!!!! T.Gy. Beszedfelism es szint