Internetes médiakommunkáció TGY 1. előadás intmedkom02_09 1 Internetes médiakommunikáció Beszédfeldolgozás 2009. február 25. Takács György.

Slides:



Advertisements
Hasonló előadás
Lineáris egyenletrendszerek
Advertisements

Lineáris egyenletrendszerek megoldása Gauss elimináció, Cramer-szabály Dr. Kovács Sándor DE GVK Gazdaságelemzési és Statiszikai Tanszék.
KÉSZÍTETTE: Takács Sándor
Kvantitatív Módszerek
Gábor Dénes Főiskola Informatikai Rendszerek Intézete Informatikai Alkalmazások Tanszék Infokommunikáció Beszédjelek Házman DIGITÁLIS BESZÉDJEL ÁTVITEL.
Függvények Egyenlőre csak valós-valós függvényekkel foglalkozunk.
MI 2003/ A következőkben más megközelítés: nem közvetlenül az eloszlásokból indulunk ki, hanem a diszkriminancia függvényeket keressük. Legegyszerűbb:
Műveletek logaritmussal
Kötelező alapkérdések
Kalman-féle rendszer definíció
Híranyagok tömörítése
A beszéd.
Globális helymeghatározás Zárthelyi dolgozat Relatív helymeghatározás fázisméréssel.
Matematika II. 2. előadás Geodézia szakmérnöki szak 2012/2013. tanév Műszaki térinformatika ágazat őszi félév.
A számítástechnika és informatika tárgya
Az anyag tulajdonságai és változásai
Ideális kontinuumok kinematikája
Lineáris programozás Modellalkotás Grafikus megoldás Feladattípusok
T.Gy. Beszedfelism es szint Beszédfelismerés és beszédszintézis Beszédfelismerés alapjai, izolált szavas kötöttszótárú felismerők Takács.
Bárdi Tamás előadására építve
Beszédfelismerés és beszédszintézis Beszédfelismerés alapjai, izolált szavas kötöttszótárú felismerők Takács György 14. előadás Beszedf
T.Gy. Beszedfelism es szint Beszédfelismerés és beszédszintézis Takács György 1. előadás
T.Gy. Beszedfelism es szint Beszédfelismerés és beszédszintézis Beszédfelismerés neurális hálózatokkal Takács György 13. előadás 2012.
T.Gy. Beszedfelism es szint Beszédfelismerés és beszédszintézis Beszédjelek lineáris predikciója, PARCOR módszer, akusztikus csőmodell Takács.
T.Gy. Beszedfelism es szint Beszédfelismerés és beszédszintézis Internetes médiakommunikáció Közös előadás Beszédjel-tömörítés Takács.
T.Gy. Beszedfelism es szint Beszédfelismerés és beszédszintézis Beszédfelismerés alapjai, izolált szavas kötöttszótárú felismerők Takács.
T.Gy. Beszedfelism es szint Beszédfelismerés és beszédszintézis Beszédjelek lineáris predikciója, PARCOR módszer, akusztikus csőmodell Takács.
T.Gy. Beszedfel Beszédfelismerés és beszédszintézis Beszédjel-tömörítés Takács György 7. előadás.
T.Gy. Beszedfelism es szint Beszédfelismerés és beszédszintézis Beszédjelek lineáris predikciója Takács György 4. előadás
Beszédfelismerés és beszédszintézis Spektrális módszerek a beszédfeldolgozásban Takács György 3. előadás Beszedfelism és szint
T.Gy. Beszedfelism es szint Beszédfelismerés és beszédszintézis Beszédjelek lineáris predikciója PARCOR módszerrel és a beszédképzés akusztikus.
Vámossy Zoltán 2006 Gonzales-Woods, SzTE (Kató Zoltán) anyagok alapján
III. előadás.
A fluidumok sebessége és árama Készítette: Varga István VEGYÉSZETI-ÉLELMISZERIPARI KÖZÉPISKOLA CSÓKA
KÖZMŰ INFORMATIKA NUMERIKUS MÓDSZEREK I.
Lineáris egyenletrendszerek megoldása
Lineáris algebra.
Lineáris egyenletrendszer megoldása MS Excel Solver segítségével
Kvantitatív Módszerek
Minőségtechnikák I. (Megbízhatóság)
Idősor elemzés Idősor : időben ekvidisztáns elemekből álló sorozat
Felszín alatti vizek védelme Vízmozgás analitikus megoldásai.
Makai M.: Transzport51 A koordinátázás kérdése Ha a világban meg kell adni egy helyet: fizikai koordináták (x,y,z) (origó és egység) postai címzés pl.
Jegyzet Készítette: Nikli Károly 2013
T.Gy. Beszedfelism es szint
Lineáris algebra.
Az alapvető kommunikáció
Kommunikációs Rendszerek
Szabályozási Rendszerek 2014/2015 őszi szemeszter Előadás Automatizálási tanszék.
Műveletek, függvények és tulajdonságaik Mátrix struktúrák:
Akusztikai mérések Sztahó Dávid
Készült a HEFOP P /1.0 projekt keretében
A mozgás egy E irányú egyenletesen gyorsuló mozgás és a B-re merőleges síkban lezajló ciklois mozgás szuperpoziciója. Ennek igazolására először a nagyobb.
Hibaszámítás Gräff József 2014 MechatrSzim.
előadás: Hangtani alapfogalmak Augusztinovicz Fülöp
Mechanikai hullámok.
Modellek a számítógép megismeréshez Takács Béla
A villamos és a mágneses tér kapcsolata
Hő- és Áramlástan I. Dr. Író Béla SZE-MTK Mechatronika és Gépszerkezettan Tanszék Ideális kontinuumok kinematikája.
A hagyományos és a hagyományos médiumoktól különböző, informatikai eszközöket alkalmazó lehetőségek, azok felhasználása. Czékmány Ilona.
Szimuláció. Mi a szimuláció? A szimuláció a legáltalánosabb értelemben a megismerés egyik fajtája A megismerés a tudás megszerzése vagy annak folyamata.
Beszédfelismerés és beszédszintézis Beszédjelek lineáris predikciója, PARCOR módszer, akusztikus csőmodell Takács György 4. előadás Beszedfelism.
Beszédfelismerés és beszédszintézis
Áramlástani alapok évfolyam
Beszédfelismerés és beszédszintézis Beszédfelismerés alapjai, izolált szavas kötöttszótárú felismerők Takács György 13. előadás Beszedf
Lineáris egyenletrendszerek megoldása Gauss elimináció, Cramer-szabály Dr. Kovács Sándor DE GVK Gazdaságelemzési és Statiszikai Tanszék.
III. előadás.
Segédlet a Kommunikáció-akusztika tanulásához VIHIAV 035
Készletek – Állandó felhasználási mennyiség (folyamatos)
Hangtani alapfogalmak
Előadás másolata:

Internetes médiakommunkáció TGY 1. előadás intmedkom02_09 1 Internetes médiakommunikáció Beszédfeldolgozás február 25. Takács György

Internetes médiakommunkáció TGY 1. előadás intmedkom02_09 2 Alapfogalmak Internetes médiakommunikáció = Szöveg, állókép, hang, beszéd, (strukturált) adat továbbítása Internet Protokoll alapú hálózatokon a megkívánt minőséggel, adatbiztonsággal, interaktivitással, megbízhatósággal.

Internetes médiakommunkáció TGY 1. előadás intmedkom02_09 3 Nyelv és beszéd A nyelv az emberi kommunikáció és az emberi gondolkodás legfőbb eszköze A kommunikáció a társadalmi élet és a munkamegosztás alapvető feltétele A nyelv egy jelrendszer, amelynek elemeihez egy nyelvközösségen belül ugyanaz a jelenség tartozik A beszéd a nyelv elsődleges megnyilvánulása A beszéd útján közvetíthető információ sebessége 15…20 bit/s értéket érhet el. (Webster, J.C.: Information in simple multidimensional speech messages. J.A. S. A. Vol. 33. pp )

Internetes médiakommunkáció TGY 1. előadás intmedkom02_09 4 Miért különleges információhordozó a beszéd? Sötétben is mindent kifejez… Álmunkban is megértjük….. Kb. 20dB szinttel halkabban elég a nevünket hallani az ébredéshez, mint egyéb szöveget…… Az ember információ befogadó sebessége kb. 50 bit/másodperc!!!!!!!!!! Ebből kb. 2/3 rész a hallás!!!!!!!!!!!! Óriási redundanciája van … a kabaré artikulálatlan hadarását is megértjük, de csak az anyanyelv és a háttérismeretek birtokosai!!!!!!!!!!! A nyelv (beszéd) segítségével szinte minden kifejezhető.

Internetes médiakommunkáció TGY 1. előadás intmedkom02_09 5 Néhány beszédminta elmélkedésre Nehezen érthető beszéd Jól érthető beszéd, pedig énekelt…..

Internetes médiakommunkáció TGY 1. előadás intmedkom02_09 6 Beszédhang A legkisebb olyan egységek, amelyek sorozatával egy nyelvet megvalósító beszéd akármilyen részlete az agy számára reprodukálható, beszédhangnak nevezzük. A beszédhangok a beszéd olyan szegmensei, részletei, amelyeket a nyelvet beszélő egymástól elkülöníteni és felismerni teljes biztonsággal képes. A beszédhangok a nyelvre jellemzőek! Egyes nyelvekben a hangmagasság hajlítása is megkülönböztet beszédhangokat. Az élő beszéd olyan leírása, amely a beszéd hangzásának leírására törekszik – a fonetikai átírás. Ennek elterjedt rendszerei az APhI és a SAMPA.

Internetes médiakommunkáció TGY 1. előadás intmedkom02_09 7 A beszédhangok folytonos és diszkrét természete

Internetes médiakommunkáció TGY 1. előadás intmedkom02_09 8 A beszéd szerkezete A beszéd egymástól megkülönböztethető elemek szervezett időbeni egymásutánisága – soros szerkezet. Elem lehet egy összefüggő mondanivaló, egy hosszabb szünetekkel elhatárolt beszédrész, egy mondat, egy szó, egy beszédhang. Egy ötven beszédhangból álló nyelvben (leszámítva, hogy nem minden hang mondható egymás után) kb. egymillió különböző tíz hangból álló szó képezhető. A beszéd szerkezete felülről gyakorlatilag nyitott, alulról zárt.

Internetes médiakommunkáció TGY 1. előadás intmedkom02_09 9

10

Internetes médiakommunkáció TGY 1. előadás intmedkom02_09 11

Internetes médiakommunkáció TGY 1. előadás intmedkom02_09 12 válasz Gerjesztések különböző helyeken Időben változó toldalékcső lineáris idővariáns rendszer H g(t)v(t)

Internetes médiakommunkáció TGY 1. előadás intmedkom02_09 13 A beszéd, mint lineáris idővariáns rendszer A beszéd, mint akusztikus jelenség egy rendszer bizonyos gerjesztésekre adott válasza Lineáris idővariáns rendszer gerjesztés g(t) válasz v(t)

Internetes médiakommunkáció TGY 1. előadás intmedkom02_09 14

Internetes médiakommunkáció TGY 1. előadás intmedkom02_09 15

Internetes médiakommunkáció TGY 1. előadás intmedkom02_09 16 Formánsok A magánhangzók közelítően vonalas spektrumának burkolója több helyi maximummal rendelkezik. Egy helyi maximumot és környezetét formánsnak nevezzük. Szokásos jelölésük: F1, F2, F3, … FN

Internetes médiakommunkáció TGY 1. előadás intmedkom02_09 17 Magyar magánhangzók első és második formáns frekvenciái

Internetes médiakommunkáció TGY 1. előadás intmedkom02_09 18

Internetes médiakommunkáció TGY 1. előadás intmedkom02_09 19

Internetes médiakommunkáció TGY 1. előadás intmedkom02_09 20

Internetes médiakommunkáció TGY 1. előadás intmedkom02_09 21

Internetes médiakommunkáció TGY 1. előadás intmedkom02_09 22

Internetes médiakommunkáció TGY 1. előadás intmedkom02_09 23

Internetes médiakommunkáció TGY 1. előadás intmedkom02_09 24 Felpattanó zárhangok jellemzője A rákövetkező magánhangzó formánsfrekvenciái a megelőző felpattanó zárhangra jellemző módon egy kezdő értékből indulnak ki és érik el a magánhangzóra jellemző állandósult értéket. Legjellemzőbb a második formáns frekvencia kezdőértéke, amelyet a nyelvészeti szakirodalom lokusz-nak nevez.

Internetes médiakommunkáció TGY 1. előadás intmedkom02_09 25

Internetes médiakommunkáció TGY 1. előadás intmedkom02_09 26

Internetes médiakommunkáció TGY 1. előadás intmedkom02_09 27 Lineári predikció alapok A beszédjel n-edik mintája becsülhető a megelőző p beszédminta lineáris kombinációjával ahol az α i lineáris predikciós együtthatók hordozzák a jelenségre vonatkozó előismereteket, tapasztalatokat. p -- a prediktor fokszáma

Internetes médiakommunkáció TGY 1. előadás intmedkom02_09 28 A predikció pontatlanságát jellemzi az predikciós hiba A predikciós hiba általában mintáról mintára változik! Gyakorlati feladatoknál a predikálandó jelenséget időszakaszokra bontjuk és egy-egy szakaszban úgy határozzuk meg az α i értékeket, hogy a predikciós hiba négyzetösszege minimális legyen.

Internetes médiakommunkáció TGY 1. előadás intmedkom02_09 29 Ez a négyzetes hiba az [n 0, n 1 ] tartományra vonatkozik! A z eredeti jel, predikált jel, hibajel értelmezhető úgy is, mint a predikciós együtthatókkal leírt fizikai rendszerek be- és kimeneti jelei.

Internetes médiakommunkáció TGY 1. előadás intmedkom02_09 30 Ebben a modellben bemenet az eredeti beszédminták sorozata és kimenő jel a predikált beszédminták sorozata.

Internetes médiakommunkáció TGY 1. előadás intmedkom02_09 31 Ebben a modellben bemenet az eredeti beszédminták sorozata és kimenő jel a predikciós hibaminták sorozata.

Internetes médiakommunkáció TGY 1. előadás intmedkom02_09 32 Ebben a modellben bemenet a pedikciós hibaminták sorozata és kimenő jel az eredeti beszédjel-minták sorozata.

Internetes médiakommunkáció TGY 1. előadás intmedkom02_09 33 Ezt az elvet használják a GSM és a VoIP rendszerekben!!

Internetes médiakommunkáció TGY 1. előadás intmedkom02_09 34 Ezt az elvet használják beszédfelismerőkben, beszédszintetizátorokban

Internetes médiakommunkáció TGY 1. előadás intmedkom02_09 35 A predikciós együtthatók kiszámolása a beszédjel mintákból Adva van a beszédminták sorozata s(0), s(1), ……s(N-1), összesen tehát N minta Keressük predikciós egyenletben szereplő α 1, α 2, ….. α p predikciós együtthatók olyan értékét, hogy az E négyzetes predikciós hiba minimális legyen

Internetes médiakommunkáció TGY 1. előadás intmedkom02_09 36 Kovarianciamódszer A predikciótól azt kívánjuk meg, hogy az n 0 =p és n 1 =N-1 határok között legyen jó! Tehát az első p elemet nem kell jól becsülnie!

Internetes médiakommunkáció TGY 1. előadás intmedkom02_09 37 Autokorrelációs módszer A 0≤n≤N-1 indextartományon kívüli jelemeket zérusnak tételezi fel és a hibát n 0 = - ∞ és n 1 = + ∞ között értelmezi, A megoldandó egyenletrendszer mátrixa szimmetrikus, a főátlóval párhuzamos átlókban azonos elemet tartalmaz, Az egyenletrendszer felírásához is csak p+1 darab együtthatót kell meghatározni

Internetes médiakommunkáció TGY 1. előadás intmedkom02_09 38 A PARCOR eljárás

Internetes médiakommunkáció TGY 1. előadás intmedkom02_09 39

Internetes médiakommunkáció TGY 1. előadás intmedkom02_09 40 A minimalizálandó visszairányú hiba: Összevetve az előre irányú hiba egyenleteivel látható, hogy

Internetes médiakommunkáció TGY 1. előadás intmedkom02_09 41 Az előre irányú predikciónál használt összefüggés

Internetes médiakommunkáció TGY 1. előadás intmedkom02_09 42 Saito és Itakura gondolata volt bevezetni az előre és visszairányú hibára együttesen jellemző Wp értéket

Internetes médiakommunkáció TGY 1. előadás intmedkom02_09 43 Az egyenleteket rendezgetve egy rekurzív formula nyerhető: Bevezetve az új k változót Tehát nem nagy mátrix-egyenleteket kell megoldani, hanem α értékei rekurzív formulával számolhatók!

Internetes médiakommunkáció TGY 1. előadás intmedkom02_09 44

Internetes médiakommunkáció TGY 1. előadás intmedkom02_09 45 Először kiszámoljuk k 1 -et minden n-re Majd e 1 (n) és f 1 (n) értékeit minden n-re és ez hasonlóan tovább ismételhető Fontos!!! | k i |≤1

Internetes médiakommunkáció TGY 1. előadás intmedkom02_09 46 A beszédkeltés akusztikus csőmodellje Közelítő feltevések: –A toldalékcsőben a hullámok csak tengelyirányban terjednek (a keresztmetszeti méretek a hullámhosszhoz képest kicsik), –A hanghullám visszaverődése a csőfalról veszteségmentes, –A toldalékcső csatolásmentes, –A csőfalak merevek.

Internetes médiakommunkáció TGY 1. előadás intmedkom02_09 47 (a) The vocal tract, modeled as a single one-dimensional acoustic tube of varying cross-sectional area and (b) an eight tube model suitable for discretization

Internetes médiakommunkáció TGY 1. előadás intmedkom02_09 48 Állóhullámú minták egy egyenes csőben: félhullámú rezonátorok A cső zárt mindkét végén A cső nyitott mindkét végén

Internetes médiakommunkáció TGY 1. előadás intmedkom02_09 49 Állóhullámú minták egy egyenes csőben: negyedhullámú rezonátorok A cső zárt a bal végén és nyitott a jobb végén

Internetes médiakommunkáció TGY 1. előadás intmedkom02_09 50 A közelítő feltételek után a csőben terjedő hanghullámokat leíró egyenletek: Ahol: p – hangnyomás, u -- térfogatsebesség ρ – a levegő sűrűsége c – a levegőben terjedő hang sebessége

Internetes médiakommunkáció TGY 1. előadás intmedkom02_09 51

Internetes médiakommunkáció TGY 1. előadás intmedkom02_09 52 További egyszerűsítés a megoldhatóság érdekében: A(x,t)=A 0 Emlékezzünk a sodrott érpárakat leíró egyenletek alakjára

Internetes médiakommunkáció TGY 1. előadás intmedkom02_09 53 Egy keresztmetszetváltás és a csatlakozó csőszakaszok viszonyai

Internetes médiakommunkáció TGY 1. előadás intmedkom02_09 54 Egy állandó keresztmetszetű szakaszon a haladó hullámok csak késleltetést szenvednek, ezért A keresztmetszetváltásnál felírható a folytonossági egyenlet Bevezetve a reflexiós tényezőt:

Internetes médiakommunkáció TGY 1. előadás intmedkom02_09 55 Egy keresztmetszetváltás és a hozzá kapcsolódó szakaszok térfogatsebesség viszonyai folyamatábrában

Internetes médiakommunkáció TGY 1. előadás intmedkom02_09 56 Térfogatsebesség viszonyok a cső végén

Internetes médiakommunkáció TGY 1. előadás intmedkom02_09 57 Térfogatsebesség viszonyok a cső elején

Internetes médiakommunkáció TGY 1. előadás intmedkom02_09 58 A toldalékcső modellje egyenletesen felosztott, állandó keresztmetszetű csőszakaszokkal

Internetes médiakommunkáció TGY 1. előadás intmedkom02_09 59 Belátható, hogy az alábbi rács struktúrák ekvivalensek… Ezért a csőmodell azonos a PARCOR szintézis modellel, ha r i = ─ k i