Az előadás letöltése folymat van. Kérjük, várjon

Az előadás letöltése folymat van. Kérjük, várjon

Beszedfelism és szint. 2014.02.18.1 Beszédfelismerés és beszédszintézis Spektrális módszerek a beszédfeldolgozásban Takács György 3. előadás 2014. 02.

Hasonló előadás


Az előadások a következő témára: "Beszedfelism és szint. 2014.02.18.1 Beszédfelismerés és beszédszintézis Spektrális módszerek a beszédfeldolgozásban Takács György 3. előadás 2014. 02."— Előadás másolata:

1 Beszedfelism és szint Beszédfelismerés és beszédszintézis Spektrális módszerek a beszédfeldolgozásban Takács György 3. előadás

2 Beszedfelism és szint Tartalom Ismétlés A beszéd, mint lineáris idővariáns rendszer Fourier-módszerek, spektrális alapfogalmak – mi az, amire léteznek eszközök (periodikus jel, egyszeri folyamat, sztochasztikus folyamat) A gördülő spektrum Kváziperiodikus jel jellemzése Fourier-sorok sorozatával Spektrum-burkoló, formáns Magánhangzók, felpattanó zárhangok jellemzői, lokusz

3 Beszedfelism és szint A természetes beszédlánc

4 Beszedfelism és szint Beszédhang A legkisebb olyan egységek, amelyek sorozatával egy nyelvet megvalósító beszéd akármilyen részlete az agy számára reprodukálható, beszédhangnak nevezzük. A beszédhangok a beszéd olyan szegmensei, részletei, amelyeket a nyelvet beszélő egymástól elkülöníteni és felismerni teljes biztonsággal képes. A beszédhangok a nyelvre jellemzőek! Egyes nyelvekben a hangmagasság hajlítása is megkülönböztet beszédhangokat. Az élő beszéd olyan leírása, amely a beszéd hangzásának leírására törekszik – a fonetikai átírás. Ennek elterjedt rendszerei az APhI és a SAMPA.

5 Beszedfelism és szint A beszédhangok folytonos és diszkrét természete

6 Beszedfelism és szint A beszéd szerkezete A beszéd egymástól megkülönböztethető elemek szervezett időbeni egymásutánisága – soros szerkezet. Elem lehet egy összefüggő mondanivaló, egy hosszabb szünetekkel elhatárolt beszédrész, egy mondat, egy szó, egy beszédhang. Egy ötven beszédhangból álló nyelvben (leszámítva, hogy nem minden hang mondható egymás után) kb. egymillió különböző tíz hangból álló szó képezhető. A beszéd szerkezete felülről gyakorlatilag nyitott, alulról zárt.

7 Beszedfelism és szint A fonéma Egy nyelv fonémakészlete elemek olyan minimális számosságú halmaza, amelyből minden szó jelentéshelyesen, de csak egyféleképpen állítható elő A fonémakészlet elemei a fonémák. Az azonos fonémákat képviselő beszédhangok az allofonok.

8 Beszedfelism és szint

9 9

10 10

11 Beszedfelism és szint

12 Beszedfelism és szint A beszéd, mint lineáris idővariáns rendszer A beszéd, mint akusztikus jelenség egy rendszer bizonyos gerjesztésekre adott válasza Lineáris idővariáns rendszer gerjesztés g(t) válasz v(t)

13 Beszedfelism és szint válasz Gerjesztések különböző helyeken Időben változó toldalékcső lineáris idővariáns rendszer H g(t)v(t)

14 Beszedfelism és szint A gerjesztés és válasz kapcsolatát leíró általános kapcsolat Ha a rendszer lineáris, akkor érvényes rá a szuperpozíció tétele, azaz több gerjesztésre adott válasz az egyes gerjesztésekre adott válaszok összege. Egy lineáris rendszer a magfüggvénnyel leírható, azaz létezik egy olyan magfüggvény, amellyel tetszőleges g(t) gerjesztésre adott v(t) válasz megadható A h magfüggvény lefutása függ attól, hogy a rendszert melyik időpillanatban érte a gerjesztés. A válasz egy adott időpillanatban a gerjesztésnek nemcsak a ugyanabban a pillanatban felvett értékétől függ (a rendszer „emlékezik”).

15 Beszedfelism és szint Lineáris időinvariáns rendszereknél a helyzet egyszerűbb: Ebben az esetben h súlyfüggvény kapcsolatban áll a lineáris rendszer Átviteli karakterisztikájával, azaz: Ahol A v a válasz szinuszjel és A g a gerjesztő szinuszjel amplitúdója

16 Beszedfelism és szint

17 Beszedfelism és szint

18 Beszedfelism és szint

19 Beszedfelism és szint

20 Beszedfelism és szint

21 Beszedfelism és szint

22 Beszedfelism és szint

23 Beszedfelism és szint Beszédjel spektrális jellemzésének nehézségei Kezelhető periodikus függvényeknél a Fourier-sor, Egyszeri folyamatoknál a Fourier-integrál, stacionárius sztochasztikus folyamatoknál a spektrális sűrűség (az autokorrelációs függvény Fourier-transzformáltja A beszédjelnek csak rövid szakaszai sorolható be a fenti függvénytípusok valamelyikébe! Nem tudjuk hogyan csinálja a fül!!!! Bizonyosan végez valamifajta spektrális elemzést Csak véges szakaszok feldolgozása lehetséges gépi úton. A periódusidő meghatározása nehéz.

24 Beszedfelism és szint

25 Beszedfelism és szint

26 Beszedfelism és szint

27 Beszedfelism és szint

28 Beszedfelism és szint A vonalas spektrum burkolója értelmezhető úgy, mint egy folytonos függvény, amelynek értékei megegyeznek a felharmonikus frekvenciákon a vonalas spektrum értékeivel, egyebütt pedig sinx / x típusú interpolációval állítható elő.

29 Beszedfelism és szint Formánsok A magánhangzók vonalas spektrumának burkolója több helyi maximummal rendelkezik. Egy helyi maximumot és környezetét formánsnak nevezzük. Szokásos jelölésük: F1, F2, F3, … FN

30 Beszedfelism és szint Magyar magánhangzók első és második formáns frekvenciái

31 Beszedfelism és szint

32 Beszedfelism és szint

33 Beszedfelism és szint

34 Beszedfelism és szint

35 Beszedfelism és szint

36 Beszedfelism és szint

37 Beszedfelism és szint

38 Beszedfelism és szint Felpattanó zárhangok jellemzője A rákövetkező magánhangzó formánsfrekvenciái a megelőző felpattanó zárhangra jellemző módon egy kezdő értékből indulnak ki és érik el a magánhangzóra jellemző állandósult értéket. Legjellemzőbb a második formáns frekvencia kezdőértéke, amelyet a nyelvészeti szakirodalom lokusz-nak nevez.

39 Beszedfelism és szint

40 Beszedfelism és szint


Letölteni ppt "Beszedfelism és szint. 2014.02.18.1 Beszédfelismerés és beszédszintézis Spektrális módszerek a beszédfeldolgozásban Takács György 3. előadás 2014. 02."

Hasonló előadás


Google Hirdetések