Előadást letölteni
Az előadás letöltése folymat van. Kérjük, várjon
KiadtaEde Mészáros Megváltozta több, mint 9 éve
1
Beszédinformációs rendszerek 6. gyakorlat Beszédszintetizátorok és adatbázisaik Olaszy Gábor olaszy@tmit.bme.hu 2015 tavasz
2
1. példa Egy formáns szintetizátor tervezéséhez kell az alapvető adatokra javaslatot tennie. a) Adja meg, hogy milyen vezérlő paraméterekkel működjön. b) Adja meg a javasolt paraméterek érték tartományát. c) Milyen sűrűn kell a vezérlő paramétereket frissíteni a beszédelőállításnál. 2
3
2. példa Diádos elemekből álló beszédelembázist készítünk szövegfelolvasóhoz. a)Adja meg a bab szó diádjait. b)Hol célszerű elvágni a mocsár szóban a zár-rés hangot, hogy a lehető legkevesebb legyen a torzítás a későbbi elemösszefűzésnél? c)A magyar nyelvre kb. hány diádot kell elkészíteni, hogy tetszőleges szöveget lehessen felolvastatni egy beszédszintetizátorral? 3
4
3. példa Diádos és triádos elemekből álló beszédelembázist készítünk hullámforma összefűzéses szövegfelolvasóhoz. a)Adja meg a babáknak szó CVC triádjait. b)Hol célszerű vágást alkalmazni, ha triádos elemeket készítünk? c)A magyar nyelvre optimálisan kb. hány diádot és kiegészítő triádot kell elkészíteni, hogy tetszőleges szöveget lehessen felolvastatni a hullámforma összefűzéses beszédszintetizátorral. 4
5
4. példa A beszédválaszú rendszerekben alkalmazott gépi beszédkeltő módszereket tanultak alapján válaszoljon a következő kérdésekre a)Mely TTS módszereket alkalmazná vakok számára készült képernyő felolvasó rendszerben. Adja meg a működésük lényegét és erőforrás igényüket. b)Példa alkalmazás bemutatása ROBOBRAILLE.org 5
6
5. példa Egy kis vállalat részére tervezzen kötött szótáras név szerinti tudakozó beszédválaszú rendszert (min. MOS 4,3 az elvárás). Az előfizető telefonszámát kell gépi hangon elmondani. - bemenet: 200 vezeték- és keresztnév - kimenet minden névhez a megadott 11 jegyű tagolt mobil telefonszám A cég által megadott női bemondó hangján kell szólnia. a)Tegyen javaslatot az elvégzendő munkafázisokra! b)Tegyen javaslatot az elkészítés időtartamára! c)Milyen vivőmondatokat alkalmazna? d)Milyen mestermondatot javasolna a fejlesztéshez? e)Adja meg, hogy milyen eszköz és szakember igényre lenne szüksége a munka sikeres elvégzéséhez! 6
7
6. példa a)Melyik mai módszerhez hasonló Kempelen Farkas beszédkeltő gépe? b)Mikor és ki adta be a világ első szabadalmát tetszőleges szöveg reprodukálására alkalmas beszélőgépre? Melyik mai módszerre hasonlít? 7
8
7. példa A Népliget autóbusz-pályaudvarra tervezzen magyar nyelvű hangos utastájékoztató rendszert. a)Milyen gépi beszédelőállítási technológiát alkalmazna ebben a rendszerben? b)Mik az előnyei? c)Mik a hátrányai? d)Mi a mestermondat szerepe a rendszer bővítésénél? e)Hány óra beszédet célszerű optimálisan rögzíteni egy ilyen rendszerhez? 8
9
8. példa Egy meglévő városi navigációs rendszert fejlesztenek tovább felhő alapú beszédszintetizátor alkalmazásával Budapest területére. Feladat: Az utcaneveket kell felolvasnia a helyesírással megadott formájú adatbázisból a felhasználó gombnyomásos kérésére a GPS koordináták alapján egy jó minőségű gépi hanggal. A meglévő rendszerből csak 20 percnyi hanganyag áll rendelkezésre, az eredeti bemondó már nem elérhető. A továbbfejlesztett rendszernek azonban hasonló hangúnak kell lennie (promtok) a)Milyen gépi beszédelőállítási technológiát javasolna? b)Adja meg a rendszer elkészítésének lépéseit! c)Adja meg az alkalmazott technológia előnyeit és hátrányait! 9
10
9. példa Egy magyar nyelvű időjárás jelentést felolvasó alkalmazáshoz korpuszos beszédszintetizátor beszédadatbázisát kell elkészítenie. a)Hogyan készítené el az alkalmazás szövegkorpuszát? b)Milyen gépi feldolgozás(oka)t alkalmazna és milyen sorrendben, miután a kiválasztott bemondó felolvasta a téma lefedését biztosító szövegkönyvet? c)Adja meg a beszédadatbázis elkészítési műveletsorának lépéseit. d)Milyen prozódiai modellt használna ebben a rendszerben? 10
Hasonló előadás
© 2024 SlidePlayer.hu Inc.
All rights reserved.