Korpusz-alapú szövegfelolvasó rendszer fejlesztése

Slides:



Advertisements
Hasonló előadás
SZAKDOLGOZAT a tudományos munka iskolája
Advertisements

Dr. Tomor Tamás Projektvezető augusztus
1/13 Péter Tamás, Bécsi Tamás, Aradi Szilárd INNOVÁCIÓ ÉS FENNTARTHATÓ FELSZÍNI KÖZLEKEDÉS KONFERENCIA Budapest, szeptember 3-5. Útmenti objektumok.
Takács György 15. előadás Készítette Feldhoffer Gergely
Tevékenység alapú költségszámítás
A hallgató neve A szak megnevezése Konzulens tanár: XY 2010.
Kétszintű érettségi vizsga Magyar nyelv és irodalom Miről? Hogyan? §?! Tájékoztassuk diákjainkat!
Árnyékoló fóliák összehasonlító mérése
Csatlakozás BRAIN rádiós hozzáférési rendszerhez mozgó ad-hoc hálózaton keresztül Konzulensek: Vajda Lóránt Török Attila Simon Csaba Távközlési és Telematikai.
Élelmiszer profilanalízis bíráló paneljének minősítése
A beszéd.
Foltkeresés tüdő röntgen képeken
Önálló Laboratórium II. Készítette: Varga Róbert
1 BME TTT E-levél felolvasó esettanulmány Beszédinformációs rendszerek előadás Németh Géza, Zainkó Csaba [nemeth, Beszédkutatási laboratórium.
tételsor 2. tétel A kistérség a korábbi együttműködési lehetőségek alapján megtartotta a soron következő ülését. Az ülés célja a logisztikai.
Szintaktikai elemzés február 23..
kötelező program, SZÁMONKÉRÉSEK
Emberierőforrás-ellátás
Tájékozódás az interneten az agyvérzés témakörében
T.Gy. Beszedfelism es szint Beszédfelismerés és beszédszintézis Beszédszintézis alapok Takács György 11. előadás
Beszéd alapfrekvencia meghatározása - Pitch detektor algoritmusok - Pázmány Péter Katolikus Egyetem, Információs Technológia Kar Beszédfelismerés és szintézis.
Önálló laboratórium II május 23.1 Mobiltelefonon futtatható program készítése Hegedűs Iván Mihály Pázmány Péter Katolikus Egyetem Információs.
Ferenci László És Viniczai Zsófia Előadásában.  A vizsgázónak tisztában kell lennie az adatbázis-kezeléssel kapcsolatos legfontosabb fogalmakkal, és.
Szervezetfejlesztési Program ÁROP November 12. Teljesítménymenedzsment fejlesztési módszertan Előadó: Tóth Dorottya.
Dr. habil. Benczik Vilmos főiskolai tanár, ELTE TÓK
A „Könyvtári minőségfejlesztés – könyvtári korszerűsítés 2.” pályázat Javaslat a feladatok végrehajtásához.
Korpuszok a nyelvészeti kutatásban: Bevezetés, követelmények ismertetése Vincze Veronika Korpuszok a nyelvészeti kutatásban – 2013.
Kiválasztás: érvényesség, megbízhatóság az interjú és az Assesment Center módszere esetén Barta Bea
Zöngétlenedés: beszélőfüggő paraméter? Gráczi Tekla Etelka, MTA Nyelvtudományi Intézet II. Alkalmazott Nyelvészeti Doktorandusz Konferencia, Budapest,
1 Természetes nyelvű interfész adatbázisok lekérdezéséhez Vajda Péter NYTI, Korpusznyelvészeti osztály – BME, TTT.
HATÉKONY SAJÁTSÁGKIEMELŐK KÉPEK ÖSSZEHASONLÍTÁSÁHOZ MobileAssistant workshop, május 4. Főnix Inkubátorház, 4029 Debrecen, Csapó u. 42. A ép III/2.
Fejmozgás alapú gesztusok felismerése Bertók Kornél, Fazekas Attila Debreceni Egyetem, Informatikai Kar Debreceni Képfeldolgozó Csoport KÉPAF 2013, Bakonybél.
Fejmozgás alapú gesztusok felismerése Bertók Kornél, Fazekas Attila Debreceni Egyetem, Informatikai Kar Debreceni Képfeldolgozó Csoport KÉPAF 2013, Bakonybél.
Méréstechnika és Információs Rendszerek Tanszék
Közlekedésmodellezés Készítette: Láng Péter Konzulens: Mészáros Tamás.
Készítette: Terdik Sándor PTM IV. Ismeretszerzés természetes nyelvű dokumentumokból.
Önálló labor munka Csillag Kristóf 2005/2006. őszi félév Téma: „Argument Mapping (és hasonló) technológiákon alapuló döntéstámogató rendszerek vizsgálata”
Csoportindítás Az első csoportülés megtervezése 0. szakasz - Felkészülés cél meghatározása módszer kiválasztása keretek meghatározása a környezettel való.
Numerikus módszerek az elektromágneses térszámításban Dr
Handover vizsgálata WLAN hálózatokban Kersch Péter Konzulensek: zVajda Lóránt zTörök Attila.
Valós idejű adaptív útvonalkeresés
Anytime algoritmusok az információ-átvitelben Írta Benedecsik Csaba Konzulens Dr. Várkonyiné Kóczy Annamária.
Dokumentumkészítés Emelt szint: 60 perc 30 pont.
Általában a kétszintű informatika érettségiről. Források, ahol utána nézhetünk részletesebben:
SZIMULÁCIÓ A BIZTONSÁGÉRT
Nicsak, ki beszél – már a számítógépek is... Szita István Eötvös Collegium.
Mikroszintű versenyk é pess é g. Az üzleti szervezetek versenyképességének elemzése, a versenyképesség növelése Egy, a magyar közgazdászok által 1995-ben.
Audio Utastájékoztató Rendszer vasútállomások részére
Beszed Beszédfelismerés és beszédszintézis Beszédszintézis alapok Takács György
Beszédinformációs rendszerek Szegmentális és szupraszegmentális elemek a beszédtechnológiában.
Beszédinformációs rendszerek 6. gyakorlat Beszédszintetizátorok és adatbázisaik Olaszy Gábor 2015 tavasz.
1/19 Hogyan tájékozódnak a robotok? Koczka Levente Eötvös Collegium.
A hőmérséklet ivararányt befolyásoló hatása csapó sügéren (Perca fluviatilis) Balikó Tímea¹, Demeter Krisztián¹, ² Merth János¹, Marton Csaba¹, Bene Szabolcs¹.
A LISTENING SPAN TESZT A RÖVID TÁVÚ VERBÁLIS SZERIÁLIS MEMÓRIA VIZSGÁLATA.
A helyváltoztatási láncok választási valószínűségét számító módszer kidolgozása Csonka Bálint, Dr. Csiszár Csaba IFFK, Budapest augusztus
SZÖM II. Fejlesztési szint folyamata 5.1. előadás
Vállalatirányítási rendszerek bevezetése és tapasztalatai a KKV szektorban Oldal Zoltán vállalati tanácsadó Gy-M-S Kereskedelmi és Iparkamara KKV vezetők.
„Adatbázis építés, adatállományok felhasználása, frissítése, targetálás; egy sikeres DM esettanulmány bemutatása” Vörös Gergely online média értékesítési.
A hallgató neve A szak megnevezése Konzulens tanár: XY ÉV
Kovács Gergely Péter Bevezetés
Vincze Veronika Korpuszok a nyelvészeti kutatásban: Bevezetés, követelmények ismertetése Vincze Veronika
HELYZETFELMÉRŐ SZINT FOLYAMATA 2. Önértékelési fázis 9. előadás
SZAKKÉPZÉSI ÖNÉRTÉKELÉSI MODELL ÖNÉRTÉKELÉSI SZINTEK
A MORPHOLOGIC - BME EGYÜTTMŰKÖDÉSEK
SZÖM II. Fejlesztési szint folyamata 3
MICS-MÉCS-PÉR (vitaindító)
SZÁMVÁLTOZÁS BEMONDÓ AUTOMATA
Címdia mindig azonos betűméretben, és stílusban!
Címdia mindig azonos betűméretben, és stílusban!
Címdia mindig azonos betűméretben, és stílusban!
Előadás másolata:

Korpusz-alapú szövegfelolvasó rendszer fejlesztése Pesti Péter Konzulensek: Dr. Németh Géza, Dr. Olaszy Gábor és Bőhm Tamás BME, Távközlési és Médiainformatikai Tanszék, Beszédkutatási Laboratórium

Bevezetés Korpusz-alapú szövegfelolvasó hullámforma-összefűzéses kevés összefűzési pont nagyobb elemméret elemkiválasztás nagy beszédadatbázisból Beszédkutatási Laboratórium munkatársainak közreműködésével kiindulás: Nagy András diplomaterve

A feladat a korpusz-alapú szintézis minőségét befolyásoló tényezők irodalmának áttekintése a teljes felvett hangadatbázist használó, elfogadható futási idejű demonstrációs rendszer kialakítása jó minőségű összefűzési algoritmus kialakítása a rendszer minőségének értékelése percepciós tesztekkel

Beszédszintetizátor rendszer architektúrája

Szerver jellemző számai nagy beszédkorpusz 10 órányi felvétel 5302 mondat 3,57 Gb (hangfájlok + címkézés) szerver indítás: 5-10 perc szintézis sebessége lejátszási idő 0,56-szorosa (WAP-os időjárás-jelentéseken) szintézis reakcióideje 1,9 sec (WAP-os időjárás-jelentéseken)

A beszédszintézis folyamata Elemkiválasztás több szinten: szó és fonéma szintetizálandó elemek meghatározása jelöltek gyűjtése a beszédkorpuszból Viterbi-algoritmus a legjobb jelölt-sorozat megtalálásához összefűzési költség célegyezési költség

Összefűzési költség két elem összefűzésének a költsége két egymással határos elem között 0 azonos forrásból (hangfájlból) származó elemek preferálása alapfrekvencia-ugrás büntetése (pl. ma napos) átmenet-vágási költségmátrix

Célegyezési költség egy elemnek a szintetizálandó céltól való eltérése fonéma-környezet egyezése  fonéma-helyettesítési költségmátrix prozódiai jellemzők szónak a prozódiai egységen belüli pozíciója prozódiai egység mondaton belüli pozíciója külön büntetés mondatzáró szónál

Utófeldolgozás vágás az összefűzési pontokon intenzitás-módosítás mássalhangzó-hasonulások szóhatáron (pl. „vad tornádó”) intenzitás-módosítás alapfrekvencia- és időtartam-módosítás PSOLA (Pitch-Synchronous Overlap and Add) pl. mondatzáró szónál

beírt mondat szintézise összefűzési költség célegyezési költség minden elem minden jelöltjére fonetikai, prozódiai, alapfrekvencia, stb. információ

Időjárás szövegadatbázis előállítása alapprobléma: meteorológiai tematikájú szövegkorpusz nem elérhető megoldás: Internetes portálok időjárás-jelentéseinek automatizált feldolgozása származási helyenként eltérő felépítésű oldalak  tartalom forrása portálonként külön kezelendő HTML fájlokból részdokumentum kinyerése relációs adatbázisba (MySQL) adatbázisban további tisztítási lépések

Meghallgatásos tesztek A fejlesztési irányt kijelölő 51 mondatos teszt Egyetlen prozódiai egységből álló mondatokkal 280 mondat Szintézis módszerek összehasonlítása természetes, korpuszos, triádos, formáns 248 résztvevő Fejlődési teszt 25 „rossz” mondat, 87 résztvevő preferencia: 76,20% WAP-os időjárás-jelentésekkel 539 mondat osztályzat mondatok száma

Reakció a bírálatra időjárások korlátozott témakörének ismertetése a bevezető előtti összefoglalóban tesztelés egyetlen prozódiai egységből álló mondatokkal a korábbi teszt alapján „nehéz” mondatok mondatok válogatása: a korpuszban biztosan ne szerepeljenek  fél éves periódusból szintézis módszerek összehasonlítása 248 fő teszteredményei alapján kiváló/jó/közepes/gyenge/rossz sok minőségi szintű felvétel  kritikusabb hallgatók

Továbblépési irányok Más témakörök További címkézési jellemzők hangsúlyosság hosszan ejtett hang Nagyobb elemméret szótag-szint  fonémákból építkezés kiváltható

Kérdések