Az előadás letöltése folymat van. Kérjük, várjon

Az előadás letöltése folymat van. Kérjük, várjon

Bemutatkozik a Világhalló Aki még nem hallott mesterségesen generált beszédet azt kérdezi, hogy: Miben különbözik a Világhalló és a beszédszintetizátor?

Hasonló előadás


Az előadások a következő témára: "Bemutatkozik a Világhalló Aki még nem hallott mesterségesen generált beszédet azt kérdezi, hogy: Miben különbözik a Világhalló és a beszédszintetizátor?"— Előadás másolata:

1 Bemutatkozik a Világhalló Aki még nem hallott mesterségesen generált beszédet azt kérdezi, hogy: Miben különbözik a Világhalló és a beszédszintetizátor? Hasonlat: A beszédszintetizátor a motor, a Világhalló a karosszéria. Aki már hallott beszédszintetizátort beszélni azt kérdezi, hogy: Miben különbözik a Világhalló és egy képernyőolvasó? Hasonlat: A képernyőolvasás az otthon főzés, a Világhalló az étteremben evés.

2 A Világhalló bemutatkozik annak, aki még nem hallott mesterségesen generált beszédet A beszédszintetizátor motor nem a kliens gépében működik, hanem központi hangszerveren, és a szövegeket kombinált szöveg- és hangfolyamként juttatja el a hallgatóhoz (mint egy „szövegrádió”) egy speciális, erre a célra kifejlesztett hang-szöveg szinkronprotokoll (wow) segítségével. Ez biztosítja, hogy a szövegben navigálni, lapozni lehessen..

3 A Világhalló architektúrája

4 Motor cseréjét, pl., fejlettebb verzióra (több hangszín, állítható sebesség, jobb beszédminőség) és több motorra, pl. idegen nyelvűre A számítógépes nyelvi elemzés új eredményeinek felhasználását A felolvasás szempontjából informatív, strukturális és nyelvi annotációk, (ilyenek pl. a mondat, bekezdés, versszak, fejezet, stb. jelölések vagy az – akár ragozott - idegenszó illetve név helyes kiejtése). Ez tesz lehetővé a nyelvtanilag helyes, központi kivételszókezelést. Pl. V. Hugoval A felolvasásra legalkalmasabb formátumra hozza függetlenül attól, hogy milyen formátumban érhetők el (HTML, ZIPHTML, TXT, ZIPTXT, MSWORD, RTF, XML, SGML) Egy egységes közeget, vizuális információk nélkül is kezelhető felhasználói felületet biztosít. Ez a felület személyre szabható. A felhasználói beállítások közül az egyik legfontosabb a „KÖNYVJELZŐ” funkció. A felhasználói beállítások megmaradnak, míg a folytonosan fejlődő alkalmazás minden bejelentkezésnél frissül (Webstart). INTEGRÁLT SZOLGÁLTATÁS A szolgáltató végzi

5 A Világhalló rendszer komponensei VH SZERVER KLIENS PROFIVOXNYELVI ELEMZŐ

6 A VilágHalló kliens A kliens program fő feladata könyvek ill. hosszabb szövegek felolvasása. Kétféle módon használható 1. Indítható a program egy web oldalon elhelyezett link segítségével, mely a VilágHalló szerver által már feldolgozott könyvre való hivatkozást tartalmaz. Ekkor a VilágHalló kliens automatikusan elindul a felhasználó számítógépén és elkezdi felolvasni a linkben hivatkozott szöveget. 2. Elindítható a kliens számítógépen. Ekkor a felhasználói felület keres ő és tallózó funkcióival választható ki a felolvasni kívánt könyv, ill. ennek valamely részlete, vagy folytatható a felolvasás a felhasználó által korábban letett könyvjelzők valamelyikétől. Verziók követésére a Java WebStart alkalmazás-menedzser rendszert használja A VilágHalló kliens felhasználói felülete konfigurálható a felhasználók igényeinek megfelelően. A konfigurálással a megjelenés (színek, betűméret, stb.), a felolvasás módja (részletesség, sebesség, szintetizátor) és a vezérlés (billentyűkombinációk) állítható be

7 A VilágHalló szerver Komponesek Web szerver Apache, Tomcat web és alkalmazás szerverek gondoskodnak a VilágHalló szerver oldali komponenseinek futtatásáról és weben keresztüli elérhetőségéről. ContentServlet A kliens programokat kiszolgáló egység. A felhasználók nyilvántartását, beléptetését, a könyvjelzők kezelését, a könyvek adatbázisában való keresést végzi és közvetít a hangszerver és a kliens között. JNLPServlet A kliens alkalmazás letöltését és frissítését végzi, valamint a gondoskodik az alkalmazásnak a hívási paraméterekkel történő indításáról. TTS szerver Egyszerű TCP protokollon keresztül teszi elérhetővé a MS Speech API-n keresztül illesztett text-to-speech motort a ContentServlet számára

8 Nyelvi Elemző A felolvasható szövegek gyűjteménye A VilágHalló rendszernek „saját gyűjteménye” van a felolvasható szövegekből. Az ide bekerülő szövegeket, könyveket egy előkészítő program dolgozza fel. Ez az előkészítés teszi lehetővé a felhasználók számára a könyvek keresését és a szövegben való navigálást, valamint az értelmezett felolvasást. Előkészítő rendszer A könyv meta-adatainak és a szöveg forrásának a megadása és tárolása: A könyvet leíró XML állomány megadásával vagy az adatok közvetlen bevitelével. Ez biztosítja a felhasználók számára a keresés lehetőségét. A különböző típusú szövegek azonos alakra való konvertálása. (A szövegek lehetnek TXT, HTML, tömörített (zip-elt) TXT vagy HTML és XML formátumúak.) A szövegek strukturális feldolgozása Könyvek esetében ez a nyitólap, tartalom, fejezetek, stb. felismerését és a szerkezet adatbázisban való rögzítését jelenti. Ez teszi lehetővé a könyv szerkezeti elemein való navigálást. A szövegek nyelvtani feldolgozása Ez szótövelést, szófelismerést és mondatokra bontást jelent. Ez teszi lehetővé a szintetizátor meghajtását értelmes szintaktikus egységekkel, mely alapfeltétele a helyes intonációnak, a kivételszavak felismerését és helyes kiejtésük megállapítását, valamint a mondat-szintű navigálást a felolvasott szövegben.


Letölteni ppt "Bemutatkozik a Világhalló Aki még nem hallott mesterségesen generált beszédet azt kérdezi, hogy: Miben különbözik a Világhalló és a beszédszintetizátor?"

Hasonló előadás


Google Hirdetések