Bemutatkozik a Világhalló Aki még nem hallott mesterségesen generált beszédet azt kérdezi, hogy: Miben különbözik a Világhalló és a beszédszintetizátor? Hasonlat: A beszédszintetizátor a motor, a Világhalló a karosszéria. Aki már hallott beszédszintetizátort beszélni azt kérdezi, hogy: Miben különbözik a Világhalló és egy képernyőolvasó? Hasonlat: A képernyőolvasás az otthon főzés, a Világhalló az étteremben evés.
A Világhalló bemutatkozik annak aki még nem hallott mesterségesen generált beszédet Az elérhető szövegeket kombinált szöveg- és hangfolyamként juttatja el a hallgatóhoz (mint egy „szövegrádió”) egy speciális, erre a célra kifejlesztett hang-szöveg szinkronprotokoll (wow) segítségével. Ez biztosítja, hogy a szövegben navigálni, lapozni lehessen. Ez a megoldás szerzői jogi szempontból is előnyös, a szöveg nem jelenik meg önállóan.
A Világhalló bemutatkozik Annak aki már hallott beszédszintetizátort A VILÁGHALLÓ egy központilag menedzselt integrált online szolgáltatás A szoftver-komponensek és az internetes szövegállomány változásainak követését és a rendszerbe építését a szolgáltató végzi: A beszédgeneráló motor fejlettebb verzióra cserélése (pl. több hangszín, állítható sebesség), az újabb motorok (pl. idegen nyelvű) beépítése, Az elektronikus formában elérhetővé vált szövegek, szövegábrázolási standardok (pl. XML, TEI) használata, A számítógépes nyelvi elemzés új eredményeinek felhasználása. A tárolt szövegek a felolvasásra legalkalmasabb formátumra hozatala, függetlenül attól, hogy milyen formátumban érhetők el (HTML, ZIPHTML, TXT, ZIPTXT, MSWORD, RTF, XML, SGML) A felolvasás szempontjából informatív, strukturális és nyelvi annotációk (ilyenek pl. a mondat, bekezdés, versszak, fejezet, stb. jelölések vagy az – akár ragozott - idegenszó illetve név helyes kiejtése). Egy egységes közeget és vizuális információk nélkül is kezelhető felhasználói felületet biztosít. Ez a felület személyre szabható, beállítható a legkedvezőbb megjelenés és a billentyűk, amikkel kezelni lehet. A felhasználói beállítások megmaradnak, míg a folytonosan fejlődő alkalmazás minden bejelentkezésnél frissül (Webstart). A felhasználói beállítások közül az egyik legfontosabb a „KÖNYVJELZŐ” funkció, mely lehetőséget biztosít arra, hogy ott folytassuk a könyvet ahol abbahagytuk. (Egy átlagos méretű könyv felolvasása 12 órát venne igénybe.)
A Világhalló architektúrája
A Világhalló rendszer komponensei VH SZERVER KLIENS PROFIVOXNYELVI ELEMZŐ
A VilágHalló kliens A kliens program fő feladata könyvek ill. hosszabb szövegek felolvasása. Kétféle módon használható 1.) Indítható a program egy web oldalon elhelyezett link segítségével, mely a VilágHalló szerver által már feldolgozott könyvre való hivatkozást tartalmaz. Ekkor a VilágHalló kliens automatikusan elindul a felhasználó számítógépén és elkezdi felolvasni a linkben hivatkozott szöveget. 2.)Elindítható a kliens számítógépen. Ekkor a felhasználói felület keres ő és tallózó funkcióival választható ki a felolvasni kívánt könyv, ill. ennek valamely részlete, vagy folytatható a felolvasás a felhasználó által korábban letett könyvjelzők valamelyikétől. Verziók követésére a Java WebStart alkalmazás-menedzser rendszert használja A VilágHalló kliens felhasználói felülete konfigurálható a felhasználók igényeinek megfelelően. A konfigurálással a megjelenés (színek, betűméret, stb.), a felolvasás módja (részletesség, sebesség, szintetizátor) és a vezérlés (billentyűkombinációk) állítható be
A VilágHalló szerver Komponesek Web szerver Apache, Tomcat web és alkalmazás szerverek gondoskodnak a VilágHalló szerver oldali komponenseinek futtatásáról és weben keresztüli elérhetőségéről. ContentServlet A kliens programokat kiszolgáló egység. A felhasználók nyilvántartását, beléptetését, a könyvjelzők kezelését, a könyvek adatbázisában való keresést végzi és közvetít a hangszerver és a kliens között. JNLPServlet A kliens alkalmazás letöltését és frissítését végzi, valamint a gondoskodik az alkalmazásnak a hívási paraméterekkel történő indításáról. TTS szerver Egyszerű TCP protokollon keresztül teszi elérhetővé a MS Speech API-n keresztül plug-in-elt text-to-speech motort a ContentServlet számára
Nyelvi Elemző A felolvasható szövegek gyűjteménye A VilágHalló rendszernek „saját gyűjteménye” van a felolvasható szövegekből. Az ide bekerülő szövegeket, könyveket egy előkészítő program dolgozza fel. Ez az előkészítés teszi lehetővé a felhasználók számára a könyvek keresését és a szövegben való navigálást valamint az értelmezett felolvasást. Előkészítő rendszer A könyv meta-adatainak és a szöveg forrásának a megadása és tárolása: A könyvet leíró XML állomány megadásával vagy az adatok közvetlen bevitelével. Ez biztosítja a felhasználók számára a keresés lehetőségét. A különböző típusú szövegek azonos alakra való konvertálása. (A szövegek lehetnek TXT, HTML, tömörített (zip-elt) TXT vagy HTML és XML formátumúak.) A szövegek strukturális feldolgozása Könyvek esetében ez a nyitólap, tartalom, fejezetek, stb. felismerését és a szerkezet adatbázisban való rögzítését jelenti. Ez teszi lehetővé a könyv szerkezeti elemein való navigálást. A szövegek nyelvtani feldolgozása Ez szótövelést, szófelismerést és mondatokra bontást jelent. Ez teszi lehetővé a szintetizátor meghajtását értelmes szintaktikus egységekkel, mely alapfeltétele a helyes intonációnak, a kivételszavak felismerését és helyes kiejtésük megállapítását, valamint a mondat-szintű navigálást a felolvasott szövegben.