Audio Utastájékoztató Rendszer vasútállomások részére Projekt Labor Audio Utastájékoztató Rendszer vasútállomások részére Németh Ádám, Uracs Tamás Konzulens: Lipovits Ágnes Pannon Egyetem aPIS: audio Passenger Information System = audió utastájékoztató rendszer
Beszédszintézis Az emberi beszéd gép általi reprodukciója. Negyedik generációs számítógép modell egyik eleme (Arthur C. Clarke: 2001 Űrodüsszeia; HAL 9000) Megvalósítása: Text To Speech (TTS) rendszer („beszédmotor”) Normál nyelvi szöveg Beszéd Első működő szintetizátor: 1968, John Larry Kelly, Jr és Louis Gerstman, Bell Labs, IBM 704 4. GENERÁCIÓ: …továbbá pl. a beszédfelismerés vagy a kézírásfelismerés is Technikák Konkatenatív szintézis: előre rögzített beszéd meghatározott egységekre bontása Egység szelekciós szintézis: hangok, szavak, kifejezések, mondatok (természetes) Di-fonéma szintézis: hangok közötti átmenetek (zajos) Tartomány-specifikus szintézis: szavak, kifejezések (korlátozott) Formáns szintézis (szabály alapú szintézis): akusztikai modell alapján képez hullámformát Artikulációs szintézis: emberi beszédszervek és arikulálási folyamat modellen alapul HMM-alapú szintézis (hidden Markov model): frekvencia-skála + hangforrás + hanghossz Szinuszhullám-szintézis: formáns helyettesítése tiszta hangokkal Technikák Konkatenatív szintézis Formáns szintézis Artikulációs szintézis HMM-alapú szintézis Szinuszhullám-szintézis Tartomány-specifikus szintézis szavak, kifejezések a beszéd egységei
Igény Napjainkban elterjedt számos autóbusz pályaudvaron, vasútállomáson a hangos utastájékoztatás. Mai (tartomány-specifikus) utastájékoztató rendszerek igényei Szinkronszínész Szinkronstúdió Vágás-utómunka Hátrányok Hangsúly-beli ugrások Nehézkes bővíthetőség Audio-fájlok nagy tárhelyigénye Az audio Passenger Information System („aPIS”) rendszer igényei Beszédmotor: Advanced Text-To-Speech (ATTS) Előnyök Nincs színész/stúdió költség Nincsenek hangsúly-hibák Gyors és olcsó bővíthetőség Nincs szükség audio-fájlokra (realtime) Ma használatos: Tartomány-specifikus szintézis – a konkatenatív szintézis altípusa: szavak, kifejezések alkotják a beszédet (korlátozott lehetőség) A rendszer célja az utas tájékoztatás megvalósítása kifejezetten vasúti környezetben.
A rendszer felépítése Beszédmotor: SpeakBoard 1.0.0.10, Speech Technology Kft. aPIS szoftver: Megvalósítása Borland Delphi fejlesztő környezetben Webszerver + Adatbázis szerver: Microsoft SQL Server 2005
A rendszer felépítése
Rendszer működése A kliens a helyi hálózaton vagy az interneten keresztül kapcsolódik a központi szerverhez, az pedig az adatbázis-szerverhez. Periodikus adatlekérdezés a szerverről Kliens oldalon csak léptetés, késés és rendkívüli események bemondására van lehetőség Adatbázis módosítása (pl. menetrend változások) adminisztrációs felületről, melyet csak az erre jogosult személy érhet el Szerver – Kliens kapcsolat LAN-on vagy Interneten keresztül (web-service, XML) Működés automata vagy félautomata üzemmódban
UML Használati Eset
Hardver követelmények (kliens oldalon) Minimális hardver 500 MHz processzor, 256 MB RAM, 200 MB szabad lemezterület, CD-ROM meghajtó, VGA monitor, Windows-kompatibilis hangkártya Ajánlott hardver 1,7 GHz processzor, 512 MB RAM, 500 MB szabad lemezterület, CD-ROM meghajtó, VGA monitor, 2 db Windows-kompatibilis hangkártya
Szoftver követelmények aPIS kliens Microsoft Windows XP Professional: a kliens futtatására SpeakBoard 1.0.0.8 vagy újabb alverzió (1.0.0.x) Web-server, adabázis-server Microsoft SQL Server 2005 vagy MSDE: az adatbázis tárolására Internet Information Server (IIS): az adatbázis webes elérésére Adatbázis adminisztráció Internet Explorer 6.0/7.0 vagy Mozilla Firefox 2.x: az adatbázis adminisztrációjára
Részfeladatok 1. Grafikus kezelő felület (GUI) megtervezése Németh Á. 2. Interfész biztosítása a SpeakBoard beszéd-motorral Németh Á. 3. Adatbázis tervezése és feltöltése teszt adatokkal Uracs T. 4. Szerverek konfigurálása az adatbázis futtatásához, web-service Uracs T. 5. Kliens-szerver kapcsolat tervezése Németh Á., Uracs T. 6. Adatbázis-adminisztráció tervezése Uracs T. 7. Tesztelés valós (demo) adatokkal Németh Á., Uracs T.
aPIS Team Köszönjük a figyelmet! www.1weblap.hu/apis/