Az előadás letöltése folymat van. Kérjük, várjon

Az előadás letöltése folymat van. Kérjük, várjon

 ====!"§==Systems= T-Systems RIC 29.06.2014 1. oldal A konvergenciapiac K+F igényeinek egyik konkrét megvalósítása: Hangportál Dr. Vinkovits László ügyvezető.

Hasonló előadás


Az előadások a következő témára: " ====!"§==Systems= T-Systems RIC 29.06.2014 1. oldal A konvergenciapiac K+F igényeinek egyik konkrét megvalósítása: Hangportál Dr. Vinkovits László ügyvezető."— Előadás másolata:

1  ====!"§==Systems= T-Systems RIC oldal A konvergenciapiac K+F igényeinek egyik konkrét megvalósítása: Hangportál Dr. Vinkovits László ügyvezető igazgató Elek Zsombor projektvezető T-Systems RIC Kutatási Kft.

2  ====!"§==Systems= T-Systems RIC oldal Tartalom •Bevezető •A Regionális Innovációs Centrum K+F feladatai •A T-Research Laboratórium projektjei •A beszédfeldolgozási technológiák áttekintése •Beszédfelismerés •Beszédszintézis •A két technológia konvergenciája: a Hangportál •Tipikus alkalmazásai •Előnyei, hátrányai •A technológia alapja: VoiceXML, dialógusok •Új alkalmazástípus: Személyreszabott portálok •Hagyományos és hangvezérelt elérés •Várható elterjedésük

3  ====!"§==Systems= T-Systems RIC oldal A kutatási irányok Hosszútávú (5-10 éves) kutatások: - Online fordítás ( tanulmány készítése ) - Bioszenzorika ( tanulmány készítése ) Prototípusok ( 1-2 év ): - Peer to peer ( tanulmány + platform előállítása ) - PeMAP ( a magyar nyelvű implementáció ) - Telebusiness ( platform készítése ) - PPPoE ( prototípus kifejlesztése ) Rollout, SI-projektek: - I-Partner ( felmérés, fejlesztés, teszt, oktatás, átadás ) - Tudor ( felmérés, fejlesztés, teszt, oktatás, átadás )

4  ====!"§==Systems= T-Systems RIC oldal A kutatási irányok - projektek Hosszútávú (5-10 éves) kutatások: - Szabványosítás / Szabványosítási portál - Intelligens beszédtechnológiák Prototípusok ( 1-2 év ): - Peer to peer folytatás - Dynamic Networking - Telebusiness folytatás Rollout, SI-projektek: - I-Partner II - CRM ( Westel, Matáv )

5  ====!"§==Systems= T-Systems RIC oldal A terv 2003-ben: Törzstőke: ,-Ft Árbevétel: ,-Ft Foglalkoztatottak száma:120 fő A projektek/témák száma:29

6  ====!"§==Systems= T-Systems RIC oldal BMGE és RIC kooperáció  Kutató laboratóriumi program •Beszédinformációs rendszerek laboratórium •Peer-to-peer szolgáltatások laboratórium •Jellemzők: •A T-Systems RIC által elfogadott témák •Alap- és alkalmazott kutatás •Doktoranduszok és hallgatók bevonása, ösztöndíjak •Fix évi finanszírozás  Projekt alapú együttműködési program •Peer-to-peer rendszerek fejlesztése •Text-to-speech, speech-to-text rendszer fejlesztése •On-line fordítás (tanulmány) •Bioszenzorok alkalmazása INM rendszerekben (tanulmány) •Jellemzők: •A T-Systems RIC által definiált határidős feladatok •Alkalmazott kutatás-fejlesztés •Doktoranduszok és hallgatók bevonása, munkadíjak •Eseti finanszírozás

7  ====!"§==Systems= T-Systems RIC oldal A beszédfeldolgozási technológiák áttekintése Beszédfelismerés (Automatic Speech Recognition, ASR) •Feladata: A beszédjelből az annak megfelelő szöveges átirat előállítása •Fő elvárások: valósidejűség, beszélőfüggetlenség, zajérzéketlenség Beszédszintézis (Text-to-Speech, TTS) •Feladata: egy szövegből a neki megfelelő hangminta előállítása •Fő elvárások: megfelelő intonáció, sebesség, hangnem, hangsúly, különböző személyiségek megjelenítése

8  ====!"§==Systems= T-Systems RIC oldal Beszédfelismerés A beszédfelismerés lehetséges csak az első szint felhasználásával, a második szint nagyobb pontosságot tesz lehetővé Beszédjel Mintavételezés, előfeldolgozás Mintaillesztés első szintű átirat: szavak Elemzés második szintű átirat: mondatok

9  ====!"§==Systems= T-Systems RIC oldal Beszédfelismerés: első szint 1.Mintavételezés, frekvenciaanalízis 2.Lényegkiemelés 3.Mintailesztés •Dinamikus idővetemítés •Neurális hálózatok •Rejtett Markov modell a,b,…,z ? xy=‘a’

10  ====!"§==Systems= T-Systems RIC oldal Beszédfelismerés: második szint •Az alapötlet: az emberi felismerés is ezt használja (ismeretlen nyelvű szöveg leírása nehéz feladat) •A fő eszköz: elemzés (megértés) •A cél: információ visszacsatolása az első szintre •Fő módszerek: •Szintaktikai elemzés •Valószínűségi: a felismart szavak sorrendje megadja annak a valószínűségét, hogy a mondat helyes-e •Nyeltani alapú: környezetfüggetlen nyelvtani elemés (Chomsky) •Szemantikai elemzés

11  ====!"§==Systems= T-Systems RIC oldal Beszédszintézis 1. „Text” Szabály- adatbázis Fonéma szótár Előfeldolgozás Fonéma átirat Prozódiai tudás (+érzelmek) + TTS Engine •Az emberi beszédképző szervrendszer modellezése •A beszédjel modelezése •Mintaadatbázis használata

12  ====!"§==Systems= T-Systems RIC oldal Beszédszintézis 2. A TTS Engine: •Az emberi beszédképző szervrendszer modellezése •A beszédjel modelezése: formánsok manipulálása •Minta-adatbázis használata: konkatenatív szintézis F1F1 F2F2 F3F3 f [Hz] B(f) +

13  ====!"§==Systems= T-Systems RIC oldal Lehetővé válik a számítógéppel való beszéd alapú kommunikáció. A számítógépen tárolt tartalom olyan környezetből is elérhető, amiből hagyományos formában eddig nehézkes vagy tilos volt. A két technológia konvergenciája: a Hangportál ASR TTS

14  ====!"§==Systems= T-Systems RIC oldal Tipikus alkalmazások • üzenetek felolvasása •Nevek és címek •Hírek, időjárás •Pénzügyi információk: számlaegyenleg, részvényárfolyamok lekérdezése •Dinamikus weboldalak •Figyelmeztetések •Riasztások

15  ====!"§==Systems= T-Systems RIC oldal Előnyei, hátrányai Hátrányok •Gyakori a visszakérdezés •Van esély félreértésre, rossz válasz rögzítésére •Könnyebben lerakják a telefont az emberek, mintha egy emberrel beszélnének •Szabad szöveget válaszként nem tud rögzíteni Előnyök •Alacsony költség •Normál munkaidőn kívül is használható •Nincs szabadság, betegállomány

16  ====!"§==Systems= T-Systems RIC oldal Telefon hírmondó •Aktuális hírek, óránként frissülve •Az egyes hírcsoportok külön előfizethetők •Tipikus parancsok: •Menüválasztás •Ismétlés •Előző hír •Következő Login Főmenü Időjárás … Belföld Hír 1 Hír 2 Hír N Új hívás Külföld Hír 1 Hír 2 Hír N

17  ====!"§==Systems= T-Systems RIC oldal Személyre szabott portálok Az általános struktúra: Alkalmazás szerver Voice browser VoiceXML (HTTP) DB A felhasználó azonosítása után lehetőség van személyre szabott tartalom megjelenítésére. ASR TTS Tel VXML Interpr.

18  ====!"§==Systems= T-Systems RIC oldal VoiceXML •Voice eXtensible Markup Language •Feladat: audio dialógusok létrehozása •Fő funkciók: •Szintetizált beszéd és Hangfelvételek lejátszása •Beszéd és DTMF jelek felismerése •Telefonvonal kezelése (pl. átirányítás) •Célja: a webes fejlesztések és tartalomszolgáltatások átültetése hangvezérelt környezetbe Dokumentum szerver VoiceXML Interpreter VXML file Kérés Implementációs platform

19  ====!"§==Systems= T-Systems RIC oldal VoiceXML dialógusok Menu Form Menu1 Menu2 Menu3 Menu4 Main menu Exit Kérem, válasszon: Form Budapest Név: Cím: Tel.: Kovács OKMégse Kérem, töltse ki:

20  ====!"§==Systems= T-Systems RIC oldal Egy működő architektúra Partnerek: •BMGE, TMIT •T-Systems RIC •T-Systems Nova Berkom, Berlin Felhasználás: •Hírportál

21  ====!"§==Systems= T-Systems RIC oldal Közvéleménykutatás 2002 Főbb jellemzők •N=200 fős minta •Magas telefonköltségű egyéni Matáv ügyfelek Kérdések •Információs eszközök elterjedtsége és használata •Vásárlási szokások, vásárlással kapcsolatos attitűdök •Információforrások preferenciája, igénybevételi jellemzők •Megközelítőleg mekkora összeget szánnának a bevezetni tervezett szolgáltatásra az interjúalanyok?

22  ====!"§==Systems= T-Systems RIC oldal Felkeltette az érdeklődését? •A szolgáltatás a fiatalok érdeklődését jobban felkeltette, mint az idősebbeké •Közel a válaszadók felének (46,4%) érdeklődését egyértelműen felkeltette a szolgáltatás az elhangzott ismertető alapján.

23  ====!"§==Systems= T-Systems RIC oldal Várható elterjedés •Közel a válaszadók tizede biztos abban, hogy előfizetne egy ilyen hírszolgáltatásra, míg nem egészen a felük valószínűnek tartja mindezt (47,6%).

24  ====!"§==Systems= T-Systems RIC oldal Várható használati gyakoriság •A válaszadók több mint fele biztos abban, hogy legalább hetente igénybe venne egy hasonló szolgáltatást.

25  ====!"§==Systems= T-Systems RIC oldal Fizetési hajlandóság Az átlag a 3000Ft feletti kategória magas aránya miatt 3226Ft

26  ====!"§==Systems= T-Systems RIC oldal Vége Köszönjük a figyelmet!


Letölteni ppt " ====!"§==Systems= T-Systems RIC 29.06.2014 1. oldal A konvergenciapiac K+F igényeinek egyik konkrét megvalósítása: Hangportál Dr. Vinkovits László ügyvezető."

Hasonló előadás


Google Hirdetések