Beszédtechnológia - A multik – és a többiek lehetőségek és korlátok

Slides:



Advertisements
Hasonló előadás
Fehér Péter PhD Edutus Főiskola Budapest
Advertisements

Tamás Kincső, OSZK, Analitikus Feldolgozó Osztály, osztályvezető A részdokumentumok szolgáltatása az ELDORADO-ban ELDORADO konferencia a partnerkönyvtárakkal.
„Esélyteremtés és értékalakulás” Konferencia Megyeháza Kaposvár, 2009
A projekt az Európai Unió támogatásával, az Európai Szociális Alap társfinanszírozásával valósul meg. TÁMOP-4.2.1/B-09/1/KONV „A felsőoktatás.
2006. szeptember 20. Vámospércs "Új szolgáltatások a könyvtárban az Internetre építve" Moldován István OSZK MEK osztály
Jövő Internet technológiák és alkalmazások kutatása Magyarországon A Magyar Tudomány Hónapja Jövő Internet technológiák és alkalmazások kutatása Magyarországon.
Nyelv-ész-gép Új technológiák az információs társadalomban.
Jövő hálózati megoldások – Future Internet
2003. november INFOtrend 2003 Váradi Tamás MTA Nyelvtudományi Intézet Korpusznyelvészeti Osztály Nyelvi technológiákkal az információs.
Nyelv-ész-gép Új technológiák az információs társadalomban.
2011. június 21. Kisfaludy Károly Megyei Könyvtár
Technológiai fejlesztés a hatékony ellátás szolgálatában
ENVI-ART Környezetvédelmi Tanácsadó és Szolgáltató Kft.
Hotel Eger Park Konferenciaközpont október
EISZ nemzeti program 2012 dr. Téglási Ágnes főigazgató-helyettes.
Elkülönített állami pénzalapok
IKTA beszámo ló Testre szabott on-line tartalomszűrés és alkalmazása mobil kommunikációban Dr. Harmat Péter projektvezető, üzletfejlesztési igazgató.
Online Katalógus aleph.nyf.hu.
"Együttműködés, Lehetőség, Tudáshasznosítás, ELTE" Kutatási- és technológiatranszfer szolgáltatások fejlesztése az ELTE-n TÁMOP /1/KMR
Mérés és adatgyűjtés laboratóriumi gyakorlat Makan Gergely, Mingesz Róbert, Nagy Tamás 2. óra szeptember 9., 10. v
A diákat jészítette: Matthew Will
A globális világgazdaság és az USA világgazdasági szerepköre
1 Kétségek között Göd, November 6-7. dr. Kiss József magánszemély.
Orvosoktatás Betegedukáció Egészségügyi kutatások, adatok közzététele Egészségügyi programok szervezése, támogatása Részvétel szakmai szervezetek munkájában.
Kutatás Üzleti Információ Informatika 1081 Budapest, Csokonai u 3. Telefon: Fax: Az e-kormányzat és az elektronikus.
”Babits Mihály a Net-en” Moldován István OSZK MEK osztály Irodalomtörténeti Szimpózium Babits Mihály születésnapján Szekszárd, november.
szakmérnök hallgatók számára
BME TMIT 1 speechlab.tmit.bme.hu A magyar beszédtechnológia helyzete és távlatai (Status Report of Hungarian Speech Technology) Németh Géza BME Távközlési.
Megoldottuk a számítógép nyelvét... Prószéky Gábor MTA, november 4. MTA, november 4.
A szelektív gyűjtés helyzete, eredményei Kommunikációs kihívások
Bringa - tekerj, hogy haladj Bringa - tekerj, hogy haladj Motiváció Máshol hogy csinálják? szeptember dr. Német Béla, tudományos munkatárs.
Nyelv-ész-gép Új technológiák az információs társadalomban.
DAT 2006 konferencia A könyvtárak digitális világa szekcióülés Budapest, november 21.
2009. november 16. Szegedi Tudományegyetem BTK Informatikus Könyvtáros Szak 1 NEMZETKÖZI TARTALOMIPAR ÁGAZATOK ÉS TRENDEK 10. előadás.
Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika és Információs Rendszerek Tanszék R „Big Data” elemzési módszerek Kocsis Imre
A Jövő Internet Nemzeti Technológiai Platform workshop-ja Az Aarlborg-i Future Internet Assembly üzenetei Dr. Sallai Gyula Budapesti Műszaki és Gazdaságtudományi.
A Dublin-i Future Internet Assembly üzenetei Sallai Gyula, Vilmos András Jövő Internet Kutatáskoordinációs Központ Budapest, június 4.
Jövő Internet Nemzeti Technológiai Platform Workshop program június 4. Levezető elnök: Dr. Bakonyi Péter Napirend: 1. Tudománypolitikai Stratégia.
Éves Konferencia- Annual Report Irányító Bizottság: Elnök: D. Terdik György DE IK dékán Tagok: Dr. Kardon Béla EMMI Dr. Sallai Gyula BME, FIRCC Nagy Miklós.
A kormányzati K+F+I politika prioritásai, különös tekintettel a gyógyszeriparra Dr. Nikodémus Antal Nemzetgazdasági Minisztérium, Innovációs és K+F Főosztály.
2005. Május 02.MTA Felolvasóterem Kőhalmi Zsolt Május 02.MTA Felolvasóterem Kőhalmi Zsolt PTA TÁMOGATÁSI PROGRAM IHM költségvetéséből Neumann Táborok.
MIKROELEKTRONIKA, VIEEA306
Budapesti Műszaki és Gazdaságtudományi Egyetem Elektronikus Eszközök Tanszéke MIKROELEKTRONIKA, VIEEA306 Integrált áramkörök: áttekintés,
Máth András, Ringier tanácsadó – OAG Szakmai Nap Marketing és kutatás hogyan segíthet a kutatás.
Transznacionális és multinacionális vállalatok
Slide 1/11 Bp BelAmI – Workshop Beszédtechnológia Helyzetkép
BelAmI2 projekt beszámoló Vida Rolland - BME március 1.
2006. Peer-to-Peer (P2P) hálózatok Távközlési és Médiainformatikai Tanszék.
Integráló iskolák a közoktatásban
A projekt az Európai Unió támogatásával, az Európai Szociális Alap társfinanszírozásával valósul meg. TÁMOP-4.2.1/B-09/1/KONV „A felsőoktatás.
1 Gyarapodó Köztársaság Növekvő gazdaság – csökkenő adók február 2.
Szélessávú tervek és akciók
TÁMOP C-11/1/KONV Történet  Az Egyesület alapítása – 1998 Budapesti Műszaki és Gazdaságtudományi Egyetem (BME) Eötvös Lóránd Tudományegyetem.
Jogi informatika, 2. előadás Az információs társadalom lényegi ismérvei és egyes modelljei szeptember 21. Témakörök: 1.Az IT-ről általában 2.Az IT.
A tudomány tudománya Kampis György ELTE TTK Tudományfilozófia Tanszék 12/7/12"FuturICT" TÁMOP ick-off meeting, SZTE.
Műegyetem - Kutatóegyetem Járműtechnika, közlekedés és logisztika.
1 AZ IKTA-2000 projektjeinek szakmai bemutatója IKTA-144/2000 projekt november 28.
Az IKT szerepe a kompetencia alapú oktatásban. THE EDUCATION INFRASTURCTURE IN HUNGARY I. The number of personal computers and users in educational institutions.
MTA SZTAKI Department of Distributed Systems Mutasd a hangod! intelligens gépi jeltolmács beszéd- és halláskárosultaknak Mátételki Péter.
A KÖVETKEZŐKBEN SZÁMOZOTT KÉRDÉSEKET VAGY KÉPEKET LÁT SZÁMOZOTT KÉPLETEKKEL. ÍRJA A SZÁMOZOTT KÉRDÉSRE ADOTT VÁLASZT, VAGY A SZÁMOZOTT KÉPLET NEVÉT A VÁLASZÍV.
„Ötletből pénzt”.
UNIVERSITY OF SZEGED D epartment of Software Engineering UNIVERSITAS SCIENTIARUM SZEGEDIENSIS Okostelefon felhő Prof. Dr. Gyimóthy Tibor Szegedi Tudományegyetem.
A könyvtár, mint az információs társadalom stratégiai tényezője Dr. Tóvári Judit
Vállalati infrastruktúra, mely minden igényt kielégít Felhasználóbarát eszközök és élmények.
Az új köznevelési rendszer jellemzői és várható eredményei
A Nyelv- és Beszédtechnológiai Platform egy éve Váradi Tamás MTA Nyelvtudományi Intézet Nyelvi áttörés A nyelv- és beszédtechnológia mint húzóágazat.
“Tudásmegosztás és szervezeti problémamegoldás a mesterséges intelligencia korában” Levente Szabados Technológiai Igazgató.
A MORPHOLOGIC - BME EGYÜTTMŰKÖDÉSEK
Takács György, Olaszy Gábor, Podoletz György, Tihanyi Attila
Előadás másolata:

Beszédtechnológia - A multik – és a többiek lehetőségek és korlátok Németh Géza BME Távközlési és Médiainformatikai Tanszék Beszédkommunikáció és Intelligens Interakciók Laboratórium nemeth@tmit.bme.hu 1

Mi is a beszédtechnológia? Miért fontos általában? Áttekintés Mi is a beszédtechnológia? Miért fontos általában? Miért fontos a magyaroknak? Történeti áttekintés Friss eredmények Erőforrások Kutatási kihívások Alkalmazási kihívások 2

Mi is a beszédtechnológia? A természetes beszédlánc bármely elemének gépi megvalósítása (interdiszciplináris tudomány) } 2

Miért fontos általában? Nyelv <> szöveg A nyelv kifejezésének a beszéd az alapvető modalitása A leghatékonyabb Siketnémák <> vakok Bizonyos helyeztekben (járműben, gyártás során, …) a kedvelt kommunikációs csatorna „Big data” forrás (természetes, valódi, …) 2

Miért fontos általában? Beszédtechnológiával kapcsolatos [Gartner hype-cycle on Emerging technologies July 2012] 2

Miért fontos a magyaroknak? Különleges a nyelvünk (ragozó, szabad szórend) Extra befektetés – Közepes piac (73. a világon [Ethnologue]) Érdekli a multikat (Google, Nuance, …) de Testreszabott, kiváló megoldások drágák <> „just sufficient effort” Prominens résztvevők Maróth Miklós (alelnök, MTA, nyelvész); Gróh Gáspár (Áder János köztársasági elnök megbízásából, közíró); Kelemen Csaba (fővh, ICT fejlesztés, Németh Lászlóné miniszter köszöntője, NFM); Csizmadia Norbert (tervezéskoordinációért felelős államtitkár, NGM); L. Simon László (kultúráért felelős államtitkár, EMMI); Hoffmann Rózsa (oktatásért felelős államtitkár, EMMI) írásos köszöntője; Bába Iván (közigazgatási ügyekért felelős államtitkár, KülügyM); Korányi László (kül- és belkapcsolati elnökhelyettes, villamosmérnök, NIH) 2

Történelem közlekedés és beszédtechnológia 1791 2012 2

Kempelentől napjainkig Kempelen Farkas 1791 HungaroVox 1982 MultiVox 1986-2002 2

Kempelentől napjainkig Voder 1939 Dectalk 1982 2

Kempelentől napjainkig ProfiVox diád 1995- ProfiVox triád 2000- ProfiVox korpusz 2002- ProfiVox HMM 2005- 2

Kempelentől napjainkig AT&T 2011 (US English) AT&T 2011 (German) Nuance (Loquendo) 2011 (US English) Nuance (Loquendo) 2011 (German) 2

A szabály-alapú modellek (artikulációs csatorna, prozódia) helyett Mi hozta ezt el? A szabály-alapú modellek (artikulációs csatorna, prozódia) helyett Természetes elemek egyre nagyobb halmaza statisztikai modellépítés minimális jelfeldolgozás Egységes(re törekvő) kiértékelés Év Legjobb ember Legjobb TTS Legrosszabb TTS Megjegyzés 2005 4,76 3,19 1,98 2006 4,66 3,74 1,34 nagyobb adatbázis (5000 mondat) 2007 4,7 3,9 1,3 nagyobb adatbázis (8 óra) 2008 4,8 4,1 2.0 UK English (15 óra) + Mandarin (6.5 óra) 2009 4,9 4,2 1,9 2010 4,8 4,2 1,6 zaj, kisebb adatbázisok 2011 Interspeechből kiszedni 2

Mi hozta ezt el? Év Legjobb ember Legjobb TTS Legrosszabb TTS Megjegyzés 2005 4,76 3,19 1,98 2006 4,66 3,74 1,34 nagyobb adatbázis (5000 mondat) 2007 4,7 3,9 1,3 nagyobb adatbázis (8 óra) 2008 4,8 4,1 2.0 UK English (15 óra) + Mandarin (6.5 óra) 2009 4,9 4,2 1,9 2010 4,8 4,2 1,6 zaj, kisebb adatbázisok 2011 Interspeechből kiszedni 2

Év Legjobb ember Legjobb TTS Legrosszabb TTS Megjegyzés 2005 4,76 3,19 1,98 2006 4,66 3,74 1,34 nagyobb adatbázis (5000 mondat) 2007 4,7 3,9 1,3 nagyobb adatbázis (8 óra) 2008 4,8 4,1 2.0 UK English (15 óra) + Mandarin (6.5 óra) 2009 4,9 4,2 1,9 2010 4,8 4,2 1,6 zaj, kisebb adatbázisok 2011 Interspeechből kiszedni 2

Blizzard Challenge (http://festvox.org/blizzard) Mi hozta ezt el? Blizzard Challenge (http://festvox.org/blizzard) Év Legjobb ember Legjobb TTS Legrosszabb TTS Megjegyzés 2005 4,76 3,19 1,98   2006 4,66 3,74 1,34 nagyobb adatbázis (5000 mondat) 2007 4,7 3,9 1,3 nagyobb adatbázis (8 óra) 2008 4,8 4,1 2.0 UK English (15 óra) + Mandarin (6.5 óra) 2009 4,9 4,2 1,9 2010 1,6 zaj, kisebb adatbázisok Év Legjobb ember Legjobb TTS Legrosszabb TTS Megjegyzés 2005 4,76 3,19 1,98 2006 4,66 3,74 1,34 nagyobb adatbázis (5000 mondat) 2007 4,7 3,9 1,3 nagyobb adatbázis (8 óra) 2008 4,8 4,1 2.0 UK English (15 óra) + Mandarin (6.5 óra) 2009 4,9 4,2 1,9 2010 4,8 4,2 1,6 zaj, kisebb adatbázisok 2011 Interspeechből kiszedni 2

Nyelvtechnológiai illusztráció Translate.google.com You can not choose the lump-sum tax of the entity, the tax identification number of the tax authority, within two years prior to the application of law suspended or canceled. Webforditas.hu The undertaking the tax number of which the inland revenue office suspended validly inside the two years preceding the announcement may not elect the itemized tax or deleted it. 2

Nyelvtechnológiai illusztráció Fordítandó: Nem választhatja a tételes adót az a vállalkozás, amelynek adószámát az adóhatóság a bejelentést megelőző két éven belül jogerősen felfüggesztette vagy törölte. 2

A Microsoft friss eredményei http://www.element14.com/community/community/news/blog/2012/11/14/microsofts-live-speech-translator-your-voice-in-other-languages

A magyar nyelvű beszédtechnológia eredményei MailMondó Westel BME TMIT 1999 T-Mobile Freedom BME TMIT 2002 Scientific Informatika a Látássérültekért Westel BME TMIT 2003 T-Mobile MIT Systems Digital Natives BME TMIT 2008 AITIA MonSpeech Vodafone Montana, AITIA, 2012 BME TMIT, MTA Nytud 2

Cégek (AITIA, Morphologic, Nextent, … ) Nemzetközi hálózatok Elérhető erőforrások Világszínvonalú nyelv- és beszédtechnológiai együttműködő K+F kapacitás (www.hlt-platform.hu) Cégek (AITIA, Morphologic, Nextent, … ) Nemzetközi hálózatok Hiányoznak a nagy ipari K+F központok Hiányzik a fókuszált (kormányzati) odafigyelés, a minőségi elvárások META-NET 2

Pontos referencia beszédfeldolgozási infrastruktúra (platform) Kutatási kihívások1 Pontos referencia beszédfeldolgozási infrastruktúra (platform) Spontán interakciók feldolgozása Elégséges (?) adat gyűjtése és annotálása Finanszírozás nélküli nagy projektek (pl. U-STAR) Szabály-adatvezérelt kombináció Cognitive Infocommunications Cognitive Robotics Eto – communications Életközeli alkalmazások 2

A rejtélyes völgy - „uncanny valley” elkerülése Kutatási kihívások2 A rejtélyes völgy - „uncanny valley” elkerülése 2

Alkalmazási kihívások 1 A 15-69 éves magyar lakosok 62%-a internet felhasználó Mi legyen a többiekkel (38%)? Információs akadálymentesítés ??? A beszédtechnológia segíthet (magyarorszag.hu, 112, MÁV, BKV, Volán) Példák: www.gyogyszervonal.hu, www.metnet.hu Alkalmazások fogyatékosoknak Képernyő olvasó vakoknak Elektronikus hozzáférés írott anyagokhoz Példák: www.robobraille.org, VoxAid 2

Alkalmazási kihívások 2 Beszédtechnológia az oktatásban „Játékok” óvodásoknak és iskolásoknak Példa: GOH hallásvizsgálat 3 éveseknek Interaktív multimodális oktatási anyag Kisebbségi helyzetű magyar gyermekek motiválása Afáziás, autista, stb. támogatása 2

Alkalmazási kihívások 3 Beszédtechnológia az egészség iparban Műtétek automatizálása (utasítások, jegyzetelés) Leletek diktálása Hang alapján gége problémák, depresszió, stb. korai diagnózisa és rehabilitációja Táv(fel)ügyeleti alkalmazások (pl. gyógyszer bevétel figyelmeztetés, ablak zárás, stb.) Demencia, Alzheimer, … felügyelete 2

Alkalmazási kihívások 4 Beszédtechnológia a tartalom- és a kreatív iparban Interdiszciplináris integráció Beszédtechnológia – orvosok – szociális munkások képzése (pl. IBM –kormányzat) Digitális közoktatás és intelligens otthon program ( pl. Microsoft – kormányzat) Multi-modális tartalomelemzés (közvélemény kutatás) Bankok, kisker., információs szolgáltatások Car infotainment (Audi, Daimler – kormányzat) Beszédvezérelt otthon okostelefon, okosTV okos mosógép, …… 2

Alkalmazási kihívások 4 Beszédtechnológia a tartalom- és a kreatív iparban Interdiszciplináris integráció Beszédtechnológia – orvosok – szociális munkások képzése (pl. IBM –kormányzat) Digitális közoktatás és intelligens otthon program ( pl. Microsoft – kormányzat) Multi-modális tartalomelemzés (közvélemény kutatás) Bankok, kisker., információs szolgáltatások Car infotainment (Audi, Daimler – kormányzat) Beszédvezérelt otthon okostelefon, okosTV okos mosógép, …… 2

Alkalmazási kihívások 5 Beszédtechnológia a gyártásban Raktár-logisztika automatizálás Gyártásközbeni információ, figyelmeztetés Beszéd utasítások Beszélő gépkönyvek 3DICC 3D Internet Based Control and Communication 2

Mélyebb érdeklődőknek: http://speechlab.tmit.bme.hu/ Hozzászólások Mélyebb érdeklődőknek: http://speechlab.tmit.bme.hu/ http://magyarbeszed.tmit.bme.hu/ Köszönjük az támogatását. (Teleauto, BelAmi, EtoCom -TÁMOP-4.2.2-08/1/KMR-2008-0007- , BME Kutatóegyetemi -TÁMOP-4.2.1/B-09/1/KMR-2010-0002- , CIP CESAR, AAL PAELIFE projektek) 15