Nicsak, ki beszél – már a számítógépek is... Szita István Eötvös Collegium.

Slides:



Advertisements
Hasonló előadás
Ó- és középmagyar morfológiai elemző Novák Attila.
Advertisements

Kis Angyalkák.
Informatikai tudásleképezés paradigmái és problémái Szekeres András Márk.
Korpusz-alapú szövegfelolvasó rendszer fejlesztése
Takács György 15. előadás Készítette Feldhoffer Gergely
Szabványosított folyamatok
Tippek, anyagok a Beszédkészség vizsgarészre, éles próbavizsgával
A „HANGOK TANÁTÓL” A BESZÉDTECHNOLÓGIÁIG
A beszéd- technológia jövője – kihívások és stratégiák Nyelvi áttörés A nyelv- és beszédtechnológia mint húzóágazat Mihajlik Péter BME-TMIT.
Kommunikációs stratégiák
Nem számít!. Nem számít! Lezárás Lényegi Részei HATÁRIDŐ BEMUTATKOZÁS JÓ STRATÉGIA, ÉS TAKTIKA TERMÉKLÉTRA KIFOGÁSKEZELÉS.
A beszéd.
Számitástechnikai alapismeretek
Naïve Bayes, HMM.
A számítógépes nyelvfeldolgozás alapjai
Számítógépes nyelvészeti alkalmazások Farkas Richárd szept 7.
A számítógépes nyelvfeldolgozás alapjai
Virtuális méréstechnika
Virtuális méréstechnika Adatok elemzése, fájl I/O 1 Mingesz Róbert V
Beszédtechnológia, beszédfelismerés
MTA-DE-PTE-SZTE Elméleti Nyelvészeti Kutatócsoport Szegedi Munkacsoport 2007–2011 Bibok Károly, Maleczki Márta, Nagy Katalin, Németh T. Enikő, Vecsey Zoltán.
1. tétel: A JELEK ÉS A NYELV
Kimeneti követelmények a 8. osztály végén
TANTÁRGY-ORIENTÁLT IDEGEN NYELV OKTATÁS Istvánffy Miklós Általános Iskola.
Stílus és jelentés /társalgási stílus, publicisztikai stílus, tudományos-szakmai stílus, hivatalos stílus /
Bárdi Tamás előadására építve
T.Gy. Beszedfelism es szint Beszédfelismerés és beszédszintézis Beszédfelismerés neurális hálózatokkal Takács György 13. előadás 2012.
T.Gy. Beszedfelism es szint Beszédfelismerés és beszédszintézis Beszédjelek lineáris predikciója Takács György 4. előadás
Beszédfelismerés és beszédszintézis Spektrális módszerek a beszédfeldolgozásban Takács György 3. előadás Beszedfelism és szint
Mesterséges intelligencia
Dr. habil. Benczik Vilmos főiskolai tanár, ELTE TÓK
Szótárak: fajták és tipologizálás
Bemutatkozik a Világhalló Aki még nem hallott mesterségesen generált beszédet azt kérdezi, hogy: Miben különbözik a Világhalló és a beszédszintetizátor?
Kis Angyalkák.
Hangtani imétlés.
Zöngétlenedés: beszélőfüggő paraméter? Gráczi Tekla Etelka, MTA Nyelvtudományi Intézet II. Alkalmazott Nyelvészeti Doktorandusz Konferencia, Budapest,
Hogyan tanítsuk meg a számítógépet magyarul? Számítógép és nyelv Varasdi Károly MTA Nyelvtudományi Intézet
KONZULTÁCIÓS TECHNIKÁK
Készítette: Terdik Sándor PTM IV. Ismeretszerzés természetes nyelvű dokumentumokból.
Szintaktikai, szemantikai szabályok
1 BESZÉDFELISMERŐ RENDSZERES ALKALMAZÁSA AZ ÉRDEKKÉPVISELETI MUNKÁBAN (ELŐKÉSZÍTÉS) A STRATOSZ SZÁMÁRA KIDOLGOZOTT VÁLTOZAT Készült a MAT támogatásával,
SPECIÁLIS TANULÁSI NEHÉZSÉGEK
A „diszes” problémák korai jelei
Néhány jótanács prezentációk készítéséhez
A mondattan Általános kérdések
Bölcsességek, aforizmák
A szövegértés diagnosztizálása és fejlesztése
Szóelemek, morfémák 10..
Döntsön a kard! Mesterséges intelligencia a játékokban Szita István Eötvös Collegium.
Sém és Hám fiai? A héber nyelv helye az afroázsiai és a sémi nyelvcsaládban Biró Tamás december.
Új Esély munkakonferencia Július 28. Zöld Kakas Líceum Braun József.
AZ AFÁZIÁK TIPOLÓGIAI OSZTÁLYOZÁSA
Vigyázat: minden üzenet!
Demens gondozás (Kommunikáció) Készítette: Jónyer Lajosné
 A TIOP pályázat SNI csomagjai  Gépi beszédfelismerés  Digitális tananyagok akadálymentesítése sajátos nevelési igényű tanulók számára  SNI IKT.
 Fizikai és infokommunikációs akadálymentesítés  Digitális tananyagok akadálymentesítése  Gépi beszédfelismerés.
AZ IGEHIRDETŐ ÉS GYÜLEKEZETE Pápa - DRA Steinbach József - I. Teológiai alapelvek a prédikáció és a gyülekezet kapcsolatában - II. Homiletikai.
METAKOMMUNIKÁCIÓ Vigyázat: minden üzenet!!!. Ismétlés Minden jel, ami önmagán túlmutat, ami önmagánál többre utal. A jelet nem az teszi jellé, aki adja,
Flashcards Tátrai Szilveszter 10/2.
Bevezetés a nyelvtudományba 3. Nyelvi szintek
előadások tervezése és kivitelezése Kovács Ilona egyetemi tanár
Bevezetés a nyelvtudományba
A nyelv mint jelrendszer
Számítógépes algoritmusok
A nyelvi tudatosság fejlesztése Meixner Iskola, Szakmai nap
METAKOMMUNIKÁCIÓ. Ismétlés Minden jel, ami önmagán túlmutat, ami önmagánál többre utal. A jelet nem az teszi jellé, aki adja, hanem az, aki „veszi”.
A MORPHOLOGIC - BME EGYÜTTMŰKÖDÉSEK
Segédlet a Kommunikáció-akusztika tanulásához VIHIAV 035
Takács György, Olaszy Gábor, Podoletz György, Tihanyi Attila
A folyamatos beszéd gépi felismerése – a kezdetektől (BME-TTT 90-es évek) napjainkig Dr. Mihajlik Péter.
Előadás másolata:

Nicsak, ki beszél – már a számítógépek is... Szita István Eötvös Collegium

Bevezetés n Star Trek, Xénia-láz: szóbeli ember-gép kommunukáció n körülöttünk a gépek semmi ilyesmit nem csinálnak n Mi az igazság? n az igazság: úton vagyunk a sci-fik felé

Hogy a géppel beszélni lehessen... Beszédfelismerés Beszédgenerálás akusztikus jel (értelmezés) szavak, mondatok (mondanivaló) akusztikus jel írott mondat

Beszédgenerálás n Feltesszük, hogy a mondanivaló adott (pl. felolvasandó levél) n Naiv megközelítés: –szövegből beszédhangok (kiejtési szótár) –beszédhangokból összevágjuk n az eredmény érthető, de kiábrándító: n „To be or not to be...”

Beszédgenerálás – okosabban n Figyelembe kell venni –a hangok finom illeszkedését –a szóhangsúlyt –a többféle kiejtési lehetőséget (pl. „read”) –az írásjeleket, mondathangsúlyt –a mondat jelentését (kellene...) n A legfejlettebb rendszerek elég szépen beszélnek:

Beszédfelismerés n Feladat: „Please write:...” [pli:z rait] összehasonlítás [a],[a:],...,[p],... visszakeresés kiejtési szótárból Naiv megközelítés:

A naiv megközelítés nem működik n egy fonéma hangjele sokféle lehet n már a szavak elkülönítése is nehéz n a feladat nekünk sem könnyű –idegen nyelvben nehéz szavakat, fonémákat találni –felismerés: akár 50-60% körül –kiegészítés nyelvismeret alapján –vicces félrehallások:

Beszédfelismerés – okosabban [e]: 55% [  ]: 30% más: 15%... [1,5,1] [1,5,2] [2,4,4]... szeletekre bontás, kivonatolás keresés valószínűségi modell alapján a legvalószínűbb szó: “apple” akusztikus és nyelvi modell

A valószínűségi modellek n Pr( szó | hanghullám ) ~ Pr( hanghullám | szó ) x Pr( szó ) Akusztikus modell n hogyan ejt ki szavakat a beszélő n készítés: sok mintából adatbázis Nyelvi modell n adott kontextusban mi a szó valószínűsége n közelítő modellek: –bigramm modell –szózsák modell

A beszédfelismerés működik! n A legjobb rendszerek a szavak 80-98%- át azonosítják n a felismerés jobb, ha ideálisak a feltételek –jó hangminőség, kis zaj –tagolt beszéd –betanítás a beszélőre n Lássunk példát!

Köszönöm a figyelmet!