Készítette: Terdik Sándor PTM IV. Ismeretszerzés természetes nyelvű dokumentumokból.

Slides:



Advertisements
Hasonló előadás
Ó- és középmagyar morfológiai elemző Novák Attila.
Advertisements

Gábor Kata MTA Nyelvtudományi Intézet Korpusznyelvészeti osztály Infotrend kiállítás A gépi ferdítéstől a gépifordításig.
A projekt az Európai Unió támogatásával, az Európai Szociális Alap társfinanszírozásával valósul meg. TÁMOP-4.2.1/B-09/1/KONV „A felsőoktatás.
Az információ alaptulajdonságai 1.Mérhető 2.Tudásunkra hat Értelmességi alapfeltétel értelmes >< igaz állítás.
Informatikai tudásleképezés paradigmái és problémái Szekeres András Márk.
Néhány fontos terület a Kreatív Ipar fejlődéséhez
2003. november INFOtrend 2003 Váradi Tamás MTA Nyelvtudományi Intézet Korpusznyelvészeti Osztály Nyelvi technológiákkal az információs.
INFORMÁCIÓKERESÉS JELENTÉSREPREZENTÁCIÓ ALAPJÁN
K-Chat Dr. Szepesvári Csaba Kutatási Alelnök mindmaker.
A BNO10 formális formális reprezentálása a GALEN alapján
A Magyar Nemzeti Szövegtár
Képességszintek.
MI 2003/ Néhány probléma: - Hogyan fordítanánk angolra? - Hogyan érthetnénk meg egy rövid törénetet? - Miként lehetne kigyűjteni az MTI hírekből.
A számítástechnika és informatika tárgya
Gépi fordítás november 9. Daniel Jurafsky and James H. Martin: SPEECH and LANGUAGE PROCESSING, 2nd editon, 2009 alapján.
Szintaktikai elemzés február 23..
A számítógépes nyelvfeldolgozás alapjai
Számítógépes nyelvészeti alkalmazások Farkas Richárd szept 7.
Korpuszok és adatbázisok
A számítógépes nyelvfeldolgozás alapjai
Gépi fordítás április 19.. Gépi fordítás Machine Translation (MT) Teljes szövegek automatikus fordításra forrás nyelvről célnyelvre. Computer Aided.
Beszédtechnológia, beszédfelismerés
A projekt az Európai Unió támogatásával, az Európai Szociális Alap társfinanszírozásával valósul meg. TÁMOP-4.2.1/B-09/1/KONV „A felsőoktatás.
Adatábrázolás, algoritmusok
A nyelv problémája természetes, és mesterséges nyelvek.
Információ típusok.
ISMERETALAPÚ RENDSZEREK SZAKÉRTŐ RENDSZEREK
Ismeretalapú rendszerek alaptechnikái I. Szabályalapú rendszerek.
Ismeretalapú rendszerek alaptechnikái I. Szabályalapú rendszerek.
Korpuszok a nyelvészeti kutatásban: Bevezetés, követelmények ismertetése Vincze Veronika Korpuszok a nyelvészeti kutatásban – 2013.
III. előadás: Írásbeliség, egyén, társadalom
Óvodáskorú gyermekek szóaktiválásának funkcionális vizsgálata
Gábor Kata MTA Nyelvtudományi Intézet Korpusznyelvészeti osztály Magyar tudomány napja, A gépi ferdítéstől a gépifordításig.
A Magyar Nemzeti Szövegtár
2006. február 20. MANYE Korpuszok 1 Kiss Gábor - Sass Bálint A Magyar Nemzeti Szövegtár MNSZ.
Megoldottuk a számítógép nyelvét... Prószéky Gábor MTA, november 4. MTA, november 4.
Magyar nyelvi szintaktikai elemzőrendszerek Vincze Veronika Szegedi Tudományegyetem Informatikai Tanszékcsoport A magyar nyelv helyzete a digitális korban.
Hogyan tanítsuk meg a számítógépet magyarul? Számítógép és nyelv Varasdi Károly MTA Nyelvtudományi Intézet
A szöveg lekérdezése A NooJ rendszer alapjai
Nyelv-ész-gép Új technológiák az információs társadalomban.
Szemantikus keresők.
Természetes és formális nyelvek Jellemzők, szintaxis definiálása, Montague, extenzió - intenzió, kategóriákon alapuló gramatika, alkalmazások.
1 Tudásalapú információ-kereső rendszerek elemzése és kifejlesztése Célkitűzés: Információk téma-specifikus, különböző típusú forrásokból (internet, intranet.
1 BESZÉDFELISMERŐ RENDSZERES ALKALMAZÁSA AZ ÉRDEKKÉPVISELETI MUNKÁBAN (ELŐKÉSZÍTÉS) A STRATOSZ SZÁMÁRA KIDOLGOZOTT VÁLTOZAT Készült a MAT támogatásával,
Yazix fordítás-segítő alkalmazás burgermeister zsolt varga koppány.
Nyelvtechnológia Ladányi Enikő
Az első és második nyelv elsajátítás elméletei
Az innováció-átvételi döntési folyamat
Slide 1/11 Bp BelAmI – Workshop Beszédtechnológia Helyzetkép
Nicsak, ki beszél – már a számítógépek is... Szita István Eötvös Collegium.
Bevezetés Előadó: Blasszauer János Kaposvár, január 14.
A szövegértés diagnosztizálása és fejlesztése
Készítette: Szalayné Tahy Zsuzsa – Szalay Sándor 1 A program megvalósulását az Apertus Közalapítvány támogatta. Számítógéppel segített módszerek a természettudományok.
2014/15 I.félév Sárközi-Lindner Zsófia.  cél: a szótáron belül (lexémák) m ű köd ő szabályok leírása  fonológiai és morfológiai szabályok ’együttm ű.
Készítette: Majoros Péter MZEGDJ SIRI. MI IS A SIRI? Az iOS-t futtató Apple készülékek intelligens személyi asszisztense.
A Nyelv- és Beszédtechnológiai Platform egy éve Váradi Tamás MTA Nyelvtudományi Intézet Nyelvi áttörés A nyelv- és beszédtechnológia mint húzóágazat.
A generatív nyelvelmélet
„Virtuális Genom Projekt” Richnovszky Ádám – menedzsment Pitlik László (PhD) – tudásmérnökség Szöllössy Dániel – forráskutatás Kócs Róbert – rendszerszervezés.
Természetes nyelvi interfészek
Bevezetés a nyelvtudományba 3. Nyelvi szintek
Vincze Veronika Korpuszok a nyelvészeti kutatásban: Bevezetés, követelmények ismertetése Vincze Veronika
Prószéky Gábor MANYE MTA Magyar Nyelvi Osztályközi Állandó Bizottság
Leíró nyelvtan - adatbázisból
A nyelvi tudatosság fejlesztése Meixner Iskola, Szakmai nap
A MORPHOLOGIC - BME EGYÜTTMŰKÖDÉSEK
Tibor Fegyó SpeechTex Kft.
A gépi beszédfelismerés kezdeti kutatásai
A SzTAKI-tól A MorphoLogicig Naszódi Mátyás
Annotációs eszközök Korpuszok a nyelvészeti kutatásban – szeptember 28.
A folyamatos beszéd gépi felismerése – a kezdetektől (BME-TTT 90-es évek) napjainkig Dr. Mihajlik Péter.
Előadás másolata:

Készítette: Terdik Sándor PTM IV. Ismeretszerzés természetes nyelvű dokumentumokból

 Általánosan a nyelvtechnológiáról  Írott szöveg értelmezése  Beszéd számítógépes feldolgozása  Nyelvtechnológiai sikerek  Nyelvtechnológia az információkeresésben  Gépi fordítás  Előretekintés

Nyelvtechnológia fogalma Nyelvtechnológia fogalma Ember és számítógép közti különbség a nyelvvel kapcsolatos bánásmódban. Ember és számítógép közti különbség a nyelvvel kapcsolatos bánásmódban. Miért akarjuk gépünket megtanítani a nyelvre? Miért akarjuk gépünket megtanítani a nyelvre? Természetes nyelv ember-gép kapcsolat kutatása Természetes nyelv ember-gép kapcsolat kutatása

Előzetes nyelvi tudás Előzetes nyelvi tudás Nyelvtechnológia alapdilemmája ( szabályalapú és statisztikai irányzat) Nyelvtechnológia alapdilemmája ( szabályalapú és statisztikai irányzat) o A LEHET és VAN kérdése, performancia o Korpusz, korpusznyelvészet, nyelvstatisztika fogalma Szabályszerűségek a természetes nyelvekben Szabályszerűségek a természetes nyelvekben Réteges szerkezetű nyelv Réteges szerkezetű nyelv

Nyelvtechnológia alapvető leírási szintjei: Nyelvtechnológia alapvető leírási szintjei: o Számítógépes morfológia Egyértelműsítés művelete Egyértelműsítés művelete Szófaji címkézés fogalma Szófaji címkézés fogalma o Számítógépes szintaxis Főnévi csoport Főnévi csoport Nyelvtan fogalma Nyelvtan fogalma Nyelv számítógépes modellezésének minősége Nyelv számítógépes modellezésének minősége o A fedés és pontosság fogalma Jelentés egyértelműsítés Jelentés egyértelműsítés o Információkeresés vs. Szövegkeresés o Tárgyterület specializáció o Szóhálók alkalmazása

Gépi beszéd, gépi beszédértés megvalósítása Gépi beszéd, gépi beszédértés megvalósítása Hanglejtés szerepe, számítógépes fonológia és fonetika Hanglejtés szerepe, számítógépes fonológia és fonetika Beszédfelismerést zavaró tényezők Beszédfelismerést zavaró tényezők BeszédszintézisBeszédfelismerés Szöveg Beszéd

Szegmentálás problémája Szegmentálás problémája Beszédfelismerő rendszerek szegmentálását egyszerűsítő módszer, hogy szűkítik a szóba jöhető beszédminták körét: Beszédfelismerő rendszerek szegmentálását egyszerűsítő módszer, hogy szűkítik a szóba jöhető beszédminták körét: o Problémák: Beszéd folytonossága Izolált szavas rendszerek Beszéd folytonossága Izolált szavas rendszerek Beszélők sokfélesége Beszélő függő rendszer Beszélők sokfélesége Beszélő függő rendszer Nagy szókincs Nagy szókincs Beszélő független rendszer Beszélő független rendszer

Helyesírás ellenőrző programok: Helyesírás ellenőrző programok: o Szóellenőrző helyesírás ellenőrző program Morfológia elemző használata Morfológia elemző használata o Szóhatáron túli nyelvhelyességet ellenőrző program Elválasztó programok Elválasztó programok Szinonimaszótár Szinonimaszótár o Szótövesítés (lemmatizálás)

A megfelelő tartalmú dokumentumok megtalálása a cél nem pedig a begépelt szavakat szó szerint tartalmazó dokumentumok keresése A megfelelő tartalmú dokumentumok megtalálása a cél nem pedig a begépelt szavakat szó szerint tartalmazó dokumentumok keresése Szóalakot intelligens módon egymáshoz rendelő keresőrendszer Szóalakot intelligens módon egymáshoz rendelő keresőrendszer

Számítógépes szótárak Számítógépes szótárak o Szótövesítés o Több szótáradatbázis használata Gyorsfordító Gyorsfordító Összetette fordítástámogató programok Összetette fordítástámogató programok o Terminológiakezelő rendszer o Terminológia adatbázis o Fordítómemória o Fordítások bevitele a fordítómemóriába o Szövegszinkronizáló programok

„Valódi” információkeresés megvalósítása „Valódi” információkeresés megvalósítása A fejlődéshez szükséges nyelvtechnológiai fejlődések: A fejlődéshez szükséges nyelvtechnológiai fejlődések: o Nyelv szerkezetének fejlettebb modellekkel történő leírása o Ontológiák o Nyelvtani elemzés és a jelentés ábrázolása közti kapcsolat meghatározása Nyelvpárokhoz megjelenő gyorsfordítók Nyelvpárokhoz megjelenő gyorsfordítók Bonyolultabb fordítómemória kezelés Bonyolultabb fordítómemória kezelés