Magyar nyelvi szintaktikai elemzőrendszerek Vincze Veronika Szegedi Tudományegyetem Informatikai Tanszékcsoport A magyar nyelv helyzete a digitális korban.

Slides:



Advertisements
Hasonló előadás
Digitális térképek összehasonlítása a gyakorlatban Szabó József – CadMap Kft. GITA 2011 Balatonalmádi.
Advertisements

A mondatelemzés modern útjai
Az OH TÁMOP fejlesztései
Gábor Kata MTA Nyelvtudományi Intézet Korpusznyelvészeti osztály Infotrend kiállítás A gépi ferdítéstől a gépifordításig.
AZ IGENEVEK.
A projekt az Európai Unió támogatásával, az Európai Szociális Alap társfinanszírozásával valósul meg. TÁMOP-4.2.1/B-09/1/KONV „A felsőoktatás.
Az információ alaptulajdonságai 1.Mérhető 2.Tudásunkra hat Értelmességi alapfeltétel értelmes >< igaz állítás.
A mondat szintagmatikus szerkezete
2003. november INFOtrend 2003 Váradi Tamás MTA Nyelvtudományi Intézet Korpusznyelvészeti Osztály Nyelvi technológiákkal az információs.
MI 2003/ Néhány probléma: - Hogyan fordítanánk angolra? - Hogyan érthetnénk meg egy rövid törénetet? - Miként lehetne kigyűjteni az MTI hírekből.
Az alany az a mondatrész, amelyről megállapítunk valamit.
Nyelvtechnológiai problémák március 10. Farkas Richárd PhD hallgató.
Gépi fordítás november 9. Daniel Jurafsky and James H. Martin: SPEECH and LANGUAGE PROCESSING, 2nd editon, 2009 alapján.
Korpuszok, szegmentálás és szófaji elemzés
Szintaktikai elemzés február 23..
Bevezetés a gépi tanulásba február 16.. Mesterséges Intelligencia „A számítógépes tudományok egy ága, amely az intelligens viselkedés automatizálásával.
A számítógépes nyelvfeldolgozás alapjai
A számítógépes nyelvfeldolgozás alapjai
Számítógépes nyelvészeti alkalmazások Farkas Richárd szept 7.
Korpuszok és adatbázisok
A számítógépes nyelvfeldolgozás alapjai
Mesterszakok (MSc): fizikatanár fizikus csillagász
Szintaktikai elemzés március 1.. Gépi tanulás Osztályozási feladat: Adott egyedek egy halmaza és azok osztályba tartozási függvénye (tanító halmaz),
A projekt az Európai Unió támogatásával, az Európai Szociális Alap társfinanszírozásával valósul meg. TÁMOP-4.2.1/B-09/1/KONV „A felsőoktatás.
Szófajok rendszere.
A tárgyas szószerkezet
A szövegszerkesztés alapjai
A szakdolgozat készítés minőségirányítási aspektusai
Bevezetés a terminológiába. input output Gépi feldolgozás Jelentés- független Jelentés- függő Információfeldolgozás.
A nyelv problémája természetes, és mesterséges nyelvek.
Objektum Vezérelt Szoftverek Analízise Ferenc Rudolf és Beszédes Árpád Szegedi Tudományegyetem FrontEndART.
4. Gyires Béla Informatikai Nap Debreceni Egyetem Informatikai Kar Új eredmények a Chomsky-féle (formális) nyelvtípusokkal kapcsolatban Dr. Nagy Benedek.
Korpuszok a nyelvészeti kutatásban: Bevezetés, követelmények ismertetése Vincze Veronika Korpuszok a nyelvészeti kutatásban – 2013.
Gábor Kata MTA Nyelvtudományi Intézet Korpusznyelvészeti osztály Magyar tudomány napja, A gépi ferdítéstől a gépifordításig.
2006. február 20. MANYE Korpuszok 1 Kiss Gábor - Sass Bálint A Magyar Nemzeti Szövegtár MNSZ.
Megoldottuk a számítógép nyelvét... Prószéky Gábor MTA, november 4. MTA, november 4.
A szöveg lekérdezése A NooJ rendszer alapjai
Fejmozgás alapú gesztusok felismerése Bertók Kornél, Fazekas Attila Debreceni Egyetem, Informatikai Kar Debreceni Képfeldolgozó Csoport KÉPAF 2013, Bakonybél.
Digitális tartalom előállítási képzés, alternatív foglalkoztatással mozgássérültek és megváltozott munkaképességűek számára HEFOP DAT Konferencia.
Nyelv-ész-gép Új technológiák az információs társadalomban.
Controlling a gyakorlatban
Idegen nyelvek tanulása
Budapest, június 28. Ontológia kezelő modul tervezése szöveges információt kezelő informatikai rendszer számára Förhécz András BME Méréstechnika.
Készítette: Terdik Sándor PTM IV. Ismeretszerzés természetes nyelvű dokumentumokból.
Természetes és formális nyelvek Jellemzők, szintaxis definiálása, Montague, extenzió - intenzió, kategóriákon alapuló gramatika, alkalmazások.
Szintaktikai, szemantikai szabályok
Yazix fordítás-segítő alkalmazás burgermeister zsolt varga koppány.
Logika 2. Klasszikus logika Miskolci Egyetem Állam- és Jogtudományi Kar Jogelméleti és Jogszociológiai Tanszék február 17.
Nyelvtechnológia Ladányi Enikő
Nyelvi nevelés 5-8. évfolyam 1. rész: A koncepció Molnár Cecília alapján aug
Slide 1/11 Bp BelAmI – Workshop Beszédtechnológia Helyzetkép
UNIVERSITY OF SZEGED D epartment of Software Engineering UNIVERSITAS SCIENTIARUM SZEGEDIENSIS 5.4 Szolgáltatói Keretrendszerek Prof. Dr. Gyimóthy Tibor,
Jó gyakorlatok listája Dobó István Gimnázium 2012.
Klasszikus héber nyelv 4.: Szintaxis
Példa Alapú Gépi Fordító Fejlesztése és Vizsgálata a World Wide Web Segítségével Magony Andor Számítógépes fordítástámogatás 2005 wEBMT: Developing and.
Germanisztika (német) alapszakos képzés
Nyelvi interfészek. IBM Watson 8:20 ill. 3:00.
Weblap-szerkesztés. Információs hálózati szolgáltatások Internet fontosabb szolgáltatásai (szóbeli) Elektronikus levelezési rendszer használata (szóbeli)
Nyelvtan és helyesírás tankönyvek
Leszoktatás gépi lélegeztetésről Molnár Zsolt Aneszteziológiai és Intenzív terápiás Intézet Szegedi Tudományegyetem 2012.
A generatív nyelvelmélet
 A TIOP pályázat SNI csomagjai  Gépi beszédfelismerés  Digitális tananyagok akadálymentesítése sajátos nevelési igényű tanulók számára  SNI IKT.
TÁMOP E-15/1/Konv Új generációs sporttudományi képzés és tartalomfejlesztés, hazai és nemzetközi hálózatfejlesztés és társadalmasítása.
Programok készítése és futtatása. Integrált fejlesztői környezet (IDE) tartalmaz:  szövegszerkesztőt a program forráskódjának szerkesztésére,  fordítóprogramot.
AP1 - SPORTTUDOMÁNYI KÉPZÉS ÉS TARTALOMFEJLESZTÉS
Bevezetés a nyelvtudományba 3. Nyelvi szintek
Vincze Veronika Korpuszok a nyelvészeti kutatásban: Bevezetés, követelmények ismertetése Vincze Veronika
Leíró nyelvtan - adatbázisból
A MorphoLogic gépi fordítórendszere
Nagy Attila1,2, Rovó László1, Kiss József Géza1
Előadás másolata:

Magyar nyelvi szintaktikai elemzőrendszerek Vincze Veronika Szegedi Tudományegyetem Informatikai Tanszékcsoport A magyar nyelv helyzete a digitális korban – Magyar nyelv- és beszédtechnológiai nap január 18.

Bevezetés Szintaxis: mondat szavai között levő nyelvtani kapcsolatok (alany- ige, főnév-névutó stb.) azonosítása (gépi úton) Szövegek nyelvtechnológiai feldolgozásának egy lépése

Szintaxis az alkalmazásokban A szintaktikai elemzés általában előfeldolgozó lépés egy magasabb rendű feladathoz Gépi fordítás Tegnap az irodában Péter öt levelet írt. TEMPLOCSUBJ OBJ VERB Peter wrote five letters in the office yesterday. SUBJ VERB OBJLOCTEMP

Számítógépes szintaxis Szabályalapú elemzés Statisztikai elemzés –Nagyméretű adatbázisok (treebankek) –Elemzők (parserek) –Konstituens-nyelvtan –Függőségi nyelvtan

Statisztikai szintaktikai elemzés Angol nyelvre kifejlesztett technológiák Konstituens- és függőségi alapú elemzők Kötött szórend vs. szabad szórend Nehezebb-e a magyar, mint az angol?

Magyar nyelvű szintaktikai elemzés Magyar: –Ragozó nyelv (gazdag morfológia) –Szabad szórend Szeged (Dependencia) Treebank 1,2M szövegszó mondat Konstituensalapú és függőségi kézi elemzés Statisztikai elemzők betanítása és kiértékelése

Kísérletek Angol elemzők magyar nyelvre történő adaptálása Konstituens- és függőségi elemző is elfogadható eredményeket nyújt Nyelvspecifikus hibák

Virtuális csomópontok létige kijelentő mód jelen idő E/3. alakja nem jelenik meg a felszínen: András katona (*van). András legyen katona! András katona lesz. azonos kezelési mód: András VAN katona.

Távoli függőségek Összetartozó elemek távol helyezkednek el egymástól A fiúnak látta a kutyáját. Melléknévi igenevek és főnévi igenevek módosítói A század elején jól bevált módszerhez próbálnak meg visszatérni. Meg kívánta ragadni az alkalmat.

Összegzés Magyar nyelvű szintaktikai elemzés Viszonylag jók a magyar eredmények – nem nehezebb nyelv a magyar Nyelvspecifikus sajátosságokra érdemes koncentrálni