Leíró nyelvtan - adatbázisból MSZNY2003 Szeged, 2003. december 10-11.
LiLe – Linguistic Lexicon lile@btk.pte.hu http://lingua.btk.pte.hu/lile.asp PTE BTK Nyelvtudományi Tanszék Bódis Zoltán Kleiber Judit Szilágyi Éva Viszket Anita
Célkitűzések: 1. nyelvészeti lexikon minden morfémánál az összes lehetséges információt tároljuk; a tulajdonságok és azok értékei szabadon bővíthetőek egy-egy tulajdonságot különböző értékekkel is elláthatunk ugyanazon morfémánál, pl: tányért / tányérat a különböző értékekhez különböző egyéb tulajdonságok rendelhetőek: szemantika, pragmatika, stilisztika akár elméleti, akár számítógépes modellek számára adatszolgáltatás, xml-formátumban minden morfémánál az összes lehetséges információt tároljuk, és a tulajdonságok és azok értékei szabadon bővíthetőek (mintha akárhány AVS-t definiálhatnánk) MSZNY, 2003. december 10-11.
Példa: egy lexikai egység tulajdonságai
Célkitűzések: 2. leíró nyelvtan előállítás: szabályok generálása az adatbázisban felvett fonológiai, morfológiai stb. tulajdonságokból. statisztika: mi hányszor „lép életbe”, hány LEE-hez van hozzárendelve. Ami sokhoz: szabály, ami kevéshez: kivétel. példák: szabály: magánhangzó harmónia (elölségi és kerekségi) szabályos kivételek: v-vel bővülés bizonyos töveknél: tő – tövek - tövön kivétel: részleges v-vel bővülés: szón, darun – lovon/ szavak, darvak – lovak). xml/xsl MSZNY, 2003. december 10-11.
Célkitűzések: 3. oktatócsomag oktatási segédanyag a nyelvtan gyakorlásához (általános iskolától egyetemig) felhasználóbarát felületen: változtathatók a morfémák tulajdonságai (nyitótő-e, mély hangrendű-e / nyitja-e a tő magánhangzóját, rövidít-e stb.) illetve beállítható, hogy egy-egy tulajdonság ellenőrzése ne lépjen életbe generálás: kiválasztott tő/toldalékhalmazon lefuttatható az összes lehetséges (szabályos) szóalak előállítása, és az egyes alakoknál megtekinthető, mely szabály (fonológiai tulajdonság + változó) eredményezte a szóalakot webes program MSZNY, 2003. december 10-11.
Eredmények: 1. adatbázis SQL-adatbázis okai: a szabadon bővíthető a tulajdonság-lista, programozói ismeretek nélkül totálisabbnál is totálisabb lexikalizmus: a szabályok is mind lexikai elemek = rekordok a keresés hatékonysága MSZNY, 2003. december 10-11.
Példa: fonológia, morfológia az adatbázisban MSZNY, 2003. december 10-11.
Eredmények: 2. szóelemző magyar főnévi inflexiós fonológia-morfológia részlegesen: nem minden jelenség csak az írásban releváns jegyek ez csak teszt arra nézve, hogy működik-e az adatbázis műveletek: háromféle elemzés szófaji egyezés morfémasorrend fonológiai egyezés kiírjuk a hiba okát natív program (egyelőre) MSZNY, 2003. december 10-11.
Példa: szóelemző működése
kiírjuk a jó megoldást is Jövőkép: 2003-2004 ebben az évben (2003): kiírjuk a jó megoldást is morfémasorrend szabályai is adatbázisból, nem programból, a GASG elméletét véve alapul webes megjelenítés, xml/xsl következő év (2004): teljes főnévi és igei morfofonológia adatbázisban rögzítése (csak az írásban releváns jelenségek!), mindenhez példa-LEE-k adatbázis automatikus töltésének kidolgozása MSZNY, 2003. december 10-11.
minden morfofonológiai szabályunk tesztelhető Jövőkép: 2005-től 2005: oktatócsomag előnyei: nem kell nagy adatbázis (közoktatási tankönyvek egy részének feldolgozása elegendő) minden morfofonológiai szabályunk tesztelhető később: szintaxis szemantika MSZNY, 2003. december 10-11.
Elérhetőségünk és támogatóink Információk a LiLe-ről: http://lingua.btk.pte.hu/lile.asp Támogatók: PTE BTK Nyelvtudományi Tanszék GeLexi (http://lingua.btk.pte.hu/gelexi.asp) Dexter Kft.: fejlesztői környezet, infrastruktúra - Lőcsei Gábor: informatikus tanácsadó - Molnár István: informatikus tanácsadó MSZNY, 2003. december 10-11.