Az előadás letöltése folymat van. Kérjük, várjon

Az előadás letöltése folymat van. Kérjük, várjon

Leíró nyelvtan - adatbázisból

Hasonló előadás


Az előadások a következő témára: "Leíró nyelvtan - adatbázisból"— Előadás másolata:

1 Leíró nyelvtan - adatbázisból
MSZNY2003 Szeged, december

2 LiLe – Linguistic Lexicon
PTE BTK Nyelvtudományi Tanszék Bódis Zoltán Kleiber Judit Szilágyi Éva Viszket Anita

3 Célkitűzések: 1. nyelvészeti lexikon
minden morfémánál az összes lehetséges információt tároljuk; a tulajdonságok és azok értékei szabadon bővíthetőek egy-egy tulajdonságot különböző értékekkel is elláthatunk ugyanazon morfémánál, pl: tányért / tányérat a különböző értékekhez különböző egyéb tulajdonságok rendelhetőek: szemantika, pragmatika, stilisztika akár elméleti, akár számítógépes modellek számára adatszolgáltatás, xml-formátumban minden morfémánál az összes lehetséges információt tároljuk, és a tulajdonságok és azok értékei szabadon bővíthetőek (mintha akárhány AVS-t definiálhatnánk) MSZNY, december

4 Példa: egy lexikai egység tulajdonságai

5 Célkitűzések: 2. leíró nyelvtan
előállítás: szabályok generálása az adatbázisban felvett fonológiai, morfológiai stb. tulajdonságokból. statisztika: mi hányszor „lép életbe”, hány LEE-hez van hozzárendelve. Ami sokhoz: szabály, ami kevéshez: kivétel. példák: szabály: magánhangzó harmónia (elölségi és kerekségi) szabályos kivételek: v-vel bővülés bizonyos töveknél: tő – tövek - tövön kivétel: részleges v-vel bővülés: szón, darun – lovon/ szavak, darvak – lovak). xml/xsl MSZNY, december

6 Célkitűzések: 3. oktatócsomag
oktatási segédanyag a nyelvtan gyakorlásához (általános iskolától egyetemig) felhasználóbarát felületen: változtathatók a morfémák tulajdonságai (nyitótő-e, mély hangrendű-e / nyitja-e a tő magánhangzóját, rövidít-e stb.) illetve beállítható, hogy egy-egy tulajdonság ellenőrzése ne lépjen életbe generálás: kiválasztott tő/toldalékhalmazon lefuttatható az összes lehetséges (szabályos) szóalak előállítása, és az egyes alakoknál megtekinthető, mely szabály (fonológiai tulajdonság + változó) eredményezte a szóalakot webes program MSZNY, december

7 Eredmények: 1. adatbázis
SQL-adatbázis okai: a szabadon bővíthető a tulajdonság-lista, programozói ismeretek nélkül totálisabbnál is totálisabb lexikalizmus: a szabályok is mind lexikai elemek = rekordok a keresés hatékonysága MSZNY, december

8 Példa: fonológia, morfológia az adatbázisban
MSZNY, december

9 Eredmények: 2. szóelemző
magyar főnévi inflexiós fonológia-morfológia részlegesen: nem minden jelenség csak az írásban releváns jegyek ez csak teszt arra nézve, hogy működik-e az adatbázis műveletek: háromféle elemzés szófaji egyezés morfémasorrend fonológiai egyezés kiírjuk a hiba okát natív program (egyelőre) MSZNY, december

10 Példa: szóelemző működése

11 kiírjuk a jó megoldást is
Jövőkép: ebben az évben (2003): kiírjuk a jó megoldást is morfémasorrend szabályai is adatbázisból, nem programból, a GASG elméletét véve alapul webes megjelenítés, xml/xsl következő év (2004): teljes főnévi és igei morfofonológia adatbázisban rögzítése (csak az írásban releváns jelenségek!), mindenhez példa-LEE-k adatbázis automatikus töltésének kidolgozása MSZNY, december

12 minden morfofonológiai szabályunk tesztelhető
Jövőkép: 2005-től 2005: oktatócsomag előnyei: nem kell nagy adatbázis (közoktatási tankönyvek egy részének feldolgozása elegendő) minden morfofonológiai szabályunk tesztelhető később: szintaxis szemantika MSZNY, december

13 Elérhetőségünk és támogatóink
Információk a LiLe-ről: Támogatók: PTE BTK Nyelvtudományi Tanszék GeLexi ( Dexter Kft.: fejlesztői környezet, infrastruktúra - Lőcsei Gábor: informatikus tanácsadó - Molnár István: informatikus tanácsadó MSZNY, december


Letölteni ppt "Leíró nyelvtan - adatbázisból"

Hasonló előadás


Google Hirdetések