Az előadás letöltése folymat van. Kérjük, várjon

Az előadás letöltése folymat van. Kérjük, várjon

Oktatási és kutatási adatbázis fejlesztése

Hasonló előadás


Az előadások a következő témára: "Oktatási és kutatási adatbázis fejlesztése"— Előadás másolata:

1 Oktatási és kutatási adatbázis fejlesztése
Nyelvészeti lexikon Oktatási és kutatási adatbázis fejlesztése Multimédia az oktatásban Pécs, október. 10.

2 LiLe – Linguistic Lexicon
PTE BTK Nyelvtudományi Tanszék Bódis Zoltán Kleiber Judit Szilágyi Éva Viszket Anita Multimédia az oktatásban - Pécs, október. 10.

3 Az előadás felépítése:
1. célkitűzések 2. az alapul vett nyelvészeti kutatás eddigi eredményeinek rövid ismertetése 3. a LiLe-projekt adatbázisának felépítése 4. jövőkép 5. hivatkozások 6. támogatóink Multimédia az oktatásban - Pécs, október. 10.

4 1. Célkitűzések 1.1 A magyar nyelvtan oktatása az általános és középiskolákban - a jelenlegi közoktatási modell elavultsága - érdektelenség (nincs semmi játékosság, látványosság, ami a gyerekeket motiválná, hiányzik az élmény és a tapasztalat a tanulásból)   Az országban több helyen (pl. PTE BTK Nyelvtudományi Tanszék, MTA Nyelvtudományi Intézet) folyik olyan projekt, mely új modern közoktatási tananyag kifejlesztésén dolgozik, és ami modern nyelvészeti tudáson alapul. Multimédia az oktatásban - Pécs, október. 10.

5 1. Célkitűzések 1.2 Idegen nyelv oktatása Praktikus lenne egy olyan segédeszköz, ami egy toldalékolt szó vagy egy egész mondat helyességét ellenőrizné, és megadná azt is, miért nem helyes a beírt szöveg, milyen szabályokat sért. Magyar mint idegen nyelv tanítása  különösen érdekes, hiszen a magyar agglutináló nyelv; és a szavakon belüli morfémahatárokon a fonológiai szabályok is jelentőséggel bírnak. Multimédia az oktatásban - Pécs, október. 10.

6 1. Célkitűzések 1.3 Példák: milyen szabályok gyakorlását segítheti az adatbázisunk A szabályok megadása: a lexikonban, vagyis kezelhetőek a kivételek és az azonos szabályok szerint működő szó-csoportok példa: hangtan példa: mondattan Multimédia az oktatásban - Pécs, október. 10.

7 1. Célkitűzések 1. hangrendi illeszkedés - kikereshetőek azok a szavak, ahol működik a hangrendi illeszkedés (ház-zal, kéz-zel) - ahol ingadozik (férfi-vel, férfi-val) - ahol nem a hangrendi szabályok érvényesülnek (hid-ak); - felfedezhető, hogy az illeszkedésen kívül más szabályok is működnek (hal-ak, pad-ok) Multimédia az oktatásban - Pécs, október. 10.

8 1. Célkitűzések 2. vonzatstruktúra - egy-egy ige esetén kikereshetőek a kötelező vonzatok, a fakultatív vonzatok és a szabad bővítmények: a, kötelező vonzat (tárgy) *Péter kerestette. Péter kerestette Marit. b, fakultatív vonzat („eszközhatározó”/ „társhatározó”?) Péter kerestette Marit. Péter kerestette Marit a rendőrséggel. ?Péter nevetett a rendőrséggel. c, szabad bővítmény (időhatározó) Péter kerestette Marit a rendőrséggel. Péter egész nap kerestette Marit a rendőrséggel.

9 2. Nyelvészeti előzmények
2.1 Elméleti alapok: GASG - Totálisan lexikalista nyelvtan: Generative/Generalized Argument Structure Grammar (Alberti Gábor) - Alapegységek: morfémák - A mondat összerakásának módját ágrajzok helyett a morfémáknál megadott tulajdonságok írják le - Jelenlegi helyzet: fejlesztés alatt álló szó- és mondatelemző program Prologban (GeLexi-projekt) Multimédia az oktatásban - Pécs, október. 10.

10 2. Nyelvészeti előzmények
2.2 GeLexi - a program eldönti egy beírt magyar szósorról, hogy - az egyes szavak jólformáltak-e (morfofonológiai komponens) - grammatikus mondatot alkot-e (szintaktikai komponens) - ha mindez teljesül, kiírja - a mondatot alkotó morfémákat (tövek és toldalékok) - a morfémák közti grammatikai viszonyokat - a mondat „jelentését” (DRS) példa:fonológiai, morfológia példa: szintaktikai Multimédia az oktatásban - Pécs, október. 10.

11 2. Nyelvészeti előzmények
1. morfofonológiai grammword("Házakkal."). Ház:n(1,1,li(m("","ház",""),labstem("house",phonfst(2,2,2,1),1,[]))) ak: n(1,2,li(m("V","k",""),labsuff("pl",phonfsu(1,1,1,1),1,1))) kal:n(1,3,li(m("S","A","l"),labsuff("INSTR",phonfsu(1,2,2,3),1,4))) yes grammword("Házot."). no 2. szintaktikai gramm("Péter keresteti."). no gramm("Péter keresteti a lányt."). … yes gramm("Péter keresteti a lányt a rendőrséggel."). … yes

12 - nem felhasználóbarát felület
2. Nyelvészeti előzmények 2.3 A program hátrányai - nem felhasználóbarát felület - hiányzik egy alaposan kidolgozott adatbázis: - növekvő szókészlet, lassuló futás - a bővítés túl nagy munka Az adatbázis megtervezése/-építése egy külön hallgatói kezdeményezés: LiLe-projekt.

13 3. LiLe-projekt 3.1 Az adatbázis: miért nem emelhető be más korpusz? - az adatbázis szabad és kötött morfémákat tartalmaz, valamint az ezekhez kötődő nyelvtani szabályokat, amik befolyásolják a lexikai egységek szintaktikai, szemantikai, morfológiai, fonológiai, stilisztikai viselkedését részletesen kidolgozott tulajdonságok az adatbázisban, hogy a modell pusztán lexikai alapokon működhessen - példák tulajdonságokra: 1. szemantikai szabályok 2. szintaktikai szabályok Multimédia az oktatásban - Pécs, október. 10.

14 szemantikai: a predikátum idő- és térstruktúrája
3. LiLe-projekt 3.2 Példák a szabályokra szemantikai: a predikátum idő- és térstruktúrája *Péter két órán át hazaért. Péter két órára hazaért. *Péter tüsszentett az irodához. Péter tüsszentett az irodában. - szintaktikai: a jelző és a jelzett szó viszonya a magyarban és a franciában *Egy nyúl fehér ül a szobában. Egy fehér nyúl ül a szobában. Un lapin blanc assis dans la chambre. *Un blanc lapin assis dans la chambre. Multimédia az oktatásban - Pécs, október. 10.

15 3. LiLe-projekt 3.3 Technológia - relációs adatbázis - dinamikus bővíthetőség: egy-egy új tulajdonság új rekordként és nem mezőként jelenik meg az adatbázisban - az adatbázis feltöltése jelen fázisban visszahat az adatbázis-struktúra tervezésére - Delphiben írt feltöltőprogram - webes megjelenítés: XML/XSL Multimédia az oktatásban - Pécs, október. 10.

16 3. LiLe-projekt 3.4 Az adatbázis feltöltésének módszerei - hallgatói projekt, mely felsőoktatási tananyaggá bővül 1. magyar leíró nyelvészet oktatása az adatbázis feltöltésén keresztül 2. az adatbázis feltöltésének automatizált módszerei – pl. morfokra tagolás disztribúciós módszerrel (a módszer lényege: az azonos karakterekből álló betűsorokat azonos morfoknak tekinti a szoftver és a mondatbeli elhelyezkedésük vagy toldalékolásuk alapján hoz döntést arról, hogy ugyanahhoz a morfémához tartoznak-e vagy sem: vár-ak, vár-ok, vár-t, vár-at) Multimédia az oktatásban - Pécs, október. 10.

17 3. LiLe-projekt 3.5 Mint oktatási segédanyag (folyamatban) - felhasználóbarát felület - nyelvfüggetlen - modularizált: kiválasztható, mely szabály alkalmazását szeretnénk gyakorolni – életkori sajátosságokhoz igazodhat Példa: - morfémákra bontásnál a kötőhang vizsgálatakor a következő lépésekben folyhat a tanulás: a, van vagy nincs kötőhang b, hogyan illeszkedik a szótő hangrendjéhez c, egyéb módosulások: kerekségi harmónia, nyúlási jelenségek, nyitótövek hatása Multimédia az oktatásban - Pécs, október. 10.

18 4. Jövőkép 4.1 A projekt hosszabb távú kilátásai GeLexi célkitűzése: fordítóprogram LiLe: ehhez adatbázis, és ennek közbülső alkalmazásai: - n-nyelvű szótár - morfológia és fonológia is egy konkrét szóhoz (szemben a puszta lemmatizálással)   Amit elemezni tud, azt generálni is – a Prolog ezen erejét megtartva eljutni a fordítóprogramhoz. GASG-hez csatolt LDRS-sel szövegfordításra is alkalmassá válhat. Multimédia az oktatásban - Pécs, október. 10.

19 5. Hivatkozások A GeLexi-vel kapcsolatos cikkek, poszterek elérhetősége: – Alberti, G. 1999: GASG: “The Grammar of Total Lexicalism”. Working Papers in the Theory of Grammar 6/1. Theoretical Linguistics Programme, Budapest University and Research Institute for Linguistics, Hungarian Academy of Sciences. – Alberti, G. 2000: Lifelong Discourse Representation Structures. Gothenburg Papers in Computational Linguistics 00‑5, Sweden, 13‑20. – Alberti, G. 2001a: Indo-Germanic Word Order Phenomena in a Totally Lexicalist Grammar. Sprachtheorie und germanistische Linguistik 11.2., Debrecen, Hungary, – Alberti, G. 2001b: Morphological Relations and Idioms in a Totally Lexicalist Grammar. Argument Structure in Hungarian, ed. by I. Kenesei. Akadémiai Kiadó, Budapest, Hungary, – Alberti, G., K. Balogh, J. Kleiber 2002a: GeLexi Project: Prolog Implementation of a Totally Lexicalist Grammar. Proceedings of the Third and Fourth Tbilisi Symposium on Language, Logic and Computation, ed. by de Jongh, Zeevat and Nilsenova. ILLC, Amsterdam, and Univ. of Tbilisi. – Alberti, G., K. Balogh, J. Kleiber, A. Viszket 2002b: Totally Lexicalist Morphology. Talk at the Sixth Int. Conf. on the Structure of Hungarian. Düsseldorf, Germany. – Alberti, G., K. Balogh, J. Kleiber, A. Viszket 2003: Total Lexicalism and GASGrammars: A Direct Way to Semantics. Proceedings of CICLing2003, (Mexico City), ed. by A. Gelbukh. Lecture Notes in Computer Science N2588, 37-48, Springer-Verlag.

20 6. Támogatóink PTE BTK Nyelvtudományi Tanszék: kurzusok, segédanyagok - Dexter Kft.: fejlesztői környezet, infrastruktúra - Lőcsei Gábor: informatikus tanácsadó - Molnár István : informatikus tanácsadó Multimédia az oktatásban - Pécs, október. 10.


Letölteni ppt "Oktatási és kutatási adatbázis fejlesztése"

Hasonló előadás


Google Hirdetések