Oktatási és kutatási adatbázis fejlesztése

Slides:



Advertisements
Hasonló előadás
A mondatelemzés modern útjai
Advertisements

A projekt az Európai Unió támogatásával, az Európai Szociális Alap társfinanszírozásával valósul meg. TÁMOP-4.2.1/B-09/1/KONV „A felsőoktatás.
ELŐADÁS INDÍTÁSA Előadó: Dr. Nikolov Marianne és Dr. Ottó István Angol Alkalmazott Nyelvészeti Tanszék E-learning a CooSpace rendszerben: egy kísérleti.
2003. november INFOtrend 2003 Váradi Tamás MTA Nyelvtudományi Intézet Korpusznyelvészeti Osztály Nyelvi technológiákkal az információs.
Tájékoztató az Anglisztika MA-ról Cser András PPKE BTK Angol Intézet október 9.
Tisztelt Látogatóink! Szeretnénk rövid tájékoztatást adni az általános iskolában megvalósuló új tanulásszervezési eljárásokról és azok tartalmáról a TÁMOP.
Adatbázis rendszerek I Relációs kalkulus Általános Informatikai Tsz. Dr. Kovács László.
Nyitórendezvény „Szak-nyelv-tudás” – Az idegen nyelvi képzési rendszer fejlesztése a Debreceni Egyetemen TÁMOP D-12/1/KONV
Kisvállalkozói Szakirány Belső vállalkozásokkal dinamizálni a nagyvállalatokat! Kisvállalkozói Szakirány!
Logika Miskolci Egyetem Állam- és Jogtudományi Kar
Microsoft IT Akadémia Sisák Zoltán
Szintaktikai elemzés február 23..
A számítógépes nyelvfeldolgozás alapjai
Szintaktikai elemzés március 1.. Gépi tanulás Osztályozási feladat: Adott egyedek egy halmaza és azok osztályba tartozási függvénye (tanító halmaz),
Annotáció, annotációs útmutató
MTA-DE-PTE-SZTE Elméleti Nyelvészeti Kutatócsoport Szegedi Munkacsoport 2007–2011 Bibok Károly, Maleczki Márta, Nagy Katalin, Németh T. Enikő, Vecsey Zoltán.
A projekt az Európai Unió támogatásával, az Európai Szociális Alap társfinanszírozásával valósul meg. TÁMOP-4.2.1/B-09/1/KONV „A felsőoktatás.
EISZ Elektronikus Információszolgáltatás melléklet a Bevezetés a pedagógiai tájékozódásba című ELTE jegyzethez.
Tájékoztató az Anglisztika MA-ról Cser András PPKE BTK Angol Intézet október 18.
Kmety Andrea május 13.. Az Alexandriai Könyvtár egykor és ma.
DoktorInfo Egészségügyi telefonos és internetes tanácsadó rendszer előkészítése (és megvalósítása) Dr. Gaál Péter, Lendvai Ferenc szeptember 22.
A nyelv problémája természetes, és mesterséges nyelvek.
Lehet-e távolból tanítani? Kovács Győző és a Távoktatás.
MINŐSÉGFEJLESZTÉS A FELSŐOKTATÁSBAN TÁMOP kiemelt program VESZPRÉM 2007 november 28.
Ittzés Zsigmond Budapest Airport IT Infrastruktúra manager
A multimédia és a közösségi hálózatok a hatékony nyelvtanulásban Debreceni Egyetem Informatika Tudományok Doktori Iskola PhD Konferencia, Hollókő, 2013.
Óvodáskorú gyermekek szóaktiválásának funkcionális vizsgálata
2006. február 20. MANYE Korpuszok 1 Kiss Gábor - Sass Bálint A Magyar Nemzeti Szövegtár MNSZ.
Megoldottuk a számítógép nyelvét... Prószéky Gábor MTA, november 4. MTA, november 4.
2006. február 20. Párhuzamos korpuszok Tartalom definíció és terminológia alkalmazási lehetőségek gyakorlati nehézségek publikus és ingyenes korpuszok.
Magyar nyelvi szintaktikai elemzőrendszerek Vincze Veronika Szegedi Tudományegyetem Informatikai Tanszékcsoport A magyar nyelv helyzete a digitális korban.
Az Utónévkereső portál előzményei Raátz Judit raatz. mta
Idegen nyelvek tanulása
Modelltranszformációs szabályok automatikus generálása példák alapján Balogh Zoltán IV. évf. informatikus Konzulens: Dr. Varró Dániel Méréstechnika és.
Kommunikáció az egyetemen hallgatói konferencia Pécs, április 26.
Kommunikáció az egyetemen hallgatói konferencia Pécs, április 14.
Készítette: Terdik Sándor PTM IV. Ismeretszerzés természetes nyelvű dokumentumokból.
Természetes és formális nyelvek Jellemzők, szintaxis definiálása, Montague, extenzió - intenzió, kategóriákon alapuló gramatika, alkalmazások.
Szintaktikai, szemantikai szabályok
Zsolt Námesztovszki, Hungarian Language Teacher Training Faculty, Subotica, University of Novi Sad, Subotica, Strosmayer 11., Márta Takács Budapest.
Nyelvi nevelés 5-8. évfolyam 1. rész: A koncepció Molnár Cecília alapján aug
Logika Miskolci Egyetem Állam- és Jogtudományi Kar Jogelméleti és Jogszociológiai Tanszék.
Az EDUCOOP-projekt szakmai programja
de français BEMUTATÁS Csűry István DE Francia Tanszék.
Avagy: Mit lát a pitypang magja repülés közben?
Klasszikus héber nyelv 4.: Szintaxis
Példa Alapú Gépi Fordító Fejlesztése és Vizsgálata a World Wide Web Segítségével Magony Andor Számítógépes fordítástámogatás 2005 wEBMT: Developing and.
Optimalitás elmélet Torma Nóra kiselőadása. Optimality Theory, OT Kortárs elméleti keret Sok mindenben eltér az SPE-től.
MODERN ÜGYVITELI GYAKORLÓHELY KIALAKÍTÁSA A NYÍREGYHÁZI FŐISKOLÁN
Prozódikus fonológia ●a fonológiai tartományok elmélete ●prozodikus tartomány - melyben az adott szabály működésbe lép, szegmentumok szintje.
2014/15 I.félév Sárközi-Lindner Zsófia.  cél: a szótáron belül (lexémák) m ű köd ő szabályok leírása  fonológiai és morfológiai szabályok ’együttm ű.
A csapat SZERZŐK: KJUC – Gorász Judit Kiszely Zoltán
Klasszikus (lineáris) Generatív Fonológia
Adatbázisszintű adatmodellek
Nyelvészeti módszerek és irányzatok, bibliai és rabbinikus héber BMA-HEBD-111, P/TÖ/HB-1, BBV , BMVD Biró Tamás április 14.: Strukturalista.
A generatív nyelvelmélet
A szintagmák (szószerkezetek).
Párhuzamos korpuszok, nagy lexikai adatbázisok, glosszázott finnugor mondatok Finnugor Szeminárium január 11., Debrecen Annotált korpuszok, avagy.
Logika szeminárium Barwise-Etchemendy: Language, Proof and Logic
Bevezetés a nyelvtudományba 3. Nyelvi szintek
A nyelvtan szerepe és célja
Tájékoztató az osztatlan képzésben tanuló Academic 1 vizsgával rendelkező angoltanár szakos hallgató számára február 13.
Magyar Tudományos Művek Tára (MTMT)
Programozási nyelvek alapfogalmai
Bódis – Kleiber – Szilágyi – Viszket
Tájékoztató az osztatlan képzésben tanuló Academic 1 vizsgával még nem rendelkező angoltanár szakos hallgató számára február 13.
Leíró nyelvtan - adatbázisból
A nyelvi tudatosság fejlesztése Meixner Iskola, Szakmai nap
beruházás-tervezési ABCD
Informatikai gyakorlatok 11. évfolyam
Előadás másolata:

Oktatási és kutatási adatbázis fejlesztése Nyelvészeti lexikon Oktatási és kutatási adatbázis fejlesztése Multimédia az oktatásban Pécs, 2003. október. 10.

LiLe – Linguistic Lexicon lile@btk.pte.hu PTE BTK Nyelvtudományi Tanszék Bódis Zoltán Kleiber Judit Szilágyi Éva Viszket Anita Multimédia az oktatásban - Pécs, 2003. október. 10.

Az előadás felépítése: 1. célkitűzések 2. az alapul vett nyelvészeti kutatás eddigi eredményeinek rövid ismertetése 3. a LiLe-projekt adatbázisának felépítése 4. jövőkép 5. hivatkozások 6. támogatóink Multimédia az oktatásban - Pécs, 2003. október. 10.

1. Célkitűzések 1.1 A magyar nyelvtan oktatása az általános és középiskolákban - a jelenlegi közoktatási modell elavultsága - érdektelenség (nincs semmi játékosság, látványosság, ami a gyerekeket motiválná, hiányzik az élmény és a tapasztalat a tanulásból)   Az országban több helyen (pl. PTE BTK Nyelvtudományi Tanszék, MTA Nyelvtudományi Intézet) folyik olyan projekt, mely új modern közoktatási tananyag kifejlesztésén dolgozik, és ami modern nyelvészeti tudáson alapul. Multimédia az oktatásban - Pécs, 2003. október. 10.

1. Célkitűzések 1.2 Idegen nyelv oktatása Praktikus lenne egy olyan segédeszköz, ami egy toldalékolt szó vagy egy egész mondat helyességét ellenőrizné, és megadná azt is, miért nem helyes a beírt szöveg, milyen szabályokat sért. Magyar mint idegen nyelv tanítása  különösen érdekes, hiszen a magyar agglutináló nyelv; és a szavakon belüli morfémahatárokon a fonológiai szabályok is jelentőséggel bírnak. Multimédia az oktatásban - Pécs, 2003. október. 10.

1. Célkitűzések 1.3 Példák: milyen szabályok gyakorlását segítheti az adatbázisunk A szabályok megadása: a lexikonban, vagyis kezelhetőek a kivételek és az azonos szabályok szerint működő szó-csoportok. 1. példa: hangtan 2. példa: mondattan Multimédia az oktatásban - Pécs, 2003. október. 10.

1. Célkitűzések 1. hangrendi illeszkedés - kikereshetőek azok a szavak, ahol működik a hangrendi illeszkedés (ház-zal, kéz-zel) - ahol ingadozik (férfi-vel, férfi-val) - ahol nem a hangrendi szabályok érvényesülnek (hid-ak); - felfedezhető, hogy az illeszkedésen kívül más szabályok is működnek (hal-ak, pad-ok) Multimédia az oktatásban - Pécs, 2003. október. 10.

1. Célkitűzések 2. vonzatstruktúra - egy-egy ige esetén kikereshetőek a kötelező vonzatok, a fakultatív vonzatok és a szabad bővítmények: a, kötelező vonzat (tárgy) *Péter kerestette. Péter kerestette Marit. b, fakultatív vonzat („eszközhatározó”/ „társhatározó”?) Péter kerestette Marit. Péter kerestette Marit a rendőrséggel. ?Péter nevetett a rendőrséggel. c, szabad bővítmény (időhatározó) Péter kerestette Marit a rendőrséggel. Péter egész nap kerestette Marit a rendőrséggel.

2. Nyelvészeti előzmények 2.1 Elméleti alapok: GASG - Totálisan lexikalista nyelvtan: Generative/Generalized Argument Structure Grammar (Alberti Gábor) - Alapegységek: morfémák - A mondat összerakásának módját ágrajzok helyett a morfémáknál megadott tulajdonságok írják le - Jelenlegi helyzet: fejlesztés alatt álló szó- és mondatelemző program Prologban (GeLexi-projekt) Multimédia az oktatásban - Pécs, 2003. október. 10.

2. Nyelvészeti előzmények 2.2 GeLexi - a program eldönti egy beírt magyar szósorról, hogy - az egyes szavak jólformáltak-e (morfofonológiai komponens) - grammatikus mondatot alkot-e (szintaktikai komponens) - ha mindez teljesül, kiírja - a mondatot alkotó morfémákat (tövek és toldalékok) - a morfémák közti grammatikai viszonyokat - a mondat „jelentését” (DRS) 1. példa:fonológiai, morfológia 2. példa: szintaktikai Multimédia az oktatásban - Pécs, 2003. október. 10.

2. Nyelvészeti előzmények 1. morfofonológiai grammword("Házakkal."). Ház:n(1,1,li(m("","ház",""),labstem("house",phonfst(2,2,2,1),1,[]))) ak: n(1,2,li(m("V","k",""),labsuff("pl",phonfsu(1,1,1,1),1,1))) kal:n(1,3,li(m("S","A","l"),labsuff("INSTR",phonfsu(1,2,2,3),1,4))) yes grammword("Házot."). no 2. szintaktikai gramm("Péter keresteti."). no gramm("Péter keresteti a lányt."). … yes gramm("Péter keresteti a lányt a rendőrséggel."). … yes

- nem felhasználóbarát felület 2. Nyelvészeti előzmények 2.3 A program hátrányai - nem felhasználóbarát felület - hiányzik egy alaposan kidolgozott adatbázis: - növekvő szókészlet, lassuló futás - a bővítés túl nagy munka Az adatbázis megtervezése/-építése egy külön hallgatói kezdeményezés: LiLe-projekt.

3. LiLe-projekt 3.1 Az adatbázis: miért nem emelhető be más korpusz? - az adatbázis szabad és kötött morfémákat tartalmaz, valamint az ezekhez kötődő nyelvtani szabályokat, amik befolyásolják a lexikai egységek szintaktikai, szemantikai, morfológiai, fonológiai, stilisztikai viselkedését. - részletesen kidolgozott tulajdonságok az adatbázisban, hogy a modell pusztán lexikai alapokon működhessen - példák tulajdonságokra: 1. szemantikai szabályok 2. szintaktikai szabályok Multimédia az oktatásban - Pécs, 2003. október. 10.

szemantikai: a predikátum idő- és térstruktúrája 3. LiLe-projekt 3.2 Példák a szabályokra szemantikai: a predikátum idő- és térstruktúrája *Péter két órán át hazaért. Péter két órára hazaért. *Péter tüsszentett az irodához. Péter tüsszentett az irodában. - szintaktikai: a jelző és a jelzett szó viszonya a magyarban és a franciában *Egy nyúl fehér ül a szobában. Egy fehér nyúl ül a szobában. Un lapin blanc assis dans la chambre. *Un blanc lapin assis dans la chambre. Multimédia az oktatásban - Pécs, 2003. október. 10.

3. LiLe-projekt 3.3 Technológia - relációs adatbázis - dinamikus bővíthetőség: egy-egy új tulajdonság új rekordként és nem mezőként jelenik meg az adatbázisban - az adatbázis feltöltése jelen fázisban visszahat az adatbázis-struktúra tervezésére - Delphiben írt feltöltőprogram - webes megjelenítés: XML/XSL Multimédia az oktatásban - Pécs, 2003. október. 10.

3. LiLe-projekt 3.4 Az adatbázis feltöltésének módszerei - hallgatói projekt, mely felsőoktatási tananyaggá bővül 1. magyar leíró nyelvészet oktatása az adatbázis feltöltésén keresztül 2. az adatbázis feltöltésének automatizált módszerei – pl. morfokra tagolás disztribúciós módszerrel (a módszer lényege: az azonos karakterekből álló betűsorokat azonos morfoknak tekinti a szoftver és a mondatbeli elhelyezkedésük vagy toldalékolásuk alapján hoz döntést arról, hogy ugyanahhoz a morfémához tartoznak-e vagy sem: vár-ak, vár-ok, vár-t, vár-at) Multimédia az oktatásban - Pécs, 2003. október. 10.

3. LiLe-projekt 3.5 Mint oktatási segédanyag (folyamatban) - felhasználóbarát felület - nyelvfüggetlen - modularizált: kiválasztható, mely szabály alkalmazását szeretnénk gyakorolni – életkori sajátosságokhoz igazodhat Példa: - morfémákra bontásnál a kötőhang vizsgálatakor a következő lépésekben folyhat a tanulás: a, van vagy nincs kötőhang b, hogyan illeszkedik a szótő hangrendjéhez c, egyéb módosulások: kerekségi harmónia, nyúlási jelenségek, nyitótövek hatása Multimédia az oktatásban - Pécs, 2003. október. 10.

4. Jövőkép 4.1 A projekt hosszabb távú kilátásai GeLexi célkitűzése: fordítóprogram LiLe: ehhez adatbázis, és ennek közbülső alkalmazásai: - n-nyelvű szótár - morfológia és fonológia is egy konkrét szóhoz (szemben a puszta lemmatizálással)   Amit elemezni tud, azt generálni is – a Prolog ezen erejét megtartva eljutni a fordítóprogramhoz. GASG-hez csatolt LDRS-sel szövegfordításra is alkalmassá válhat. Multimédia az oktatásban - Pécs, 2003. október. 10.

5. Hivatkozások A GeLexi-vel kapcsolatos cikkek, poszterek elérhetősége: http://lingua.btk.pte.hu/gelexi.asp – Alberti, G. 1999: GASG: “The Grammar of Total Lexicalism”. Working Papers in the Theory of Grammar 6/1. Theoretical Linguistics Programme, Budapest University and Research Institute for Linguistics, Hungarian Academy of Sciences. – Alberti, G. 2000: Lifelong Discourse Representation Structures. Gothenburg Papers in Computational Linguistics 00‑5, Sweden, 13‑20. – Alberti, G. 2001a: Indo-Germanic Word Order Phenomena in a Totally Lexicalist Grammar. Sprachtheorie und germanistische Linguistik 11.2., Debrecen, Hungary, 135-193. – Alberti, G. 2001b: Morphological Relations and Idioms in a Totally Lexicalist Grammar. Argument Structure in Hungarian, ed. by I. Kenesei. Akadémiai Kiadó, Budapest, Hungary, 201-235. – Alberti, G., K. Balogh, J. Kleiber 2002a: GeLexi Project: Prolog Implementation of a Totally Lexicalist Grammar. Proceedings of the Third and Fourth Tbilisi Symposium on Language, Logic and Computation, ed. by de Jongh, Zeevat and Nilsenova. ILLC, Amsterdam, and Univ. of Tbilisi. – Alberti, G., K. Balogh, J. Kleiber, A. Viszket 2002b: Totally Lexicalist Morphology. Talk at the Sixth Int. Conf. on the Structure of Hungarian. Düsseldorf, Germany. – Alberti, G., K. Balogh, J. Kleiber, A. Viszket 2003: Total Lexicalism and GASGrammars: A Direct Way to Semantics. Proceedings of CICLing2003, (Mexico City), ed. by A. Gelbukh. Lecture Notes in Computer Science N2588, 37-48, Springer-Verlag.

6. Támogatóink PTE BTK Nyelvtudományi Tanszék: kurzusok, segédanyagok - Dexter Kft.: fejlesztői környezet, infrastruktúra - Lőcsei Gábor: informatikus tanácsadó - Molnár István : informatikus tanácsadó Multimédia az oktatásban - Pécs, 2003. október. 10.