Az előadás letöltése folymat van. Kérjük, várjon

Az előadás letöltése folymat van. Kérjük, várjon

Korpuszok a nyelvészeti kutatásban: Bevezetés, követelmények ismertetése Vincze Veronika Korpuszok a nyelvészeti kutatásban – 2013.

Hasonló előadás


Az előadások a következő témára: "Korpuszok a nyelvészeti kutatásban: Bevezetés, követelmények ismertetése Vincze Veronika Korpuszok a nyelvészeti kutatásban – 2013."— Előadás másolata:

1 Korpuszok a nyelvészeti kutatásban: Bevezetés, követelmények ismertetése Vincze Veronika vinczev@inf.u-szeged.hu Korpuszok a nyelvészeti kutatásban – 2013. szeptember 5.

2 Bevezetés Nyelvészeti kutatásmódszertan Adatorientált / elméletorientált módszerek Kompetencia / performancia Honnan származnak a nyelvi adatok?

3 Adatgyűjtés Intuíció alapján Adatközlőktől gyűjtött adatok Korpuszok

4 Alapfogalmak Korpusz: speciális célokra létrehozott, (gyakran tematikus) adatbázis – „szöveggyűjtemény” Annotáció: a szövegek nyelvi információval történő kézi jelölése (és kézi ellenőrzése) Korpusznyelvészet: korpuszban található nyelvi adatok elemzése

5 Korpusztípusok Egynyelvű Többnyelvű – párhuzamos korpusz: ugyanazok az adatok egynél több nyelven Beszédkorpusz: hanganyagok Írott nyelvi korpusz: szövegek

6 Szegedi korpuszok Szeged Treebank Szeged Dependencia Treebank Bizonytalanságra annotált korpuszok Tulajdonnévkorpuszok Lemmatizált tulajdonnevek Többszavas kifejezések korpuszai Jelentés-egyértelműsített korpusz Kutatói adatok HTML korpusza SzegedParalell HunOr Véleménydetekciós korpusz Kulcsszókinyerési korpuszok HunLearner http://www.inf.u-szeged.hu/rgai/nlp_download

7 Kutatási témák Saját BA-szakdolgozat / MA- szakdolgozati téma? Milyen korpusz lenne/lett volna hasznos? Létezik-e?

8 A kurzus célja Miként használatosak a korpuszok és egyéb nyelvi adatbázisok a nyelvészeti kutatásban? A nyelvi adatgyűjtés módszertani követelményeinek áttekintése A korpuszépítés különböző lépései A korpuszból való adatgyűjtés módjai Adatok statisztikai elemzése

9 Tematika Nyelvi adatok, az adatgyűjtés módszertana Korpuszok és adatbázisok Korpuszépítés, annotáció, nyelvi elemzés Adatgyűjtés korpuszból Statisztikai elemzések

10 Követelmények saját minikorpusz létrehozása az abból kigyűjtött adatok rendszerezése, statisztikai elemzése Beadandó: a kész korpusz + az elemzés leírása

11 Menetrend Szeptember 12-én, 19-én, október 10-én és 17-én elmarad az óra! Pótlás később megbeszélendő módon és időpontban Beadandók elkészítése: a szemeszter vége

12 Elérhetőség A kurzus anyaga elérhető: http://www.inf.u-szeged.hu/~vinczev/oktatas.html MTA-SZTE Mesterséges Intelligencia Kutatócsoport 6720 Szeged, Tisza Lajos krt. 103. 45/b szoba Telefon: +36 62 544 140 Fogadóóra: előzetes egyeztetés alapján


Letölteni ppt "Korpuszok a nyelvészeti kutatásban: Bevezetés, követelmények ismertetése Vincze Veronika Korpuszok a nyelvészeti kutatásban – 2013."

Hasonló előadás


Google Hirdetések