Előadást letölteni
Az előadás letöltése folymat van. Kérjük, várjon
KiadtaVeronika Hegedűsné Megváltozta több, mint 10 éve
1
Korpuszok a nyelvészeti kutatásban: Bevezetés, követelmények ismertetése Vincze Veronika vinczev@inf.u-szeged.hu Korpuszok a nyelvészeti kutatásban – 2013. szeptember 5.
2
Bevezetés Nyelvészeti kutatásmódszertan Adatorientált / elméletorientált módszerek Kompetencia / performancia Honnan származnak a nyelvi adatok?
3
Adatgyűjtés Intuíció alapján Adatközlőktől gyűjtött adatok Korpuszok
4
Alapfogalmak Korpusz: speciális célokra létrehozott, (gyakran tematikus) adatbázis – „szöveggyűjtemény” Annotáció: a szövegek nyelvi információval történő kézi jelölése (és kézi ellenőrzése) Korpusznyelvészet: korpuszban található nyelvi adatok elemzése
5
Korpusztípusok Egynyelvű Többnyelvű – párhuzamos korpusz: ugyanazok az adatok egynél több nyelven Beszédkorpusz: hanganyagok Írott nyelvi korpusz: szövegek
6
Szegedi korpuszok Szeged Treebank Szeged Dependencia Treebank Bizonytalanságra annotált korpuszok Tulajdonnévkorpuszok Lemmatizált tulajdonnevek Többszavas kifejezések korpuszai Jelentés-egyértelműsített korpusz Kutatói adatok HTML korpusza SzegedParalell HunOr Véleménydetekciós korpusz Kulcsszókinyerési korpuszok HunLearner http://www.inf.u-szeged.hu/rgai/nlp_download
7
Kutatási témák Saját BA-szakdolgozat / MA- szakdolgozati téma? Milyen korpusz lenne/lett volna hasznos? Létezik-e?
8
A kurzus célja Miként használatosak a korpuszok és egyéb nyelvi adatbázisok a nyelvészeti kutatásban? A nyelvi adatgyűjtés módszertani követelményeinek áttekintése A korpuszépítés különböző lépései A korpuszból való adatgyűjtés módjai Adatok statisztikai elemzése
9
Tematika Nyelvi adatok, az adatgyűjtés módszertana Korpuszok és adatbázisok Korpuszépítés, annotáció, nyelvi elemzés Adatgyűjtés korpuszból Statisztikai elemzések
10
Követelmények saját minikorpusz létrehozása az abból kigyűjtött adatok rendszerezése, statisztikai elemzése Beadandó: a kész korpusz + az elemzés leírása
11
Menetrend Szeptember 12-én, 19-én, október 10-én és 17-én elmarad az óra! Pótlás később megbeszélendő módon és időpontban Beadandók elkészítése: a szemeszter vége
12
Elérhetőség A kurzus anyaga elérhető: http://www.inf.u-szeged.hu/~vinczev/oktatas.html MTA-SZTE Mesterséges Intelligencia Kutatócsoport 6720 Szeged, Tisza Lajos krt. 103. 45/b szoba Telefon: +36 62 544 140 Fogadóóra: előzetes egyeztetés alapján
Hasonló előadás
© 2024 SlidePlayer.hu Inc.
All rights reserved.