Az előadás letöltése folymat van. Kérjük, várjon

Az előadás letöltése folymat van. Kérjük, várjon

Vincze Veronika vinczev@inf.u-szeged.hu Korpuszok a nyelvészeti kutatásban: Bevezetés, követelmények ismertetése Vincze Veronika vinczev@inf.u-szeged.hu.

Hasonló előadás


Az előadások a következő témára: "Vincze Veronika vinczev@inf.u-szeged.hu Korpuszok a nyelvészeti kutatásban: Bevezetés, követelmények ismertetése Vincze Veronika vinczev@inf.u-szeged.hu."— Előadás másolata:

1 Vincze Veronika vinczev@inf.u-szeged.hu
Korpuszok a nyelvészeti kutatásban: Bevezetés, követelmények ismertetése Vincze Veronika Korpuszok a nyelvészeti kutatásban – szeptember 20.

2 Bevezetés Nyelvészeti kutatásmódszertan
Adatorientált / elméletorientált módszerek Kompetencia / performancia Honnan származnak a nyelvi adatok?

3 Adatgyűjtés Intuíció alapján Adatközlőktől gyűjtött adatok Korpuszok

4 Alapfogalmak Korpusz: speciális célokra létrehozott, (gyakran tematikus) adatbázis – „szöveggyűjtemény” Annotáció: a szövegek nyelvi információval történő kézi jelölése (és kézi ellenőrzése) Korpusznyelvészet: korpuszban található nyelvi adatok elemzése

5 Korpusztípusok Egynyelvű
Többnyelvű – párhuzamos korpusz: ugyanazok az adatok egynél több nyelven Beszédkorpusz: hanganyagok Írott nyelvi korpusz: szövegek

6 Szegedi korpuszok Szeged Treebank Szeged Dependencia Treebank
Bizonytalanságra annotált korpuszok Tulajdonnévkorpuszok Lemmatizált tulajdonnevek Többszavas kifejezések korpuszai Jelentés-egyértelműsített korpusz Kutatói adatok HTML korpusza SzegedParalell HunOr Véleménydetekciós korpusz Kulcsszókinyerési korpuszok HunLearner

7 Kutatási témák Saját BA-szakdolgozat / MA-szakdolgozati téma?
Milyen korpusz lenne/lett volna hasznos? Létezik-e?

8 A kurzus célja Miként használatosak a korpuszok és egyéb nyelvi adatbázisok a nyelvészeti kutatásban? A nyelvi adatgyűjtés módszertani követelményeinek áttekintése A korpuszépítés különböző lépései A korpuszból való adatgyűjtés módjai Adatok statisztikai elemzése

9 Tematika Nyelvi adatok, az adatgyűjtés módszertana
Korpuszok és adatbázisok Korpuszépítés, annotáció, nyelvi elemzés Adatgyűjtés korpuszból Statisztikai elemzések

10 Követelmények Saját minikorpusz létrehozása
Az abból kigyűjtött adatok rendszerezése, statisztikai elemzése A projekt bemutatása a félév végén Beadandó: a kész korpusz + az elemzés leírása

11 Menetrend Saját korpusz megtervezése: november 11.
Beadandó leírás elkészítése: december 4. Bemutató tartása: december 6.

12 Elérhetőség A kurzus anyaga elérhető:
MTA-SZTE Mesterséges Intelligencia Kutatócsoport 6720 Szeged, Tisza Lajos krt /b szoba Telefon: Fogadóóra: előzetes egyeztetés alapján


Letölteni ppt "Vincze Veronika vinczev@inf.u-szeged.hu Korpuszok a nyelvészeti kutatásban: Bevezetés, követelmények ismertetése Vincze Veronika vinczev@inf.u-szeged.hu."

Hasonló előadás


Google Hirdetések