Előadást letölteni
Az előadás letöltése folymat van. Kérjük, várjon
KiadtaIda Dobosné Megváltozta több, mint 6 éve
1
Vincze Veronika vinczev@inf.u-szeged.hu
Korpuszok a nyelvészeti kutatásban: Bevezetés, követelmények ismertetése Vincze Veronika Korpuszok a nyelvészeti kutatásban – szeptember 20.
2
Bevezetés Nyelvészeti kutatásmódszertan
Adatorientált / elméletorientált módszerek Kompetencia / performancia Honnan származnak a nyelvi adatok?
3
Adatgyűjtés Intuíció alapján Adatközlőktől gyűjtött adatok Korpuszok
4
Alapfogalmak Korpusz: speciális célokra létrehozott, (gyakran tematikus) adatbázis – „szöveggyűjtemény” Annotáció: a szövegek nyelvi információval történő kézi jelölése (és kézi ellenőrzése) Korpusznyelvészet: korpuszban található nyelvi adatok elemzése
5
Korpusztípusok Egynyelvű
Többnyelvű – párhuzamos korpusz: ugyanazok az adatok egynél több nyelven Beszédkorpusz: hanganyagok Írott nyelvi korpusz: szövegek
6
Szegedi korpuszok Szeged Treebank Szeged Dependencia Treebank
Bizonytalanságra annotált korpuszok Tulajdonnévkorpuszok Lemmatizált tulajdonnevek Többszavas kifejezések korpuszai Jelentés-egyértelműsített korpusz Kutatói adatok HTML korpusza SzegedParalell HunOr Véleménydetekciós korpusz Kulcsszókinyerési korpuszok HunLearner
7
Kutatási témák Saját BA-szakdolgozat / MA-szakdolgozati téma?
Milyen korpusz lenne/lett volna hasznos? Létezik-e?
8
A kurzus célja Miként használatosak a korpuszok és egyéb nyelvi adatbázisok a nyelvészeti kutatásban? A nyelvi adatgyűjtés módszertani követelményeinek áttekintése A korpuszépítés különböző lépései A korpuszból való adatgyűjtés módjai Adatok statisztikai elemzése
9
Tematika Nyelvi adatok, az adatgyűjtés módszertana
Korpuszok és adatbázisok Korpuszépítés, annotáció, nyelvi elemzés Adatgyűjtés korpuszból Statisztikai elemzések
10
Követelmények Saját minikorpusz létrehozása
Az abból kigyűjtött adatok rendszerezése, statisztikai elemzése A projekt bemutatása a félév végén Beadandó: a kész korpusz + az elemzés leírása
11
Menetrend Saját korpusz megtervezése: november 11.
Beadandó leírás elkészítése: december 4. Bemutató tartása: december 6.
12
Elérhetőség A kurzus anyaga elérhető:
MTA-SZTE Mesterséges Intelligencia Kutatócsoport 6720 Szeged, Tisza Lajos krt /b szoba Telefon: Fogadóóra: előzetes egyeztetés alapján
Hasonló előadás
© 2024 SlidePlayer.hu Inc.
All rights reserved.