Vincze Veronika vinczev@inf.u-szeged.hu Korpuszok a nyelvészeti kutatásban: Bevezetés, követelmények ismertetése Vincze Veronika vinczev@inf.u-szeged.hu.

Slides:



Advertisements
Hasonló előadás
A projekt az Európai Unió támogatásával, az Európai Szociális Alap társfinanszírozásával valósul meg. TÁMOP-4.2.1/B-09/1/KONV „A felsőoktatás.
Advertisements

Tájékoztató NGM_AK002 NGM_AK004 NGB_KM016_2. Fogadóóra Szorgalmi időszakban kedd óra között ig. 604-ben, más időpontban csak egyeztetés után!
2003. november INFOtrend 2003 Váradi Tamás MTA Nyelvtudományi Intézet Korpusznyelvészeti Osztály Nyelvi technológiákkal az információs.
A Leonardo kísérleti projekt célja: Az AIFSZ (illetve az ISCED szintnek megfelelő) képzések európai és hazai felmérése, elemzése Egy konkrét AIFSZ képzés.
Tanácsadási szolgáltatások „ A jövő önkormányzatának alapja Pusztamonostoron – ÁROP-1.A.2/A számú forrás felhasználásával” projektben Bíró Gabriella.
„CSOPORT VEZET CSOPORTOT”
A Magyar Nemzeti Szövegtár
Kutatási terv.
Készítette: Babinszki Helga TEJ3W9
Követelmények Szoftver- környezet SQL ismétlés ADATBÁZIS ALAPÚ RENDSZEREK.
‘rEUsearch’ Az Európai Unióhoz való csatlakozás hatásai a határon átnyúló kapcsolatokra, agráriumra és kereskedelemre – kutatási projekt (HURO/0801/075)
Számítógépes nyelvészeti alkalmazások Farkas Richárd szept 7.
Korpuszok és adatbázisok
Számítógépes Nyelvészet – nyelvi adatbázisok és használatuk
Korpuszok és adatbázisok A számítógépes nyelvfeldolgozás alapjai A számítógépes nyelvfeldolgozás alapjai – február 14.
Annotáció, annotációs útmutató
kötelező program, SZÁMONKÉRÉSEK
MTA-DE-PTE-SZTE Elméleti Nyelvészeti Kutatócsoport Szegedi Munkacsoport 2007–2011 Bibok Károly, Maleczki Márta, Nagy Katalin, Németh T. Enikő, Vecsey Zoltán.
A projekt az Európai Unió támogatásával, az Európai Szociális Alap társfinanszírozásával valósul meg. TÁMOP-4.2.1/B-09/1/KONV „A felsőoktatás.
Pénziránytű pénzügyi ismeretterjesztő honlap fiataloknak Háttér információk Szalay György Pénzügyi Kultúra Központ november 27.
| | Tananyagfejlesztések fejlesztői szemmel Wagner Balázs MTA SZTAKI.
TÁMOP szakmai támogatás Educatio Nonprofit Kft
Szótárak: fajták és tipologizálás
Korpuszok a nyelvészeti kutatásban: Bevezetés, követelmények ismertetése Vincze Veronika Korpuszok a nyelvészeti kutatásban – 2013.
A Magyar Nemzeti Szövegtár
Magyar nyelvi szintaktikai elemzőrendszerek Vincze Veronika Szegedi Tudományegyetem Informatikai Tanszékcsoport A magyar nyelv helyzete a digitális korban.
A SZAKDOLGOZAT.
Készítette: Terdik Sándor PTM IV. Ismeretszerzés természetes nyelvű dokumentumokból.
Ebsco adatbázisok Koltay Klára 2006/ félév.
1 Tudásalapú információ-kereső rendszerek elemzése és kifejlesztése Célkitűzés: Információk téma-specifikus, különböző típusú forrásokból (internet, intranet.
TÉRÍTÉSES INFORMÁCIÓS SZOLGÁLTATÁSOK = TISZ. JÓ TUDNI… 1. Miért működtetjük a TISZ-t? 2. Miért számítunk fel költségeket?
Farkas Katalin – Vilmányi Márton június 15.
1 Tájékoztató a tantárgyakról és a jegyzetekről Digitális oktatási gyűjtemény az ALEPH könyvtári rendszerben.
Klasszikus héber nyelv 4.: Szintaxis
Tájékoztató NGM_AK002 NGM_AK004. Fogadóóra Szorgalmi időszakban csütörtök óra között ig. 604-ben, más időpontban csak egyeztetés után!
Korpuszok létrehozása
Tematikus kutatás, 2. félév Témák és feladatok. Kutatás – írás Témák (szűkítés, konkretizálás) Módszerek (külön is: PhD-sok rövid bemutatója: történeti.
Útmutató a szakdolgozat elkészítéséhez
A HEFOP PÁLYÁZAT EREDMÉNYEI A GYAKORLATI KÉPZÉSBEN.
Tájékoztató NGM_AK002 NGM_AK004. Fogadóóra Szorgalmi időszakban szerda óra között ig. 604-ben, más időpontban csak egyeztetés után!
Bevezetés az SPSS használatába
Tájékoztató NGM_AK002 NGM_AK004. Fogadóóra Szorgalmi időszakban csütörtökön óra között ig. 604-ben, más időpontban csak egyeztetés után!
Gazdaság és Vezetéstudományi Intézet - szakszeminárium dr.LuxJudit 2016.április 8.
Gazdaság és Vezetéstudományi Intézet - szakszeminárium dr.Lux Judit október 16.
„Interdiszciplináris kutatói teamek létrehozása és felkészítése a nemzetközi programokban való részvételre környezetbiztonsági kutatási területeken” GEO-TEAM.
DROGPREVENCIÓ Készítette : Szegedi Károlyné. A modul megvalósításának tartalmi célja : A káros szenvedélyekkel kapcsolatos fogalmak, ismeretek bővítése,
Biztosítási matematika és kockázatelemzés I. Egészségbiztosítási szakirány Előadó és gyakorlatvezető: Vályi Sándor Fogadóóra: kedd 14-15, 208/4. szoba.
A projekt az Európai Unió támogatásával, az Európai Szociális Alap társfinanszírozásával valósul meg A projekt az Európai Unió támogatásával, az Európai.
Tájékoztató NGM_AK004. Fogadóóra Szorgalmi időszakban szerdán és óra között ig. 604-ben, más időpontban csak egyeztetés után!
Párhuzamos korpuszok, nagy lexikai adatbázisok, glosszázott finnugor mondatok Finnugor Szeminárium január 11., Debrecen Annotált korpuszok, avagy.
Tájékoztató NGM_AK004.
Tájékoztató NGM_AK004.
A kreatív találkozó Előadó neve.
Euler 3D térgeometriai szerkesztő és szemléltető program
EVA 1 – 5. kurzus Kanyó Kristóf.
SZÖM II. Fejlesztési szint folyamata 5.1. előadás
Nyelvi adatok és az adatgyűjtés módszertana
Towards an Effective Regional Resource Allocation (TERRA) Zárókonferencia Nagyvárad, március 19. A projekt rövid bemutatása - célok és eredmények.
A jólét mérésének elméleti alapjai és problémái
Projekt neve Cég neve Előadó neve
Tájékoztató LGM_ak002 LGM_ak004 LGS_ak011.
Hatékony és pontos munkavégzés
Határon túli magyar társadalmi adatok elemzése
Várnai-Vígh Adrienn E november 29.
BEA, GABI, Tini bea Bencsik-Marton Melánia
Tájékoztató NGM_AK004.
Századfordulós ékkövek – tematikus kalandozások a szecesszió varázslatos világában HUSRB/1203/212/121 sajtótájékoztató Szeged, Dr. Igaz Ágnes.
Értékesítési oktatás Előadó: [Név].
Hatékony és pontos munkavégzés
Annotációs eszközök Korpuszok a nyelvészeti kutatásban – szeptember 28.
Előadás másolata:

Vincze Veronika vinczev@inf.u-szeged.hu Korpuszok a nyelvészeti kutatásban: Bevezetés, követelmények ismertetése Vincze Veronika vinczev@inf.u-szeged.hu Korpuszok a nyelvészeti kutatásban – 2016. szeptember 20.

Bevezetés Nyelvészeti kutatásmódszertan Adatorientált / elméletorientált módszerek Kompetencia / performancia Honnan származnak a nyelvi adatok?

Adatgyűjtés Intuíció alapján Adatközlőktől gyűjtött adatok Korpuszok

Alapfogalmak Korpusz: speciális célokra létrehozott, (gyakran tematikus) adatbázis – „szöveggyűjtemény” Annotáció: a szövegek nyelvi információval történő kézi jelölése (és kézi ellenőrzése) Korpusznyelvészet: korpuszban található nyelvi adatok elemzése

Korpusztípusok Egynyelvű Többnyelvű – párhuzamos korpusz: ugyanazok az adatok egynél több nyelven Beszédkorpusz: hanganyagok Írott nyelvi korpusz: szövegek

Szegedi korpuszok Szeged Treebank Szeged Dependencia Treebank Bizonytalanságra annotált korpuszok Tulajdonnévkorpuszok Lemmatizált tulajdonnevek Többszavas kifejezések korpuszai Jelentés-egyértelműsített korpusz Kutatói adatok HTML korpusza SzegedParalell HunOr Véleménydetekciós korpusz Kulcsszókinyerési korpuszok HunLearner http://rgai.inf.u-szeged.hu/nlp_download

Kutatási témák Saját BA-szakdolgozat / MA-szakdolgozati téma? Milyen korpusz lenne/lett volna hasznos? Létezik-e?

A kurzus célja Miként használatosak a korpuszok és egyéb nyelvi adatbázisok a nyelvészeti kutatásban? A nyelvi adatgyűjtés módszertani követelményeinek áttekintése A korpuszépítés különböző lépései A korpuszból való adatgyűjtés módjai Adatok statisztikai elemzése

Tematika Nyelvi adatok, az adatgyűjtés módszertana Korpuszok és adatbázisok Korpuszépítés, annotáció, nyelvi elemzés Adatgyűjtés korpuszból Statisztikai elemzések

Követelmények Saját minikorpusz létrehozása Az abból kigyűjtött adatok rendszerezése, statisztikai elemzése A projekt bemutatása a félév végén Beadandó: a kész korpusz + az elemzés leírása

Menetrend Saját korpusz megtervezése: november 11. Beadandó leírás elkészítése: december 4. Bemutató tartása: december 6.

Elérhetőség A kurzus anyaga elérhető: http://www.inf.u-szeged.hu/~vinczev/oktatas.html MTA-SZTE Mesterséges Intelligencia Kutatócsoport 6720 Szeged, Tisza Lajos krt. 103. 45/b szoba Telefon: +36 62 544 140 Fogadóóra: előzetes egyeztetés alapján