Korpuszok a nyelvészeti kutatásban: Bevezetés, követelmények ismertetése Vincze Veronika Korpuszok a nyelvészeti kutatásban – 2013.

Slides:



Advertisements
Hasonló előadás
SZTE Klebelsberg Könyvtár
Advertisements

Az OH TÁMOP fejlesztései
E-Corvina Informatikai Szolgáltató Kft Budapest, Róbert Károly krt ▪ Telefon: (1) ▪ Fax: (1)
Digitális képanalízis Félévi megbeszélnivalók. A tárgy •címe: Digitális képanalízis •szakirányos tárgy •neptun-kód: BMEEOFTASJ5 (BSc) •előadó és gyakorlatvezető:
A projekt az Európai Unió támogatásával, az Európai Szociális Alap társfinanszírozásával valósul meg. TÁMOP-4.2.1/B-09/1/KONV „A felsőoktatás.
Tájékoztató NGM_AK002 NGM_AK004 NGB_KM016_2. Fogadóóra Szorgalmi időszakban kedd óra között ig. 604-ben, más időpontban csak egyeztetés után!
Szakdolgozat leadásával kapcsolatos tudnivalók Suri József gyakorlatszervező.
„CSOPORT VEZET CSOPORTOT”
A Magyar Nemzeti Szövegtár
Kutatási terv.
Készítette: Babinszki Helga TEJ3W9
Szoftveripari Innovációs Pólus Klaszter
Követelmények Szoftver- környezet SQL ismétlés ADATBÁZIS ALAPÚ RENDSZEREK.
Budapest, szeptember 22.1 A KÖVI képzései a hallgatói vélemények tükrében Baráth Tibor KÖVI igazgató KÖZOKTATÁSI VEZETŐKÉPZŐ ÉS TOVÁBBKÉPZŐ INTÉZET.
Korpuszok, szegmentálás és szófaji elemzés
Számítógépes nyelvészeti alkalmazások Farkas Richárd szept 7.
Korpuszok és adatbázisok
Számítógépes Nyelvészet – nyelvi adatbázisok és használatuk
Korpuszok és adatbázisok A számítógépes nyelvfeldolgozás alapjai A számítógépes nyelvfeldolgozás alapjai – február 14.
Annotáció, annotációs útmutató
kötelező program, SZÁMONKÉRÉSEK
MTA-DE-PTE-SZTE Elméleti Nyelvészeti Kutatócsoport Szegedi Munkacsoport 2007–2011 Bibok Károly, Maleczki Márta, Nagy Katalin, Németh T. Enikő, Vecsey Zoltán.
A projekt az Európai Unió támogatásával, az Európai Szociális Alap társfinanszírozásával valósul meg. TÁMOP-4.2.1/B-09/1/KONV „A felsőoktatás.
Informatika tanítása ea.
EISZ Elektronikus Információszolgáltatás melléklet a Bevezetés a pedagógiai tájékozódásba című ELTE jegyzethez.
| | Tananyagfejlesztések fejlesztői szemmel Wagner Balázs MTA SZTAKI.
Objektum Vezérelt Szoftverek Analízise Ferenc Rudolf és Beszédes Árpád Szegedi Tudományegyetem FrontEndART.
MTA KRTK Regionális Kutatások Intézete Genfi Egyetem, Európai Tanulmányok Intézete FÖDERALIZMUS ÉS DECENTRALIZÁCIÓ Kézikönyv a svájci struktúrákról és.
A Magyar Nemzeti Szövegtár
Magyar nyelvi szintaktikai elemzőrendszerek Vincze Veronika Szegedi Tudományegyetem Informatikai Tanszékcsoport A magyar nyelv helyzete a digitális korban.
A szöveg lekérdezése A NooJ rendszer alapjai
A SZAKDOLGOZAT.
Speciális kollégium bevezetés. A félév aláírásának feltétele(i): A szabályzatnak megfelelő óralátogatás. Az elmaradt gyakorlatok pótlása. A források és.
Speciális kollégium bevezetés. A félév aláírásának feltétele(i): A szabályzatnak megfelelő óralátogatás. Az elmaradt gyakorlatok pótlása. A források és.
Készítette: Terdik Sándor PTM IV. Ismeretszerzés természetes nyelvű dokumentumokból.
Ebsco adatbázisok Koltay Klára 2006/ félév.
Képek beillesztése. A beszúrandó képnek abban a mappában kell lennie, ahol a html oldalad forráskódja található! Először mindig a képet szúrjuk be, majd.
TÉRÍTÉSES INFORMÁCIÓS SZOLGÁLTATÁSOK = TISZ. JÓ TUDNI… 1. Miért működtetjük a TISZ-t? 2. Miért számítunk fel költségeket?
Szaknyelvi és terminológiai ismeretek SZTE 2010 Kiss Gábor TINTA Könyvkiadó, kissgabo kukac tintakiado pont hu.
Klasszikus héber nyelv 4.: Szintaxis
Statisztikai eszközök a multimédiás kurzuselemek hatékonyságának elemzésére T. Nagy Judit
Tájékoztató NGM_AK002 NGM_AK004. Fogadóóra Szorgalmi időszakban csütörtök óra között ig. 604-ben, más időpontban csak egyeztetés után!
Az informatika logikai alapjai
Sajátos képzési igényű hallgatók számára nyújtott szociális szolgáltatások a Szegedi Tudományegyetemen Horváth Hajnalka SZTE ETSZK IV. évf. Szociális munka.
Korpuszok létrehozása
Tematikus kutatás, 2. félév Témák és feladatok. Kutatás – írás Témák (szűkítés, konkretizálás) Módszerek (külön is: PhD-sok rövid bemutatója: történeti.
Útmutató a szakdolgozat elkészítéséhez
Digitális képanalízis Félévi megbeszélnivalók. A tárgy címe: Digitális képanalízis szakirányos tárgy neptun-kód: BMEEOFTASJ5 (BSc) előadó és gyakorlatvezető:
SZTE OPAC, adatbázisok A szakirodalmi keresés kezdő lépései Aranyi Zoltán SZTE Klebelsberg Könyvtár
Tájékoztató NGM_AK002 NGM_AK004. Fogadóóra Szorgalmi időszakban szerda óra között ig. 604-ben, más időpontban csak egyeztetés után!
Tájékoztató NGB_ak072 Vállalati kultúrák. Dr. Szigeti Cecília IG 604 Fogadóóra szerda
Tájékoztató NGM_AK002 NGM_AK004. Fogadóóra Szorgalmi időszakban csütörtökön óra között ig. 604-ben, más időpontban csak egyeztetés után!
Bevezetés. Alapok: szövegszerkesztő alkalmazás (Word) megnyitása: Start gomb  Minden program  Microsoft Office  Microsoft Office Word 2007 szövegszerkesztő.
Biztosítási matematika és kockázatelemzés I. Egészségbiztosítási szakirány Előadó és gyakorlatvezető: Vályi Sándor Fogadóóra: kedd 14-15, 208/4. szoba.
Tájékoztató NGM_AK004. Fogadóóra Szorgalmi időszakban szerdán és óra között ig. 604-ben, más időpontban csak egyeztetés után!
Tájékoztató NGM_AK004.
Tájékoztató NGM_AK004.
A kreatív találkozó Előadó neve.
EVA 1 – 5. kurzus Kanyó Kristóf.
Nyelvi adatok és az adatgyűjtés módszertana
Vincze Veronika Korpuszok a nyelvészeti kutatásban: Bevezetés, követelmények ismertetése Vincze Veronika
Nemzeti Agykutatási Program Szegedi Tudományegyetem október Szegedi Akadémiai Bizottság 110. termében (Szeged, Somogyi u. 7.) Sajtótájékoztató.
Határon túli magyar társadalmi adatok elemzése
Várnai-Vígh Adrienn E november 29.
BEA, GABI, Tini bea Bencsik-Marton Melánia
Tájékoztató NGM_AK004.
NGB_AJ040_1 Forgácsolás és szerszámai
Hatékony és pontos munkavégzés
NGB_ak072 Vállalati kultúrák
Annotációs eszközök Korpuszok a nyelvészeti kutatásban – szeptember 28.
Előadás másolata:

Korpuszok a nyelvészeti kutatásban: Bevezetés, követelmények ismertetése Vincze Veronika Korpuszok a nyelvészeti kutatásban – szeptember 5.

Bevezetés Nyelvészeti kutatásmódszertan Adatorientált / elméletorientált módszerek Kompetencia / performancia Honnan származnak a nyelvi adatok?

Adatgyűjtés Intuíció alapján Adatközlőktől gyűjtött adatok Korpuszok

Alapfogalmak Korpusz: speciális célokra létrehozott, (gyakran tematikus) adatbázis – „szöveggyűjtemény” Annotáció: a szövegek nyelvi információval történő kézi jelölése (és kézi ellenőrzése) Korpusznyelvészet: korpuszban található nyelvi adatok elemzése

Korpusztípusok Egynyelvű Többnyelvű – párhuzamos korpusz: ugyanazok az adatok egynél több nyelven Beszédkorpusz: hanganyagok Írott nyelvi korpusz: szövegek

Szegedi korpuszok Szeged Treebank Szeged Dependencia Treebank Bizonytalanságra annotált korpuszok Tulajdonnévkorpuszok Lemmatizált tulajdonnevek Többszavas kifejezések korpuszai Jelentés-egyértelműsített korpusz Kutatói adatok HTML korpusza SzegedParalell HunOr Véleménydetekciós korpusz Kulcsszókinyerési korpuszok HunLearner

Kutatási témák Saját BA-szakdolgozat / MA- szakdolgozati téma? Milyen korpusz lenne/lett volna hasznos? Létezik-e?

A kurzus célja Miként használatosak a korpuszok és egyéb nyelvi adatbázisok a nyelvészeti kutatásban? A nyelvi adatgyűjtés módszertani követelményeinek áttekintése A korpuszépítés különböző lépései A korpuszból való adatgyűjtés módjai Adatok statisztikai elemzése

Tematika Nyelvi adatok, az adatgyűjtés módszertana Korpuszok és adatbázisok Korpuszépítés, annotáció, nyelvi elemzés Adatgyűjtés korpuszból Statisztikai elemzések

Követelmények saját minikorpusz létrehozása az abból kigyűjtött adatok rendszerezése, statisztikai elemzése Beadandó: a kész korpusz + az elemzés leírása

Menetrend Szeptember 12-én, 19-én, október 10-én és 17-én elmarad az óra! Pótlás később megbeszélendő módon és időpontban Beadandók elkészítése: a szemeszter vége

Elérhetőség A kurzus anyaga elérhető: MTA-SZTE Mesterséges Intelligencia Kutatócsoport 6720 Szeged, Tisza Lajos krt /b szoba Telefon: Fogadóóra: előzetes egyeztetés alapján