Az előadás letöltése folymat van. Kérjük, várjon

Az előadás letöltése folymat van. Kérjük, várjon

A Magyar Nemzeti Szövegtár Váradi Tamás MTA Nyelvtudományi Intézet Korpusznyelvészeti Osztály.

Hasonló előadás


Az előadások a következő témára: "A Magyar Nemzeti Szövegtár Váradi Tamás MTA Nyelvtudományi Intézet Korpusznyelvészeti Osztály."— Előadás másolata:

1 A Magyar Nemzeti Szövegtár Váradi Tamás MTA Nyelvtudományi Intézet Korpusznyelvészeti Osztály

2 Rövid jellemzés Kiknek készült? Nemzetközi előzmények Összetétele Mitől „nemzeti”? Hogyan készült? Hogy néz ki belülről? Hogyan használható? Intelligens keresés Hogyan tovább? Magyar Nemzeti Szövegtár

3 Rövid jellemzés Az írott nyelvhasználat hiteles tükre 150 millió szavas reprezentatív minta Válogatott szövegek, egységesen kódolva nyelvhasználatunk keresztmetszete válogatás nem ‘érdem’ alapján Intelligens korpusz nyelvtanilag elemzett és egyértelműsített lekérdezés nyelvtani jellemző szerint is

4 Kiknek készült? Nyelvészeknek, szótárszerkesztőknek pontos, számszerűsíthető kép napjaink írott magyar nyelvhasználatáról Számítógépes nyelvészeknek értékes forrás számítógépes alkalmazások számára Társadalomtudósoknak, a magyar kultúra kutatóinak a nyelvhasználatban kódolt finom „üzenetek”

5 Nemzetközi előzmények 60-as évek: BROWN, LOB korpusz 1 millió szavas gondos összeállítás 80-as évek: COBUILD szótár 20 m  450 m szó Bank of English 90-es évek: British National Corpus 100m szó, 10 m szó beszélt nyelvből 90-évektől: nemzeti korpuszok Cseh, szlovén, német, francia, USA, ausztrál stb.

6 Az MNSZ összetétele Nyelvi változatm. szóForrás Sajtó75 online kiadás Szépirodalom15 Digitális Irod. Akadémia Tudományos próza20 Magyar Elektronikus Könyvtár Hivatali nyelv20 Minisztérium, önkormányzat Személyes közlés20 Index.hu Törzsasztal Összesen:150150

7 Mitől „nemzeti”? Mérete szerint egyedülálló vállalkozás Tartalma szerint nem csak az „írástudó elit” nyelvezete nem csak budapesti nyelvhasználat határon túli nyelvhasználat is Kárpát-medencei Magyar Korpusz előkészületben az MNSZ alapján

8 Hogyan készült? 1998 – 2000 között OTKA támogatás Elektronikus források Előfeldolgozás Nyelvtani elemzés Egyértelműsítés Összefűzés, indexálás Lekérdező szoftver

9 HVG 2001/16. szám 2001._április_21. Egészségügyi szigorítások Sok zsebből vérzik Annotált korpusz - részlet belülről Hogy néz ki belülről?

10 Hogyan használható? - Keresés

11 Hogyan használható? - Találatok

12 Intelligens keresés Keresés szófaj és nyelvtani alak alapján pl. „az”: előfordulás névelő és mutatószó egyaránt esetben mutatószó Két szó együttes előfordulása állandósult szókapcsolatok igei vonzatok

13 Hogyan tovább? állapotfelvétel a 90-es évek második feléről a nyelvhasználat dokumentálása újabb és újabb állapotfelvétel élő nyelvtörténet minden eddiginél pontosabb adatokkal

14 Köszönöm a figyelmet!


Letölteni ppt "A Magyar Nemzeti Szövegtár Váradi Tamás MTA Nyelvtudományi Intézet Korpusznyelvészeti Osztály."

Hasonló előadás


Google Hirdetések