Az előadás letöltése folymat van. Kérjük, várjon

Az előadás letöltése folymat van. Kérjük, várjon

Magyar Nemzeti Szövegtár A Magyar Nemzeti Szövegtár Váradi Tamás MTA Nyelvtudományi Intézet Korpusznyelvészeti Osztály

Hasonló előadás


Az előadások a következő témára: "Magyar Nemzeti Szövegtár A Magyar Nemzeti Szövegtár Váradi Tamás MTA Nyelvtudományi Intézet Korpusznyelvészeti Osztály"— Előadás másolata:

1 Magyar Nemzeti Szövegtár A Magyar Nemzeti Szövegtár Váradi Tamás MTA Nyelvtudományi Intézet Korpusznyelvészeti Osztály

2 Magyar Nemzeti Szövegtár Rövid jellemzés Kiknek készült? Nemzetközi előzmények Összetétele Mitől „nemzeti”? Hogyan készült? Hogy néz ki belülről? Hogyan használható? Intelligens keresés Hogyan tovább? Tartalom

3 Magyar Nemzeti Szövegtár Rövid jellemzés Az írott nyelvhasználat hiteles tükre 150 millió szavas reprezentatív minta Válogatott szövegek, egységesen kódolva nyelvhasználatunk keresztmetszete válogatás nem ‘érdem’ alapján Intelligens korpusz nyelvtanilag elemzett és egyértelműsített lekérdezés nyelvtani jellemző szerint is

4 Magyar Nemzeti Szövegtár Kiknek készült? Nyelvészeknek, szótárszerkesztőknek pontos, számszerűsíthető kép napjaink írott magyar nyelvhasználatáról Számítógépes nyelvészeknek értékes forrás számítógépes alkalmazások számára Társadalomtudósoknak, a magyar kultúra kutatóinak a nyelvhasználatban kódolt finom „üzenetek”

5 Magyar Nemzeti Szövegtár Nemzetközi előzmények 60-as évek: BROWN, LOB korpusz 1 millió szavas gondos összeállítás 80-as évek: COBUILD szótár 20 m  450 m szó Bank of English 90-es évek: British National Corpus 100m szó, 10 m szó beszélt nyelvből 90-évektől: nemzeti korpuszok Cseh, szlovén, német, francia, USA, ausztrál stb.

6 Magyar Nemzeti Szövegtár Az MNSZ összetétele Nyelvi változatm. szóForrás Sajtó75 online kiadás Szépirodalom15 Digitális Irod. Akadémia Tudományos próza20 Magyar Elektronikus Könyvtár Hivatali nyelv20 Minisztérium, önkormányzat Személyes közlés20 Index.hu Törzsasztal Összesen:150150

7 Magyar Nemzeti Szövegtár Mitől „nemzeti”? Mérete szerint egyedülálló vállalkozás Tartalma szerint nem csak az „írástudó elit” nyelvezete nem csak budapesti nyelvhasználat határon túli nyelvhasználat is Kárpát-medencei Magyar Korpusz előkészületben az MNSZ alapján

8 Magyar Nemzeti Szövegtár Hogyan készült? Elektronikus források Előfeldolgozás Nyelvtani elemzés Egyértelműsítés Összefűzés, indexálás Lekérdező szoftver 1998 – 2000 között OTKA támogatás SZT-IS-7 pályázat

9 Magyar Nemzeti Szövegtár HVG 2001/16. szám 2001._április_21. Egészségügyi szigorítások Sok zsebből vérzik Annotált korpusz - részlet belülről Hogy néz ki belülről?

10 Magyar Nemzeti Szövegtár Hogyan használható? - Keresés

11 Magyar Nemzeti Szövegtár Hogyan használható? - Találatok

12 Magyar Nemzeti Szövegtár Intelligens keresés Keresés szófaj és nyelvtani alak alapján pl. „az”: előfordulás névelő és mutatószó egyaránt esetben mutatószó Két szó együttes előfordulása állandósult szókapcsolatok igei vonzatok

13 Magyar Nemzeti Szövegtár Hogyan tovább? állapotfelvétel a 90-es évek második feléről a nyelvhasználat dokumentálása újabb és újabb állapotfelvétel élő nyelvtörténet minden eddiginél pontosabb adatokkal

14 Magyar Nemzeti Szövegtár


Letölteni ppt "Magyar Nemzeti Szövegtár A Magyar Nemzeti Szövegtár Váradi Tamás MTA Nyelvtudományi Intézet Korpusznyelvészeti Osztály"

Hasonló előadás


Google Hirdetések