Az előadás letöltése folymat van. Kérjük, várjon

Az előadás letöltése folymat van. Kérjük, várjon

A Magyar Nemzeti Szövegtár

Hasonló előadás


Az előadások a következő témára: "A Magyar Nemzeti Szövegtár"— Előadás másolata:

1 A Magyar Nemzeti Szövegtár
Váradi Tamás MTA Nyelvtudományi Intézet Korpusznyelvészeti Osztály

2 Tartalom Rövid jellemzés Kiknek készült? Nemzetközi előzmények
Magyar Nemzeti Szövegtár Tartalom Rövid jellemzés Kiknek készült? Nemzetközi előzmények Összetétele Mitől „nemzeti”? Hogyan készült? Hogy néz ki belülről? Hogyan használható? Intelligens keresés Hogyan tovább?

3 Rövid jellemzés Az írott nyelvhasználat hiteles tükre
Magyar Nemzeti Szövegtár Rövid jellemzés Az írott nyelvhasználat hiteles tükre 150 millió szavas reprezentatív minta Válogatott szövegek, egységesen kódolva nyelvhasználatunk keresztmetszete válogatás nem ‘érdem’ alapján Intelligens korpusz nyelvtanilag elemzett és egyértelműsített lekérdezés nyelvtani jellemző szerint is

4 Kiknek készült? Nyelvészeknek, szótárszerkesztőknek
Magyar Nemzeti Szövegtár Kiknek készült? Nyelvészeknek, szótárszerkesztőknek pontos, számszerűsíthető kép napjaink írott magyar nyelvhasználatáról Számítógépes nyelvészeknek értékes forrás számítógépes alkalmazások számára Társadalomtudósoknak, a magyar kultúra kutatóinak a nyelvhasználatban kódolt finom „üzenetek”

5 Nemzetközi előzmények
Magyar Nemzeti Szövegtár Nemzetközi előzmények 60-as évek: BROWN, LOB korpusz 1 millió szavas gondos összeállítás 80-as évek: COBUILD szótár 20 m  450 m szó Bank of English 90-es évek: British National Corpus 100m szó, 10 m szó beszélt nyelvből 90-évektől: nemzeti korpuszok Cseh, szlovén, német, francia, USA, ausztrál stb.

6 Az MNSZ összetétele Nyelvi változat m. szó Forrás Sajtó 75
Magyar Nemzeti Szövegtár Az MNSZ összetétele Nyelvi változat m. szó Forrás Sajtó 75 online kiadás Szépirodalom 15 Digitális Irod. Akadémia Tudományos próza 20 Magyar Elektronikus Könyvtár Hivatali nyelv Minisztérium, önkormányzat Személyes közlés Index.hu Törzsasztal Összesen: 150

7 Mitől „nemzeti”? Mérete szerint Tartalma szerint
Magyar Nemzeti Szövegtár Mitől „nemzeti”? Mérete szerint egyedülálló vállalkozás Tartalma szerint nem csak az „írástudó elit” nyelvezete nem csak budapesti nyelvhasználat határon túli nyelvhasználat is Kárpát-medencei Magyar Korpusz előkészületben az MNSZ alapján

8 Hogyan készült? Elektronikus források Előfeldolgozás Nyelvtani elemzés
Magyar Nemzeti Szövegtár Hogyan készült? Elektronikus források Előfeldolgozás Nyelvtani elemzés Egyértelműsítés Összefűzés, indexálás Lekérdező szoftver 1998 – 2000 között OTKA támogatás SZT-IS-7 pályázat

9 Hogy néz ki belülről? Annotált korpusz - részlet belülről
Magyar Nemzeti Szövegtár Hogy néz ki belülről? Annotált korpusz - részlet belülről <!-- HVG ./0116/ htm --> <div type="article" column="unspec"> <opener> <dateline> <w lemma="HVG" msd="N.NOM" ctag="NS3NN">HVG</w> <w lemma="2001/16" msd="DIG" ctag="Q">2001/16</w> <c lemma="." msd="SPUNCT" ctag="SPUNCT">.</c> <w lemma="szám" msd="N.NOM" ctag="NS3NN">szám</w> <date iso8601=" "> <w lemma="2001._április_21." msd="DATUM" ctag="DATUM">2001._április_21.</w> </date> </dateline> </opener> <head rend="IT" type="unspec"> <s> <w lemma="egészségügyi" msd="A.NOM" ctag="AS_A">Egészségügyi</w> <w lemma="szigorítás" msd="N.PL.NOM" ctag="NP3NN">szigorítások</w> </s> </head> <head> <w lemma="sok" msd="Num.NOM" ctag="Q">Sok</w> <w lemma="zseb" msd="N.ELA" ctag="NS3NE">zsebből</w> <w lemma="vérzik" msd="V.e3" ctag="VS3RI">vérzik</w> </s> <head rend="BO" type="display">

10 Hogyan használható? - Keresés
Magyar Nemzeti Szövegtár Hogyan használható? - Keresés

11 Hogyan használható? - Találatok
Magyar Nemzeti Szövegtár Hogyan használható? - Találatok

12 Intelligens keresés Keresés szófaj és nyelvtani alak alapján
Magyar Nemzeti Szövegtár Intelligens keresés Keresés szófaj és nyelvtani alak alapján pl. „az”: előfordulás névelő és mutatószó egyaránt 15542 esetben mutatószó Két szó együttes előfordulása állandósult szókapcsolatok igei vonzatok

13 Hogyan tovább? állapotfelvétel a 90-es évek második feléről
Magyar Nemzeti Szövegtár Hogyan tovább? állapotfelvétel a 90-es évek második feléről a nyelvhasználat dokumentálása újabb és újabb állapotfelvétel élő nyelvtörténet minden eddiginél pontosabb adatokkal

14 Magyar Nemzeti Szövegtár


Letölteni ppt "A Magyar Nemzeti Szövegtár"

Hasonló előadás


Google Hirdetések