A Magyar Nemzeti Szövegtár

Slides:



Advertisements
Hasonló előadás
SZTE Klebelsberg Könyvtár
Advertisements

Keresés a számítógépes katalógusokban
A korpusz alapú szótár alapja: a korpusz
Az Educatio digitális tartalomszolgáltatási projektjei XIX. Budapesti Nemzetközi Könyvfesztivál április Markója Szilárd EISZ Iroda és könyvtárvezető.
Gábor Kata MTA Nyelvtudományi Intézet Korpusznyelvészeti osztály Infotrend kiállítás A gépi ferdítéstől a gépifordításig.
Az Internet Fiesta a könyvtárakban 2002 dr. Bakonyi Péter Országos Könyvtári Kuratórium elnöke.
2003. november INFOtrend 2003 Váradi Tamás MTA Nyelvtudományi Intézet Korpusznyelvészeti Osztály Nyelvi technológiákkal az információs.
Szolgáltatásfejlesztés, adatbázisépítés együttműködéssel Networkshop 2005 Szeged Burmeister Erzsébet Miskolci Egyetem, Könyvtár, Levéltár, Múzeum
Könyvtári digitális tartalmak az oktatási multimédiák számára
Korpuszmunkálatok Pintér Tibor MTA Nyelvtudományi Intézet Gramma Nyelvi Iroda.
Tetten ért szavak a Magyar Nemzeti Szövegtárban
ZENEI ADATBÁZISOK. The Music Index Online A Music Index a zenei időszaki kiadványok legátfogóbb bibliográfiai és részben teljes szöveges adatbázisa több.
MI 2003/ Néhány probléma: - Hogyan fordítanánk angolra? - Hogyan érthetnénk meg egy rövid törénetet? - Miként lehetne kigyűjteni az MTI hírekből.
A magyar nyelvtörténet korszakai
Korpuszok és adatbázisok
Korpusznyelvészet
Annotáció, annotációs útmutató
MTA-DE-PTE-SZTE Elméleti Nyelvészeti Kutatócsoport Szegedi Munkacsoport 2007–2011 Bibok Károly, Maleczki Márta, Nagy Katalin, Németh T. Enikő, Vecsey Zoltán.
Példa az Early-algoritmus alkalmazására
Kommunikáció az egyetemen Konferencia április 17. Gellér Zsuzsanna Szabad bölcsész szakos hallgató, II. évfolyam Az elektronikus kommunikáció és.
MATARKA szakmai nap Miskolci Egyetem Könyvtár, Levéltár, Múzeum március 24. KÖSZÖNTJÜK A RÉSZTVEVŐKET!
DELOS projekt, Könyvtári Intézet Budapest, május 6.
A digitális dokumentumok hosszútávú megőrzésének problémái Moldován István OSZK MEK Osztály „Networkshop” Szeged, március 30.
A Magyar Elektronikus Könyvtár új szolgáltatásai és működése Moldován István OSZK MEK osztály Somogyi Károly Városi és Megyei Könyvtár.
A könyvtárak szerepe az információs társadalomban
”Babits Mihály a Net-en” Moldován István OSZK MEK osztály Irodalomtörténeti Szimpózium Babits Mihály születésnapján Szekszárd, november.
Könyvtár egy kicsit másképp - a Magyar Elektronikus Könyvtárról és legújabb fejlesztéseiről Szombathely, Góczán Andrea OSZK, MEK osztály.
2009. április 24.XVI.Budapesti Nemzetközi Könyvfesztivál Kereslet és kínálat e-book témában Moldován István OSZK.
Korpuszok a nyelvészeti kutatásban: Bevezetés, követelmények ismertetése Vincze Veronika Korpuszok a nyelvészeti kutatásban – 2013.
Gábor Kata MTA Nyelvtudományi Intézet Korpusznyelvészeti osztály Magyar tudomány napja, A gépi ferdítéstől a gépifordításig.
A Magyar Nemzeti Szövegtár
Hány szó van a magyarban?
2006. február 20. MANYE Korpuszok 1 Kiss Gábor - Sass Bálint A Magyar Nemzeti Szövegtár MNSZ.
Idegennyelvű korpuszok Kuti Judit MTA Nyelvtudományi Intézet Korpusznyelvészeti Osztály
2006. február 20. Párhuzamos korpuszok Tartalom definíció és terminológia alkalmazási lehetőségek gyakorlati nehézségek publikus és ingyenes korpuszok.
Héja Enikő MTA Nyelvtudományi Intézet Korpusznyelvészeti Osztály XML-alapú komplex korpusz-lekérdezés.
Hogyan tanítsuk meg a számítógépet magyarul? Számítógép és nyelv Varasdi Károly MTA Nyelvtudományi Intézet
A szöveg lekérdezése A NooJ rendszer alapjai
1 Természetes nyelvű interfész adatbázisok lekérdezéséhez Vajda Péter NYTI, Korpusznyelvészeti osztály – BME, TTT.
Az Utónévkereső portál előzményei Raátz Judit raatz. mta
Budapesti Műszaki Főiskola CAD/CAM szakirány A CAD/CAM modellezés alapjai 2001/2000 tanév, II. félév 1. Előadás A számítógépes modellezés fogalma, szerepe.
Nyelv-ész-gép Új technológiák az információs társadalomban.
Nemzeti Egészségügyi Számlák (NESZ) május 23. Mentusz Zsófia Központi Statisztikai Hivatal.
Debrecen Networkshop 2010 Határon túli magyar tartalomszolgáltatások Networkshop Debrecen, április.
Idegen nyelvek tanulása
Készítette: Terdik Sándor PTM IV. Ismeretszerzés természetes nyelvű dokumentumokból.
Vida Andrea SZTE Egyetemi Könyvtár
Az intelligens közlekedési rendszerek/szolgáltatások rendszerfelépítése, felhasználói igények HITS – Hungarian ITS Framework Architecture Hladon Andrea.
1 A nemzeti ITS rendszer-felépítési terv a magyar úthálózatra, valamint a nemzeti rendszerfelépítések harmonizációja HITS – Hungarian ITS Framework Architecture.
A kultúrnemzeti Akadémia tudománypolitikájáról
Hodinka Antal Intézet Tudományos műhelyek a kárpátaljai magyar tudományosság szolgálatában.
Dunaújváros2014. szeptember 15. Projekt eredményeinek disszeminációja – 9. fejlesztési elem ÁROP- 1.A „Szervezetfejlesztés a konvergencia régióban.
A Magyar Elektronikus Könyvtár új szolgáltatásai és működése Moldován István OSZK MEK osztály Balassi Bálint Megyei Könyvtár Salgótarján,
Integrált Könyvtári Rendszer. Történeti áttekintés  ‘85-ben kezdődött el a fejlesztés  ‘94-ben már a felhasználók rendelkezésére állt  ‘95-től az OSZK-val.
ORSZÁGOS SZÉCHÉNYI KÖNYVTÁR E-SZOLGÁLTATÁSI IGAZGATÓSÁG BIBLIOTHECA NATIONALIS HUNGARIAE Az Országos Széchényi Könyvtár digitális folyóirat archiválási.
Szeged, április 16. CACAO projekt katalógusok, digitális könyvtárak lekérdezése saját nyelven Moldován István Országos.
Prof. Dr. Neményi Miklós tudományos és külügyi rektorhelyettes A doktori és publikációs adatbázis kialakításának elvei és megvalósítása Nyugat-magyarországi.
A MEK2.0 magyar digitális könyvtári alkalmazása - eleMEK Moldován István OSZK MEK osztály ”Networkshop” Pécs, április
SZTE OPAC, adatbázisok A szakirodalmi keresés kezdő lépései Aranyi Zoltán SZTE Klebelsberg Könyvtár
A Nyelv- és Beszédtechnológiai Platform egy éve Váradi Tamás MTA Nyelvtudományi Intézet Nyelvi áttörés A nyelv- és beszédtechnológia mint húzóágazat.
A Nation Library of Medicine és adatbázisai Vasas Lívia PhD 1 /21.
KERESÉS ELEKTRONIKUS KÖNYVTÁRI KATALÓGUSOKBAN Kiss Annamária Semmelweis Egyetem Központi Könyvtár 2013.
Adatbázisok használata a tájékoztatási gyakorlatban Dr. Nagy Enikő Csomád,
Korpusznyelvészet és releváns társterületeik Pintér Tibor.
Érettségi élő idegen nyelv
Készítette: Kiss András
Óbudai Egyetem FENNTARTÓ Rektor Kancellár Szenátus
Használd jól a könyvtári katalógust!
Vincze Veronika Korpuszok a nyelvészeti kutatásban: Bevezetés, követelmények ismertetése Vincze Veronika
Kiadói adatbázisok: SpringerLink, PubMed, Surf, a német sport szakadatbázis. Teljes szövegek keresése a SURF-ben április 9. Kovács Klaudia Ágota.
Előadás másolata:

A Magyar Nemzeti Szövegtár Váradi Tamás MTA Nyelvtudományi Intézet Korpusznyelvészeti Osztály varadi@nytud.hu

Tartalom Rövid jellemzés Kiknek készült? Nemzetközi előzmények Magyar Nemzeti Szövegtár Tartalom Rövid jellemzés Kiknek készült? Nemzetközi előzmények Összetétele Mitől „nemzeti”? Hogyan készült? Hogy néz ki belülről? Hogyan használható? Intelligens keresés Hogyan tovább?

Rövid jellemzés Az írott nyelvhasználat hiteles tükre Magyar Nemzeti Szövegtár Rövid jellemzés Az írott nyelvhasználat hiteles tükre 150 millió szavas reprezentatív minta Válogatott szövegek, egységesen kódolva nyelvhasználatunk keresztmetszete válogatás nem ‘érdem’ alapján Intelligens korpusz nyelvtanilag elemzett és egyértelműsített lekérdezés nyelvtani jellemző szerint is

Kiknek készült? Nyelvészeknek, szótárszerkesztőknek Magyar Nemzeti Szövegtár Kiknek készült? Nyelvészeknek, szótárszerkesztőknek pontos, számszerűsíthető kép napjaink írott magyar nyelvhasználatáról Számítógépes nyelvészeknek értékes forrás számítógépes alkalmazások számára Társadalomtudósoknak, a magyar kultúra kutatóinak a nyelvhasználatban kódolt finom „üzenetek”

Nemzetközi előzmények Magyar Nemzeti Szövegtár Nemzetközi előzmények 60-as évek: BROWN, LOB korpusz 1 millió szavas gondos összeállítás 80-as évek: COBUILD szótár 20 m  450 m szó Bank of English 90-es évek: British National Corpus 100m szó, 10 m szó beszélt nyelvből 90-évektől: nemzeti korpuszok Cseh, szlovén, német, francia, USA, ausztrál stb.

Az MNSZ összetétele Nyelvi változat m. szó Forrás Sajtó 75 Magyar Nemzeti Szövegtár Az MNSZ összetétele Nyelvi változat m. szó Forrás Sajtó 75 online kiadás Szépirodalom 15 Digitális Irod. Akadémia Tudományos próza 20 Magyar Elektronikus Könyvtár Hivatali nyelv Minisztérium, önkormányzat Személyes közlés Index.hu Törzsasztal Összesen: 150

Mitől „nemzeti”? Mérete szerint Tartalma szerint Magyar Nemzeti Szövegtár Mitől „nemzeti”? Mérete szerint egyedülálló vállalkozás Tartalma szerint nem csak az „írástudó elit” nyelvezete nem csak budapesti nyelvhasználat határon túli nyelvhasználat is Kárpát-medencei Magyar Korpusz előkészületben az MNSZ alapján

Hogyan készült? Elektronikus források Előfeldolgozás Nyelvtani elemzés Magyar Nemzeti Szövegtár Hogyan készült? Elektronikus források Előfeldolgozás Nyelvtani elemzés Egyértelműsítés Összefűzés, indexálás Lekérdező szoftver 1998 – 2000 között OTKA támogatás 2002-2003 SZT-IS-7 pályázat

Hogy néz ki belülről? Annotált korpusz - részlet belülről Magyar Nemzeti Szövegtár Hogy néz ki belülről? Annotált korpusz - részlet belülről <!-- HVG ./0116/0116009.htm --> <div type="article" column="unspec"> <opener> <dateline> <w lemma="HVG" msd="N.NOM" ctag="NS3NN">HVG</w> <w lemma="2001/16" msd="DIG" ctag="Q">2001/16</w> <c lemma="." msd="SPUNCT" ctag="SPUNCT">.</c> <w lemma="szám" msd="N.NOM" ctag="NS3NN">szám</w> <date iso8601="04-21-2001"> <w lemma="2001._április_21." msd="DATUM" ctag="DATUM">2001._április_21.</w> </date> </dateline> </opener> <head rend="IT" type="unspec"> <s> <w lemma="egészségügyi" msd="A.NOM" ctag="AS_A">Egészségügyi</w> <w lemma="szigorítás" msd="N.PL.NOM" ctag="NP3NN">szigorítások</w> </s> </head> <head> <w lemma="sok" msd="Num.NOM" ctag="Q">Sok</w> <w lemma="zseb" msd="N.ELA" ctag="NS3NE">zsebből</w> <w lemma="vérzik" msd="V.e3" ctag="VS3RI">vérzik</w> </s> <head rend="BO" type="display">

Hogyan használható? - Keresés Magyar Nemzeti Szövegtár Hogyan használható? - Keresés

Hogyan használható? - Találatok Magyar Nemzeti Szövegtár Hogyan használható? - Találatok

Intelligens keresés Keresés szófaj és nyelvtani alak alapján Magyar Nemzeti Szövegtár Intelligens keresés Keresés szófaj és nyelvtani alak alapján pl. „az”: 656272 előfordulás névelő és mutatószó egyaránt 15542 esetben mutatószó Két szó együttes előfordulása állandósult szókapcsolatok igei vonzatok

Hogyan tovább? állapotfelvétel a 90-es évek második feléről Magyar Nemzeti Szövegtár Hogyan tovább? állapotfelvétel a 90-es évek második feléről a nyelvhasználat dokumentálása újabb és újabb állapotfelvétel élő nyelvtörténet minden eddiginél pontosabb adatokkal

Magyar Nemzeti Szövegtár http://corpus.nytud.hu/mnsz varadi@nytud.hu