A Magyar Nemzeti Szövegtár

Slides:



Advertisements
Hasonló előadás
SZTE Klebelsberg Könyvtár
Advertisements

Keresés a számítógépes katalógusokban
A korpusz alapú szótár alapja: a korpusz
Az Educatio digitális tartalomszolgáltatási projektjei XIX. Budapesti Nemzetközi Könyvfesztivál április Markója Szilárd EISZ Iroda és könyvtárvezető.
Gábor Kata MTA Nyelvtudományi Intézet Korpusznyelvészeti osztály Infotrend kiállítás A gépi ferdítéstől a gépifordításig.
Az Internet Fiesta a könyvtárakban 2002 dr. Bakonyi Péter Országos Könyvtári Kuratórium elnöke.
2003. november INFOtrend 2003 Váradi Tamás MTA Nyelvtudományi Intézet Korpusznyelvészeti Osztály Nyelvi technológiákkal az információs.
A Magyar Nemzeti Szövegtár
Szolgáltatásfejlesztés, adatbázisépítés együttműködéssel Networkshop 2005 Szeged Burmeister Erzsébet Miskolci Egyetem, Könyvtár, Levéltár, Múzeum
Elektronikus szolgáltatások mindenkinek Electronic services for everybody Moldován István OSZK Budapest, november 24.
Könyvtári digitális tartalmak az oktatási multimédiák számára
Korpuszmunkálatok Pintér Tibor MTA Nyelvtudományi Intézet Gramma Nyelvi Iroda.
Tetten ért szavak a Magyar Nemzeti Szövegtárban
ZENEI ADATBÁZISOK. The Music Index Online A Music Index a zenei időszaki kiadványok legátfogóbb bibliográfiai és részben teljes szöveges adatbázisa több.
MI 2003/ Néhány probléma: - Hogyan fordítanánk angolra? - Hogyan érthetnénk meg egy rövid törénetet? - Miként lehetne kigyűjteni az MTI hírekből.
A magyar nyelvtörténet korszakai
Korpuszok és adatbázisok
Számítógépes Nyelvészet – nyelvi adatbázisok és használatuk
Korpusznyelvészet
Annotáció, annotációs útmutató
MTA-DE-PTE-SZTE Elméleti Nyelvészeti Kutatócsoport Szegedi Munkacsoport 2007–2011 Bibok Károly, Maleczki Márta, Nagy Katalin, Németh T. Enikő, Vecsey Zoltán.
Példa az Early-algoritmus alkalmazására
A projekt az Európai Unió támogatásával, az Európai Szociális Alap társfinanszírozásával valósul meg. TÁMOP-4.2.1/B-09/1/KONV „A felsőoktatás.
Kommunikáció az egyetemen Konferencia április 17. Gellér Zsuzsanna Szabad bölcsész szakos hallgató, II. évfolyam Az elektronikus kommunikáció és.
MATARKA szakmai nap Miskolci Egyetem Könyvtár, Levéltár, Múzeum március 24. KÖSZÖNTJÜK A RÉSZTVEVŐKET!
A digitális dokumentumok hosszútávú megőrzésének problémái Moldován István OSZK MEK Osztály „Networkshop” Szeged, március 30.
A Magyar Elektronikus Könyvtár új szolgáltatásai és működése Moldován István OSZK MEK osztály Somogyi Károly Városi és Megyei Könyvtár.
”Babits Mihály a Net-en” Moldován István OSZK MEK osztály Irodalomtörténeti Szimpózium Babits Mihály születésnapján Szekszárd, november.
Újjászülető oktatási tartalmak a nemzeti könyvtárban Moldován István MultiMédia az oktatásban konferencia Zsigmond Király Főiskola,
Könyvtár egy kicsit másképp - a Magyar Elektronikus Könyvtárról és legújabb fejlesztéseiről Szombathely, Góczán Andrea OSZK, MEK osztály.
2009. április 24.XVI.Budapesti Nemzetközi Könyvfesztivál Kereslet és kínálat e-book témában Moldován István OSZK.
Korpuszok a nyelvészeti kutatásban: Bevezetés, követelmények ismertetése Vincze Veronika Korpuszok a nyelvészeti kutatásban – 2013.
Gábor Kata MTA Nyelvtudományi Intézet Korpusznyelvészeti osztály Magyar tudomány napja, A gépi ferdítéstől a gépifordításig.
Hány szó van a magyarban?
2006. február 20. MANYE Korpuszok 1 Kiss Gábor - Sass Bálint A Magyar Nemzeti Szövegtár MNSZ.
Idegennyelvű korpuszok Kuti Judit MTA Nyelvtudományi Intézet Korpusznyelvészeti Osztály
2006. február 20. Párhuzamos korpuszok Tartalom definíció és terminológia alkalmazási lehetőségek gyakorlati nehézségek publikus és ingyenes korpuszok.
Héja Enikő MTA Nyelvtudományi Intézet Korpusznyelvészeti Osztály XML-alapú komplex korpusz-lekérdezés.
Hogyan tanítsuk meg a számítógépet magyarul? Számítógép és nyelv Varasdi Károly MTA Nyelvtudományi Intézet
A szöveg lekérdezése A NooJ rendszer alapjai
1 Természetes nyelvű interfész adatbázisok lekérdezéséhez Vajda Péter NYTI, Korpusznyelvészeti osztály – BME, TTT.
Az Utónévkereső portál előzményei Raátz Judit raatz. mta
Budapesti Műszaki Főiskola CAD/CAM szakirány A CAD/CAM modellezés alapjai 2001/2000 tanév, II. félév 1. Előadás A számítógépes modellezés fogalma, szerepe.
Nyelv-ész-gép Új technológiák az információs társadalomban.
Debrecen Networkshop 2010 Határon túli magyar tartalomszolgáltatások Networkshop Debrecen, április.
Idegen nyelvek tanulása
Készítette: Terdik Sándor PTM IV. Ismeretszerzés természetes nyelvű dokumentumokból.
Vida Andrea SZTE Egyetemi Könyvtár
1 A nemzeti ITS rendszer-felépítési terv a magyar úthálózatra, valamint a nemzeti rendszerfelépítések harmonizációja HITS – Hungarian ITS Framework Architecture.
A kultúrnemzeti Akadémia tudománypolitikájáról
Hodinka Antal Intézet Tudományos műhelyek a kárpátaljai magyar tudományosság szolgálatában.
EISZ Fórum Október 14.. Szakmai háttér 1. Nyomtatott + elektronikus előfizetés (p+e) 2. elektronikus tartalmak előfizetése (e-only) 3. elektronikus.
Dunaújváros2014. szeptember 15. Projekt eredményeinek disszeminációja – 9. fejlesztési elem ÁROP- 1.A „Szervezetfejlesztés a konvergencia régióban.
A Magyar Elektronikus Könyvtár új szolgáltatásai és működése Moldován István OSZK MEK osztály Balassi Bálint Megyei Könyvtár Salgótarján,
Integrált Könyvtári Rendszer. Történeti áttekintés  ‘85-ben kezdődött el a fejlesztés  ‘94-ben már a felhasználók rendelkezésére állt  ‘95-től az OSZK-val.
ORSZÁGOS SZÉCHÉNYI KÖNYVTÁR E-SZOLGÁLTATÁSI IGAZGATÓSÁG BIBLIOTHECA NATIONALIS HUNGARIAE Az Országos Széchényi Könyvtár digitális folyóirat archiválási.
Szeged, április 16. CACAO projekt katalógusok, digitális könyvtárak lekérdezése saját nyelven Moldován István Országos.
SZTE OPAC, adatbázisok A szakirodalmi keresés kezdő lépései Aranyi Zoltán SZTE Klebelsberg Könyvtár
A Nation Library of Medicine és adatbázisai Vasas Lívia PhD 1 /21.
KERESÉS ELEKTRONIKUS KÖNYVTÁRI KATALÓGUSOKBAN Kiss Annamária Semmelweis Egyetem Központi Könyvtár 2013.
Tudományos publikációk nyilvántartása az MTMT-ben Áncsán Gizella Semmelweis Egyetem Központi Könyvtár Magyar Fül-, Orr-, Gége és Fej-,
Korpusznyelvészet és releváns társterületeik Pintér Tibor.
Érettségi élő idegen nyelv
Készítette: Kiss András
Óbudai Egyetem FENNTARTÓ Rektor Kancellár Szenátus
Magyar Orvosi Bibliográfia (MOB)
A menekültek feltételezett titkos nyelvének vizsgálata
Használd jól a könyvtári katalógust!
Vincze Veronika Korpuszok a nyelvészeti kutatásban: Bevezetés, követelmények ismertetése Vincze Veronika
Kiadói adatbázisok: SpringerLink, PubMed, Surf, a német sport szakadatbázis. Teljes szövegek keresése a SURF-ben április 9. Kovács Klaudia Ágota.
Előadás másolata:

A Magyar Nemzeti Szövegtár Váradi Tamás MTA Nyelvtudományi Intézet Korpusznyelvészeti Osztály

Magyar Nemzeti Szövegtár Rövid jellemzés Kiknek készült? Nemzetközi előzmények Összetétele Mitől „nemzeti”? Hogyan készült? Hogy néz ki belülről? Hogyan használható? Intelligens keresés Hogyan tovább?

Rövid jellemzés Az írott nyelvhasználat hiteles tükre 150 millió szavas reprezentatív minta Válogatott szövegek, egységesen kódolva nyelvhasználatunk keresztmetszete válogatás nem ‘érdem’ alapján Intelligens korpusz nyelvtanilag elemzett és egyértelműsített lekérdezés nyelvtani jellemző szerint is

Kiknek készült? Nyelvészeknek, szótárszerkesztőknek pontos, számszerűsíthető kép napjaink írott magyar nyelvhasználatáról Számítógépes nyelvészeknek értékes forrás számítógépes alkalmazások számára Társadalomtudósoknak, a magyar kultúra kutatóinak a nyelvhasználatban kódolt finom „üzenetek”

Nemzetközi előzmények 60-as évek: BROWN, LOB korpusz 1 millió szavas gondos összeállítás 80-as évek: COBUILD szótár 20 m  450 m szó Bank of English 90-es évek: British National Corpus 100m szó, 10 m szó beszélt nyelvből 90-évektől: nemzeti korpuszok Cseh, szlovén, német, francia, USA, ausztrál stb.

Az MNSZ összetétele Nyelvi változat m. szó Forrás Sajtó 75 online kiadás Szépirodalom 15 Digitális Irod. Akadémia Tudományos próza 20 Magyar Elektronikus Könyvtár Hivatali nyelv Minisztérium, önkormányzat Személyes közlés Index.hu Törzsasztal Összesen: 150

Mitől „nemzeti”? Mérete szerint Tartalma szerint egyedülálló vállalkozás Tartalma szerint nem csak az „írástudó elit” nyelvezete nem csak budapesti nyelvhasználat határon túli nyelvhasználat is Kárpát-medencei Magyar Korpusz előkészületben az MNSZ alapján

Hogyan készült? 1998 – 2000 között OTKA támogatás Elektronikus források Előfeldolgozás Nyelvtani elemzés Egyértelműsítés Összefűzés, indexálás Lekérdező szoftver

Hogy néz ki belülről? Annotált korpusz - részlet belülről <!-- HVG ./0116/0116009.htm --> <div type="article" column="unspec"> <opener> <dateline> <w lemma="HVG" msd="N.NOM" ctag="NS3NN">HVG</w> <w lemma="2001/16" msd="DIG" ctag="Q">2001/16</w> <c lemma="." msd="SPUNCT" ctag="SPUNCT">.</c> <w lemma="szám" msd="N.NOM" ctag="NS3NN">szám</w> <date iso8601="04-21-2001"> <w lemma="2001._április_21." msd="DATUM" ctag="DATUM">2001._április_21.</w> </date> </dateline> </opener> <head rend="IT" type="unspec"> <s> <w lemma="egészségügyi" msd="A.NOM" ctag="AS_A">Egészségügyi</w> <w lemma="szigorítás" msd="N.PL.NOM" ctag="NP3NN">szigorítások</w> </s> </head> <head> <w lemma="sok" msd="Num.NOM" ctag="Q">Sok</w> <w lemma="zseb" msd="N.ELA" ctag="NS3NE">zsebből</w> <w lemma="vérzik" msd="V.e3" ctag="VS3RI">vérzik</w> </s> <head rend="BO" type="display">

Hogyan használható? - Keresés

Hogyan használható? - Találatok

Intelligens keresés Keresés szófaj és nyelvtani alak alapján pl. „az”: 656272 előfordulás névelő és mutatószó egyaránt 15542 esetben mutatószó Két szó együttes előfordulása állandósult szókapcsolatok igei vonzatok

Hogyan tovább? állapotfelvétel a 90-es évek második feléről a nyelvhasználat dokumentálása újabb és újabb állapotfelvétel élő nyelvtörténet minden eddiginél pontosabb adatokkal

Köszönöm a figyelmet! http://corpus.nytud.hu/mnsz varadi@nytud.hu