Magyar Tudományos Akadémia Budapest, november 24.
HATÁRTALANÍTÁS ÉS HT-SZÓTÁR Lanstyák István–Benő Attila
Miről lesz szó? 1. Bevezetés: alapfogalmak – határtalanítás – ht-szótár 2. Ez történt (a határtalanítás rövid története, tanulságokkal) 3. A Termini magyar–magyar szótár és adatbázis bemutatása
1. Bevezetés
Alapfogalmak
Határtalanítás – banalitás: magyar ≠ magyarországi, ahogy sokan hiszik Magyarországon – határtalanítás általában – szóhatártalanítás GYIK: tyepi mint „rendes szó”) – névhatártalanítás – Kárpát-medencei magyar nyelvi korpusz
Ht-szótár – Termini magyar–magyar szótár és adatbázis (magyar–magyar–magyar–magyar– magyar–magyar–magyar–magyar szótár )
2. Ez történt
Előzmények –1994
Tájszógyűjtés – a Magyar Nyelvjárások Atlasza gyűjtési munkálatai során az Atlasz munkatársai néhány Fv szót is följegyeztek (tájszóként) és közre is adtak a szlovákiai kutatópontok tájszavai közt – nem tudni, hogy tudatában voltak-e annak, hogy ezek nem „ártatlan” tájszavak, hanem a nyelvművelők által megbélyegzett elemek
Nyelvművelői megközelítés – „nyelvhelyesség” és a ht-szavak: a határon túli magyarok nyelvhasználatában nincs olyan fogalom, amelyet ne lehetne „magyarul“ (értsd: magyarországi magyar nyelven) kifejezni, ezért a sajátos határon túli magyar szavak használata még a nyelvhasználat alacsonyabb szintjén, a mindennapi beszélt nyelvben sem indokolt, az írásbeliség magasabb szintjein pedig szóba sem jöhet
→ nyelvi homogenista ideológia, amely abban a korban egyeduralkodó volt !!! a politikai rendszer homogenista törekvései is hathattak rá
a) közvetlen kölcsönszavak: nagyfokú elutasítás (nem magyar szavak, sőt nem is szavak) b) közvetett kölcsönszavak: – egy részük: „fordítási hiba” – más részüket: kényszerűségből elfogadták ! egyik csoportot sem tartották tudományos vizsgálatra érdemesnek
→ nyelvi performancionalista ideológia – a platonista ideológia egyik válfaja – domináns volt a kor nyelvművelésében – megtagadta a nyelvi státuszt azoktól az elemektől, amelyek a szisztemista és/vagy purista ideológia szempontjából nem voltak megfelelőek (pl. a szó idézőjelezése)
Helyesírási kéziszótár és Magyar helyesírási szótár – (tudtunkkal) egyedüli magyarországi kiadvány, amely nem megbélyegzési szándékkal közölt határon túli szókészleti elemeket
– HKsz. (1988): alapiskola 'általános iskola‘, egységes földműves-szövetkezet 'mezőgazdasági termelőszövetkezet‘; Duna Menti Múzeum – MHSz. (1999): alapiskola, Duna Menti Múzeum
Szombathely 1983 – 4. nemzetközi magyar nyelvész- kongresszus – Pete István A magyar nyelv állami változatai (Kárpátukrán változat). Kiss Jenő–Szűts László szerk., A magyar nyelv rétegződése I–II, 779–789. Budapest: Akadémiai Kiadó.
– a magyar nyelv állami változatainak fogalma – a szótárkészítők a jövőben „nagyobb mértékben“ legyenek tekintettel a magyarországi standardtól eltérő ht szókészlettani sajátosságokra → mérföldkő: a pluralista és vernakularista nyelvi ideológiák nyílt megjelenése ! a „nyelvmentők” részéről visszhangtalan maradt
Eger 1994 – 6. nemzetközi magyar nyelvészkongresszus – Lanstyák István–Szabómihály Gizella 1994/1998. Standard – köznyelv – nemzeti nyelv. Kontra Miklós--Saly Noémi szerk., Nyelvmentés vagy nyelvárulás? (Vita a határon túli magyar nyelvhasználatról.), 211–216. Budapest: Osiris Kiadó.
– a standard minden kritériumának megfelelő szókészleti elemek bemutatása – konklúzió: – a Fv nyelvváltozatok sajátos szókincsének három rétege: standard, köznyelvi, szubstandard → ezek közül a standard és a köznyelvi elemeket szükséges volna felvenni az ÉKsz. új kiadásába „Ha nem a magyar nyelv értelmező szótára szorít nekik helyet, akkor vajon milyen nyelvű szótárba kell őket utasítani?”
– Pusztai Ferenc Leíró lexikográfiánk változó és változatlan feladatai. Magyar Nyelv 90, 413 – 421. – szükség van rá, hogy a ht magyar nyelvváltozatok formális regisztereiben használatos elemek egy része bekerüljön a szótárakba !!! ezek közt nem lehetnek „kevert“ elemek !!! a készülő kiadásban még nem lehet erről szó, megfelelő háttérkutatások hiányában → nyelvi purizmus
A „hőskor” 1994–2003
Budapest 1994 ősze – a Nyelvtudományi Intézet átértékelte az értelmező kéziszótár új kiadásának koncepcióját – Er: Péntek János és Szilágyi N. Sándor – Fv: Lanstyák István – Ka: Csernicskó István (– Va: Ágoston Mihály)
1995 eleje Pusztai Ferenc 8 irányelve – 2. irányelv: a szótárba bevett lexéma nem lehetett volna „kevert elem“ (közvetlen kölcsönszó, tükörszó, tükörkifejezés, jelentésbeli kölcsönszó) → nyelvi purizmus
– 3. irányelv: adatolható kellett volna legyen az igényes publicisztikából, szakirodalomból, sőt a szépirodalomból is, méghozzá egynél több szerzőtől → nyelvi belletrizmus, nyelvi elitizmus, nyelvi elegantizmus → e két irányelv figyelembevételével egyetlen lexéma se kerülhetett volna be a szótárba
Szótári munkálatok 1995–2003 – a felkért szakemberek javaslatait Pusztai Ferenc korrektül bírálta el !!! egy-egy szó szótárazásának elutasítása sosem történt pusztán purista megfontolások alapján, hanem az a szótár egészének logikájából következett, legtöbbször a következetesség szempontjai indokolták
→ Er, Fv, Ka szójegyzékek: három önálló szójegyzék – egymástól teljesen függetlenül jöttek létre – az egyes régiókban dolgozó munkatársak nem ismerték egymás szójegyzékeit, így nem is történt köztük semmiféle egyeztetés – ennek ellenére vannak a kéziszótárban „többrégiós” szavak, azok, amelyeket egynél több régióban javasoltak felvételre a munkatársak, egymástól függetlenül
!!! a legtöbb közös szó viszont nem tartalmazza mindhárom régió felségjelzését → megtévesztő, hiszen valamely régió felségjelzésének megléte azt implikálja, hogy a másik két ht régióban az illető szó nem használatos – pl. a blokk ‘lakótelepi panelház; tömbház’ jelentésben az ÉKSz. 2 -ben csak Er és Fv szóként van jelölve, holott a Ka nyelvváltozatokban is használatos (sőt minden Kárpát-medencei ht régióban)
Példák egyéb „áldozatul esett” Ka szavakra – átmegy ‘ elmúlik, megszűnik’ – balkon (nem „választékos”), balkonos – bufet ‘büfé’ – diplom ‘elismerő oklevél’ – elsős ‘elsőéves’, másodikos ‘másodéves’ stb. – fal ‘szekrénysor’
– fizikai személy ‘természetes személy’ – fogpaszta (nem „régies”) – halász ‘horgász’, halászik ‘horgászik’ – házasságlevél ‘házassági anyakönyvi kivonat’ – infarkt ‘(szív)infarktus’ – internát ‘diákotthon’, internátus (nem „régies”) – kapitány ‘százados’ (nem „régies”) – kaszárnya (nem „régies”)
– kibeszéli magát ‘kimagyarázkodik’ (nem „ritka”) – kihágás (nem „régies”) – község ‘önálló jogállású település (város is)’ – kurz ‘tanfolyam’ – kurzus (nem „kissé választékos”, inkább „bizalmas”) – leesik ‘elesik’ – norma ‘szabvány’ – paciens ‘páciens’
– pasztelina, plasztelina ‘gyurma’ – polgár ‘lakos’ – poliklinika ‘rendelőintézet’ – prorektor ‘rektorhelyettes’ – rászed ‘rávesz’ – respekt ‘tekintély’ – fizetetlen szabadság ‘fizetés nélküli szabadság’ – szesztra ‘nővér, ápolónő’ – szirup ‘szörp’
– szvetter ‘kardigán’ (nem „régies”) – tanító ‘tanár’ – útadó ‘súlyadó’ – vetrovka ‘dzseki’ – vizsgán van ‘vizsgázik’
Hu gondok !!! mintha még a Hu anyaggal se történt volna mindig egyeztetés – respekt → valójában a nyelvi konzervativizmus (nyelvi purizmus?, nyelvi originalizmus? érvényesülése)
Stílusminősítés – az egyeztetés hiánya miatt még a többrégiósként felvett szavakban sem biztos, hogy az azonos stílusminősítés azonos stílusértéket takar-e, ill. az eltérő stílusminősítés eltérő stílusértéket takar-e (nem kaptunk szerkesztési útmutatót, sem irányelveket)
A Termini Kutatóhálózat szóhatártalanító munkálatai 2003–
A „papír nélküli papírszótár” korszaka (2003—2007)
Regionális szólisták 2003 –2004 Papír nélküli „papírszótárak” – regionális szólisták az Osiris Idegen szavak szótára számára – munkaeszközök: a) szövegszerkesztő: papírszótár típusú szócikkek b) levelezőprogram: kapcsolattartás, egyeztetés, anyagok átküldése egymásnak
c) koordinátor – listák összehasonlítása – változtatások bevitele – értelmezések egységesítése – stílusértékek egymáshoz viszonyítása – példamondatok egyeztetése – javaslatok új szócikkekre → „közvetett közös fejlesztés”
„Csatlakozási tárgyalások” – 2003 őszén: a négy nagyrégióban kezdődtek a munkálatok (Er, Fv, Va, Ka) – 2003 végén: két kisrégió csatlakozása (Mv, Őv) – 2004 tavaszán: a hiányzó kisrégió csatlakozása (Hv)
Ht-lista 2004–2007 – 2004 júniusában: a hét régió saját szójegyzékeinek összeolvasztása → ht-lista – áttekinthetőbbé vált a nyelvi anyag, s némileg könnyebben kezelhetővé is – minden változtatást a koordinátor vitt be (a ht-lista szétfejlődésének megelőzése érdekében)
Ht-online (2007—)
– 2006 kora tavasza: Juhász Tihamér kezdeményezése → fordulópont a szóhatártalanítás történetében – 2007 folyamán a szótár anyaga felkerült a világhálóra, s létrejött egy interaktív online szótár, amely fokozatosan multifunkciós adatbázissá bővült
a) szótárként: hozzáférhetővé vált a látogatók számára b) multifunkciós adatbázisként: hatalmas lehetőségeket magában rejtő, hatékony munkaeszközzé vált az szerkesztők, ill. kutatók számára
3. A Termini magyar–magyar szótár és adatbázis
Főbb jellemzői
1. Az együttműködést segítő funkciók a) Szimultán módon elérhető – egymástól több száz kilométerre, különböző országokban tartózkodó munkatársak egyszerre dolgozhatnak ugyanazzal az adatbázissal
b) Gyors kommunikációs lehetőséget biztosít – ímélküldés a keresőfelületről
– megjegyzések fűzése az egyes szócikkekhez, azok részeihez
a) kényelmesen kezelhető szerkesztőfelület 2. A szerkesztőmunkát megkönnyítő további funkciók
b) listázási lehetőségek, pl.: – adathiányos szócikkek – konstruált példamondatokat tartalmazó szócikkek – belső megjegyzéssel ellátott szócikkek – külső megjegyzéssel ellátott szócikkek
– példamondat nélküli jelentéseket tartalmazó címszók – felségjelzések régiók szerint – teljes lista készítése (→ ezáltal újjáéledt az egykori ht-lista) – részleges listák készítése, pl. A–C kezdőbetűs szócikkek – regionális listák készítése (→ ezáltal a megszüntetett regionális listák is újjáéledtek) – a külső felhasználók elől elrejtett (nem kész) szócikkek
c) kimutatások – pl. példamondat- típusok száma
a) listázások – keresési kifejezések rostált listája b) kimutatások (– leggyakrabban megtalált szócikkek) – felhasználók regisztrációjának időbeli eloszlása – keresések időbeli eloszlása 3. A továbbfejlesztést segítő funkciók
a) a kereső- és a böngészőfelületről elérhető „módosítási lista” 4. Felügyeleti és visszakereshetőségi funkciók
– a módosítási lista segítségével az egyes szerkesztők tevékenysége követhetővé és szükség esetén visszafordíthatóvá vált → a program nem egyszerűen felülírja az aktuális szerkesztés előtti változatot, hanem meg is őrzi (szerkesztéstörténet)
b) listázások – egy-egy szerkesztő által módosított szócikkek jegyzéke c) kimutatások, pl.: – egy-egy szerkesztő által módosított szócikkek száma és időbeli eloszlása
– felségjelzések száma régiók szerint
a) listázások, pl.: – stílusminősítések – stílusminősítések kombinációi – többrégiós szócikkek listája – egyszerűsített listák készítése (pl. csak címszót, szófaji minősítést, nyelvtani alakokat, felségjelzéseket tartalmazók) 5. Kutatási funkciók
b) kimutatások, pl.: – különbözõ szófajú szavak száma
a) keresés – címszóban, jelentésben, példamondatban – szó elején, szó belsejében, szó végén, teljes egyezéssel – ékezetes és ékezet nélküli keresés 6. Online szótári funkciók
b) böngészés – szó elején, szó belsejében, szó végén, teljes egyezéssel – választható a teljes szócikk vagy címszó megjelenítése
7. Interaktivitás a) „megjegyzés” funkció a regisztrált felhasználók megjegyzéseket fűzhetnek az egyes szócikkekhez
b) fórum (eddig még nem sikerült aktívvá tenni)
Újszerű vonások
Többdimenziós stílusminősítési rendszer
– az ÉKSz. 2 -munkálatok során egyértelművé vált: a hagyományos minősítésekkel lehetetlen szakmailag korrekt módon megragadni a ht szókincs változatosságát (amiképp egyébként a közmagyar szókincsét is…) – legnagyobb probléma: a minősítések egy részének többértelműsége, ill. néhány minősítés „ideologizáltsága”
A Termini stílusminősítési rendszer jellemzői: a) többdimenziós rendszer: a minősítés különféle szempontjai nem keverednek, hanem elválnak egymástól b) a semleges stílusértéket is jelöljük (a listázások, azaz a kutatás megkönnyítése végett) c) nem alkalmazunk ideologikus minősítéseket, mint az ÉKSz. 2 „vulgáris” és „kiveszőben” minősítése, ill. „pongyola használatú”, „helyesebben” stb. kitételei
A stílusminősítési rendszer dimenziói
– a földrajzi és társadalmi (iskolázottsági, kétnyelvűségi, korosztályi) dialektusokra vonatkozó minősítések 1. Dialektális dimenzió
2. Regiszterbeli dimenzió – azok a stílusértékek, amelyekre a bizonyos specializált tevékenységekhez vagy élethelyzetekhez kötődő (vagy nem kötődő) lexémák tesznek szert
3. Stílusváltozati dimenzió – a beszédhelyzet formalitása által meghatározott regiszterek alkotják
4. Időbeliség dimenziója – a nyelv korábbi állapotából fennmaradt elemek mai nyelvi sajátos stílusértéke fejeződik ki ezekben a minősítésekben
5. Érzelmi dimenzió – a lexémákhoz való pozitív vagy negatív beszélői viszonyulás, érzelmi telítettség
6. Egyéb jelölések – gyakoriság – felségjelzések
Példamondatok minősítése
– nagyban meghatározza a szövegrészletben található címszó jelentésének és stílusértékének megállapítását A példamondatok státusza
A szó és a beszélő régióbeli hovatartozásának megkülönböztetése – ehhez az a felismerés vezetett, hogy egy beszélő alkalmanként más régió szavait is használja, s az ilyen használat dokumentálásának is nagy az értéke (pl. Hu turisták Er szavakat tanulnak meg, Er beszélő Szlovákiában vállal munkát, és Fv szavakat tanul meg)
A példamondatok nagy száma
– mivel nem korlátoz minket a terjedelem úgy, mint a papírszótárak esetében, korlátok nélkül gyűjtjük a példamondatokat, ha kell, bő kontextussal (a kontextus segít a jelentés/árnyalat/ és a stílusérték megállapításában) → a Termini-szótár és adatbázis így egyre inkább „korpusz alapúvá” válik, bár a „korpusz”-t egyelőre még csak szövegrészletek képviselik
– fontolóra vesszük, hogy nem lehetne-e a Termini-szótár példamondatait hasonló módon generálni egy korpuszból, mint azt teszi pl. az MNSZ, természetesen megőrizve szótár jellegét – ehhez első lépésnek tekinthető a nemrégiben elkezdett fejlesztés: példamondatok automatikus keresése az interneten, a példamondatokat tartalmazó oldalak automatikus eltárolása
Az eddig megtett út
Az értelmező kéziszótár „blokk”- kal kezdődő szócikkbokra
A ht-lista „blokk” szócikke
A Termini-szótár és adatbázis „blokk” szócikkének 1.változata (két-két példamondattal)
A Termini-szótár és adatbázis „blokk” szócikkének 2.változata (az összes példamondattal)
Tervek és álmok
a) ← a szótári adatbázis korpusz hátterűvé való alakítása b) értelmezéseknek a denotátumot ábrázoló fényképekkel való kiegészítése tárgyat jelölő szavak esetén c) azokban az esetekben, amikor a denotátum helyi kulturális sajátság, néprajzi leírások beiktatása, ill. belinkelése (saját adatbázisból)
d) a beszélt nyelvi példamondatok meghallgathatósága e) a szótárban közölt elemekre vonatkozó bibliográfia létrehozása, ill. maguknak a szövegeknek az összegyűjtése és belinkelése
→ a fejlesztések nyomán az, ami szójegyzékként indult, szótárként folytatódott s többfunkciós adatbázissá vált, fokozatosan olyan komplex információs rendszerré nőhetné ki magát, amely magába foglalná a szótár, a strukturált adatbázis, a nyelvi korpusz, valamint a lexikon és az enciklopédia jellemzőit