Prószéky Gábor MorphoLogic DAT-2006, november 21. Prószéky Gábor MorphoLogic Pázmány Péter Katolikus Egyetem Információs Technológiai Kar Nyelvtechnológia és a szerzői jogi iparágak
Prószéky Gábor MorphoLogic DAT-2006, november 21. A nyelvi tartalomipar Definíció: a nyelvi tartalomra épülő termékekkel (információs alakzatokkal) és szolgáltatásokkal összefüggő alkotás, fejlesztés, valamint ezek disztribúciója Típusai: a nyomtatott kiadványok (pl. szótár, nyelvkönyv) az audiovizuális ipar (pl. nyelvtanító TV- vagy rádióadás, film) az elektronikus publikációk (pl. online vagy offline nyelvi adatbázisok/szótárak, CD- vagy internet-alapú szolgáltatások)
Prószéky Gábor MorphoLogic DAT-2006, november 21. A nyelvtechnológiai tartalom Nyelvtechnológiai tartalom = az elektronikus világban megjelenített nyelvi tartalom Előállítása: alapértelmezésben nem a nyelvtechnológia keretében jön létre, hanem „már létezik” Feldolgozása: hozzáadott értékkel vagy anélkül (v.ö. az első autó) Közlése: közvetett tartalommal: a szoftvereszközökbe beépül közvetlen tartalommal: a felhasználóhoz az eredeti nyelvi tartalom jut el (új formában)
Prószéky Gábor MorphoLogic DAT-2006, november 21. A MorphoLogic „nyelvtechnológia-ipari” eredményei Fogalmazástámogatás (Helyesek): szóellenőrzők (Helyes-e?), mondatellenőrzők (Helyesebb), toldalékoló szinonimaszótárak (Helyette), elválasztóprogramok (Helyesel) Kereséstámogatás (HelyesLem, MorphoStem) Gépi fordítás (MetaMorpho, MoBiCAT, MorphoWord, Szótárak és megértéstámogatás (MoBiDic, MoBiWeb, MoBiMouse, … és ez utóbbi a „jogilag kritikus” terület!
Prószéky Gábor MorphoLogic DAT-2006, november 21. A nyelvi/szótári tartalomszolgáltatás és a szerzői jog Az „offline világban” kialakult szerzői jog egyszerű alkalmazása nem igazán működik, de van itt még más is… A fő nyelvi/szótári tartalomkategóriák: szabadon hozzáférhető, letölthető, használható nyelvi/szótári tartalom (free HLT content) kötelezően hivatkozandó, szabad terjesztésű és felhasználású nyelvi/szótári tartalom (free content with exact reference to the HLT source) jogosultság alapján elsajátítható nyelvi/szótári tartalom (titled HLT content). klasszikus szerzői joggal védett nyelvi/szótári tartalom (copyrighted HLT content)
Prószéky Gábor MorphoLogic DAT-2006, november 21. Egy példa… X szótári termékből: Az „eredeti” (=bizonyíték 1 ):
Prószéky Gábor MorphoLogic DAT-2006, november 21. „Most már van egy újabb szótári tartalom is az elektronikus piacon” Csak: az egyik létrehozta, a másik meg nem az egyik lektoráltatta, a másik meg nem az egyik fizet utána jogdíjat, a másik meg nem az egyiknek talán marad valamije a marketingre, a másiknak meg a marketing az egyetlen költsége … és a marketinget olyan tényekre építi, amik jól hangzanak, és némiképp eltakarják az igazi forrást (pl. egyedileg értelmezett „számokat” használ)
Prószéky Gábor MorphoLogic DAT-2006, november 21. A „szó-szaporításról” X szótár azt állítja magáról, azért a legnagyobb, mert szópár kifejezéspár = „pár” van benne … és az „eredeti forrás” tényleg kisebb? Angol−magyar Akadémiai Nagyszótár: jelentéspár Magyar−angol Akadémiai Nagyszótár: jelentéspár összesen jelentéspár A két szótárban szereplő zárójelpár és a törtvonal feloldásával az Akadémiai Nagyszótárban jelentéspár van Az eredeti egy szócikke: … és a „csodálatos szó-szaporítás” ezzel „ekvivalens” 5 szócikke:
Prószéky Gábor MorphoLogic DAT-2006, november 21. A sajtó felelőssége Egyre többször megjelenik az „ál-objektivitás” „Nem akarunk állást foglalni két szótárkiadó vitájában” Analógia: „nem akarunk állást foglalni két magánember, a betörő és a lakástulajdonos vitájában”
Prószéky Gábor MorphoLogic DAT-2006, november 21. Köszönöm a figyelmet!