Az előadás letöltése folymat van. Kérjük, várjon

Az előadás letöltése folymat van. Kérjük, várjon

Tématérképek A tématérkép adatmodell, tématérkép szintaxisok, tématérképek szerkesztése LTM-ben Tóth Máté

Hasonló előadás


Az előadások a következő témára: "Tématérképek A tématérkép adatmodell, tématérkép szintaxisok, tématérképek szerkesztése LTM-ben Tóth Máté"— Előadás másolata:

1 Tématérképek A tématérkép adatmodell, tématérkép szintaxisok, tématérképek szerkesztése LTM-ben Tóth Máté

2 Mai menetrend A tématérkép adatmodell Az ISO/IEC szabványcsalád részei A tématérkép szintaxisok Tématérképek szerkesztése LTM-ben

3

4 Tématípusok A tématípusok dolgok egy osztályát definiálja. –Ha egy fogalomhoz nem rendelhetők konkrét esetek, akkor a fogalom nem tekinthető tématípusnak. –Az "irodalom" lehet-e tématípus? –És az "irodalmi mű" Amikor tématípushoz konkrét esetet rendelünk, akkor állítást fogalmazunk meg, amely a tématípus és a hozzá rendelhető konkrét eset közötti relációt írja le. Pl. a következő állítást formalizáljuk: „A gólyakalifa egy irodalmi mű.” (The nightmare is a literary work.)

5 Tématípusok Puskás Öcsi is a football player Football player is a person. VAGY Buksi is a dog; Dog is an animal; VAGY The National Széchényi Library is a library; Library is a public institution. ? „IS A”

6 Tématípusok IS A relációk és a generikus hierarchialáncok 1. Puskás öcsi Puskás öcsi egy futball játékos A futball játékos egy személy Akkor ebből az következik, hogy Puskás öcsi egy személy 2. Buksi Buksi egy kutya; A kutya egy állat; Tehát Buksi egy állat. 3. OSZK Az OSZK egy könyvtár; A könyvtár egy közintézmény; Az OSZK egy közintézmény.

7 Tématípusok Kanada miniszterelnöke egy homo sapiens. A homo sapiens egy emlős. Tehát: Kanada miniszterelnöke egy emlős? Ez az AKO reláció, vagyis „a kind of” azaz „A homo sapiens egy fajta emlős…” (Az emlősök egy fajtája.)

8 Tématípusok ország (pl. Magyarország) –megye (pl. Baranya) város (pl. Pécs) Tehát: Pécs egy megye? Baranya egy ország? Ezek a partitív relációk Helyesen: hely –ország –megye –város

9 Melyik generikus hierarchialánc?

10 Tématípusok FORMAI KÖVETELMÉNYEK A tématípus legyen kellően általános (az ország jobb tématípus, mint például az európai ország, mert általánosabb fogalomra utal. Igaz ez akkor is, ha ebből az következik, hogy valamennyi európai ország esetében definiálnunk kell egy újabb asszociációt, miszerint Európában található.) Ne legyen nagyon általános sem, mert zavarhatja a megértést. (Az ország tehát jobb, mint a hely, amely képes lenne összemosni a városokat, kontinenseket és az országokat). A tématípus neve legyen rövid a könnyű kezelhetőség, megjeleníthetőség kedvéért. Minden tématípus legyen egyes számban (a tématípus tehát ország és nem országok)

11 Szereptípusok Témák közötti kapcsolatokat írhatunk le asszociációkkal. Az asszociációk szerepek között értelmeződnek. Pl. István király –az ország szempontjából: király –az egyház szempontjából: szent –Szent Imre szempontjából: édesapa –Koppány szempontjából: ellenfél –Géza fejedelem szempontjából: fiú SZEREPEK

12 MAGYARORSZÁG R. KAT. EGYHÁZ GÉZA FEJEDELEM IMRE HERCEG KOPPÁNY VEZÉR király szent fiú édesapa ellenfél

13 Szereptípusok Egy téma akármennyi szerepet felvehet Van amikor a tématípus megegyezik a szereptípussal. –Pl. I. István egy király, I. István királyként van viszonyban Magyarországgal (a téma- és a szereptípus egyaránt király); –Gera Zoltán egy futballista, futballistaként tagja a Fulham csapatának (persze mondhatjuk azt is, hogy az alkalmazottja)

14 Asszociációtípusok Két azonos szerep között szimmetrikus asszociáció –pl. Kosztolányi barátja Karinthynak, Karinthy barátja Kosztolányinak Bináris asszociáció: két különböző szerep között –Kosztolányi férjként viszonyul Harmos Ilonához, aki feleségként viszonyul hozzá) Három- vagy többértékű reláció: Több szereplő vesz részt az asszociációban. –Ki ölt meg kit, mivel? (elkövető, áldozat, elkövetés módja)

15 Asszociációtípusok Kerüljük a redundanciát! Pl. –Géza fejedelem fia István király, –István király fia Imre herceg, –Géza fejedelem unokája Imre herceg Így a tématérképünk is átláthatóbb marad. Nehezebben kerülünk ellentmondásba saját magunkkal. GÉZA IMRE ISTVÁN FIA UNOKÁJA

16 Névtípusok A tématérképek a dolgokat több néven is képesek kezelni! Pl. Dr. Tanner Béla (főorvos) –édesanyjának Bélus; –kollégáknak: Béla; –szomszéd kisfiúnak: Béla bá; –betegeknek: Tanner főorvos úr; –stb. Pl. A gólyakalifa –The nightmare (angol) –Il califo della cicogna (olasz) Kitüntetett névalak Névvariánsok

17 Névtípusok és scope Az egyes névalakok, szerepek csak bizonyos szövegkörnyezetben, beszédmódban értelmezhetők. –Pl. The nightmare (érvényes: angol szövegkörnyezetben) –Bélus (érvényes: informális közegben), Dr. Tanner Béla (hivatalos névalak) Csak a tématérképek képesek ezt kezelni; Mindig kell egy kitüntetett névalak! Mindennek van kontextusa (ha más nem, akkor a nyelv)

18 Scope Az érvényességi tartomány az asszociációk irányát is meghatározza. Az asszociációk kétirányúsága szintén tématérképes specialitás (Ilyet már az LTM tématérképünkben is láttunk) Scope. Akkor érvényes a kijelentés, ha ebben az irányban olvassuk... Lovasi András Kispál és a borz frontembere zenekara

19 Előfordulások A belső előfordulások (internal occurences) olyan rövid adatok, tulajdonságok, amelyek a tématérképen belül könnyen elhelyezhetők, begépelhetők a megfelelő helyre. –Pl. Babitsnál és Kosztolányinál a születési és halálozási évszám feltüntetése. Külső előfordulásként (external occurences) a weben máshol található dokumentumok szerepelhetnek URL cím megadásával (pl. egy regény teljes szövegének hozzáférhetősége).

20 Külső előfordulások A tématérképek kiindulása volt, hogy a kibertérben lévő információkat elérhetővé tegyék. (tárgymutató) A külső előfordulások külső hivatkozások. Előfordulás – hol fordulnak elő információk az adott téma kapcsán. Online és offline forrásokra is lehet hivatkozni: –Könyvekre; –Újságcikkekre; –Honlapokra; Lényegében a PSI egy speciális külső előfordulás, amely az adott téma egyértelműsítését szolgálja.

21 Külső előfordulások T T T T T

22 Belső előfordulások A tématérképen belül elhelyezkedő rövid feljegyzések. Pl. –évszámok (Babits Mihály ) –Adatok (Mount Everest 8848 m) –Tulajdonságok (Gordon „Ő a leggyorsabb a szigeten.”) –Rövid definíció (Kisvakond „Zdenek Miler népszerű mesefigurája, a hasonló című cseh rajzfilm főhőse.” –Stb. A belső előfordulások mentén nem jönnek létre tripletek, így ezek nem kereshetők!

23 Téma vagy előfordulás Melyik megoldás a helyes? Azt szeretnénk kifejezni, hogy az Egri Bikavér színe vörös. két téma közötti asszociáció, vagy előfordulás? VÖRÖS Soproni Kékfrankos Egri Bikavér Belső előfordulás „VÖRÖS” színe Egri Bikavér színe Soproni Kékfrankos Belső előfordulás „VÖRÖS”

24 Ontológiavezérelt tématérkép- szerkesztés Először az ontológiát kell elkészíteni; –Definiálni a téma-, asszociáció-, előfordulás-, név- és szereptípusokat; –Ezek lényegében az ontológai szintű megfelelői a tématérképek elemeinek; –Az ontológiában meg kell adnunk a számszerűségi jellemzőket; –A potenciális kapcsolatokat az egyes elemek között. „Benépesítés” –Az egyes típusokhoz konkrét eseteket rendelünk. Iterativitás –A benépesítés során szokott kiderülni, hogy mi nem jó az ontológiában, ezért állandóan vissza kell oda térni;

25 A tématérkép szabványcsalád A jelenleg elérhető hivatalos szabványok a következők: –ISO/IEC 13250:2003 SGML applications – Topic maps (SGML alkalmazások); –ISO/IEC :2006 Topic Maps – Data model (adatmodell); –ISO/IEC :2007 Topic Maps – XTM Syntax (XTM szintakszis); –ISO/IEC :2009 Topic Maps – Canonicalization (kanonizálás).

26 A tématérkép szabványcsalád A szabványosításért felelős munkacsoport a fentieken túl a következő tématérkép szabványokon dolgozik jelenleg: –ISO/IEC Topic Maps Reference Model (referencia modell); –ISO/IEC CTM (kompakt leíró nyelv); –ISO/IEC GTM (grafikus leíró nyelv); –ISO/IEC Topic Maps Query Language (lekérdező nyelv); –ISO/IEC Topic Maps Constraint Language (specifikációs nyelv).

27 A tématérkép adatmodell A tématérképek sokféleképpen megjeleníthetőek: –tématérkép szintakszisokat használva fájlokban, –adatbázisokban, –futó programok belső adatszerkezeteiként, –és mentálisan az emberi gondolkodásban is. Ezek a formátumok ugyanannak az absztrakt szerkezetnek a megjelenítésére szolgálnak. Az ISO/IEC ezt a szerkezetet határozza meg egy adatmodell formájában.

28 A tématérkép adatmodell Az adatmodell meghatározza –a Tématérképek absztrakt szerkezetét, az információs készlet formalizálásával és szöveges formában bizonyos mértékig az értelmezésüket is. –a Tématérképek összeolvasztásának szabályait, –néhány alapvető tárgyazonosítót. Az adatmodell célja, –hogy meghatározza a Tématérképek csereszabványos szintakszisának értelmezését –és hogy alapul szolgáljon a kanonizálást, lekérdezést, korlátozásokat stb. meghatározó további szabványokhoz.

29 A tématérkép adatmodell Az adatmodell szabad teret enged a dolgok reprezentálásának. Két speciális relációtípust definiál: –Típus-eset kapcsolat –Szupertípus-altípus kapcsolat

30 A tématérkép adatmodell A típus-eset kapcsolat. (homo sapiens – Kanada miniszterelnöke) A tématípus olyan tárgy, amely egy tárgykészlet tagjaiban lévő azonosságokat tömörít. –Bármely tárgy, amely egy adott tématípus kiterjesztéséhez tartozik, annak a tématípusnak az esete. –Egy tématípus lehet egy másik tématípus esete. –Nincs korlátozás, hogy egy tárgy hány tématípusnak lehet az esete. A típus-eset kapcsolat nem tranzitív. Azaz, ha B az A típus esete, és C a B típus esete, ebből nem következik, hogy C esete A-nak. (A – emlős; B – homo sapiens; C – Kanada miniszterelnöke)

31 A tématérkép adatmodell A szupertípus-altípus kapcsolat –Egy általánosabb típus (a szupertípus) és ennek a specifikusabb változata (az altípus) közötti kapcsolat. –Ha B altípusa A-nak, ebből az következik, hogy B minden esete A- nak is esete. –Ennek fordítottja nem feltétlenül igaz. –Egy típusnak akármennyi altípusa és szupertípusa lehet. A szupertípus-altípus kapcsolat tranzitív, ami azt jelenti, hogy ha B altípusa A-nak, és C altípusa B-nek, akkor C altípusa A-nak is. (pl. A – élőlény; B – állat; C – kutya) –Generikus hierarchialánc

32 A tématérkép szintaxisok HyTM (HyTime Topic Maps) –A tématérképek számára eredetileg kifejlesztett szintaxis –Nem része a legújabb ISO szabványnak. –A tématérképek történetének kezdeti szakaszában ez volt az egyetlen szintakszis. –Az alapjául szolgáló HyTime nyelvet eredetileg az SMDL-lel (Standard Music Description Language) együtt kezdték el fejleszteni az 1980-as évek végén. –Arra keresték a választ, hogy miként lehetne zenei utalásokat hiperlinkekkel reprezentálni.

33 A tématérkép szintaxisok HyTime –Az első szabvány javaslat 1989-ben született, –1992. november 1-től az ISO és az IEC közös szabványa lett ISO/IEC tételszámon. A HyTM nyelv, hosszú időn keresztül része volt az ISO/IEC szabványnak.

34 A tématérkép szintaxisok A régi tématérkép szabvány fogalmai: –BOS (Bounded Object Set) –Hub document –Sort name és Display name (Variant name) –Topic charachteristic –Topic characteristic assignment –Unconstrained scope A tématérkép SGML dokumentum.

35 A tématérkép szintaxisok Az XTM –XML Topic Maps = XML Tématérképek –XML (eXtensible Markup Language = Kiterjesztett Jelölőnyelv) alapján tématérképek készítésére kifejlesztett nyelv. –Ez a leggyakrabban használt szintakszis, –A tématérképek nemzetközi csereformátuma.

36 A tématérkép szintaxisok XTM 2.0 –A nyelv legújabb verziója, az XTM 2.0, amely az ISO/IEC 13250:2007(E) szabvány szabvány része. –Az 1.0 verzióhoz képest meglévő különbségeket a szabvány D függeléke tartalmazza. (ISO 13250, 2007) Az XTM alkalmazására manuálisan nincs szükség, így nem okoz problémát annak terjengőssége. –Több tématérkép-szerkesztő program is van forgalomban, amelyekkel készíthetők alkalmazások.

37 A tématérkép szintaxisok A CTM (Compact Topic Maps) –szöveg alapú tématérkép-reprezentáló szintaxis. –Az XTM szabvány kiegészítésére fejlesztik. –A nyelv még nem készült el, jelenleg csupán egy munkaverzió érhető el –Alkalmas arra, hogy manuálisan hozzanak létre tématérképeket, hogy dokumentumokban érthető példákat nyújtsanak általuk, és hogy szintaktikai bázisául szolgáljon a TMCL-nek és a TMQL- nek. –Fő szempont a fejlesztés során az egyszerűség, a könnyű írhatóság és olvashatóság.

38 A tématérkép szintaxisok GTM (Graphical Notation for Topic Maps) –Szintén a tématérképek humán interpretációját segíti –vizuális alapon reprezentálja az alkalmazásban leírt viszonyrendszereket. –A fejlesztés előrehaladott állapotban van, mégsincsenek erről átfogó anyagok. –Maguk a fejlesztői is csak szűk körben használják ezt a szintakszist.

39 A tématérkép szintaxisok

40 LTM (The Linear Topic Map Notation) –Tématérképek közvetlen humán létrehozása és értelmezése szempontjából van jelentősége. –Az LTM az oslói székhelyű Ontopia cég által kifejlesztett nyelv, –egyszerű, az XTM-mel szemben sokkal „szűkszavúbb” és hatékonyabb. –Az LTM elsősorban oktatási célokra készült, –A gyakorlati alkalmazás során megérthetők az alapvető fogalmak.

41 A tématérkép szintaxisok –szöveg-alapú leíró nyelv –alkalmas tématérképek manuális szerkesztésére, a tématérkép modell reprezentálására (pl. ben) –Az Ontopia által készített technikai dokumentáció írja le. –Ebben a jelentésben még nem tartották kizártnak, hogy a nyelv szabvánnyá növi ki magát, –Ugyanilyen céllal elkezdődött a CTM fejlesztése az ISO/IEC keretein belül.

42 A tématérkép szintaxisok ISO 18048: TMQL (Topic Maps Query language) –A tématérkép adatmodellnek megfelelő alkalmazások különböző technológiákkal tárolódnak (relációs adatbázisok, szövegfájlok, XML dokumentumok, tématérkép adatbázisok). –Valamennyi technológia biztosítja a visszakereshetőséget, szükséges volt egy egységes szabványos lekérdező nyelv megalkotása. –A lekérdező nyelv logikája megegyezik a relációs adatbázisok lekérdezésére szolgáló SQL-ével. –A számítógép azt keresi, hogy a hiányzó elem mely asszociációban foglalt állításba helyettesíthető be.

43 A tématérkép szintaxisok ISO/IEC TMCL (Topic Maps Constraint Language) –A OWL (Web Ontology Language) nyelvvel azonos funkciót lát el –A TMCL-t fejlesztő bizottság legújabb munkaverziója július 15-én jelent meg. –A szabványként való közzététel hónapokon belül várható.

44 A tématérkép szintaxisok A tématérkép szabványosítás nem terjed ki valamennyi a technológiával kapcsolatos kérdésre. (Pl.: PSI) A tématérkép technológiában a dolgoknak van identitásuk, Egyértelműen meg kell határozni, hogy amiről egy adott néven állítunk valamit, az pontosan milyen valóságban létező dolognak a reprezentánsa. Ennek a tématérképek esetében –egyrészt az egybeolvasztáskor (merging), –másrészt a témák, fogalmak humán és gépi interpretációját lehetővé tételében van jelentősége.

45 A tématérkép szintaxisok Az OASIS bizottsága öt ajánlást fogalmazott meg a PSI- kre vonatkozóan: 1.A Publikált tárgyindikátor ember által olvasható metaadatokat kell adjon saját magáról; 2.A Publikált tárgyindikátor megadhat géppel olvasható metaadatokat saját magáról; 3.Az első és a második ajánlás metaadatainak következetesnek, de nem feltétlenül azonosnak kell lenni; 4.A Publikált tárgyindikátornak jeleznie kell, hogy PSI-ként használandó; 5.Publikált tárgyindikátornak azonosítania kell a publikálóját.

46 Az Omnigator Tématérkép vizualizáló szoftver, amely az OKS Samplers része; Omnivorous (mindenevő: LTM, XTM, RDF) (OKS Samplers ingyenes letöltés) Indításhoz: apache-tomcat/bin/startup.bat Majd a böngészőbe beírni, hogy Szükséges hozzá: –JAVA Runtime Environment (JRE) 1.4 –JAVA_HOME (Vezérlőpult…) Nézzük meg, hogy mit tud!

47 Az Omnigator A legújabb verzió problémás ügy. Alternatív megoldás: –Licensz kulcsot bemásolni: C:\Documents and Settings\UserName\ –Innen letölteni egy jó verziót: enterprise zip

48

49 Tématérkép-szerkesztés (LTM) Válasszuk ki, hogy miről szeretnénk tématérképet szerkeszteni? –Babits és Kosztolányi regényekről; Papíron írjuk le a fogalmakat, amelyekkel dolgozni szeretnénk –egyelőre a témákat, asszociációkat és előfordulásokat; Az LTM szintaxis szabályai szerint írjuk le az egyes témákat, asszociációkat és előfordulásokat egy szövegfájlba.

50 Fogalmak összegyűjtése Témák: –regény A gólyakalifa Édes Anna Aranysárkány Halálfiai –író Babits Mihály Kosztolányi Dezső –város Budapest Szabadka Szekszárd Asszociációk: –írta (ki írta az adott regényt?) –született (a szerző születési helye) –meghalt (a szerző elhalálozásának helye) –itt játszódik (a regény) Előfordulások: –első megjelenés dátuma (regényé); –kép (szerzőről); –teljes szöveg (regényé); –hivatalos honlap (városé); –élt (születés, és elhalálozás dátuma)

51 Témák definiálása (LTM) [regeny = ”Regény”] [golyakalifa = ”A gólyakalifa”] [edes-anna = ”Édes Anna”] [halalfiai = ”Halálfiai”] [aranysarkany = ”Aranysárkány”] [golyakalifa : regeny] [edes-anna : regeny] [halalfiai : regeny] [aranysarkany : regeny] [iro = ”Író”] [babits = ”Babits Mihály”] [kosztolanyi = ”Kosztolányi Dezső”] [babits : iro] [kosztolanyi : iro] [varos = ”Város”] [budapest = ”Budapest”] [szabadka = ”Szabadka”] [szekszárd = ”Szekszárd”] [budapest : varos] [szabadka : varos] [szekszard : varos]

52 regény író város Édes Anna A gólyakalifa Halálfiai Aranysárkány Babits Kosztolányi Szabadka Szekszárd Budapest

53 Asszociációk definiálása (LTM) [irta = ”írta” =”regénye” / iro] irta( babits, golyakalifa ) irta( babits, halalfiai ) irta( kosztolanyi, edes-anna ) irta( kosztolanyi, aranysarkany ) [szul = ”szülőhelye a következőnek” =”születési helye” / iro] szul( babits, szekszard ) szul( kosztolanyi, szabadka ) [hal = ”elhalálozási helye a következőnek” =”elhalálozásának helye” / iro] hal( babits, budapest ) hal( kosztolanyi, budapest ) [jatsz = ”itt játszódik” =”a következő helyen játszódik” / regeny] jatsz( halalfiai, szekszard ) jatsz( edes-anna, budapest ) jatsz( aranysarkany, szabadka )

54 regény író város Édes Anna A gólyakalifa Halálfiai Aranysárkány Babits Kosztolányi Szabadka Szekszárd Budapest

55 regény író város Édes Anna A gólyakalifa Halálfiai Aranysárkány Babits Kosztolányi Szabadka Szekszárd Budapest írta szül hal jatsz

56 Előfordulások definiálása (LTM) BELSŐ ELŐFORDULÁSOK [megj = ”Első megjelenés dátuma”] {golyakalifa, megj, [[1913]]} {edes-anna, megj, [[1926]]} {aranysarkany, megj, [[1925]]} {halalfiai, megj, [[1927]]} [elt = ”Élt”] {babits, elt, [[ ]]} {kosztolanyi, elt, [[ ]]} KÜLSŐ ELŐFORDULÁSOK [kep = ”Kép”] {babits, kep, ”http://upload.wikimedia.org /wikipedia/hu/6/6d/Babits.jp g”} {kosztolanyi, kep, ”http://upload.wikimedia.org /wikipedia/hu/5/5b/Kosztolan yi.jpg”} [szoveg = ”Teljes szöveg”] {golyakalifa, szoveg, ”http://mek.oszk.hu/00600/00 600/”}


Letölteni ppt "Tématérképek A tématérkép adatmodell, tématérkép szintaxisok, tématérképek szerkesztése LTM-ben Tóth Máté"

Hasonló előadás


Google Hirdetések