Az előadás letöltése folymat van. Kérjük, várjon

Az előadás letöltése folymat van. Kérjük, várjon

Tóth Máté Toth.Mate@feek.pte.hu Tématérképek A tématérkép adatmodell, tématérkép szintaxisok, tématérképek szerkesztése LTM-ben Tóth Máté Toth.Mate@feek.pte.hu.

Hasonló előadás


Az előadások a következő témára: "Tóth Máté Toth.Mate@feek.pte.hu Tématérképek A tématérkép adatmodell, tématérkép szintaxisok, tématérképek szerkesztése LTM-ben Tóth Máté Toth.Mate@feek.pte.hu."— Előadás másolata:

1 Tóth Máté Toth.Mate@feek.pte.hu
Tématérképek A tématérkép adatmodell, tématérkép szintaxisok, tématérképek szerkesztése LTM-ben Tóth Máté

2 Mai menetrend A tématérkép adatmodell
Az ISO/IEC szabványcsalád részei A tématérkép szintaxisok Tématérképek szerkesztése LTM-ben

3

4 Tématípusok A tématípusok dolgok egy osztályát definiálja.
Ha egy fogalomhoz nem rendelhetők konkrét esetek, akkor a fogalom nem tekinthető tématípusnak. Az "irodalom" lehet-e tématípus? És az "irodalmi mű" Amikor tématípushoz konkrét esetet rendelünk, akkor állítást fogalmazunk meg, amely a tématípus és a hozzá rendelhető konkrét eset közötti relációt írja le. Pl. a következő állítást formalizáljuk: „A gólyakalifa egy irodalmi mű.” (The nightmare is a literary work.)

5 ? „IS A” Tématípusok Puskás Öcsi is a football player
Football player is a person. VAGY Buksi is a dog; Dog is an animal; The National Széchényi Library is a library; Library is a public institution. ? „IS A”

6 Tématípusok IS A relációk és a generikus hierarchialáncok
1. Puskás öcsi Puskás öcsi egy futball játékos A futball játékos egy személy Akkor ebből az következik, hogy Puskás öcsi egy személy 2. Buksi Buksi egy kutya; A kutya egy állat; Tehát Buksi egy állat. 3. OSZK Az OSZK egy könyvtár; A könyvtár egy közintézmény; Az OSZK egy közintézmény.

7 Tématípusok Kanada miniszterelnöke egy homo sapiens.
A homo sapiens egy emlős. Tehát: Kanada miniszterelnöke egy emlős? Ez az AKO reláció, vagyis „a kind of” azaz „A homo sapiens egy fajta emlős…” (Az emlősök egy fajtája.)

8 Tématípusok ország (pl. Magyarország) megye (pl. Baranya)
város (pl. Pécs) Tehát: Pécs egy megye? Baranya egy ország? Ezek a partitív relációk Helyesen: hely ország megye város

9 Melyik generikus hierarchialánc?

10 Tématípusok FORMAI KÖVETELMÉNYEK
A tématípus legyen kellően általános (az ország jobb tématípus, mint például az európai ország, mert általánosabb fogalomra utal. Igaz ez akkor is, ha ebből az következik, hogy valamennyi európai ország esetében definiálnunk kell egy újabb asszociációt, miszerint Európában található.) Ne legyen nagyon általános sem, mert zavarhatja a megértést. (Az ország tehát jobb, mint a hely, amely képes lenne összemosni a városokat, kontinenseket és az országokat). A tématípus neve legyen rövid a könnyű kezelhetőség, megjeleníthetőség kedvéért. Minden tématípus legyen egyes számban (a tématípus tehát ország és nem országok)

11 Szereptípusok Témák közötti kapcsolatokat írhatunk le asszociációkkal.
Az asszociációk szerepek között értelmeződnek. Pl. István király az ország szempontjából: király az egyház szempontjából: szent Szent Imre szempontjából: édesapa Koppány szempontjából: ellenfél Géza fejedelem szempontjából: fiú SZEREPEK

12 király ellenfél édesapa szent fiú KOPPÁNY VEZÉR MAGYARORSZÁG
IMRE HERCEG GÉZA FEJEDELEM R. KAT. EGYHÁZ

13 Szereptípusok Egy téma akármennyi szerepet felvehet
Van amikor a tématípus megegyezik a szereptípussal. Pl. I. István egy király, I. István királyként van viszonyban Magyarországgal (a téma- és a szereptípus egyaránt király); Gera Zoltán egy futballista, futballistaként tagja a Fulham csapatának (persze mondhatjuk azt is, hogy az alkalmazottja)

14 Asszociációtípusok Két azonos szerep között szimmetrikus asszociáció
pl. Kosztolányi barátja Karinthynak, Karinthy barátja Kosztolányinak Bináris asszociáció: két különböző szerep között Kosztolányi férjként viszonyul Harmos Ilonához, aki feleségként viszonyul hozzá) Három- vagy többértékű reláció: Több szereplő vesz részt az asszociációban. Ki ölt meg kit, mivel? (elkövető, áldozat, elkövetés módja)

15 Asszociációtípusok GÉZA Így a tématérképünk is átláthatóbb marad.
Kerüljük a redundanciát! Pl. Géza fejedelem fia István király, István király fia Imre herceg, Géza fejedelem unokája Imre herceg Így a tématérképünk is átláthatóbb marad. Nehezebben kerülünk ellentmondásba saját magunkkal. GÉZA FIA UNOKÁJA ISTVÁN FIA IMRE

16 Névtípusok A tématérképek a dolgokat több néven is képesek kezelni!
Pl. Dr. Tanner Béla (főorvos) édesanyjának Bélus; kollégáknak: Béla; szomszéd kisfiúnak: Béla bá; betegeknek: Tanner főorvos úr; stb. Pl. A gólyakalifa The nightmare (angol) Il califo della cicogna (olasz) Kitüntetett névalak Névvariánsok

17 Névtípusok és scope Az egyes névalakok, szerepek csak bizonyos szövegkörnyezetben, beszédmódban értelmezhetők. Pl. The nightmare (érvényes: angol szövegkörnyezetben) Bélus (érvényes: informális közegben), Dr. Tanner Béla (hivatalos névalak) Csak a tématérképek képesek ezt kezelni; Mindig kell egy kitüntetett névalak! Mindennek van kontextusa (ha más nem, akkor a nyelv)

18 Scope Az érvényességi tartomány az asszociációk irányát is meghatározza. Az asszociációk kétirányúsága szintén tématérképes specialitás (Ilyet már az LTM tématérképünkben is láttunk) Scope. Akkor érvényes a kijelentés, ha ebben az irányban olvassuk... zenekara Lovasi András Kispál és a borz frontembere

19 Előfordulások A belső előfordulások (internal occurences) olyan rövid adatok, tulajdonságok, amelyek a tématérképen belül könnyen elhelyezhetők, begépelhetők a megfelelő helyre. Pl. Babitsnál és Kosztolányinál a születési és halálozási évszám feltüntetése. Külső előfordulásként (external occurences) a weben máshol található dokumentumok szerepelhetnek URL cím megadásával (pl. egy regény teljes szövegének hozzáférhetősége).

20 Külső előfordulások A tématérképek kiindulása volt, hogy a kibertérben lévő információkat elérhetővé tegyék. (tárgymutató) A külső előfordulások külső hivatkozások. Előfordulás – hol fordulnak elő információk az adott téma kapcsán. Online és offline forrásokra is lehet hivatkozni: Könyvekre; Újságcikkekre; Honlapokra; Lényegében a PSI egy speciális külső előfordulás, amely az adott téma egyértelműsítését szolgálja.

21 Külső előfordulások T T T T T

22 Belső előfordulások A tématérképen belül elhelyezkedő rövid feljegyzések. Pl. évszámok (Babits Mihály ) Adatok (Mount Everest 8848 m) Tulajdonságok (Gordon „Ő a leggyorsabb a szigeten.”) Rövid definíció (Kisvakond „Zdenek Miler népszerű mesefigurája, a hasonló című cseh rajzfilm főhőse.” Stb. A belső előfordulások mentén nem jönnek létre tripletek, így ezek nem kereshetők!

23 Téma vagy előfordulás Melyik megoldás a helyes?
Azt szeretnénk kifejezni, hogy az Egri Bikavér színe vörös. két téma közötti asszociáció, vagy előfordulás? Soproni Kékfrankos színe VÖRÖS Egri Bikavér színe Egri Bikavér Soproni Kékfrankos Belső előfordulás „VÖRÖS” Belső előfordulás „VÖRÖS”

24 Ontológiavezérelt tématérkép-szerkesztés
Először az ontológiát kell elkészíteni; Definiálni a téma-, asszociáció-, előfordulás-, név- és szereptípusokat; Ezek lényegében az ontológai szintű megfelelői a tématérképek elemeinek; Az ontológiában meg kell adnunk a számszerűségi jellemzőket; A potenciális kapcsolatokat az egyes elemek között. „Benépesítés” Az egyes típusokhoz konkrét eseteket rendelünk. Iterativitás A benépesítés során szokott kiderülni, hogy mi nem jó az ontológiában, ezért állandóan vissza kell oda térni;

25 A tématérkép szabványcsalád
A jelenleg elérhető hivatalos szabványok a következők: ISO/IEC 13250:2003 SGML applications – Topic maps (SGML alkalmazások); ISO/IEC :2006 Topic Maps – Data model (adatmodell); ISO/IEC :2007 Topic Maps – XTM Syntax (XTM szintakszis); ISO/IEC :2009 Topic Maps – Canonicalization (kanonizálás).

26 A tématérkép szabványcsalád
A szabványosításért felelős munkacsoport a fentieken túl a következő tématérkép szabványokon dolgozik jelenleg: ISO/IEC Topic Maps Reference Model (referencia modell); ISO/IEC CTM (kompakt leíró nyelv); ISO/IEC GTM (grafikus leíró nyelv); ISO/IEC Topic Maps Query Language (lekérdező nyelv); ISO/IEC Topic Maps Constraint Language (specifikációs nyelv).

27 A tématérkép adatmodell
A tématérképek sokféleképpen megjeleníthetőek: tématérkép szintakszisokat használva fájlokban, adatbázisokban, futó programok belső adatszerkezeteiként, és mentálisan az emberi gondolkodásban is. Ezek a formátumok ugyanannak az absztrakt szerkezetnek a megjelenítésére szolgálnak. Az ISO/IEC ezt a szerkezetet határozza meg egy adatmodell formájában.

28 A tématérkép adatmodell
Az adatmodell meghatározza a Tématérképek absztrakt szerkezetét, az információs készlet formalizálásával és szöveges formában bizonyos mértékig az értelmezésüket is. a Tématérképek összeolvasztásának szabályait, néhány alapvető tárgyazonosítót. Az adatmodell célja, hogy meghatározza a Tématérképek csereszabványos szintakszisának értelmezését és hogy alapul szolgáljon a kanonizálást, lekérdezést, korlátozásokat stb. meghatározó további szabványokhoz.

29 A tématérkép adatmodell
Az adatmodell szabad teret enged a dolgok reprezentálásának. Két speciális relációtípust definiál: Típus-eset kapcsolat Szupertípus-altípus kapcsolat

30 A tématérkép adatmodell
A típus-eset kapcsolat. (homo sapiens – Kanada miniszterelnöke) A tématípus olyan tárgy, amely egy tárgykészlet tagjaiban lévő azonosságokat tömörít. Bármely tárgy, amely egy adott tématípus kiterjesztéséhez tartozik, annak a tématípusnak az esete. Egy tématípus lehet egy másik tématípus esete. Nincs korlátozás, hogy egy tárgy hány tématípusnak lehet az esete. A típus-eset kapcsolat nem tranzitív. Azaz, ha B az A típus esete, és C a B típus esete, ebből nem következik, hogy C esete A-nak. (A – emlős; B – homo sapiens; C – Kanada miniszterelnöke)

31 A tématérkép adatmodell
A szupertípus-altípus kapcsolat Egy általánosabb típus (a szupertípus) és ennek a specifikusabb változata (az altípus) közötti kapcsolat. Ha B altípusa A-nak, ebből az következik, hogy B minden esete A-nak is esete. Ennek fordítottja nem feltétlenül igaz. Egy típusnak akármennyi altípusa és szupertípusa lehet. A szupertípus-altípus kapcsolat tranzitív, ami azt jelenti, hogy ha B altípusa A-nak, és C altípusa B-nek, akkor C altípusa A-nak is. (pl. A – élőlény; B – állat; C – kutya) Generikus hierarchialánc

32 A tématérkép szintaxisok
HyTM (HyTime Topic Maps) A tématérképek számára eredetileg kifejlesztett szintaxis Nem része a legújabb ISO szabványnak. A tématérképek történetének kezdeti szakaszában ez volt az egyetlen szintakszis. Az alapjául szolgáló HyTime nyelvet eredetileg az SMDL-lel (Standard Music Description Language) együtt kezdték el fejleszteni az 1980-as évek végén. Arra keresték a választ, hogy miként lehetne zenei utalásokat hiperlinkekkel reprezentálni.

33 A tématérkép szintaxisok
HyTime Az első szabvány javaslat 1989-ben született, 1992. november 1-től az ISO és az IEC közös szabványa lett ISO/IEC tételszámon. A HyTM nyelv, hosszú időn keresztül része volt az ISO/IEC szabványnak.

34 A tématérkép szintaxisok
A régi tématérkép szabvány fogalmai: BOS (Bounded Object Set) Hub document Sort name és Display name (Variant name) Topic charachteristic Topic characteristic assignment Unconstrained scope A tématérkép SGML dokumentum.

35 A tématérkép szintaxisok
Az XTM XML Topic Maps = XML Tématérképek XML (eXtensible Markup Language = Kiterjesztett Jelölőnyelv) alapján tématérképek készítésére kifejlesztett nyelv. Ez a leggyakrabban használt szintakszis, A tématérképek nemzetközi csereformátuma.

36 A tématérkép szintaxisok
XTM 2.0 A nyelv legújabb verziója, az XTM 2.0, amely az ISO/IEC 13250:2007(E) szabvány szabvány része. Az 1.0 verzióhoz képest meglévő különbségeket a szabvány D függeléke tartalmazza. (ISO 13250, 2007) Az XTM alkalmazására manuálisan nincs szükség, így nem okoz problémát annak terjengőssége. Több tématérkép-szerkesztő program is van forgalomban, amelyekkel készíthetők alkalmazások.

37 A tématérkép szintaxisok
A CTM (Compact Topic Maps) szöveg alapú tématérkép-reprezentáló szintaxis. Az XTM szabvány kiegészítésére fejlesztik. A nyelv még nem készült el, jelenleg csupán egy munkaverzió érhető el Alkalmas arra, hogy manuálisan hozzanak létre tématérképeket, hogy dokumentumokban érthető példákat nyújtsanak általuk, és hogy szintaktikai bázisául szolgáljon a TMCL-nek és a TMQL-nek. Fő szempont a fejlesztés során az egyszerűség, a könnyű írhatóság és olvashatóság.

38 A tématérkép szintaxisok
GTM (Graphical Notation for Topic Maps) Szintén a tématérképek humán interpretációját segíti vizuális alapon reprezentálja az alkalmazásban leírt viszonyrendszereket. A fejlesztés előrehaladott állapotban van, mégsincsenek erről átfogó anyagok. Maguk a fejlesztői is csak szűk körben használják ezt a szintakszist.

39 A tématérkép szintaxisok

40 A tématérkép szintaxisok
LTM (The Linear Topic Map Notation) Tématérképek közvetlen humán létrehozása és értelmezése szempontjából van jelentősége. Az LTM az oslói székhelyű Ontopia cég által kifejlesztett nyelv, egyszerű, az XTM-mel szemben sokkal „szűkszavúbb” és hatékonyabb. Az LTM elsősorban oktatási célokra készült, A gyakorlati alkalmazás során megérthetők az alapvető fogalmak.

41 A tématérkép szintaxisok
szöveg-alapú leíró nyelv alkalmas tématérképek manuális szerkesztésére, a tématérkép modell reprezentálására (pl. ben) Az Ontopia által készített technikai dokumentáció írja le. Ebben a jelentésben még nem tartották kizártnak, hogy a nyelv szabvánnyá növi ki magát, Ugyanilyen céllal elkezdődött a CTM fejlesztése az ISO/IEC keretein belül.

42 A tématérkép szintaxisok
ISO 18048: TMQL (Topic Maps Query language) A tématérkép adatmodellnek megfelelő alkalmazások különböző technológiákkal tárolódnak (relációs adatbázisok, szövegfájlok, XML dokumentumok, tématérkép adatbázisok). Valamennyi technológia biztosítja a visszakereshetőséget, szükséges volt egy egységes szabványos lekérdező nyelv megalkotása. A lekérdező nyelv logikája megegyezik a relációs adatbázisok lekérdezésére szolgáló SQL-ével. A számítógép azt keresi, hogy a hiányzó elem mely asszociációban foglalt állításba helyettesíthető be.

43 A tématérkép szintaxisok
ISO/IEC TMCL (Topic Maps Constraint Language) A OWL (Web Ontology Language) nyelvvel azonos funkciót lát el A TMCL-t fejlesztő bizottság legújabb munkaverziója július 15-én jelent meg. A szabványként való közzététel hónapokon belül várható.

44 A tématérkép szintaxisok
A tématérkép szabványosítás nem terjed ki valamennyi a technológiával kapcsolatos kérdésre. (Pl.: PSI) A tématérkép technológiában a dolgoknak van identitásuk, Egyértelműen meg kell határozni, hogy amiről egy adott néven állítunk valamit, az pontosan milyen valóságban létező dolognak a reprezentánsa. Ennek a tématérképek esetében egyrészt az egybeolvasztáskor (merging), másrészt a témák, fogalmak humán és gépi interpretációját lehetővé tételében van jelentősége.

45 A tématérkép szintaxisok
Az OASIS bizottsága öt ajánlást fogalmazott meg a PSI-kre vonatkozóan: A Publikált tárgyindikátor ember által olvasható metaadatokat kell adjon saját magáról; A Publikált tárgyindikátor megadhat géppel olvasható metaadatokat saját magáról; Az első és a második ajánlás metaadatainak következetesnek, de nem feltétlenül azonosnak kell lenni; A Publikált tárgyindikátornak jeleznie kell, hogy PSI-ként használandó; Publikált tárgyindikátornak azonosítania kell a publikálóját.

46 Az Omnigator Tématérkép vizualizáló szoftver, amely az OKS Samplers része; Omnivorous (mindenevő: LTM, XTM, RDF) (OKS Samplers ingyenes letöltés) Indításhoz: apache-tomcat/bin/startup.bat Majd a böngészőbe beírni, hogy Szükséges hozzá: JAVA Runtime Environment (JRE) 1.4 JAVA_HOME (Vezérlőpult…) Nézzük meg, hogy mit tud!

47 Az Omnigator A legújabb verzió problémás ügy. Alternatív megoldás:
Licensz kulcsot bemásolni: C:\Documents and Settings\UserName\ Innen letölteni egy jó verziót:

48

49 Tématérkép-szerkesztés (LTM)
Válasszuk ki, hogy miről szeretnénk tématérképet szerkeszteni? Babits és Kosztolányi regényekről; Papíron írjuk le a fogalmakat, amelyekkel dolgozni szeretnénk egyelőre a témákat, asszociációkat és előfordulásokat; Az LTM szintaxis szabályai szerint írjuk le az egyes témákat, asszociációkat és előfordulásokat egy szövegfájlba.

50 Fogalmak összegyűjtése
Témák: regény A gólyakalifa Édes Anna Aranysárkány Halálfiai író Babits Mihály Kosztolányi Dezső város Budapest Szabadka Szekszárd Asszociációk: írta (ki írta az adott regényt?) született (a szerző születési helye) meghalt (a szerző elhalálozásának helye) itt játszódik (a regény) Előfordulások: első megjelenés dátuma (regényé); kép (szerzőről); teljes szöveg (regényé); hivatalos honlap (városé); élt (születés, és elhalálozás dátuma)

51 Témák definiálása (LTM)
[regeny = ”Regény”] [golyakalifa = ”A gólyakalifa”] [edes-anna = ”Édes Anna”] [halalfiai = ”Halálfiai”] [aranysarkany = ”Aranysárkány”] [golyakalifa : regeny] [edes-anna : regeny] [halalfiai : regeny] [aranysarkany : regeny] [iro = ”Író”] [babits = ”Babits Mihály”] [kosztolanyi = ”Kosztolányi Dezső”] [babits : iro] [kosztolanyi : iro] [varos = ”Város”] [budapest = ”Budapest”] [szabadka = ”Szabadka”] [szekszárd = ”Szekszárd”] [budapest : varos] [szabadka : varos] [szekszard : varos]

52 Szekszárd Aranysárkány regény város A gólyakalifa Budapest Édes Anna Szabadka Halálfiai Kosztolányi Babits író

53 Asszociációk definiálása (LTM)
[irta = ”írta” =”regénye” / iro] irta( babits, golyakalifa ) irta( babits, halalfiai ) irta( kosztolanyi, edes-anna ) irta( kosztolanyi, aranysarkany ) [szul = ”szülőhelye a következőnek” =”születési helye” / iro] szul( babits, szekszard ) szul( kosztolanyi, szabadka ) [hal = ”elhalálozási helye a következőnek” =”elhalálozásának helye” / iro] hal( babits, budapest ) hal( kosztolanyi, budapest ) [jatsz = ”itt játszódik” =”a következő helyen játszódik” / regeny] jatsz( halalfiai, szekszard ) jatsz( edes-anna, budapest ) jatsz( aranysarkany, szabadka )

54 Szekszárd Aranysárkány regény város A gólyakalifa Budapest Édes Anna Szabadka Halálfiai Kosztolányi Babits író

55 Szekszárd Aranysárkány regény jatsz jatsz szül város A gólyakalifa Budapest Édes Anna jatsz Szabadka hal hal Halálfiai írta szül írta írta írta Kosztolányi Babits író

56 Előfordulások definiálása (LTM)
BELSŐ ELŐFORDULÁSOK [megj = ”Első megjelenés dátuma”] {golyakalifa, megj, [[1913]]} {edes-anna, megj, [[1926]]} {aranysarkany, megj, [[1925]]} {halalfiai, megj, [[1927]]} [elt = ”Élt”] {babits, elt, [[ ]]} {kosztolanyi, elt, [[ ]]} KÜLSŐ ELŐFORDULÁSOK [kep = ”Kép”] {babits, kep, ”http://upload.wikimedia.org/wikipedia/hu/6/6d/Babits.jpg”} {kosztolanyi, kep, ”http://upload.wikimedia.org/wikipedia/hu/5/5b/Kosztolanyi.jpg”} [szoveg = ”Teljes szöveg”] {golyakalifa, szoveg, ”http://mek.oszk.hu/00600/00600/”}


Letölteni ppt "Tóth Máté Toth.Mate@feek.pte.hu Tématérképek A tématérkép adatmodell, tématérkép szintaxisok, tématérképek szerkesztése LTM-ben Tóth Máté Toth.Mate@feek.pte.hu."

Hasonló előadás


Google Hirdetések