Resource Description Framework (RDF)
Probléma a Web-es kereséssel Szemantika hiánya Jelentés helyett szöveges alakkal dolgozunk Jelentés helyett szöveges alakkal dolgozunk Függ az információ reprezentációjától Függ az információ reprezentációjától Nyelvi korlátok Nyelvi korlátok Képekhez, hangokhoz semmilyen jelentést nem tudunk társítani Képekhez, hangokhoz semmilyen jelentést nem tudunk társítani Nem tudunk következtetni (szinonimák, taxonómiák) Nem tudunk következtetni (szinonimák, taxonómiák)
Szemantika megragadása Kézi indexelés Katalógust készítünk (YAHOO) Katalógust készítünk (YAHOO) Ember szolgáltatja a szemantikát Ember szolgáltatja a szemantikát Garantált minőség Garantált minőség Lassú Lassú Melléktémák kimaradnak Melléktémák kimaradnak Következtetés továbbra is hiányzik Következtetés továbbra is hiányzik
Szemantika megragadása Helyezzünk el metainformációt a Weben! Információ, mely információról szól Információ, mely információról szól link egy másik oldalról, szerző neve, stb. link egy másik oldalról, szerző neve, stb. Jelenleg a metainformáció is heterogén A különféle formátumú adatforrásaink számára tegyük lehetővé, hogy metaadatot szolgáltassanak magukról A metaadat legyen egységes, strukturált A metaadat legyen egységes, strukturált Géppel fel tudjuk dolgozni Géppel fel tudjuk dolgozni
Szemantikus Világháló Célkitűzés: Oldalakhoz metainformáció társítása Oldalakhoz metainformáció társítása Következtetéshez szükséges háttértudás leírása Következtetéshez szükséges háttértudás leírása Mindezeket egységesen és automatikusan feldolgozható módon
Metainformáció társítása Tetszőleges webes erőforrás Tetszőleges mondanivaló Nagyon általános keretrendszer kell RDF: Resource Description Framework
RDF RDF segítségével erőforrásokról tehetünk kijelentéseket Erőforrás bármi lehet Erőforrás bármi lehet Lényeg, hogy egyértelműen azonosítható legyen Lényeg, hogy egyértelműen azonosítható legyen A számítógép nem erőforrás, de az én számítógépem már az A számítógép nem erőforrás, de az én számítógépem már az
Erőforrások Erőforrásokra egyértelmű azonosítóval hivatkozunk (például URL) Általánosabb: Universal Resource Identifier (URI) file:///c:/examples/cat.rdf file:///c:/examples/cat.rdf file:///c:/examples/cat.rdf uuid:BDC6E3F0-6DA3-11d1-A2A3- 00AA00C1C14882 uuid:BDC6E3F0-6DA3-11d1-A2A3- 00AA00C1C14882
URI Abszolút URI: egyértelműen azonosít Relatív URI: adott környezetben azonosít, azon kívül csak egy bázis URI-val együtt Bázis segítségével feloldjuk a relatív URI-t és abszolút URI-t kapunk Bázis segítségével feloldjuk a relatív URI-t és abszolút URI-t kapunk Komplex honlap részei könnyen tudnak egymásra hivatkozni Komplex honlap részei könnyen tudnak egymásra hivatkozni
URI Ugyanarról az erőforrásról több különböző helyen is tehetünk kijelentéseket Bárki bármit mondhat – csak a megfelelő URI kell hozzá Más helyről származó információtöredékek kombinálhatóak
RDF Erőforrások kapcsolatrendszerét tudjuk leírni Általános séma: (Erőforrás1, Kapcsolat, Erőforrás2) (Erőforrás1, Kapcsolat, Erőforrás2) ( tulajdonosa, SZIT) ( tulajdonosa, SZIT) (SZIT, típusa, Tanszék) (SZIT, típusa, Tanszék) (SZIT, vezetője, Katona Gyula) (SZIT, vezetője, Katona Gyula) Egy RDF leírás megfeleltethető egy gráfnak
RDF-gráf típusa tulajdonosa Tanszék SZIT Katona Gyula vezetője
RDF adatmodell Erőforrások: bármi aminek URI-ja van Tulajdonságok: Speciális erőforrás Speciális erőforrás Erőforrásokhoz kapcsolható jellemzők Erőforrásokhoz kapcsolható jellemzők Bizonyos tulajdonságok jelentése előre meghatározott Bizonyos tulajdonságok jelentése előre meghatározott Literálok: karaktersorozatok
RDF adatmodell Kijelentések: hármasok (alany, állítmány, tárgy) (alany, állítmány, tárgy) (erőforrás, tulajdonság, erőforrás | literál) (erőforrás, tulajdonság, erőforrás | literál) RDF leírás: kijelentések halmaza (sorrend nem számít) Jelentés: a kijelentések igazak RDF segítségével bináris relációkat írhatunk le
RDF szintaxis RDF adatmodell nem rögzíti a formátumot Tényleges modellezéshez kell valamilyen szintaxis 3 adatmodell reprezentáció Hármasok halmaza Hármasok halmaza Címkézett, irányított gráf Címkézett, irányított gráf XML formátum XML formátum
RDF gráf Csomópont: erőforrás vagy literál Él: tulajdonság (URI-val ellátott) Csak abszolút URI szerepelhet Tulajdonságról is lehet állítást megfogalmazni
RDF gráf A Magányos Cédrus festője Csontváry Kosztka Tivadar. {[ festője, „Cs. K. Tivadar”} [ Csontváry Kosztka Tivadar festője
RDF gráf És ha azt is modellezni szeretnénk, hogy Csontváry 1853-ban született? Literálokról nem tudunk kijelentéseket tenni. Bevezetünk egy köztes erőforrást: [ Csontváry Kosztka Tivadar festője 1853 neve születési éve
Köztes erőforrás Köztes csomópontnak nincs URI-ja Információ strukturáltságát növeli Több csomópont, de könnyebb gépi feldolgozás Komplex lterál szétbontható (cím)
XML szintaxis RDF gráf linearizálása Valódi XML dokumentum Bizonyos XML elemek speciális jelentéssel bírnak Alkalmazások közti adatcserére alkalmas
Példa Ádám rdf:type s:levélcímes:neve „Kis Ádám (aki ember) címe
XML szintaxis <rdf:RDF xmlns:rdf= xmlns:s= <rdf:Description <rdf:Description rdf:about= rdf:about= Kis Ádám Kis Ádám </rdf:RDF>
XML szintaxis Csontváry Kosztka Tivadar </rdf:Description></rdf:RDF>
XML szintaxis Tulajdonság is erőforrás – URI xmlns:s= … Csontváry K. Tivadar Csontváry K. Tivadar
XML szintaxis Megosztott alany használata Csontváry Kosztka Tivadar Magyar Nemzeti Galéria Magyar Nemzeti Galéria </rdf:Description>
XML szintaxis Erőforrás tárgypozícióban <s:helye> </s:helye></rdf:Description> Rossz megoldás
XML szintaxis Erőforrás tárgypozícióban rdf:resource attribútum <rdf:Description rdf:about=“ rdf:about=“ <s:helye <s:helye rdf:resource= rdf:resource= </rdf:Description>
Típusmegadás egyszerűbb szintaxissal <rdf:Description rdf:about=s:csiprozs> rdf:about=s:csiprozs> Csipkerózsika Csipkerózsika <s:mesehos rdf:about=s:csiprozs> rdf:about=s:csiprozs> Csipkerózsika Csipkerózsika
XML szintaxis Rdf:parsetype attribútum – tulajdonságelem interpretációjának megváltoztatása Ez az én gépem! </dc:Title> Compaq Compaq </rdf:Description>
XML szintaxis Rdf:parsetype attribútum – köztes erőforrások leírása <rdf:Description rdf:about=“ rdf:about=“ Csontváry Kosztka Tivadar Csontváry Kosztka Tivadar </rdf:Description>
XML szintaxis Köztes erőforrások leírása lokális azonosító segítségével: rdf:nodeID attribútum </rdf:Description> Csontváry Kosztka Tivadar Csontváry Kosztka Tivadar </rdf:Description>
XML szintaxis Új URI bevezetése: rdf:ID attribútum Egy azonosító csak egyszer szerepelhet Szép Hajnalka Szép Hajnalka </rdf:Description> Abszolút URI: bázis URI + # + ID:
RDF gráf vs. XML szintaxis Gráf Elméleti vizsgálódásokhoz kényelmes Szemléletesen megjeleníthető a kapcsolatrendszer XML Hordozható Géppel jól feldolgozható Gyakran automatikusan generálják (ontológiakészítő programok: Protege, Lore)
Nem bináris relációk Köztes erőforrás bevezetésével több bináris relációra bontjuk Pithagoraszi számhármasok: köztes erőforrás 4 3 5
Magasabbrendű kijelentések Kijelentések kijelentésekről Magasabb metaszinten levő információ Egy kijelentés mint erőforrás Reifikált kijelentés – rdf:Statement osztály egy példánya Van alanya, állítmánya és tárgya
Magasabbrendű kijelentések <rdf:type <rdf:type rdf:resource= rdf-syntax-ns#Statement/> rdf-syntax-ns#Statementhttp:// rdf-syntax-ns#Statement <rdf:subject <rdf:subject rdf:resource= rdf:resource= </rdf:Description>
Magasabbrendű kijelentések rdf:type rdf:subject rdf:predicate rdf:object
Konténerek és kollekciók Egy csoportra vonatkozó állítások A csoport egyedeire nem feltétlenül igaz! Nyílt végű: rdf:bag, rdf:seq, rdf:alt Zárt végű: rdf:list
rdf:Bag Sorrend nem számít Egy elem többször is előfordulhat Deuter 28 Deuter 28 </rdf:Description>
rdf:Seq Rendezett, sorrend számít Ági Ági Kati Kati Zita Zita
rdf:Alt Az elemek lehetséges alternatívákat jelölnek Legalább 1 elemű, az első elem az alapértelmezett </rdf:Alt>
rdf:List Zárt végű kollekció Nagy Géza Nagy Géza Kis Ádám Kis Ádám </rdf:Description>
Típusos literálok RDF nem ismer beépített típusokat rdf:datatype attribútum XML séma definiál ilyen típusokat, az RDF pedig ajánlja a használatukat
Típusos literálok <rdf:Description rdf:about= rdf:about= Csontváry Kosztka Tivadar Csontváry Kosztka Tivadar </rdf:Description>