Ungváry Rudolf: Tezauruszok mint „kisvilágok”

Slides:



Advertisements
Hasonló előadás
GRIN: Gráf alapú RDF index
Advertisements

Tamás Kincső, OSZK, Analitikus Feldolgozó Osztály, osztályvezető A részdokumentumok szolgáltatása az ELDORADO-ban ELDORADO konferencia a partnerkönyvtárakkal.
Összefoglalás Hardver,szoftver,perifériák Memóriák fajtái
ADATBÁZISOK.
Adatbázis gyakorlat 1. Szerző: Varga Zsuzsanna ELTE-IK (2004) Budapest
Informatikai tudásleképezés paradigmái és problémái Szekeres András Márk.
Néhány fontos terület a Kreatív Ipar fejlődéséhez
TCP/IP protokollverem
Információbiztonság vs. informatikai biztonság?
A TCP/IP hivatkozási modell
Tanárok kis világa Lehetőségek a tanári hálózatok kutatásában.
HÁLÓZATOK.
A BNO10 formális formális reprezentálása a GALEN alapján
Kultúra mint kapcsolat Birher Nándor. „A tudás a világ alkotóelemeiről szerzett ismeret, a bölcsesség az elemek kapcsolódásának ismerete.” -szemléletmódváltozás-
Az ÉRÁK legfontosabb céljai A képzés és a munkaerő-piaci szolgáltatások egységes normák szerinti működtetése. A munkanélküliek folyamatos képzésbe kerülésének.
E-learning és a multimédia
Előadó: Szabó Márton (iwiw) Katalógus → házi feladatnak beszámít
Címkézett hálózatok modellezése
A számítógépes nyelvfeldolgozás alapjai
Hálózati Biológia A sejt funkcionális működésének megértése.
A Hálózatok csoportosítása…
ARISZTOTELÉSZ (Kr. e ).
Szoftver bonyolultsági mértékek alkalmazási területei Király Roland 2011.
Besorolási rekordok adatcsere formátuma
Összehasonlító könyvtártudomány Gernot Wersig Balogh Melinda PTE-FEEK Informatikus könyvtáros, II/II.
Az érvelés.
Készülj az érettségire
ISMERETALAPÚ RENDSZEREK SZAKÉRTŐ RENDSZEREK
Vámossy Zoltán 2004 (H. Niemann: Pattern Analysis and Understanding, Springer, 1990) DIP + CV Bevezető II.
Csoport, szervezet, hálózatok
HÁLÓZATI TANULÁS Megújuló pedagógia: hálózati együttműködés Észak-Magyarországon TÁMOP nyitókonferencia EGER, szeptember 3.
2009., a működés negyedik éve Áldozatsegítő Szolgálat.
Budapest, június 28. Ontológia kezelő modul tervezése szöveges információt kezelő informatikai rendszer számára Förhécz András BME Méréstechnika.
1 Az EMC témaköre, EMC Irányelv Zavarok frekvencia tartomány szerinti elhelyezkedése Az EMC megvalósításának módszere.
Szemantikus keresők.
Természetes és formális nyelvek Jellemzők, szintaxis definiálása, Montague, extenzió - intenzió, kategóriákon alapuló gramatika, alkalmazások.
1 Tudásalapú információ-kereső rendszerek elemzése és kifejlesztése Célkitűzés: Információk téma-specifikus, különböző típusú forrásokból (internet, intranet.
Pénzügyi-gazdasági ismereteket oktató iskolák hálózatának kialakítása.
A világ dokumentumtermésének az összegyűjtéséhez (20.század 2. fele)
Állatok a természetben
ONTOLÓGIA és TUDÁSREPREZENTÁCIÓ Szőts Miklós Alkalmazott Logikai Laboratórium
Tk.: oldal + Tk.:19. oldal első két bekezdése
Matematika feladatlap a 8. évfolyamosok számára
Fogalom-rendszerek - bevezetés -. Minden fogalom az emberi gondolkodás terméke Mindazok a dolgok, amelyek alapján a fogalom létrehozható, az emberi gondolkodástól.
A metafizika és a természettudomány. Különböző érzékszervi ingereket érzünk, melyeket alkalmi mondatokkal fejezhetünk ki. Pl.: a tej látványára a „Tej.
11. tétel Adatbázis táblái közti kapcsolatok optimalizálása
A kriminálpszichológia
A tezaurusz alkalmazása a BME- OMIKK ALEPH rendszerében.
Adatbázis-kezelés.
Adatbázis-kezelés. Alapfogalmak Adat: –észlelhető, felfogható ismeret –jelsorozat –valakinek, vagy valaminek a jellemz ő je –tény, közlés Információ:
Háló- (gráf-) algoritmusok
Halmazállapotok Gáz, folyadék, szilárd.
Adatbáziskezelés. Adat és információ Információ –Új ismeret Adat –Az információ formai oldala –Jelsorozat.
Algoritmizálás, adatmodellezés
DNS. Az interneten használt osztott név adatbázis, a DNS (Domain Name Service) folyton használatos: –minden web lap letöltésnél, –levél közvetítésnél.
Jogi alapfogalmak. Társadalmi normák A társadalmi normáknak nevezzük az emberek életét, tevékenységét meghatározó magatartási szabályok összességét, amelyeknek.
Ungváry Rudolf (OSZK) A földrajzi névtér típusai
Pályázatok értékelésének tapasztalatai Hoffmann Miklós független szakértő.
Terminus (terminus technicus). Terminology - Vocabulary International standard: Terminology - Vocabulary (ISO 1087, 1990 Genf)
PÁRHUZAMOS ARCHITEKTÚRÁK – 13 INFORMÁCIÓFELDOLGOZÓ HÁLÓZATOK TUDÁS ALAPÚ MODELLEZÉSE Németh Gábor.
Antenna Hungária Rt. Átalakítási Bizottság, Külső Szakértői Munkacsoport Előadás 02:52:15, június június június 26.
Szövegfeldolgozás ontológiák segítségével – fogalmak azonosítása Szekeres András Márk.
Adatbázisszintű adatmodellek
TÁMOP /1-2F Informatikai gyakorlatok 11. évfolyam Alapvető programozási tételek megvalósítása Czigléczky Gábor 2009.
Ungváry Rudolf A névterek értelme. Filozófiai-szerkezeti jellemzők
PRIMUS INTER PARES (pipa)
A Robotok miért nem értik az internetet?
A Robotok miért nem értik az internetet?
Hálózatok.
Informatikai gyakorlatok 11. évfolyam
Előadás másolata:

Ungváry Rudolf: Tezauruszok mint „kisvilágok” Ungváry Rudolf: Tezauruszok mint „kisvilágok”. Kapcsoltság a fogalmak között

A tezaurusz (IKNY-i szótár) fogalmak hálózataként is vizsgálható nem véletlenszerű, hanem skálafüggetlen hálózatok (Barabási) kapcsoltságuk mértéke a tapasztalatok szerint 6-8 közé esik gráfstruktúrájuk hálózati „térkép” Megjelenésükkel első alkalommal áll rendelkezésre a fogalmakról explicit „térkép”, melynek alapján a fogalmi rendszerek skálafüggetlen hálózati tulajdonságai vizsgálhatók (még ha rendkívül leegyszerűsített formában is) A fogalmi „kisvilág” térképe

Tezauruszstruktúra vizsgálata A (poli)hierarchikus fogalmi strukúrák (=osztályozási rendszerek, taxonómiák), különösen pedig a sokrelációs (nem csak [poli]hierachikus) fogalmi struktúrák (tezauruszok) ISO 2888; MSZ 3418 metainformációs (metaadatokból álló) hálózatokat alkotnak A tezaurusz tehát tartalmazza a (poli)hierarchikus fogalmi struktúrát is. A formalizált (pl. OWL-) nyelven leírt, és formális logikai következtetési (tulajdonságörökítő) rendszerrel ellátott (poli)hierachikus fogalmi struktúrák ontológiákat alkotnak. Az ontológiák és a sokrelációs fogalmi struktúrák a szemantikus web eszközei „ismeret[tudás]tár”

valami KATEGÓRIÁK élő anyag állat TÍPUSOK növényevő ragadozó kecske marha macska kutya puli agár hegyi kecske HIERARCHIKUS STRUKTÚRA, címkézett, irányított gráf

A FENTI GENERIKUS FOGALMI HIERACHIA HAGYOMÁNYOS TAXONÓMIAI (OSZTÁLYOZÁSI RENDSZEREKBEN SZOKÁSOS) FORMÁJA valami . élő anyag . . állat F, „fölé” MSZ 3418 . . . növényevő BTG, „fölé” ISO 2888 . . . . kecske ”van”, „is a” . . . . . hegyi kecske . . . . marha . . . ragadozó . . . . kutya . . . . . agár . . . . . puli . . . . macska

A FENTI GENERIKUS FOGALMI HIERACHIA HAGYOMÁNYOS TEZURUSZCIKKEKBE SZERVEZETT FORMÁJA (MSZ 3418, ISO 2888) valami ragadozó F élő anyag F állat A kutya élő anyag macska F valami A állat macska F ragadozó állat F élő anyag kutya A növényevő F ragadozó ragadozó A agár puli növényevő F állat agár A kecske F kutya marha kecske F kutya F növényevő A hegyi kecske F növényevő stb.

Osztályozási rendszer, taxonómia, tezaurusz – ugyanannak a fogalmi háló(zat)nak különféle szakterületeken használt megnevezései Formális (alkalmazássemleges) megjelenítése címkézett irányított gráffal A továbbiakban így ábrázolva bővítjük a struktúrát ahhoz, hogy szemléltessük ennek a hálózatnak a „kisvilágszerű” viselkedését (és kapcsoltságának mértékét)

valami tulajdonság mozgás élő anyag táplálkozás állattársulás növény állat falka növényevő ragadozó kérődzés ugatás kecske marha macska kutya puli agár hegyi kecske KAPCSOLÓDÁSOK MÁS RELÁCIÓKBAN (TEZ.)

Az előbbi struktúra már nem reprezentálható pusztán fogalmi hierarchiával („taxonomikus” formában) – csak tezauruszszerkezetben! Például az „állat” esetében: állat F élő anyag F, A : hierarchikus relációk A ragadozó növényevő T állattársulás T, X, stb : öröklődő relációk X táplálkozás

valami tulajdonság mozgás élő anyag táplálkozás állattársulás növény állat falka növényevő ragadozó kérődzés ugatás kecske marha macska kutya puli agár hegyi kecske AZ ÖRÖKLŐDÉS, de még ez se ontológia!

Ez a szerkezet csak ontológiaformában reprezentálható! <owl:ObjectProperty rdf:ID="P"><rdf:type rdf:resource="http://www.w3.org/2002/07/owl#TransitiveProperty"/> <rdfs:domainrdf:resource="#DESZKRIPTOR"/> <rdfs:range rdf:resource="#DESZKRIPTOR"/> <rdfs:comment>partitív része</rdfs:comment> </owl:ObjectProperty> stb.

valami tulajdonság mozgás élő anyag táplálkozás állattársulás növény állat falka növényevő ragadozó kérődzés ugatás kecske marha macska kutya puli agár hegyi kecske TOVÁBBI HIERARCHIKUS KAPCSOLATOK. térkép

valami tulajdonság mozgás élő anyag táplálkozás állattársulás növény állat falka növényevő ragadozó kérődzés ugatás kecske marha macska kutya puli agár hegyi kecske Egyesített gráf

valami tulajdonság mozgás élő anyag táplálkozás állattársulás növény állat falka növényevő ragadozó kérődzés ugatás kecske marha macska kutya puli agár hegyi kecske TELJES GRÁF

Internetstruktúra hostok szerint (USA) A sűrűsödések a fogalmi kategóriáknak felelnek meg

A teljes internet Barabási szerint

skálafüggetlen hálózatok Az információkereső-nyelvi struktúrák (ontológiák, tezauruszok) a webhez hasonlóan skálafüggetlen hálózatok Eme „valódi” komplex rendszerek legfontosabb jellemzője az ún. kapcsoltság: P(k). Ez kifejezi annak valószínűségét, hogy a hálózat egy csomópontja hány másik k csomóponthoz kapcsolódódik. Szemben a véletlenszerű és mesterséges fizikai rendszerekkel (pl. úthálózat, gép), a csomópontok kapcsoltságának semmiféle átlagos valószínűsége nincs A legnagyobb kapcsoltsággal az általános fogalmak rendelkeznek Az ontológiákban ezért alakítanak ki teljes (a valami-ig terjedő) struktúrákat.

kisvilágok („small worlds”) Minden skálafüggetlen hálózatként viselkedő IKNY-ben van néhány nagy középpont, amelyik a hálózat szerkezete szempontjából alapvető jelentőségű (ezek a fogalmi kategóriák). Rendkívüli hibatűrő képesség és stabilitás (a csomópontok 80 % eltávolítható anélkül, hogy szétesnék) [„rossz IKNY-vel is jól lehet dolgozni”]. 5-8 ugrással a hálózat bármely pontja elérhető („six degress of separation”). kisvilágok („small worlds”) mivel minden csomópont (lexikai egység) egyformán közel van!

A mai tezauruszok és ontológiák már hatalmas szóhálózatok, bennük minden egyformán közel van egymáshoz. Kongresszusi Köztaurusz könyvtár (OSZK) 1990: 20.000 szó – 2000: 65.000 szó 22.000 szó 2006: 100.000 szó 45.000 szó várható telítődés: kb. 130.000 szó

reinkarnáció L lélekvándorlás lélekvándorlás H reinkarnáció T buddhizmus misztika X halál halál H& halálfélelem halotti szokás T thanatológia R halálozás E emberölés haldoklás X eschatológia félelem halott emberölés F élet, testi épség és becsület elleni bűncselekmény A gyilkosság öngyilkosság R halál E párbaj X művi abortusz testi sértés párbaj R emberölés E becsületsértés X konfliktus

A reprezentált fogalmi kisvilágok jövője HAGYOMÁNYOS: katalógusok osztályozási rendszerek egységesített besorolási tárgyszórendszerek adatok (név hozzáférési pontok ontológiák névterek tezauruszok információkereső nyelvek (metainformációs rendszerek) JÖVŐ: ismeretbázisok adatbázisok