Bevezetés a szemantikus technológiákba. Szemantikus technológiák  Rendszerelemek – jelentés – logikai formula  Elvárások – logikai formula  Az elvárások.

Slides:



Advertisements
Hasonló előadás
GRIN: Gráf alapú RDF index
Advertisements

Keresés a számítógépes katalógusokban
A Savaria Egyetemi Könyvtár Katalógusa Böngészés Keresés Találatok megjelenítése Adatbázis választás Olvasói tranzakciók.
Kereső program használata Készítette: Berger Nikolett
Adatbázis gyakorlat 1. Szerző: Varga Zsuzsanna ELTE-IK (2004) Budapest
Orbán Éva SZIE Állatorvos-tudományi Könyvtár Hagyományos és új terápiás eljárások az információhiány kezelésére Tanulságos esetek az Állatorvos-tudományi.
 A Web, kezdeti időszakában csak a szöveges file-okat kezelte.  Ma teljes körű multimédia szolgáltatásokat nyújt  Filmet,  Zenét,  Képeket nézhet.
Programozás III STRING-XML.
Néhány fontos terület a Kreatív Ipar fejlődéséhez
MTA SZTAKI Department of Distributed Systems Webes annotációs platform tudományos diskurzusokhoz Turbucz Sándor Micsik András Kovács László.
1 Internet. 2 WWW  World Wide Web  Hivatkozásokkal összekötött hipermédia dokumentumok rendszere  Dokumentumok -> Weboldalak  A weboldalak hipertext.
Internet ismeretek II..
SZENT ISTVÁN EGYETEM GAZDASÁG- ÉS TÁRSADALOMTUDOMÁNYI KAR AUTO- SZŰRŐ FEJLESZTÉSE TÁBLÁZAT ALAPÚ JELENTÉSEK UTÓLAGOS, BÖNGÉSZŐN BELÜLI TOVÁBB- FELDOLGOZÁSÁRA.
INFORMÁCIÓKERESÉS JELENTÉSREPREZENTÁCIÓ ALAPJÁN
SZENT ISTVÁN EGYETEM GAZDASÁG- ÉS TÁRSADALOMTUDOMÁNYI KAR KUTATÓK ÉJSZAKÁJA SZEPTEMBER 24. AUTO-SZŰRŐ FEJLESZTÉSE OLAP JELENTÉSEK UTÓLAGOS, OFFLINE.
K-Chat Dr. Szepesvári Csaba Kutatási Alelnök mindmaker.
SZENT ISTVÁN EGYETEM GAZDASÁG- ÉS TÁRSADALOMTUDOMÁNYI KAR TUDOMÁNYOS DIÁKKÖRI KONFERENCIA NOVEMBER 25. AUTO-SZŰRŐ FEJLESZTÉSE OLAP JELENTÉSEK UTÓLAGOS,
A BNO10 formális formális reprezentálása a GALEN alapján
Képességszintek.
Savaria Egyetemi Könyvtár Katalógusa Böngészés Keresés Találatok megjelenítése Adatbázis választás Olvasói tranzakciók.
ZENEI ADATBÁZISOK. The Music Index Online A Music Index a zenei időszaki kiadványok legátfogóbb bibliográfiai és részben teljes szöveges adatbázisa több.
A számítógépes nyelvfeldolgozás alapjai
Műszaki tudományok az interneten
Miskolci Egyetemi Publikációs Adatbázis Egy új szolgáltatás születése és bevezetésének problémai Kiss Andrea, Miskolci Egytem,
Önleíró adatok: XML INFO ÉRA, Békéscsaba
Kereső programok használata
SZENT ISTVÁN EGYETEM GAZDASÁG- ÉS TÁRSADALOMTUDOMÁNYI KAR TUDOMÁNYOS DIÁKKÖRI KONFERENCIA NOVEMBER 25. AUTO-SZŰRŐ FEJLESZTÉSE OLAP JELENTÉSEK UTÓLAGOS,
Metaadatok szerepe a multimédia elemek elérhetőségében Forczek Erzsébet SZTE, ÁOK Orvosi Informatikai Intézet Szeptember
ISMERETALAPÚ RENDSZEREK SZAKÉRTŐ RENDSZEREK
Metaadatok és digitális szövegek Bakonyi Géza SZTE Egyetemi Könyvtár.
Könyvtár egy kicsit másképp - a Magyar Elektronikus Könyvtárról és legújabb fejlesztéseiről Szombathely, Góczán Andrea OSZK, MEK osztály.
1 Természetes nyelvű interfész adatbázisok lekérdezéséhez Vajda Péter NYTI, Korpusznyelvészeti osztály – BME, TTT.
Adatbázisrendszerek jövője
Körlevél.
Budapest, június 28. Ontológia kezelő modul tervezése szöveges információt kezelő informatikai rendszer számára Förhécz András BME Méréstechnika.
Szemantikus keresők.
Ebsco adatbázisok Koltay Klára 2006/ félév.
Természetes és formális nyelvek Jellemzők, szintaxis definiálása, Montague, extenzió - intenzió, kategóriákon alapuló gramatika, alkalmazások.
Önálló labor munka Csillag Kristóf 2005/2006. őszi félév Téma: „Argument Mapping (és hasonló) technológiákon alapuló döntéstámogató rendszerek vizsgálata”
1 Tudásalapú információ-kereső rendszerek elemzése és kifejlesztése Célkitűzés: Információk téma-specifikus, különböző típusú forrásokból (internet, intranet.
Az internetes keresőkben a felhasználó az őt érdeklő szavakra, adatokra kereshet rá egy általában egyszerű oldalon, egy beviteli mező és egyéb szűrési.
Körlevél.
ONTOLÓGIA és TUDÁSREPREZENTÁCIÓ Szőts Miklós Alkalmazott Logikai Laboratórium
Weboldalak tervezése (X)HTML.
Egyszerűsítő megoldások Eddigi problémák: Természetes nyelv kényelmes használat – magas kifejező erő – feldologozhatatlanság Kódrendszerek: feldolgozható.
RDF sémák. RDF  URI-val azonosított erőforrások  Hármasok a kapcsolatrendszer leírására  Egyszerű lekérdezések (rdf:type)  Következtetésre nem alkalmas.
Keresőrendszerek.
Java web programozás 11..
Web Ontology Language OWL. RDF emlékeztető  Nagyon egyszerű ontológialeíró nyelv  Erőforrások közötti kapcsolatrendszer leírására  Jelentés a kapcsolatrendszerből.
Keresés a weben Kulcsszavas keresés: Google (
Resource Description Framework (RDF). Probléma a Web-es kereséssel  Szemantika hiánya Jelentés helyett szöveges alakkal dolgozunk Jelentés helyett szöveges.
Weblap-szerkesztés. Információs hálózati szolgáltatások Internet fontosabb szolgáltatásai (szóbeli) Elektronikus levelezési rendszer használata (szóbeli)
14. Szóbeli középszintű informatika tétel:
A MEK2.0 magyar digitális könyvtári alkalmazása - eleMEK Moldován István OSZK MEK osztály ”Networkshop” Pécs, április
Az XML nyelv (Extensible Markup Language). XML  XML: leíró nyelv (metanyelv)  XML alkalmazás: egy megalkotott nyelv  XML dokumentum: egy új nyelv egy.
Többnyelvű információ-kereső rendszerek Douglas W. Oard College of Information Studies and Institute for Advanced Computer Studies University of Maryland,
Keresés fajtái Matching (szabadszavas)
Adatkeresés az interneten
Google Scholar Wolfram Alpha Scirus Készítette: Varga Ádám.
OSINT eszközök a gyakorlatban avagy hogyan gyűjtsünk és elemezzünk nyílt adatokat személyekhez kapcsolódóan Dr. Gorza Jenő PhD nyá. ezredes, c. egyetemi.
FELHASZNÁLÓI TRÉNINGEK Bevezetés a könyvtári katalógusok használatába.
A JaDoX, mint repozitórium szoftver a közgyűjteményi informatikában JaDoX 3 Monguz Portál24 Monguz Kft. Mazula Zoltán.
Készítette: Kiss András
Dublin Core mint metaadat szabvány gyakorlati alkalmazása
Használd jól a könyvtári katalógust!
Kulcsrakész Közgyűjteményi Portál
Tudományos adatok keresése, avagy a Data Citation Index bemutatása
A JaDoX, mint repozitórium szoftver
Navigáció az Interneten:
Előadás másolata:

Bevezetés a szemantikus technológiákba

Szemantikus technológiák  Rendszerelemek – jelentés – logikai formula  Elvárások – logikai formula  Az elvárások megvalósítása a rendszerelemek segítségével – logikai következtetés  Pl: Szemantikus integráció Szemantikus integráció Szemantikus világháló Szemantikus világháló

Szemantikus világháló  Cél: Világhálón elérhető információ gépi feldolgozásra alkalmassá tétele Világhálón elérhető információ gépi feldolgozásra alkalmassá tétele A gép ne csak olvassa, értse is az információt A gép ne csak olvassa, értse is az információt  Eszközök: Metainformáció társítás Metainformáció társítás Ontológiaépítés – háttértudás formalizálása Ontológiaépítés – háttértudás formalizálása Automatikus következtetési módszerek Automatikus következtetési módszerek

A kurzus felépítése  I. rész: A szemantikus világháló alapjai A világháló napjainkban A világháló napjainkban RDF – metainformációk RDF – metainformációk RDFS – egyszerű háttértudás formalizálás RDFS – egyszerű háttértudás formalizálás RDF használata RDF használata

A kurzus felépítése  II. rész: Ontológiák és leíró logikák Leíró logikák: AL, ALC, SHIQ… Leíró logikák: AL, ALC, SHIQ… TBox (Terminology Box) – háttértudásTBox (Terminology Box) – háttértudás ABox (Assertion Box) - metainformációkABox (Assertion Box) - metainformációk Következtetés leíró logikákon: tabló alapú algoritmusok Következtetés leíró logikákon: tabló alapú algoritmusok Egy egyszerű következtető megvalósítása Haskellben Egy egyszerű következtető megvalósítása Haskellben

A kurzus felépítése  III. rész: Ontológiák használata Ontológiák a Weben: OWL – Web Ontology Language Ontológiák a Weben: OWL – Web Ontology Language Protegé ontológiaépítő eszköz Protegé ontológiaépítő eszköz A DLog Prolog alapú következtető rendszer A DLog Prolog alapú következtető rendszer

A Világháló napjainkban  Heterogén szemantikájú és szintaktikájú dokumentumok Eltérő típusok (szöveg, kép, hang, video…) Eltérő típusok (szöveg, kép, hang, video…) Eltérő formátumok (pdf, ps, word, txt…) Eltérő formátumok (pdf, ps, word, txt…) Eltérő nyelvek (magyar, angol, pascal, c…) Eltérő nyelvek (magyar, angol, pascal, c…)  Nem ellenőrzött (bárki bármit közzétehet)

Keresés a világhálón  Oldalak begyűjtése (keresőbotok)  Indexelés (tárgymutató készítés, fontos kifejezések kigyűjtése)  Kérdés értelmezése, keresés az indexben  Találatok sorrendezése és visszaadása

Oldalak begyűjtése  Hosszadalmas (rengeteg adat)  Rendszeres frissités szükséges  Nincs link, nincs begyűjtés

Indexelés  Dokumentum elemzése nehéz feladat  Mik a fontos kifejezések? Előbb meg kellene érteni…   Szavak gyakorisága jó heurisztika, de félrevezethet  Gépelési hibák, nem szabványos html  Eredménye egy jól karbantartott, tömör, strukturált, viszonylag kicsi adathamaz

Keresés  Vektortér modell Minden dokumentum és a kérdés egy-egy vektornak felel meg Minden dokumentum és a kérdés egy-egy vektornak felel meg Vektorok közti távolságokat számítunk Vektorok közti távolságokat számítunk Természetes nyelven megfogalmazott kérdésre jó Természetes nyelven megfogalmazott kérdésre jó Kulcsszavas keresésre nem jó  Kulcsszavas keresésre nem jó 

Keresés  Bool modell Csak azt figyeljük, hogy milyen kifejezések fordulnak elő az oldalon illetve a kérdésben Csak azt figyeljük, hogy milyen kifejezések fordulnak elő az oldalon illetve a kérdésben  A hangsúly a keresés utáni rangsoroláson  Rangsoroláshoz különféle heurisztikák Szavak gyakorisága, előfordulás helye (cím, bevezetés), fontméret, szín, korábbi felhasználók reakciói… Szavak gyakorisága, előfordulás helye (cím, bevezetés), fontméret, szín, korábbi felhasználók reakciói…

Sorrendezés linkstruktura alapján  A fenti szempontok mind könnyen manipulálhatóak  Nehezen befolyásolható kritériumok előtérbe kerülnek  Többet számít az, amit más mond rólunk, mint amit mi mondunk magunkról (link körüli szöveg)  Az az oldal, amire többen hivatkoznak, valószínűleg értékesebb (csupán linkstruktura alapján)

Mérőszámok a keresés jellemzésére  Precizitás: releváns visszadott / visszaadott  Visszahívás: releváns visszaadott / releváns  Egymás ellen dolgoznak  Manapság tipikusan Kis precizitás (rengeteg érdektelen találat) Kis precizitás (rengeteg érdektelen találat) Nagy visszahívás (ritka, hogy a számunkra fontos oldalat ne találja meg a kereső) Nagy visszahívás (ritka, hogy a számunkra fontos oldalat ne találja meg a kereső)

Problémák a Webes kereséssel  Hatalmas és változékony a világháló  Mély Web Lekérdezhető adatbázisban tárolt tartalom (Web nagyrésze!!!) Lekérdezhető adatbázisban tárolt tartalom (Web nagyrésze!!!) Nem szöveges tartalom Nem szöveges tartalom  Szemantika hiánya Jelentés helyett szöveges alakkal dolgozunk Jelentés helyett szöveges alakkal dolgozunk Függ az információ tényleges reprezentációjától Függ az információ tényleges reprezentációjától Nyelvi korlátok Nyelvi korlátok Képekhez, hangokhoz semmilyen jelentést nem tudunk társítani Képekhez, hangokhoz semmilyen jelentést nem tudunk társítani Nem tudunk következtetni (szinonimák, taxonómiák) Nem tudunk következtetni (szinonimák, taxonómiák)

Problémák a Webes kereséssel  Megoldás Metakeresők: összevetjük az eredményeket Metakeresők: összevetjük az eredményeket Fókuszált keresők: kisebb méret, könnyebb frissíteni, jobb precizitás és visszahívás Fókuszált keresők: kisebb méret, könnyebb frissíteni, jobb precizitás és visszahívás Szemantika megragadása Szemantika megragadása

Szemantika megragadása  Kézi indexelés Katalógust készítünk (YAHOO) Katalógust készítünk (YAHOO) Ember szolgáltatja a szemantikát Ember szolgáltatja a szemantikát Garantált minőség Garantált minőség Lassú  Lassú  Melléktémák kimaradnak  Melléktémák kimaradnak  Következtetés továbbra is hiányzik  Következtetés továbbra is hiányzik 

Szemantika megragadása  Helyezzünk el metainformációt a Weben  Információ, mely információról szól, leírja, hogy ez utóbbi miről szól  Pl. link egy másik oldalról, szerző neve, dokumentum módosítási ideje  Jelenleg a metainformáció is heterogén formában van 

Szemantikus Világháló  Az oldalakhoz kapcsolódó metainformáció és a következtetéshez szükséges háttértudás egységes és feldolgozható alakban történő leírása

Szemantikus Világháló  Erőforrásainkhoz metaadatokat társítunk  Mi lehet erőforrás? Bármi, ami egyedileg azonosítható (egy honlap, honlap része, kép video, egy hardware eszköz, állomány)  HTML-ben van metaadat: tag Nagyon korlátozott, csak néhány attribútum Nagyon korlátozott, csak néhány attribútum Csak a honlap egészéről szólhat Csak a honlap egészéről szólhat

Szemantikus Világháló  A különféle formátumú adatforrásaink számára lehetővé tesszük, hogy metaadatot szolgáltassanak magukról  A metaadat már egységes, strukturált  Géppel fel tudjuk dolgozni