Szemantikus keresők.

Slides:



Advertisements
Hasonló előadás
Hogyan jutunk információkhoz az interneten
Advertisements

Keresőrendszerek.
Keresés a számítógépes katalógusokban
A Savaria Egyetemi Könyvtár Katalógusa Böngészés Keresés Találatok megjelenítése Adatbázis választás Olvasói tranzakciók.
Kereső program használata Készítette: Berger Nikolett
 A Web, kezdeti időszakában csak a szöveges file-okat kezelte.  Ma teljes körű multimédia szolgáltatásokat nyújt  Filmet,  Zenét,  Képeket nézhet.
Hirdetésfeladás, vásárlás az interneten, aukciós oldalak.
Internet ismeretek II..
SZENT ISTVÁN EGYETEM GAZDASÁG- ÉS TÁRSADALOMTUDOMÁNYI KAR AUTO- SZŰRŐ FEJLESZTÉSE TÁBLÁZAT ALAPÚ JELENTÉSEK UTÓLAGOS, BÖNGÉSZŐN BELÜLI TOVÁBB- FELDOLGOZÁSÁRA.
CORSENET sajtótájékoztató és projektzáró rendezvény Gaizer Tamás, projektvezető május Hotel Aquincum Budapest.
Képességszintek.
Savaria Egyetemi Könyvtár Katalógusa Böngészés Keresés Találatok megjelenítése Adatbázis választás Olvasói tranzakciók.
Online Katalógus aleph.nyf.hu.
Célcsoport elérése – online támogatással Go East! – a ki nem használt lehetőségek birodalma.
GOOGLE 1998 szeptember Ma: az IN-es keresés 75%-a Webes keresés Képkeresés Usenet csoportokban Könyvtárban (hierarchikus katalógus) Egyéb szolgáltatások.
1 Hogyan juthatunk be a keresők első oldalára – kereső optimalizálás.
Kereső programok használata
Aki keres, az talál? Igen, talál. Ki ezt, ki azt, de egy szót beütve a google keresőbe (pl.) mindig ugyanazt, hacsak nem kerültek fel új honlapok az adott.
Keresőoptimalizáló eszközök ( S earch E ngine O ptimization tools )
 mesterséges intelligencián alapuló szoftver rendszer  a felhasználó által szolgáltatott adatok alapján képes viszonylag bonyolult problémákat megoldani,
Természetes és formális nyelvek Jellemzők, szintaxis definiálása, Montague, extenzió - intenzió, kategóriákon alapuló gramatika, alkalmazások.
Önálló labor munka Csillag Kristóf 2005/2006. őszi félév Téma: „Argument Mapping (és hasonló) technológiákon alapuló döntéstámogató rendszerek vizsgálata”
1 Tudásalapú információ-kereső rendszerek elemzése és kifejlesztése Célkitűzés: Információk téma-specifikus, különböző típusú forrásokból (internet, intranet.
Önálló labor munka Csillag Kristóf 2004/2005. tavaszi félév Téma: „Argument Mapping (és hasonló) technológiákon alapuló döntéstámogató rendszerek vizsgálata”
Vida Andrea SZTE Egyetemi Könyvtár
Az internetes keresőkben a felhasználó az őt érdeklő szavakra, adatokra kereshet rá egy általában egyszerű oldalon, egy beviteli mező és egyéb szűrési.
Wikicsoda? Márkaépítés és forgalom-generálás tartalommal Sáfrány Zsuzsanna head of neo content DigitalFestival április 29.
Pankász Balázs PTE FEEK Munkapszichológia és Ergonómia Tanszék
A Google teljes kihasználása. A legtöbb felhasználónak a webkeresés jelenti a Google legfontosabb funkcióját. Alapértelmezésben aktivált.
Yazix fordítás-segítő alkalmazás burgermeister zsolt varga koppány.
Térinformatika a mindennapok online médiájában Pohly Ferenc T-Online Magyarország.
A legjobb weboldás! “Oszd meg a tudásodat másokkal: ez az egyik módja annak, hogy halhatatlan légy.” (Dalai Láma)
Ugrás az első oldalra Pályázatmenedzsment Rácz József tanácsadó Készült a NFGM támogatásával, a KKC-2007-K projekt keretében.
Keresőrendszerek.
Az internetes keresési módszerek
Keresés a weben Kulcsszavas keresés: Google (
Nyelvi interfészek. IBM Watson 8:20 ill. 3:00.
Violet nails Készítette: Csőke Vivien. Bevezetés Téma: Violet nails - műkörömkészítő weblapjának elkészítése A weboldal elérhető az alábbi címen: violetnails.atw.hu.
Bevezetés a szemantikus technológiákba. Szemantikus technológiák  Rendszerelemek – jelentés – logikai formula  Elvárások – logikai formula  Az elvárások.
Többnyelvű információ-kereső rendszerek Douglas W. Oard College of Information Studies and Institute for Advanced Computer Studies University of Maryland,
Keresés fajtái Matching (szabadszavas)
TÁMOP /1-2F Internet-szolgáltatások I/13. évfolyam Keresések, regisztrációk Szepessy István 2009.
Adatkeresés az interneten
Az internetes keresők működésének technikai háttere
Google Scholar Wolfram Alpha Scirus Készítette: Varga Ádám.
Online katalógusok Semmelweis Egyetem Központi Könyvtár 2014 Ruttkay Szilvia
Online katalógusok Semmelweis Egyetem Központi Könyvtár 2013 Ruttkay Szilvia
FELHASZNÁLÓI TRÉNINGEK Bevezetés a könyvtári katalógusok használatába.
17 ISMERTESSE AZ INTERNETES KERESÉSI MÓDSZEREKET! KONKRÉT GYAKORLATI PÉLDA KERESÉSRE.(KERESÉS, TALÁLATI LISTA ÉRTELMEZÉSE, TALÁLT OLDAL MENTÉSE.) Készítette:
Mi a keresőmarketing? A feladat: az internetes keresők által a számunkra legrelevánsabb látogatókat az oldalunkra juttatni a leg- költséghatékonyabban.
Internet tudományos használata Skultéti Attila 2015.
Keresési módszerek könyvtári katalógusokban. A könyvtári katalógus funkciója A könyvtár állományában meglévő dokumentumok feltárása Az egyes példány adatainak.
Semmelweis Egyetem Központi Könyvtárának katalógusai Semmelweis Egyetem Központi Könyvtár 2015 Ruttkay Szilvia
Természetes nyelvi interfészek
Információ és kommunikáció
A könyvtárak állományának tagolódása
OVIDIUS Info-Service Co Ltd.
kielégítetlen információs igényeim
Keresési stratégia, Boolean operátorok
OVIDIUS Info-Service Co Ltd.
OVIDIUS Info-Service Co Ltd.
DRUPAL Előadja: Nagy Nikoletta :05.
Az irodalomkutatás és idézet keresés segédeszköze
Navigáció az Interneten:
Internet-szolgáltatások I/13. évfolyam
GEGES JÓZSEF Ph.D. OVIDIUS Info-Service Co Ltd.
OVIDIUS Info-Service Co Ltd.
Az internet minőségi információ halmazainak feltárásáról
Az irodalomkutatás és idézet keresés segédeszköze
Előadás másolata:

Szemantikus keresők

A számítógépes keresés fejlődése Teljes szövegű keresés Kulcsszó alapú keresés Boole-operátorok alkalmazása Gyakorlati problémák: Rokon értelmű szavak Azonos alakú szavak

A számítógépes keresés fejlődése Dokumentumok osztályozása tartalom szerint: Szemantikus web Intelligens szövegelemzők, taxonómiák Látens szemantikai elemzés Support Vector Machines

Intelligens szövegelemzés Feladatai: Taxonómiák elkészítése Új dokumentumok automatikus besorolása Keresések elvégzése Felhasználása Kompromisszumok: Relevancia Teljes körűség

Internetes keresés A tudás reprezentálása a világhálón Hagyományos keresőrendszerek működése: Oldalak begyűjtése Oldalak indexelése Kérdésértelmezés és keresés Találatok sorrendezése, rangsorolása

Oldalak begyűjtése Keresőrobotok feladata Linkek követése a gyűjtés során Gyűjtés gyakorisága Kihagyott weblapok

Oldalak indexelése Az indexelő feladatai Felmerülő problémák: Dokumentumok elemzése Fontos és kevésbé fontos kifejezések elkülönítése Gyakorlati módszerek

Kérdésértelmezés és keresés Vektortér modell: Releváns visszacsatolás A VSM előnyei Internetes felhasználás problémái Visszaadott dokumentumhalmazok jellemzői: Precizitás= visszaadott relaváns dokumentum / összes visszaadott dokumentum Visszahívás= visszaadott relaváns dokumentum / összes releváns dokumentum

Találatok sorrendezése, rangsorolása A megtalált kifejezések helyének vizsgálata A megtalált kifejezések gyakoriságának vizsgálata Felhasználók reakciói Oldalak közötti linkstrúktúra, horgonyok

A Google PageRank algoritmusa Egy valós szám, amely egy adott oldalra vonatkoztatva annak fontosságát jelzi. M(i) azoknak az oldalaknak a halmaza, amik tartalmaznak linket az i. oldalra, L(j) a j. oldalról kimenő linkek száma.

d csillapító tényező (damping factor) Bevezetésére azért volt szükség, mert feltételezzük, hogy a felhasználó nem örökösen csak a meglévő linkek közül választva halad tovább, hanem egyszer csak úgy gondolja, itt az ideje egy teljesen új kezdőlapról elindulni. Ennek a valószínűsége 1-d, azaz d annak a valószínűségnek felel meg, hogy a szörfölő folyamatosan a meglévő linkek közül választ.

A Google kereső PageRank implementációja Eredetileg a Google az alábbi három tényező alapján rangsorolta a weblapokat: - Weboldal részeinek vizsgálata: oldalspecifikus tényezők - Bejövő Linkre rakott kulcsszavak - PageRank

IR érték A keresési eredmények előállítása érdekében a Google egy IR értéket generál az oldalspecifikus tényezők és a bejövő Linkre rakott kulcsszavak elemzésével, amit tovább súlyoz, aszerint, hogy a kifejezés hol fordul elő az oldalon Az IR-érték kombinálásra kerül az oldal PageRank értékével

A PageRank kijelzése a Google Eszköztáron http://toolbar.google.com/intl/hu/

HITS Hyperlink-Induced Topic Search, hiperlinkeken alapuló téma szerinti keresés Egy kapcsolatrendszerből nyer ki információt az egyes csomópontok fontosságáról.

Alapötlete a releváns oldalak felbontása két kategóriára: A keresett téma szempontjából központi (hub) mértékadó (authoritive) oldalakra. A csoportosítás egy rekurzív definíció alapján történik: a központi oldalak azok, amik sok mértékadó oldalra mutatnak, a mértékadó oldalak pedig azok, amikre sok központi oldal mutat.

HITS és a közösségi szűrés Közösségi szűrés (collaborative filtering), sok felhasználó profilja alapján von le következtetést az adott felhasználóra vonatkozólag. Ha két oldal ugyanazokra vagy majdnem ugyanazokra az oldalakra mutat, akkor a két oldal valószínűleg azonos témájú, illetve azonos közösséghez tartozik. Ugyanez igaz arra a két oldalra, amire ugyanazok az oldalak mutatnak.

HITS és a PageRank A PageRank egy témafüggetlen, csak a linkstruktúra által meghatározott érték, a HITS viszont mindig egy konkrét témára nézve keres. A HITS eredménye sokkal pontosabb és relevánsabb lesz, viszont minden egyes kérdésnél újra ki kell számolni, tehát kevésbé hatékony.

PowerSet kereső A keresett szó "jelentésére keres rá, nem pedig szavakra". Alapkoncepció: nem egyszerűen leindexelni akarják az oldalak tartalmát, hanem összefüggéseket keresni bennük. A végcél, hogy a keresőnek a természeteshez közeli nyelven tudjunk kérdéseket feltenni, amire az válaszolni is tud.