Az előadás letöltése folymat van. Kérjük, várjon

Az előadás letöltése folymat van. Kérjük, várjon

A láthatatlan/mély web tartalmi és technikai jellemzői

Hasonló előadás


Az előadások a következő témára: "A láthatatlan/mély web tartalmi és technikai jellemzői"— Előadás másolata:

1 A láthatatlan/mély web tartalmi és technikai jellemzői
Csikó Tímea és Soós Barbara

2 A jéghegy csúcsa Láthatatlan Invisible Dark Hidden Mély Deep W E B

3 Mi a Mély Web? A Mély Web az az elnevezés amit a World Wide Web azon oldalai kapnak melyek nem részei a felszíni webnek, azaz nincsenek indexelve az általános keresők által. Nem szabad összekeverni a deep (mély) webet a dark (sötét) webbel, ami olyan gépeknek vagy hálózati szegmenseket jelent, amelyek nincsenek az Internetre kapcsolva.

4 A láthatatlan web A láthatatlan web információi sokkal
nagyobb mennyiségűek jobb minőségűek pontosabbak ellenőrzöttek Rendezettebbek Általánosságban elmondható, hogy a láthatatlan web információforrásainak minősége háromszor jobb a felszíni, a látható web információinál

5 Keresünk, de mivel? Keresőgépek Tematikus keresők
Speciális programok által felépített adatbázisban tárolt, indexeken alapul a keresés kulcsszavak alapján A web robotok a weboldalakat tartalmuk alapján indexelik Tematikus keresők Weboldalak témakörönként csoportosított, általában hierarchikus gyűjteménye Általában az adott témakör szakértői által válogatott oldalak kerülhetnek be

6 Keresőgépek 3 funkcionális részből állnak Web robot (spider, crawler)
Indexelő eljárás – adatbázis építés Kereső rendszer – keresés az adatbázisban Az egyszerű keresés mellett általában összetettebb lekérdezésekre is lehetőséget nyújtanak

7 Keresőgépek A találatok között sorrendet állítanak fel
Különböznek az alábbiakban - indexelt oldalak nagysága - kulcsszavak - indexelő, kereső, sorrendet felállító algoritmusok

8 Több mint 20 milliárd weboldalt ismer a Google – úgy gondolnánk, nem maradhat rejtve információ az Interneten. A keresőóriás azonban vakká tesz. Az első pár oldalnál többet nem nézünk meg, a releváns információk nem itt lesznek megtalálhatók. Google keresés: „Arany János” kb. 681 000 találat Mély weben: 70 találat (a legminőségibb, a legjobb)

9 A Láthatatlan web 100-500%-szor nagyobb mint a látható web
Tudományos kutatás Látható web Amit az általános keresők meg tudnak találni Library of Congress Eric A magán szféra anyagai Oktatás és kutatás Egyetemek és főiskolák

10 A keresést megnehezíti
A csak részben (egy webhelyen belül) strukturált tartalom Az óriási információmennyiség Képeken, mozgóképeken fellelhető információ felkutatása A weboldalakról elérhető, hasznos információt hordozó, nem HTML formátumú források kezelése (pl: pdf, doc,…) A web keresők számára láthatatlan tartalom

11 Hogyan lehet hatékonnyá tenni a keresést?
Felhasználói oldalon Meg kell tanítani jól keresni Népszerűsíteni kell a metakeresőket Láthatóvá kell tenni a láthatatlan webet Szerver oldali megoldások Kereső oldali megoldások

12 Felszíni, és a Mély és sokszor láthatatlan web?
Keywords

13 Megoldások a rejtett web feltárására
Szerver oldalon Web-site optimalizációs megoldások - TOC készítése, publikálása Kereső oldalon Rejtett webet is kereső robotok Probléma: ?-t tartalmazó URL-k Megoldás: ? lecserélése /-re Közvetlen hivatkozás nélküli oldalak még mindig nem láthatóak Spider Linker Tartalomfeltárás Tartalomjegyzék (TOC) készítése: HTML oldal sitelist.txt Publikálás: Linkelés nyitólapról TOC nyitólap

14 Metakeresők Metakereső megoldások a keresőkérdést egyszerre több kereső index adatbázisában keresik Dogpile Ithaki Langenberg Monster Crawler Polymeta (új) Supercrawl the webVivisimo

15 Speciális keresők Clusty Fazzle Hippocrates HIWE (Hidden Web Exposer)
Incywincy Noodle ToolsScience Accelerator ScirusTurbo10

16

17

18

19 Bibliográfia http://melyweb.lap.hu/ Órai jegyzetek
<http://techline.hu/it_vilag/ _google_rejtett/2.aspx> Amit elrejt az internet = Vakká tesz a Google ( ) <https://listserv.niif.hu/pipermail/katalist/2001-December/ html> Bakonyi Geza: láthatatlan web ( ) <http://index.hu/tech/net/2009/03/08/ahova_a_google_sem_jut_elahova_a_google_sem_jut_el > Kömlődi Ferenc : Ahova a Google sem jut el ( ) Rabb Ágnes szakdolgozata

20 Somogyi Tamás: A láthatatlan web tudományos részének feltárása
Somogyi Tamás: A láthatatlan web tudományos részének feltárása. In: TMT, (56. évf.) 1. sz. p Palkó Mária: Tudományos kutatás az Akadémiai Láthatatlan Weben. In: Korunk, (20. évf.) 1. sz. p Kovács-Ördög Éva: Információs társadalom. Cikkek, tanulmányok az interneten <http://www.szilleri.tvn.hu/http://www.szilleri.tvn.hu >( ) Nagymélykúti Balázs: Tartalommegőrzés az interneten: webarchívumok <http://www.szilleri.tvn.hu/http://www.szilleri.tvn.hu >( ) Rabb Ágnes: Szöveggyűjtemény a mélyweb tanulmányozásáhozí<http://www.szilleri.tvn.hu/http://www.szilleri.tvn.hu >( )

21 Terfil Rita: A német nyelvű mélyweb forrásai az interneten <http://www.szilleri.tvn.hu/http://www.szilleri.tvn.hu >( ) Törökné Schedl Magdolna: Bepillantás a mélyweb adatbázisaiban a alapján <http://www.szilleri.tvn.hu/http://www.szilleri.tvn.hu >( ) Ujfalusi Hajnalka: Az internet titkai. Barangolás a láthatatlan web világában Marcus P. Zillman szakértővel <http://www.szilleri.tvn.hu/http://www.szilleri.tvn.hu >( )


Letölteni ppt "A láthatatlan/mély web tartalmi és technikai jellemzői"

Hasonló előadás


Google Hirdetések