Az előadás letöltése folymat van. Kérjük, várjon

Az előadás letöltése folymat van. Kérjük, várjon

A láthatatlan/mély web tartalmi és technikai jellemzői Csikó Tímea és Soós Barbara 2009. 05. 13.

Hasonló előadás


Az előadások a következő témára: "A láthatatlan/mély web tartalmi és technikai jellemzői Csikó Tímea és Soós Barbara 2009. 05. 13."— Előadás másolata:

1 A láthatatlan/mély web tartalmi és technikai jellemzői Csikó Tímea és Soós Barbara

2 A jéghegy csúcsa 1. Láthatatlan 2. Invisible 3. Dark 4. Hidden 5. Mély 6. Deep WEBWEB

3 Mi a Mély Web? A Mély Web az az elnevezés amit a World Wide Web azon oldalai kapnak melyek nem részei a felszíni webnek, azaz nincsenek indexelve az általános keresők által. A Mély Web az az elnevezés amit a World Wide Web azon oldalai kapnak melyek nem részei a felszíni webnek, azaz nincsenek indexelve az általános keresők által. Nem szabad összekeverni a deep (mély) webet a dark (sötét) webbel, ami olyan gépeknek vagy hálózati szegmenseket jelent, amelyek nincsenek az Internetre kapcsolva. Nem szabad összekeverni a deep (mély) webet a dark (sötét) webbel, ami olyan gépeknek vagy hálózati szegmenseket jelent, amelyek nincsenek az Internetre kapcsolva.

4 A láthatatlan web A láthatatlan web információi sokkal nagyobb mennyiségűek nagyobb mennyiségűek jobb minőségűek jobb minőségűek pontosabbak pontosabbak ellenőrzöttek ellenőrzöttek Rendezettebbek Rendezettebbek Általánosságban elmondható, hogy a láthatatlan web információforrásainak minősége háromszor jobb a felszíni, a látható web információinál

5 Keresünk, de mivel? Keresőgépek Speciális programok által felépített adatbázisban tárolt, indexeken alapul a keresés kulcsszavak alapján Speciális programok által felépített adatbázisban tárolt, indexeken alapul a keresés kulcsszavak alapján A web robotok a weboldalakat tartalmuk alapján indexelik A web robotok a weboldalakat tartalmuk alapján indexelik Tematikus keresők Weboldalak témakörönként csoportosított, általában hierarchikus gyűjteménye Weboldalak témakörönként csoportosított, általában hierarchikus gyűjteménye Általában az adott témakör szakértői által válogatott oldalak kerülhetnek be Általában az adott témakör szakértői által válogatott oldalak kerülhetnek be

6 Keresőgépek 3 funkcionális részből állnak 3 funkcionális részből állnak 1. Web robot (spider, crawler) 2. Indexelő eljárás – adatbázis építés 3. Kereső rendszer – keresés az adatbázisban Az egyszerű keresés mellett általában összetettebb lekérdezésekre is lehetőséget nyújtanak Az egyszerű keresés mellett általában összetettebb lekérdezésekre is lehetőséget nyújtanak

7 Keresőgépek A találatok között sorrendet állítanak fel A találatok között sorrendet állítanak fel Különböznek az alábbiakban - indexelt oldalak nagysága - kulcsszavak - indexelő, kereső, sorrendet felállító algoritmusok Különböznek az alábbiakban - indexelt oldalak nagysága - kulcsszavak - indexelő, kereső, sorrendet felállító algoritmusok

8 Több mint 20 milliárd weboldalt ismer a Google – úgy gondolnánk, nem maradhat rejtve információ az Interneten. A keresőóriás azonban vakká tesz. Több mint 20 milliárd weboldalt ismer a Google – úgy gondolnánk, nem maradhat rejtve információ az Interneten. A keresőóriás azonban vakká tesz. Az első pár oldalnál többet nem nézünk meg, a releváns információk nem itt lesznek megtalálhatók. Az első pár oldalnál többet nem nézünk meg, a releváns információk nem itt lesznek megtalálhatók. Google keresés: „Arany János” kb találat Google keresés: „Arany János” kb találat Mély weben: 70 találat (a legminőségibb, a legjobb) Mély weben: 70 találat (a legminőségibb, a legjobb)

9 A Láthatatlan web %-szor nagyobb mint a látható web Láthatatlan web Látható web Library of Congress Eric Amit az általános keresők meg tudnak találni Egyetemek és főiskolák A magán szféra anyagai Tudományos kutatás Oktatás és kutatás

10 A keresést megnehezíti A csak részben (egy webhelyen belül) strukturált tartalom A csak részben (egy webhelyen belül) strukturált tartalom Az óriási információmennyiség Az óriási információmennyiség Képeken, mozgóképeken fellelhető információ felkutatása Képeken, mozgóképeken fellelhető információ felkutatása A weboldalakról elérhető, hasznos információt hordozó, nem HTML formátumú források kezelése (pl: pdf, doc,…) A weboldalakról elérhető, hasznos információt hordozó, nem HTML formátumú források kezelése (pl: pdf, doc,…) A web keresők számára láthatatlan tartalom A web keresők számára láthatatlan tartalom

11 Hogyan lehet hatékonnyá tenni a keresést? Felhasználói oldalon Felhasználói oldalon Meg kell tanítani jól keresni Meg kell tanítani jól keresni Népszerűsíteni kell a metakeresőket Népszerűsíteni kell a metakeresőket Láthatóvá kell tenni a láthatatlan webet Láthatóvá kell tenni a láthatatlan webet Szerver oldali megoldások Szerver oldali megoldások Kereső oldali megoldások Kereső oldali megoldások

12 Felszíni, és a Mély és sokszor láthatatlan web? Keywords

13 Megoldások a rejtett web feltárására Szerver oldalon Szerver oldalon Web-site optimalizációs megoldások - TOC készítése, publikálása Web-site optimalizációs megoldások - TOC készítése, publikálása Kereső oldalon Kereső oldalon Rejtett webet is kereső robotok Rejtett webet is kereső robotok Probléma: ?-t tartalmazó URL-k Probléma: ?-t tartalmazó URL-k Megoldás: Megoldás: ? lecserélése /-re ? lecserélése /-re Közvetlen hivatkozás nélküli oldalak még mindig nem láthatóak Közvetlen hivatkozás nélküli oldalak még mindig nem láthatóak Spider Linker Spider Linker Tartalomfeltárás Tartalomfeltárás Tartalomjegyzék (TOC) készítése: Tartalomjegyzék (TOC) készítése: HTML oldal HTML oldal sitelist.txt sitelist.txt Publikálás: Publikálás: Linkelés nyitólapról Linkelés nyitólapról TOC nyitólap TOC nyitólap

14 Metakeresők Metakereső megoldások a keresőkérdést egyszerre több kereső index adatbázisában keresik Metakereső megoldások a keresőkérdést egyszerre több kereső index adatbázisában keresik Dogpile Dogpile Ithaki Ithaki Langenberg Langenberg Monster Crawler Monster Crawler Polymeta (új) Polymeta (új) Supercrawl the webVivisimo Supercrawl the webVivisimo

15 Speciális keresők Clusty Clusty Fazzle Fazzle Hippocrates Hippocrates HIWE (Hidden Web Exposer) HIWE (Hidden Web Exposer) Incywincy Incywincy Noodle Noodle ToolsScience ToolsScience Accelerator Accelerator ScirusTurbo10 ScirusTurbo10

16

17

18

19 Bibliográfia Órai jegyzetek Amit elrejt az internet = Vakká tesz a Google ( )http://techline.hu/it_vilag/ _google_rejtett/2.a spx : láthatatlan web Bakonyi Geza: láthatatlan web ( )https://listserv.niif.hu/pipermail/katalist/2001- December/ html Kömlődi Ferenc : Ahova a Google sem jut el ( )http://index.hu/tech/net/2009/03/08/ahova_a_google_ sem_jut_elahova_a_google_sem_jut_el Kömlődi Ferenc Rabb Ágnes szakdolgozata

20 Somogyi Tamás: A láthatatlan web tudományos részének feltárása. In: TMT, (56. évf.) 1. sz. p Palkó Mária: Tudományos kutatás az Akadémiai Láthatatlan Weben. In: Korunk, (20. évf.) 1. sz. p Kovács-Ördög Éva: Információs társadalom. Cikkek, tanulmányok az interneten ( ) Kovács-Ördög Éva: Információs társadalom. Cikkek, tanulmányok az interneten ( )http://www.szilleri.tvn.hu/http://www.szilleri.tvn.hu Nagymélykúti Balázs: Tartalommegőrzés az interneten: webarchívumok ( ) Nagymélykúti Balázs: Tartalommegőrzés az interneten: webarchívumok ( )http://www.szilleri.tvn.hu/http://www.szilleri.tvn.hu Rabb Ágnes: Szöveggyűjtemény a mélyweb tanulmányozásáhozí ( ) Rabb Ágnes: Szöveggyűjtemény a mélyweb tanulmányozásáhozí ( )http://www.szilleri.tvn.hu/http://www.szilleri.tv n.huhttp://www.szilleri.tvn.hu/http://www.szilleri.tv n.hu

21 Terfil Rita: A német nyelvű mélyweb forrásai az interneten ( ) Terfil Rita: A német nyelvű mélyweb forrásai az interneten ( )http://www.szilleri.tvn.hu/http://www.szilleri.tvn.hu Törökné Schedl Magdolna: Bepillantás a mélyweb adatbázisaiban a alapján ( ) Törökné Schedl Magdolna: Bepillantás a mélyweb adatbázisaiban a alapján ( )http://www.szilleri.tvn.hu/http://www.szilleri.tvn.hu Ujfalusi Hajnalka: Az internet titkai. Barangolás a láthatatlan web világában Marcus P. Zillman szakértővel ( ) Ujfalusi Hajnalka: Az internet titkai. Barangolás a láthatatlan web világában Marcus P. Zillman szakértővel ( )http://www.szilleri.tvn.hu/http://www.szilleri.tvn.hu


Letölteni ppt "A láthatatlan/mély web tartalmi és technikai jellemzői Csikó Tímea és Soós Barbara 2009. 05. 13."

Hasonló előadás


Google Hirdetések