Információk rendszerezése a könyvtárban Információforrások a weben március 3. Dr. Kiss Danuta NymE Központi Könyvtára
2 Látható (visible) és láthatatlan (invisible) web A látható A web azon része, amelyet az általános keresőgépek képesek találati oldalaikon elénk tárni A web-en történő keresés eszköztára Keresőgépek Meta-keresők Portálok Képi-, zenei file-ok keresésére használt eszközök Szótárak, enciklopédiák
3 A keresőgépek jellemzői Számítógép-vezérelt eszköz A honlap-tulajdonosok által korlátozott területen keres Kiszolgáltatott a „robotoknak” Könnyen manipulálhatók
4
5 Egy kis történelem 1993: W3Catalog, Aliweb, JumpStation 1994: WebCrawler, Infoseek, Lycos, Magellan 1995: AltaVista, Open Text Web Index, Magellan, Excite, SAPO 1996: Dogpile, Inktomi, HotBot, Ask Jeeves 1997: Northern Light, Yandex 1998: Google 1999: AlltheWeb, GenieKnows, Naver, Teoma, Vivisimo 2000: Baidu, Exalead 2003: Info.com 2004: Yahoo! Search, A9.com, Sogu 2005: MSN Search, Ask.com, GoodSearch, SearchMe 2006: wikiseek, Quaero, Ask.com, Live Search, ChaCha, Guruji.com 2007: Sproose, Wikia Search, Blackle.com 2008: Powerset, Picollator, Viewzi, Cuil, Boogami, LeapFish, Forestie, VADLO,Sperse! Search, Duck Duck Go 2009: Bing, Yebol, Mugurdy, Goby
6 Internetes keresők összehasonlítása Az indexállomány minősége: az indexelés a teljes web mekkora részére terjed ki, milyen az országok szerinti megoszlás, és mennyire naprakész az adatbázis? A találatok minősége: ez a klasszikus relevanciatesztekkel vizsgálható; de kérdés, hogy az egyes keresőgépek és felhasználóik speciális jellemzői milyen módszerekkel mérhetők? A keresési funkciók minősége: milyen opciók állnak rendelkezésre (pl. „összetett keresés”), mennyire kifinomult a keresőnyelv, mennyire megbízhatóan dolgozik a keresőprogram? A keresőgép használhatósága: ez a felhasználók viselkedésének vizsgálatával mérhető, és kérdőíves felmérésekkel, előre gyártott tesztek végrehajtásával, vagy a naplóállományok utólagos elemzésével valósítható meg a gyakorlatban.
Keresőgépek piaci részesedése Desktop Search Engine Market Share február 7 Forrás: Market Share Statistics for Internet Technologies
Google – speciális keresés 8
9
10 GOOGLE Tudós (Google Scholar) - a Google tudományos keresője Online elérhető referált folyóiratok (Elsevier által kiadottakon kívül) Könyvtári katalógusokban (MOKKA katalóguson keresztül) Rangsorolás (relevancia) hivatkozások alapján
11
12 Meta-keresők jellemzői Egyszerre több keresőgépet futtatnak, akár öt is Minden meta-kereső más algoritmust használ Nagyon időkímélő eljárás Hátrányuk: csak a felszínen keresnek, még a keresőgépek által feltárható teljes mélységet sem tárják fel Néhány meta-kereső: Dogpile, Monster Crawler, Polymeta
13 (Google, Yahoo, Bing, Ask.com)
Portálok és weblapok mint szabad hozzáférésű információforrások 14
15
FAO erdészeti információforrásai 16
17 A portálok jellemzői Rendszerezett kategóriákba sorolja a honlapokat Néhány jellemző kifejezésből kell megítélni a tartalmat Sokszor változik a tartalom A „human elements” tartalommódosító szereppel bír Vannak honlapok, amelyek nem kaphatnak helyet
18 Tudományos publikációk keresői Egyszerű keresés Haladó keresés ScienceResearch
19
20 CiteSeerX Elsősorban számítás- és információtudomány keresője Egyszerű keresés Haladó keresés Találati lista
21 Könyvtári honlap – kapu az információhoz Kulturális honlap követelményei EU Minerva Projekt 10 minőségi elve: átláthatóság, hatékonyság, karbantartottság, elérhetőség/hozzáférhetőség, felhasználó- központúság, interaktivitás, többnyelvűség, árjárhatóság, jogkövetés, hosszú távú megőrzés (Quality Principles - Kézikönyv a minőségi elvekről, 2003) Könyvtári honlapok jellemzői Cél közönség Tartalmi jellemzők Szabad- és korlátozott hozzáférésű információforrások MATARKA, MOKKA, Erdészeti Tallózó (erdészeti folyóiratok), egyéb információforrások EISZ Elektronikus Információszolgáltatás
22 Helyi (egyetemi) hálózatban elérhető adatbázisok Web of Science SCOPUS adatbázis Science Direct Springerlink EBSCO - Bibliográfiai és hivatkozási, részben teljes szövegű adatbázisok Akadémiai Kiadó online folyóiratok ADT- Arcanum Digitális Tudománytár
23 A láthatatlan web Forrás:
24 A láthatatlan - mély, rejtett, sötét… „Invisible Web” fogalma – Dr.Jill Ellsworth 1996 Deep Web, Hidden Web, Dark Web Az a terület, amelyet nem képesek láttatni sem a keresők, sem a direktorik, amelyek nem részei egy-egy ugrópontnak (link) sem University of California-n (Berkeley) 2007-ben publikált „How much information is there?” tanulmány szerint a web kb TB információt tartalmaz (Library of Congress 11 TB), abból kb. 167 TB a hozzáférhető információ 0,183% (1TB = 1000GB = MB = KB) A láthatatlan web tartalmi változásai Cégadatok, cégjelentések, telefonszámok, térképek, útvonaltervek, klinikai kísérletek, szabványok, szabadalmak, könyvek – pl. nem kaphatók, könyvtári katalógusok, hitelesített szaknévsorok – ügyvédek, orvosok, környezeti információk, történelmi forráshelyek, történelmi dokumentumok… (Sherman and Price, 2001)
25 A láthatatlan feltérképezése
26 Az eltűnt információ nyom ában
Keresés a web-, szöveg-, audio-, video-, szoftver- és képi anyagok között 27
28
29 Megtalálni a láthatatlant Tudni mit, hol és hogyan Különböző információforrások, adatbázisok használata Helyes keresési technikák és stratégiák alkalmazása Speciális keresők használata „Kérdezz a könyvtárost!”
30 Kapcsolódó tananyagok Az előadás elektronikus verziója