A hatékony információkeresés alapjai Aranyi Zoltán SZTE Klebelsberg Könyvtár aranyi@ek.szte.hu
Áttekintés Alapfogalmak Adatbázisok kategorizálása Adatbázisok jellemzése Keresés menete Keresési technikák Találatok feldolgozása
Alapfogalmak 1. Adatbázis : Adatmezőkből álló rekordok rendezett halmaza. Logikai szerkezettel rendelkező, információk tárolására és visszakeresésére szolgáló számítógépes állomány. (Forrás : Elektronikus könyvtári értelmező szótár : http://www.bibl.u-szeged.hu/mke_eksz/docs/ekszotar/)
Alapfogalmak 2. Rekord : A számítógépes adatbázisok egyik alapegysége: önállóan kezelhető, logikailag összetartozó adatmezők együttese (pl. egy dokumentum bibliográfiai adatsora). (Forrás : Elektronikus könyvtári értelmező szótár : http://www.bibl.u-szeged.hu/mke_eksz/docs/ekszotar/)
Alapfogalmak 3. Mező : A rekord alapegysége, melyet névvel (kóddal) és tartalommal látnak el. Megkülönböztetünk kereshető és nem kereshető (de megjeleníthető) mezőket.
Struktúra Mező => Rekord => Adatbázis
Adatbázisok kategorizálása Két fő szempont : TARTALOM TÍPUS A fentiek keverednek egymással Bizonyos esetekben a kategorizálás (pl. információ hiányában) nem végezhető el egyértelműen
Adatbázisok tartalom szerinti csoportosítása Milyen szakterületet ölelnek fel? Lehet multidiszciplináris is! Milyen típusú forrásokat dolgoz fel? Pl. könyvek, folyóiratok, szabadalmak, videodokumentumok, vegyes, stb. Milyen a feldolgozás mélysége? Csak bibliográfiai adatok, vagy tartami kivonatok is, esetleg teljes szöveg; stb. Milyen időtartamot fed le? Milyen gyakran frissítik? Hány rekordot tartalmaz?
Adatbázisok típus szerint Bibliografikus „szakirodalmi” szabadalmi vegyes Teljes szövegű (full-text) Faktografikus Katalógus Egyéb (pl. kémiai szerkezeti, stb.) Vegyes (a fentiek közül több is)
A szakirodalmazás menete Két fő fázisa a tágabb értelemben vett ELŐKÉSZÍTÉS és a VÉGREHAJTÁS A két fő fázis ciklikusan ismétlődik Ha EREDMÉNYESEN akarunk dolgozni, az előkészítés a hosszadalmasabb, a nagyobb körültekintést igénylő fázis
Keresés előkészítése Tisztáznunk kell a keresés célját Megfelelő adatbázis(oka)t kell keresnünk Tartalmuk és típusuk szerint is mérlegelni kell Át kell gondolnunk a keresendő fogalomköröket Meddig terjed a határ ; milyen keresőszavak merülhetnek fel (szerzőnevek, tárgyszavak, stb.) ; hol érdemes csonkolni ; kell-e korlátozni a keresést (idő, nyelv, dokumentum típusa szerint) ; milyen operátorokat használunk majd ; stb.
Keresés végrehajtása A találatok kiértékelését követően az esetleg felmerülő problémák miatt legtöbbször vissza kell térni az előkészítéshez, és módosítani kell a keresést. Ezt akár többször is érdemes megtenni. A „végső” találati halmaz még feldolgozásra vár, ez nem kerülhető meg!
Keresési technikák Kulcsszavas keresés : Böngészés : egy vagy több szó előfordulását keressük Böngészés : indexben szereplő szavakat vagy kifejezéseket keresünk („lista” áttekintése) (Hasonlóan, mint Az SZTE EK OPAC-ja ppt-ben!)
Csonkolás, karakterhelyettesítés Az egyes adatbázisok különböző speciális karaktereket használnak : *, $, %, #, ?, ! Eltérő csonkolási típusok lehetnek : A) Végtelen csonkolás Általánosan használt; akárhány karakter követheti a beírtakat (nulla is!) B) Adott karakterre történő csonkolás Karaktersorozaton belül is használhatjuk (pl. wom!n => woman ; women) C) Csonkolás megadott határok között (pl. 4 karakterre) A magyar nyelvi sajátosságok miatt nagyon alaposan át kell gondolni a használatukat
Keresések korlátozása Leggyakoribb esetei : idő, nyelv, dokumentum típusa Legtöbbször valamely mező kitöltésével (pl. megjelenés éve / időszaka), vagy legördülő menüből történő kiválasztással (pl. dokumentum típusa) működik Akkor érdemes használni, ha biztosak vagyunk a hatékonyságában
Operátorok A legtöbb adatbázis keresések eredményeiből találati halmazokat képez A halmazok, vagy egyes keresőszavak között, de halmaz és keresőszó között is kapcsolatokat létesíthetünk: erre szolgálnak az operátorok Három típusukat különítjük el: Logikai vagy Boole-operátorok Helyzeti operátorok (más elnevezése is lehet!) Szám- vagy numerikus operátorok
Logikai operátorok A legelterjedtebb operátorok: ÉS, VAGY, NEM (AND, OR, NOT) Ritkán speciális karaktereket is használhatnak helyettük (*, +, -, stb.) Jelentésüket „halmazábrákkal” (Venn-diagram) szoktuk szemléltetni Egyértelmű a használatuk, ha zárójeleket alkalmazunk
AND (ÉS) erős kicsi erős AND kicsi Sok kicsi sokra megy. x Erős, mint a méreg. x Kicsi a bors, de erős. A sorrend tetszőleges : erős AND kicsi ugyan azt adja, mint kicsi AND erős
OR (VAGY) erős kicsi erős OR kicsi Sok kicsi sokra megy. Erős, mint a méreg. Kicsi a bors, de erős. A sorrend tetszőleges : erős OR kicsi ugyan azt adja, mint kicsi OR erős
NOT (NEM ; DE NEM) erős kicsi erős NOT kicsi kicsi NOT erős Sok kicsi sokra megy. x Sok kicsi sokra megy. Erős, mint a méreg. Erős, mint a méreg. x Kicsi a bors, de erős. x Kicsi a bors, de erős. x A sorrend fontos : erős NOT kicsi mást jelent, mint kicsi NOT erős
Helyzeti operátorok Hívhatják szóközelségi, távolsági, stb. operátoroknak is Jelentésük, jelölésük, alkalmazhatóságuk keresőrendszerenként változik Szavak, kifejezések sorrendjét és távolságát határozzuk meg segítségükkel Leggyakrabban a "pontos kifejezés keresése" esetet alkalmazzuk
Pontos kifejezés keresése 1. Az egyik nagy Internet-kereső az egér elefánt keresésére ~166.000 találatot ad (2013 szeptember végén) Ugyan ezt kapjuk az elefánt egér megadásával (~166.000 találat) Az "egér elefánt" beírására 2.910 találatunk lesz Az "elefánt egér" 1.820 találatot produkál
Pontos kifejezés keresése 2. Egy másik Internet-kereső az egér elefánt keresésére ~33.500 találatot ad (az előző ~166.000 volt) Az elefánt egér keresésre ~2.780.000 találat van (előzőleg ~166.000 találat) Az "egér elefánt" 2170 találatot eredményez (2.910) Az "elefánt egér" pedig 191.00 találatot (1.820) A látszólagos ellentmondás oka : a kereső az "elefánt egér" kifejezésbe beleveszi az "elephant ear" -t is.
Példa helyzeti operátorok menüből történő használatára CompLex Web Jogtár keresőablaka
Szám- vagy numerikus operátorok < ; > ; = ; =< ; <= ; => ; >= ; - (-tól/-ig) Általában űrlapokon használjuk őket:
Keresési eredmények értékelése Két fő problémával találkozhatunk Túl sok találat Túl kevés találat Leginkább a sok találat okoz gondot
Túl sok találat… Újra át kell gondolnunk a téma megközelítését Újabb keresőszavak, kifejezések használata Operátorok használata (az AND sokat szűkít, a helyzeti operátorok méginkább!) Korlátozások (idő, nyelv dokumentum típusa) megfontolása
Túl kevés találat… Helyesírás ellenőrzése Tágabb fogalmak, kifejezések használata Operátorok : az OR bővít! Csonkolás használata Téma átgondolása : Lehet, hogy rossz a megközelítésünk?
A keresés módosítása után Új keresés lefuttatása Újabb értékelés!!! (Esetleg újabb futtatás…) Mentés előkészítése: minden találat, vagy csak a kijelöléssel kiválasztottak Mentés : csak a találatok, vagy a keresés menete (stratégia) is – későbbi futtatás, átdolgozás céljából
Keresés „befejezése” Lehet, hogy kezdetben csak a bibliográfiai adatok állnak rendelkezésünkre, de újabb ötleteket, megközelítéseket kaphatunk a primer dokumentumok feldolgozása során Ez újabb információkeresésre sarkallhat bennünket
Információk a sikeres tanuláshoz Az alapos megértéshez, a gyakorlati ismeretek elsajátításához a teljes diasorozatot érdemes tanulmányozni Tesztkérdések csak az aláhúzott című diákból lesznek GYAKORLAT TESZI A MESTERT!