Hálózatkezelés, Internet 4. óra Előadó: Jánosik Tamás
A keresőrendszerek története Az online adatbázisok után a hypertext megjelenésével kezdődhetett el az internetes, ill. a webes információkeresés. A 80-as évek végétől vált lehetővé az interneten való keresés széles körben való elterjedése. A telnettől a webig vezető úton számos új módszer jelent meg az elérhető információk áttekintésére. A gyors fejlődést már nem lehetett nyomon követni csupán szóban, elektronikus levelezéssel vagy sokszorosított listák útján. 2
A kezdeti eszközök a laikus felhasználó számára elég nehézkesen voltak használhatók. Ilyen az FTP (File Transfer Protocol), az adatátvitel általános szabványa, s egyben program, ami biztosítja, hogy a hálózat számítógépei között egységes formában jöjjön létre az állománycsere. Az áttörést két rendszer megszületése hozta: 3
1991-ben Gophereket készítettek. Ez egy szöveges, menüszerkezetű információs hálózat, ami hasonlít a hierarchikus tartalomjegyzékekhez. A Gopherben a felhasználó szöveges (és csak szöveges) állományokat nézhetett meg és tölthetett le. Legismertebb keresőeszköze a Veronica integrált menülekérdező és indexelő rendszer (Very Easy Rodent-Oriented Net-wide Index to Computerized Archives) azaz „nagyon egyszerű rágcsáló-orientált egész hálózatra kiterjedő tárgymutató a számítógépes archívumokhoz”. A haladás a Gophertől a Webig természetes haladásnak tekinthető a szövegalapútól a grafikus felületig. Számos más tényező is közrejátszott a Gopher bukásában: 4
1993-ban a minnesotai egyetem bejelentette, hogy licenszdíjakat fog kérni a Gopher szerverek kivitelezéséért. Ezzel szemben nem volt ilyen korlátozás a World Wide Weben. a Web HTMLének nagyobb mértékű rugalmassága, és főleg a szöveg és grafika egyesítése bátorított a tartalmak Gopherről Webre költöztetésére. Gopherrel minden dokumentumnak előre meghatározott alakja és típusa van, és a felhasználónak be kell járnia egy egyedi, szerveren meghatározott menürendszert, hogy eljusson egy bizonyos dokumentumhoz. Sok felhasználó nem kedvelte a mesterséges különbséget a menü és a fix szöveg között a Gopher rendszerben, és a web rugalmasságát sokkal használhatóbbnak tartották egymáshoz kapcsolódó dokumentumok és interaktív alkalmazások kialakításához. 5
Ugyancsak 1991-ben Tim Berners-Lee kísérleteiből kiindulva született meg a World Wide Web hipermédia információs hálózat üzemszerű formája. „Ebben a rendszerben a hypertext jóvoltából az információforrásokra hypertext csatolók (hyperlinks) formájában teljesen szabadon lehet egymással összekapcsolni. A kapcsolódó és megjeleníthető információforrások nemcsak szövegek, hanem képek, hangok és mozgóképek is lehetnek. A rendszeren belül nem érvényesül semmiféle hierarchikus rendező elv, minden forrás egyszerre több forrással is összefügghet és fordítva. 6
A weben belül hamarosan kialakultak különféle keresőszolgáltatások, mint például a Galaxy, az Infoseek, a Yahoo!, a Lycos vagy az AltaVista. Az internet fejlődését a kereslet-kínálat kettőssége is meghatározta. Így alakult ki a web két „oldala”: a tartalomszolgáltatás és a keresőszolgáltatás. 7
Keresők Az AT Internet Institute felmérése szerint az alábbiak szerint oszlik meg a keresőmotorok használata: 8
Keresőkről általában Az internetes keresőkben a szörföző felhasználó az őt érdeklő szavakra, adatokra kereshet rá egy általában egyszerű oldalon, egy beviteli mező és egyéb szűrési lehetőségek segítségével. A puritán előkép mögött általában egy komoly keresőmotor bújik meg, amely az oldalakat tartalmuk, népszerűségük, felépítésük, kapcsolataik alapján rangsorolja, és a keresési feltételeknek leginkább megfelelő honlapok URL-jét egy listában megjeleníti. 9
Hogyan működnek a webkeresők? A webkereső (search engine, szó szerint keresőmotor) nem más, mint egy automatikus böngésző. A keresőprogramok időről időre „végigmásznak” a világhálón – ezért nevezik őket póknak is – és automatikusan „rákattintanak” minden linkre, amit találnak, vagyis követik a weboldalakon elhelyezett hivatkozásokat. A keresők a talált oldalakat tárolják, és különböző módszerekkel indexelik őket – a jobb programok megjegyzik egyes szavak előfordulását, az oldalak címeit és néha az úgynevezett „meta tag”-ekben tárolt tartalomleíró kifejezéseket is. 10
Amikor a felhasználó webkeresőt használ, nem is az interneten, hanem a keresőprogram által létrehozott adatbázisában turkál. A módszer előnye, hogy a már indexelt oldalakon jóval hatékonyabban lehet keresni, mint ha a póknak minden egyes alkalommal végig kellene másznia az interneten – ez napokat, sőt akár heteket is igénybe vehetne. Egyszerre hátrány és előny, hogy a weboldalakon található információt egyes keresők egy ideig gyorsítótárban (cache-ben) tárolják, így a böngészők olyan tartalmakhoz is hozzáférhetnek, amelyet készítőik már eltávolítottak weboldalaikról. 11
A statisztikák szerint a legtöbb weblapot a keresőoldalakon keresztül találják meg (mint amilyen a Google, Yahoo, Bing, AltaVista és társaik). GoogleYahooBingAltaVista Nyilvánvaló tehát, hogy ezekben ajánlatos minél jobban szerepelni. Ráadásul ez a jelenlét a legolcsóbb és egyik leghatékonyabb fajtája az oldalak népszerűsítésének. Csakhogy az is általánosan elismert tény, hogy a keresés eredményei közül az első találatnál (tehát az első néhány találati oldalnál) többet ritkán néznek meg. 12
Így hát a puszta jelenlét a keresők adatbázisában még nem ér sokat: ha ugyanis a számunkra lényeges kulcsszavakra rákeresve a 433-ik helyen bukkanunk fel, onnan forgalomra nem nagyon lehet számítani. A keresőkbe bekerüléshez nem kell más, mint legalább egy, az oldalunkra mutató link egy olyan oldalról, ami már megtalálható az adott keresőben. E nélkül a bekerüléshez szükséges a regisztráció, de az olyan lapokat, melyekre nem mutat link, előbb-utóbb úgyis kiszórják a keresők. 13
A jó weblap – a keresők által ajánlott technikák Tévhitek Ha már van weboldalam, az azt jelenti hogy sok látogatója is lesz. Ha már beregisztráltam magam a keresőrendszerekbe akkor jól állok a keresőoptimalizálás szempontjából. Ha rákeresnek a cégem, vagy az oldalam nevére, akkor az első helyen dob ki a keresőrendszer, vagyis jól állok a keresőoptimalizálás szempontjából. 14
Kulcsszavak Az egyik legfontosabb, ha nem a legfontosabb lépés a kulcsszavak kiválasztása. Az oldalunk szövegét tudatosan kell megírni, úgy hogy a lehető legtöbb kulcsszót tartalmazza. Természetesen ez nem azt jelenti, hogy egy mondaton belül ötször kell elismételni őket, figyelni kell arra, hogy az oldalt alapvetően nem a keresőrobotoknak, hanem embereknek készítjük, így fontos az átláthatóság. Meta tag-ek A lényegük jóformán az, hogy a keresőrendszerek által használt keresőrobotoknak információkat adjon az oldalunkról, miközben vizsgálják azt. 15
Linknépszerűség Ha már kész az oldalunk, beregisztráltunk a keresőrendszerekbe, úgy érezzük, hogy készen vagyunk, akkor jön a lényeg. Az oldalunk a Google keresőrendszerben egy adott skála szerint, egy úgynevezett PageRank skála szerint osztályozva van, attól függően, hogy a Google rendszer mennyire tartja az adott témán belül fontosnak az oldalt. Ezt a PageRank-ot aszerint osztja ki, hogy mennyire releváns egy oldal (adott témában), ami a mi oldalunkra linkel. Ezáltal lett a Google egyedi a keresőrendszerek között, hogy kitalálta azt a technikát, amivel az oldalakat témájuk szerint csoportosította és azon belül rangsorolta is. Ezért manapság, ha valaki bármit beír a google-ba, maximum 2 kattintás után pozitív eredményre talál. 16
A web-katalógusok, vagy tematikus keresők Van a világhálón való keresésnek egy másik módszere, a tematikus keresők alkalmazása. Itt tulajdonképpen arról van szó, hogy az oldalak linkjei kategóriákra vannak bontva, és azokon belül is további kategóriák találhatók. Ha az ember tudja mit keres, érdemes alkalmazni. A legismertebb katalógusok (azaz témakörök szerint csoportosított adatbázisok) a Dmoz.org (Google Directory néven is ismert), a Yahoo Directory, és az iparági, céges, stb. katalógusok.Dmoz.orgYahoo Directory 17
Ehhez Magyarországon még feltétlenül hozzá kell venni a és oldalakat, ez utóbbi szinte hegemóniát élvez ebben a kategóriában. Az ilyen tematikus keresőkbe mindig be kell regisztrálni az oldalainkat, ha azt akarjuk, hogy megjelenjen. Keressük meg a legmegfelelőbb kategóriát, és valószínűleg találunk a keresőoldalon egy linket/mezőt vagy egyéb lehetőséget, ahol beajánlhatjuk oldalunkat az adatbázisba. A bekerülés általában nem automatikus, hanem a kereső működtetői elbírálják az oldal megjelenését, az alapján, hogy megfelelő helyre ajánlottuk-e, és hogy mindenben megfelel-e a szabályzatuknak tartalmi szempontból. 18
A legtöbb katalógust emberi munkával szerkesztik, ezért a minőségük is jobb sokszor, mint a keresőmotorok által visszaadott automatikus találatok. Sok katalógus esetében fizetni kell a bekerülésért, míg néhány katalógusba csak egy bizonyos kort elért oldalak kerülhetnek be. A katalógusok nagyon fontos eszközei a keresőoptimalizálásnak, illetve az egész internet marketingnek. Ennek két oka van: i) lehetőségünk van releváns (azaz: az oldal témájába vágó) linkek szerzésére fontosnak ítélt oldalakról, ii) lehetőségünk van a témával foglalkozó látogatók szerzésére. 19
A Google 1998-ban a Google-t összesen két szakadt kaliforniai diák és egy ötlet alkotta. Azon az ötleten kívül pedig, hogy újszerű keresőmotort hozzon létre, Larry Page-nek és Sergey Brinnek volt még egy terabájtnyi tárolókapacitása és egy kollégiumi szobája, ahol a leértékelt merevlemezekből összetákolt adatpark működött – igaz, nem sokkal később sikerült átköltözniük egy garázsba.
Azóta eltelt egy kis idő: Tavaly a Google hárommilliárd dolláros forgalom mellett négyszázmillió dolláros nyereséget produkált, ami háromszorosa volt a as nyereségnek. Február elején pedig a cég részvényeinek értéke olyan magasra ugrott, hogy a Google többet ért, mint a General Motors és a Ford együttvéve. A cég ma saját Palo Alto-i palotájában, a Googleplexben székel.
A „google” kitalált szó, de van értelme: elődjét, a „googol”-t Edward Kasner amerikai matematikus írta le először, és azt a számot jelöli, ami egy egyesből és az utána következő száz nullából ( ) áll – a névadók a neten található információ mennyiségére kívántak vele utalni. A Google jelenleg az egyik legnépszerűbb keresőrendszer, aminek részben az az oka, hogy a találatok nagyon gyakran vannak olyan sorrendben, ahogy a keresést végző személy elvárja. A web egyik legnépszerűbb ilyen jellegű szolgáltatásaként legalább 200 millió keresési kérés érkezik be hozzá és társlapjaihoz naponta.
A máig titkos algoritmust ma PageRanknek nevezik, és, ahogy a cég fogalmaz, a web egyedülállóan demokratikus jellemzőjén alapul, mert a hivatkozások struktúrájából következtet egy-egy oldal értékességére. A PageRank lényege, hogy azt mérik, hány link mutat egy adott weboldalra. A PageRank rendszer egy adott weboldal népszerűségének és fontosságának mérésén alapszik.
Mindehhez a Google a kezdetektől folyamatosan növelte a szolgáltatások számát, és az elmúlt évek szinte minden hónapjában eldurrantott valamilyen újítást. A megtévesztően egyszerű kezdőoldal mögött a szimpla szöveges keresésen kívül ma legalább húsz olyan szolgáltatás bujkál, amelyek jó részéről a felhasználók nem is tudnak. A Google-t például lehet számológépként és mértékegység-átváltóként is használni: írja be a keresőablakba, hogy 9 + (3 * 5), és megtudja, hogy 24; írja be, hogy „100 miles in kilometers”, és megtudja, hogy
Ezeket az eredményeket a Google nem a weben találja, hanem saját erőforrásból szolgáltatja, grátisz. A kereső ezen kívül képes nyomon követni a postán feladott csomagok útját, de van benne amerikai telefonkönyv, térkép, helyesírás-ellenőrző és részvényárfolyamfigyelő is. A keresőbe épített fordítógép angolra fordítja a francia, német, olasz, portugál és spanyol nyelvű szájtok tartalmát, a cache pedig azután is tárolja az indexelt oldalak tartalmát, hogy azok hivatalosan már nem elérhetők az interneten.
A Google nem csak az angol nyelvű oldalakon keres, hanem a keresést végző nyelv és régió szerint szabja testre a találatokat. Magyar nyelvű kezelőfelülettel rendelkezik, kezeli a magyar ékezetes betűket, s mindemellett vannak olyan kiegészítő szolgáltatásai is mint pl: a Google Earth, a Google News és a Google Maps stb.
Köszönöm a figyelmet!