Keresőszolgáltatások MAGYAR DÁNIEL 2015.11.16. I. Keresőmotorok története  1993 Wandex  Fejlesztő: Matthew Gray  Ma már nem működik  1993 Aliweb 

Slides:



Advertisements
Hasonló előadás
Hogyan jutunk információkhoz az interneten
Advertisements

Keresőrendszerek.
A Savaria Egyetemi Könyvtár Katalógusa Böngészés Keresés Találatok megjelenítése Adatbázis választás Olvasói tranzakciók.
Kereső program használata Készítette: Berger Nikolett
 A Web, kezdeti időszakában csak a szöveges file-okat kezelte.  Ma teljes körű multimédia szolgáltatásokat nyújt  Filmet,  Zenét,  Képeket nézhet.
Az Internet adta lehetőségek
1 Internet. 2 WWW  World Wide Web  Hivatkozásokkal összekötött hipermédia dokumentumok rendszere  Dokumentumok -> Weboldalak  A weboldalak hipertext.
Internet ismeretek II..
Készítette: Kozák Magdolna. Google  „google”: eredetileg „googol”, ami a matematikában azt a számot fejezi ki, ahol egy 1-es után 100 darab nulla van.
Savaria Egyetemi Könyvtár Katalógusa Böngészés Keresés Találatok megjelenítése Adatbázis választás Olvasói tranzakciók.
A láthatatlan/mély web tartalmi és technikai jellemzői
ZENEI ADATBÁZISOK. The Music Index Online A Music Index a zenei időszaki kiadványok legátfogóbb bibliográfiai és részben teljes szöveges adatbázisa több.
A web és működése A Világháló három szabványra épül:
Amit a HTML-ről érdemes tudni
GOOGLE 1998 szeptember Ma: az IN-es keresés 75%-a Webes keresés Képkeresés Usenet csoportokban Könyvtárban (hierarchikus katalógus) Egyéb szolgáltatások.
Internetes böngészőprogram használata, beállításai
1 Hogyan juthatunk be a keresők első oldalára – kereső optimalizálás.
Kereső programok használata
Hogyan lehet használni a keresőprogramokat? Készítette: Tankó Csongor Felkészítő tanár: András Izabella Gábor Áron Iskolaközpont Szentegyháza.
Aki keres, az talál? Igen, talál. Ki ezt, ki azt, de egy szót beütve a google keresőbe (pl.) mindig ugyanazt, hacsak nem kerültek fel új honlapok az adott.
Hálózatkezelés, Internet 4. óra Előadó: Jánosik Tamás.
Hálózatkezelés, Internet 5. óra Előadó: Jánosik Tamás.
Keresőoptimalizáló eszközök ( S earch E ngine O ptimization tools )
Szemantikus keresők.
Vida Andrea SZTE Egyetemi Könyvtár
Az internetes keresőkben a felhasználó az őt érdeklő szavakra, adatokra kereshet rá egy általában egyszerű oldalon, egy beviteli mező és egyéb szűrési.
Készítette: Gocsál Ákos, Gocsál Klára, Fehér Péter 1 A program megvalósulását az Apertus Közalapítvány támogatta. Internet az oktatásban – taneszközök.
Számítógép-kezelői tanfolyam VFMK
Keresőrendszerek.
World Wide Web Szabó Péter Számítástechnika-technika IV. évfolyam.
Topológiák Hálózati eszközök
Az internetes keresési módszerek
Keresés a weben Kulcsszavas keresés: Google (
Bevezetés az informatikába 11. előadás Internet. Egyetlen nagy egységes elveken működő világhálózat hálózatok összekapcsolása nagy világhálóvá csomagkapcsolt.
Keresés fajtái Matching (szabadszavas)
Adatkeresés az interneten
Az internetes keresők működésének technikai háttere
Készítette: Gál Imola.
Jogi informatika1 INFORMATIKA III. alkalom szeptember ELŐADÓ.
Google Scholar Wolfram Alpha Scirus Készítette: Varga Ádám.
A web története és statisztikái. World Wide Web előtti internet, internet előtti hiperszöveg.
OSINT eszközök a gyakorlatban avagy hogyan gyűjtsünk és elemezzünk nyílt adatokat személyekhez kapcsolódóan Dr. Gorza Jenő PhD nyá. ezredes, c. egyetemi.
A keresőmarketing szerepe és lehetőségei a könyvpiacon Sziebig Péter ügyvezető Klikkmánia - keresőmarketing ügynökség április 15.
KERESÉS ELEKTRONIKUS KÖNYVTÁRI KATALÓGUSOKBAN Kiss Annamária Semmelweis Egyetem Központi Könyvtár 2013.
Internet tudományos használata Skultéti Attila 2015.
17 ISMERTESSE AZ INTERNETES KERESÉSI MÓDSZEREKET! KONKRÉT GYAKORLATI PÉLDA KERESÉSRE.(KERESÉS, TALÁLATI LISTA ÉRTELMEZÉSE, TALÁLT OLDAL MENTÉSE.) Készítette:
Google Scholar és Mendeley Az irodalomkutatás, valamint a bibliográfia- készítés, megosztás, kapcsolatépítés segédeszközei Semmelweis Egyetem Központi.
Internet tudományos használata Skultéti Attila 2015.
Információ és kommunikáció Gellér Zoltán 2015 Számítógépes ismeretek.
A JaDoX, mint repozitórium szoftver a közgyűjteményi informatikában JaDoX 3 Monguz Portál24 Monguz Kft. Mazula Zoltán.
Információk rendszerezése a könyvtárban Információforrások a weben március 3. Dr. Kiss Danuta NymE Központi Könyvtára.
Készítette: Kiss András
Információ és kommunikáció
A HTML alapjai Az internet és a web.
INFORMATIKA ELŐADÁS október 15. I. ELŐADÓ Informatika
INFORMATIKA ELŐADÁS október 20. I. ELŐADÓ Informatika
OVIDIUS Info-Service Co Ltd.
Útmutató az adatbázis használatához
OVIDIUS Info-Service Co Ltd.
OVIDIUS Info-Service Co Ltd.
INFORMATIKA ELŐADÁS október 19. I. ELŐADÓ Informatika
DRUPAL Előadja: Nagy Nikoletta :05.
Navigáció az Interneten:
INFORMATIKA november ELŐADÓ VI. alkalom
GEGES JÓZSEF Ph.D. OVIDIUS Info-Service Co Ltd.
Az internet minőségi információ halmazainak feltárásáról
CINAHL with Full Text Kiss Annamária
Networkshop 2019 Győr, április 26.
Bibliográfia adatbázis-kezelő alkalmazások, EndNote 2018 Skultéti Attila
Előadás másolata:

Keresőszolgáltatások MAGYAR DÁNIEL

I. Keresőmotorok története  1993 Wandex  Fejlesztő: Matthew Gray  Ma már nem működik  1993 Aliweb  Archie Like Indexing for the Web  Ma is működik  1994 Lycos  Üzleti vállalkozássá válik

II.  Ezután sok keresőmotor jön létre  WebCrawler, Hotbot, Excite, Infoseek, Inktomi, Open Text, Northern Light és az AltaVista mind ekkortájt születtek  sok olyan kereső is született, ami nem a World Wide Weben keresett  valamilyen más internetes protokollon át elérhető oldalak között  Pl. Archie, ami az anonymous FTP szerverek között,  Veronica, ami a Gopher oldalak között keresett

III.  1996 Google  Stanford egyetem: Larry Page, Sergey Brin  PageRank algoritmus  2001 körül válik egyeduralkodóvá  2004 Yahoo  2002-ben megvásárolta az Inktomit, majd 2003-ban az AlltheWebet és az AltaVistát, és 2004-ben megindította saját keresőszolgáltatását.

IV. Új kísérletek a keresőmotorokkal  Tárgyspecifikus hivatkozási népszerűség  ezt használja a Teoma keresőmotor, amire az Ask Jeeves épül  Klaszterezés  Adott dolgokból halmazokat (klasztereket) alakítunk ki úgy, hogy az egy klaszterbe tartozó elemek jobban hasonlítsanak egymásra, mint a más klaszterben levőkre.  például a Clusty és a magyar fejlesztésű Polymeta

V. Kétféle keresőszolgáltatás  A, tematikus  Metázás:Tartalmak -> kulcsszavak -> ez alapján később visszakeresés  Összes lap.hu  Ingyenes  Emberi intelligencia alapú szűrés  Nagy adatbázisok (pl. Könyvtár oldalai) itt oxford MTAittoxfordMTA

VI.  B, Index alapú  Indexelés  Index: „régi telefonkönyv” (betűk alapján besorolva)  Nagy adatbázisok teljes szavakra vannak indexelve  Nem indexelnek be minden szót/oldalt  Yahoo-Google: „vas” szó  Yahoo: találat  Google: találat

VII. Index alapú keresőszolgáltatások működése  Folyamat – 3 része van 1. Kb szerver  Robotprogram (vö. szondák)  Bejárja a weblapokat  Elküldi az adatokat 2. Kb szerver  A robotprogramok által elküldött adatok feldolgozásáért felelősek  Indexelnek 3. A kérést befogadó szerverek csoportja  A keresni kívánt szót begépeljük például a Google keresőjébe  Erre a kérésre a szerver már a saját adatbázisából jelenít meg találatokat  Fontos a találatok sorrendje (átlagos felhasználó: Első három találat)

VIII. PageRank  PageRank  A PageRank az informatikában egy olyan algoritmus, amely hiperlinkekkel összekötött dokumentumokhoz számokat rendel azoknak a hiperlink-hálózatban betöltött szerepe alapján. (Ezt a számot szintén PageRanknek nevezik.) A PageRank a Google internetes keresőmotor legfontosabb eleme.  A Google arra a feltételezésre épít, hogy a weboldalak készítői általában azokra az oldalakra linkelnek a saját lapjukról, amiket jónak tartanak, vagyis minden hiperlink felfogható egy-egy szavazatként a céloldalra. Minél több szavazatot kap egy oldal, annál fontosabb, de azt is figyelembe kell venni, hogy a szavazatot leadó oldal mennyire fontos. (Ez egy rekurzív definíció: az a fontos oldal, amire fontos oldalak mutatnak.) A PageRank a fontosság számszerűsítése.

IX.  Az alapötlet szerint kezdetben minden oldalnak egy egységnyi szavazata van, amit egyenlően szétoszt azok között az oldalak között, amikre hivatkozik, és a más oldalaktól kapott szavazatokat is ugyanígy továbbosztja. Egy oldal PageRankje megegyezik a kapott szavazatok számával (ami nem feltétlenül egész szám).

X. Weboldalak 10-es PageRankkel  Adobe.com – Adobe Systems, szoftvercég  Blogger.com – Blogger.com  Energy.gov – az Egyesült Államok energetikai minisztériuma  ERCIM.org – Európai Informatikai és Matematikai Kutatókonzorcium  Facebook.com – Közösségi alkalmazás, portál  FirstGov.gov – USA kormányzati portál  Google.com – Google, a PageRanket alkalmazó keresőrendszer  Keio.ac.jp – a tokiói Keio Egyetem  Macromedia.com – Macromedia, szoftvercég  NASA.gov – NASA, az Egyesült Államok Nemzeti Légügyi és Űrhajózási Hivatala  NSF.gov – National Science Foundation, az Egyesült Államok tudományos kutatási ügynöksége  NYTimes.com The New York Times  Real.com – RealPlayer  StatCounter.com – internetes statisztikai szolgáltatás  W3.org – World Wide Web Consortium  WebStandards.org – Web Standards Project  Whitehouse.gov – a Fehér Ház

XI. A Google  A Google keresési mechanizmusa a PageRank eljáráson alapszik (melyet 2001 szeptemberében szabadalmaztattak), melynek lényege, hogy azt mérik, hány link mutat egy adott weboldalra. A PageRank rendszer egy adott weboldal népszerűségének és fontosságának mérésén alapszik.  A Google a HTML-en kívül 13 más állománytípust is rendszerez és tárol. A jelentősebbek: PDF, Word-dokumentumok, Excel-táblázatok, Flash- (SWF) animációk, szövegfájlok stb. A szöveg és SWF fájlok kivételével a tartalmat HTML-re konvertálva tárolja a Google, így azok böngészővel is megtekinthetők.  2007 májusában vezették be az univerzális keresés funkciót, ami annyit tesz, hogy a Google nemcsak a weblapok, hanem a videók, képek, hírek, blogok, térképek és könyvek között is keres novembere óta a bejelentkezett felhasználók a SearchWiki koncepció jegyében a saját találati listájuk egyes tételeit lejjebb vagy feljebb rangsorolhatják, eltüntethetik, illetve mások számára is elérhető megjegyzéssel láthatják el, s az így kialakított listát meg is oszthatják egymással márciusi fejlesztésként jelent meg a szemantikus keresés egy próbaváltozata, ahol a Google megpróbálja értelmezni a keresőkifejezést, összefüggést találni a keresőmezőbe írt szavak között, és intelligensen válogatni a találatok között. Az így kapott eredmények egyelőre csak az oldal alján, egy sávban jelennek meg.

XII. A világ 10 legnagyobb adatbázisa SorszámNévOrszágFelhasználási cél 1. Klímaadatok VilágközpontjaKlímaadatok Világközpontja (WDCC) – a Max Planck Intézet tartja fennMax Planck Intézet NémetországTudományos kutatás 2. Az USA Nemzeti Energiakutató Tudományos SzámítóközpontjaAz USA Nemzeti Energiakutató Tudományos Számítóközpontja (NERSC) USATudományos kutatás 3.AT&TUSATávközlési szolgáltató 4.GoogleUSAInternetesInternetes keresőkereső 5.SprintUSATávközlési szolgáltató 6ChoicePointUSA Kormányzati, közösségi és üzleti jellegű információk megosztása 7.YouTubeUSAVideomegosztás 8.AmazonUSAKiskereskedelem 9. CIACIA – az USA központi hírszerző ügynöksége USATitkosszolgálat 10.USA Kongresszusi KönyvtárKongresszusi KönyvtárUSANemzeti Könyvtár

XIII. Google és Facebook problematikája  Adatbázisok, vagy sem?  Indexek segítségével dolgozzák fel az anyagot  Magánvélemény: mindkettő adatbázis, mivel külön telephelyeket tartanak fent az adatok tárolására.  Google Google  Facebook: Kormányzatok és óriáscégek is letöltik az adatbázisát  Nevek gyakoriságának vizsgálatára alkalmas (csak nevet és urlt tartalmaz)  Nvidia, Ubisoft, IBM, Seagate, Disney, Sony, Fujitsu stb.

Köszönöm a figyelmet!