1/40 High Speed Networks Laboratory Önszerveződő adatbázisok.

Slides:



Advertisements
Hasonló előadás
Keresőrendszerek.
Advertisements

GRIN: Gráf alapú RDF index
Valóban azt látjuk, ami a retinára vetül? Dr. Kosztyánné Mátrai Rita Eötvös Loránd Tudományegyetem, Bölcsészettudományi Kar, Informatika Tanszék.
Adatbázis gyakorlat 1. Szerző: Varga Zsuzsanna ELTE-IK (2004) Budapest
Logók és logfájlok Az online közönségmérés kihívásai.
Jövő hálózati megoldások – Future Internet
INTERNET.
Tanárok kis világa Lehetőségek a tanári hálózatok kutatásában.
HÁLÓZATOK.
Hálózatok.
Kultúra mint kapcsolat Birher Nándor. „A tudás a világ alkotóelemeiről szerzett ismeret, a bölcsesség az elemek kapcsolódásának ismerete.” -szemléletmódváltozás-
Fekvőbeteg adatbázis szervezés GyógyinfokPirisa Levente.
Hálózatba kapcsolt adatbázisok – Hálózatelmélet I.
Előadó: Szabó Márton (iwiw) Katalógus → házi feladatnak beszámít
Számítástudományi módszerek a webes szolgáltatásokban Rácz Balázs október 20.
Címkézett hálózatok modellezése
Hatékony gyorsítótár használata legrövidebb utak kereséséhez Bodnár István, Fodor Krisztián, Gyimesi Gábor Jeppe Rishede Thomsen, Man Lung Yiu, Christian.
13.a CAD-CAM informatikus
Hálózati Biológia A sejt funkcionális működésének megértése.
1 Hogyan juthatunk be a keresők első oldalára – kereső optimalizálás.
Kereső programok használata
Szélességi bejárás A szélességi bejárással egy irányított vagy irányítás nélküli véges gráfot járhatunk be a kezdőcsúcstól való távolságuk növekvő sorrendjében.
Iskolahálózatok itthon és külföldön Pénziránytű műhelymunka MNB, november 10.
A Magyar Elektronikus Könyvtárról Kaposvár, november 5. Moldován István MEK könyvtáros
Hálózati réteg.
Keresőoptimalizáló eszközök ( S earch E ngine O ptimization tools )
Szemantikus keresők.
Az internetes keresőkben a felhasználó az őt érdeklő szavakra, adatokra kereshet rá egy általában egyszerű oldalon, egy beviteli mező és egyéb szűrési.
Az internetről.
Pankász Balázs PTE FEEK Munkapszichológia és Ergonómia Tanszék
Navigáció hypertext- rendszerekben Varga Balázs tanársegéd ELTE IK Algoritmusok és Alkalmazásaik Tsz.
WEB 2.0. Amiről szó lesz… Web átalakulóban, a WEB 2.0 –Újszerű weboldalak… –Első a tartalom! –A felhasználók hatalomátvétele?! –A Web mint platform –
Keresőrendszerek.
Nevezetes algoritmusok: Fa megvalósítása Készítette: Várkonyi Tibor Zoltán.
Mélységi bejárás Az algoritmus elve: Egy kezdőpontból kiindulva addig megyünk egy él mentén, ameddig el nem jutunk egy olyan csúcsba, amelyből már nem.
Hálózatok szerkezete és dinamikája
Keresés a weben Kulcsszavas keresés: Google (
CALDERONI FORRÁSKEZELŐ RENDSZER A Calderoni Program során fejlesztésre kerülő rendszer vázlatos bemutatása.
Social Media 2015-ben, üzleti szemmel - avagy merre tart a közösségépítő világ? Kulcsár István Róbert 1.
DNS. Az interneten használt osztott név adatbázis, a DNS (Domain Name Service) folyton használatos: –minden web lap letöltésnél, –levél közvetítésnél.
Nyílt rendszerek összekapcsolása
Miért érdemes egy cégvezetőnek regisztrálni a …………… közösségi oldalra? Hogyan használjuk ki hatékonyan a jelenlétet a világ legnagyobb szakmai hálózatán?
Készítette: Kokrák Mihály Konzulens: Smid László
Keresés fajtái Matching (szabadszavas)
Automatikus fizikai tervezési javaslatok XML adatbázisokhoz Balogh Bernadett Kresz Marcell Cseh Tamás.
Adatbázisszintű adatmodellek
Google Scholar Wolfram Alpha Scirus Készítette: Varga Ádám.
Hálózatok és hatlépésnyi távolság
VARGA RÓBERT ONLINE MARKETING SZAKÉRTŐ MARKETINGOKOSAN.HU BUDAPEST, JÚNIUS 9. Generációs hidak építése az online világban.
1 / 28 High Speed Networks Laboratory Összefoglalás és gyakorlás.
FELHASZNÁLÓI TRÉNINGEK Bevezetés a könyvtári katalógusok használatába.
17 ISMERTESSE AZ INTERNETES KERESÉSI MÓDSZEREKET! KONKRÉT GYAKORLATI PÉLDA KERESÉSRE.(KERESÉS, TALÁLATI LISTA ÉRTELMEZÉSE, TALÁLT OLDAL MENTÉSE.) Készítette:
Mi a keresőmarketing? A feladat: az internetes keresők által a számunkra legrelevánsabb látogatókat az oldalunkra juttatni a leg- költséghatékonyabban.
Fájlcsere: Technikai megoldások
Információ és kommunikáció
Kapcsolati hálók és internetes közösségi rendszerek
PRIMUS INTER PARES (pipa)
Nem módosítható keresések
Hálózatok.
Hálózati struktúrák, jogosultságok
Internet és kommunikáció
Navigáció az Interneten:
GEGES JÓZSEF Ph.D. OVIDIUS Info-Service Co Ltd.
OVIDIUS Info-Service Co Ltd.
Toborzás forrásának azonosítása, tervezése (sourcing)
Az internet minőségi információ halmazainak feltárásáról
Networkshop 2019 Győr, április 26.
A világ sarkából is elérhető könyvtár, a könyvtár sarkából is elérhető világ Winkler Bea.
AVON CAREER SITE FELÉPÍTÉSE
Előadás másolata:

1/40 High Speed Networks Laboratory Önszerveződő adatbázisok

2/40 Önszerveződő adatbázisok Hosszu Éva 1. Paradigmaváltás az adatbázisokban Megtervezett adatbázis → Evolúció alkotta adatbázis 2. Önszerveződő adatbázis: struktúra, lekérdezés 3. Struktúra: a hálózatot meghatározó jellemzők Méret, átmérő Kisvilág tulajdonság Skálafüggetlen hálózatok Preferenciális kapcsolódás 4. Lekérdezés Lekérdezés önszerveződő adatbázisokban Internetes keresőmotorok működésének alapjai Önszerveződő adatbázisok

3/40 Önszerveződő adatbázisok Hosszu Éva Mennyi zenét tárolsz a számítógépeden? Régen: rengeteg zene a számítógépen Hatalmas adatbázisban Viszonylag struktúrálva Most: Kevés zene a gépen, csak amire azonnal szükség van Túlnyomó részben: YouTube, Spotify, Tidal, Google, … Egy struktúrálatlan halmazból keressük ki Paradigmaváltás az adatbázisokban

4/40 Önszerveződő adatbázisok Hosszu Éva Eddig Relációs adatbázis Elosztott adatbázis Lekérdezés: erősen megnövelte a kommunikációs költségek részarányát az adatbázis-kezelés költségein belül Ötlet: próbáljuk meg az adatokat a felhasználás közelében elhelyezni. Osztott adatbázisok. Az osztott adatbázis egy fizikailag megosztott, de logikailag egységes adatbázis. Paradigmaváltás az adatbázisokban

5/40 Önszerveződő adatbázisok Hosszu Éva Megtervezett adatbázis → evolúció alkotta adatbázis Elosztott adatbázisok: A kommunikációs költségek csökkenése. Mindenki a számára ismerős adatokat gondozza. Egy-egy csomópont kiesése esetén a többi adatai továbbra is elérhetőek. Lehetséges a moduláris tervezés, a rugalmas konfigurálás. Rugalmasabb adatstruktúra kell Önszerveződő adatbázisok: A kapcsolódást nem egy központi egység határozza meg A csomópontok saját maguk döntik el, hova kapcsolódnak Amerre mozdul a világ:

6/40 Önszerveződő adatbázisok Hosszu Éva 1. Paradigmaváltás az adatbázisokban Megtervezett adatbázis → Evolúció alkotta adatbázis 2. Önszerveződő adatbázis: struktúra, lekérdezés 3. Struktúra: a hálózatot meghatározó jellemzők Méret, átmérő Kisvilág tulajdonság Skálafüggetlen hálózatok Preferenciális kapcsolódás 4. Lekérdezés Lekérdezés önszerveződő adatbázisokban Internetes keresőmotorok működésének alapjai Önszerveződő adatbázisok

7/40 Önszerveződő adatbázisok Hosszu Éva A szó tág értelmében Önszerveződő adatbázis = (struktúra,lekérdezés) Az adatbázis önszerevződő jellege meghatározza a kialakuló topológiát A topológia meghatározza, milyen a hatékony keresés Önszerveződő adatbázis példák: Internet Blogok Google Fordító Szocális hálózat P2P hálózat Mit az önszerveződő adatbázis?

8/40 Önszerveződő adatbázisok Hosszu Éva Általános értelemben: Nagy bonyolult hálózatok Hálózat komplexitása Sok csomópont Sok kapcsolat Heterogén csomópont típusok és kapcsolattípusok Tisztán kivehető tendencia: kommunikációs hálózatok egyre bonyolultabbakká válnak Az Internet fejlődési trendek Felhasználók számának drámai növekedése Kicsi mobil eszközök Szerteágazó szabványok, sok gyártó  Heterogén eszközök Virtuális hálózatok fizikai hálózakon – VPNs, virtual ISPs Milyen struktúra lakozik a komplexitás mögött? Önszerveződő hálózat: Az Internet

9/40 Önszerveződő adatbázisok Hosszu Éva A hálózatok dinamikusak Még jó, annyira gyorsan változnak az igények Jelenleg nincs lehetőség a dinamizmus vizsgálatára nagy léptékben Legtöbb adatbázis csak a pillanatnyi állapotot tárolja Ezért egy-egy elemzés csak egy pillanatfelvétel Előfordulnak statisztikai hibák Néha később módosított eredmények Pillanatfelvételek

10/40 Önszerveződő adatbázisok Hosszu Éva 1. Paradigmaváltás az adatbázisokban Megtervezett adatbázis → Evolúció alkotta adatbázis 2. Önszerveződő adatbázis : struktúra, lekérdezés 3. Struktúra: a hálózatot meghatározó jellemzők Méret, átmérő Kisvilág tulajdonság Skálafüggetlen hálózatok Preferenciális kapcsolódás 4. Lekérdezés Lekérdezés önszerveződő adatbázisokban Internetes keresőmotorok működésének alapjai Önszerveződő adatbázisok

11/40 Önszerveződő adatbázisok Hosszu Éva 1. Hálózat méret: Csomópontok száma Ezres, milliós, esetleg milliárdos méretek esetén lehet statisztikai adatokkal jól jellemezni egy hálózatot 2. Klaszterezettség: “ C soportosul ás ” mértéke A szomszéd node-jaim kapcsolódnak-e egymáshoz? Ha 1 akkor mindig, ha 0 akkor soha! 3. Átmérő: Kis átmérő, rövid utak, “kisvilág ” jelleg Egy rácsban igen nagy átmérők lehetnek, míg pl. a teljes gráf átmérője Hasonlósági paraméter (γ): Mennyire hasonló a szerepük? (s kálafüggetlen szerkezet ) Ha a szám magas, akkor az egyének nagyon hasonlítanak, ha alacsony akkor (~ 2) akkor erősen eltérő szerepek vannak 5. Fokszámeloszlás: a csúcsok mekkora hányadának k a fokszáma? Egyenletes? Binomiális? Valami más? Számunkra jelenleg lényeges paraméterek

12/40 Önszerveződő adatbázisok Hosszu Éva Mekkora egy önszerveződő adatbázis? Csomópontok száma: néhány tíz – milliárdok Mekkora az adatbázis átmérője? 1929: Karinthy Frigyes – Láncszemek Hat lépés távolság 1967: Milgram—kísérlet (a másik) Levélküldés nagy távolságra (szociológiai, földrajzi), véletlenszerűen választott emberek Információk a célszemélyről Személyes ismeretség esetén azonnal a célhoz Egyébként olyanhoz aki valószínűleg személyesen ismeri+levél a Harvardra Méret és átmérő

13/40 Önszerveződő adatbázisok Hosszu Éva Néha 1-2 lépés elég volt néha kilenc kellett 296 levélből 232 nem ért célba A maradékból az átlagos távolság 5.5-nek adódott (ellentmondott a tapasztalatokkal, és várakozásokkal) Az utolsó személy igen sokszor ugyanaz Legtöbbször gyorsan földrajzi közelbe értek, ahol köröztek, amíg rést nem találtak a célszemély belső köreibe Problémák Kevés célbeérkező levél Emiatt hosszabb láncok kevésbé vannak jelen (alábecslés) Többször ismételték 2002-ben verzió 2008, Microsoft.NET Messenger Service: 6.6 Hatlépésnyi távolság Milgram kísérlete (további részletek)

14/40 Önszerveződő adatbázisok Hosszu Éva Példa: Rubik-kocka állapotai Átmérő

15/40 Önszerveződő adatbázisok Hosszu Éva Átmérő

16/40 Önszerveződő adatbázisok Hosszu Éva Ugander, Karrer, Backstrom, Marlow arXiv: v1 [cs.SI] májusi állapot elemzése Aktív felhasználók: 1. Bejelentkezett a vizsgálatot megelőző 28 napban 2. Van legalább 1 ismerőse 721 millió aktív felhasználó (a Föld lakossága akkor 6.9 milliárd) 68.7 milliárd kapcsolat átlagosan 190 ismerős The Anatomy of the Facebook Social Graph

17/40 Önszerveződő adatbázisok Hosszu Éva 4.7 lépés távolság USÁ-n belül: 4.3 Független tanulmány: átmérő ~40 Az átmérő önmagában megtévesztő Felhasználók közti átlagos távolság

18/40 Önszerveződő adatbázisok Hosszu Éva A weboldalak jellemzően szoktak egymásra mutatni Minél több közös oldalra mutatnak, annál nagyobb valószínűséggel egymásra is Melyik tűnik hihetőbbnek mint weboldalak hálózata? Miért? Csoportosulás mértéke

19/40 Önszerveződő adatbázisok Hosszu Éva Klaszterezettségi együttható

20/40 Önszerveződő adatbázisok Hosszu Éva Egy adatbázisban

21/40 Önszerveződő adatbázisok Hosszu Éva Kisvilág-tulajdonság

22/40 Önszerveződő adatbázisok Hosszu Éva Fokszámeloszlás

23/40 Önszerveződő adatbázisok Hosszu Éva Fokszámeloszlás

24/40 Önszerveződő adatbázisok Hosszu Éva A fokszámeloszlás hatványfüggvényt követ Skálafüggetlenség

25/40 Önszerveződő adatbázisok Hosszu Éva 1. A hálózatra rázoomolva önhasonló szerkezet Pont így van a természetben is 2. Nem heterogén szerepű csomópontok Néhány központ, sok kis node Skálafüggetlenség szemléletesen

26/40 Önszerveződő adatbázisok Hosszu Éva Valós hálózatok

27/40 Önszerveződő adatbázisok Hosszu Éva Egy már meglévő adatbázis melyik pontjához fogunk kapcsolódni? P2P hálózatban melyik fájlt töltöd le? Egy nemzetségen belül melyik fajok szaporodnak el? Minél népszerűbb Népszerűség ~ minél több kapcsolata van eddig Hogyan kapcsolódnak új pontok az adatbázishoz?

28/40 Önszerveződő adatbázisok Hosszu Éva Preferenciális kapcsolódás

29/40 Önszerveződő adatbázisok Hosszu Éva Speciális értelemben 1. Nem véletlenszerű kapcsolatok, “csoportosuló” 2. Kis átmérő, rövid utak, kisvilág 3. Skálafüggetlen szerkezet: erősen változó szerepek a hálózatban Szűkebb értelemben vett önszerveződő hálózatok

30/40 Önszerveződő adatbázisok Hosszu Éva 1. Paradigmaváltás az adatbázisokban Megtervezett adatbázis → Evolúció alkotta adatbázis 2. Önszerveződő adatbázis : struktúra, lekérdezés 3. Struktúra: a hálózatot meghatározó jellemzők Méret, átmérő Kisvilág tulajdonság Skálafüggetlen hálózatok Preferenciális kapcsolódás 4. Lekérdezés Lekérdezés önszerveződő adatbázisokban Internetes keresőmotorok működésének alapjai Önszerveződő adatbázisok

31/40 Önszerveződő adatbázisok Hosszu Éva Hogyan működnek a keresőmotorok?

32/40 Önszerveződő adatbázisok Hosszu Éva A keresőmotorok két fő funciója 1. Crawling és az oldalak térképének felépítése 2. Válasz a lekérdezésre 1. Crawling & Indexing A weben levő dokumentumok, fájlok, oldalak bejárása és indexelése Indexelés ~ tárgymutató egy könyv végén 2. Válaszadás a felhasználói lekérdezésre Releváns oldalak listája Sorrend Internetes keresőmotorok

33/40 Önszerveződő adatbázisok Hosszu Éva 1. Megmondjuk, hogy létezik Home page URL-je search.yahoo.com/info/submit.html search.live.com/docs/submit.aspx XML oldaltérkép 2. Ha egy másik oldal mutat rá: keresőrobotok beindexelik Struktúra miatt működik A kapcsolatok mentén a keresőmotor bejárja = crawling Ha találnak egy új oldalt: részleteket tárolnak Honnan tud a keresőmotor egy oldalról?

34/40 Önszerveződő adatbázisok Hosszu Éva Egy Google keresés

35/40 Önszerveződő adatbázisok Hosszu Éva A keresőmotor egy válaszadó gép Háromféle keresés: "Do" Tranzakciós keresés – valami végrehajtása: repülőjegy vásárlás, zenehallgatás "Know" Információs keresés – egy zenekar neve, a város legjobb étterme "Go" Navigációs keresés – Kifejezetten egy weblap keresése: menj a Facebook-ra, az NFL homepage-re Csak az a válasz érdekel, ami relevéns Hasznosság remélt sorrendjében A relevancia több, mint hogy “tartalmazza a jó szavakat” A keresőmotorok első napjaiban ennyi volt Nem is működött jól AltaVista → Google Adjunk választ!

36/40 Önszerveződő adatbázisok Hosszu Éva Egy weboldal láthatóságának befolyásolása egy keresőmotor találati listájában Nem a keresőmotorok kijátszása Jó felhasználói élmény Az oldal szándékainak közvetítése, hogy a releváns kereséseknél ajánlhassák robots.txt: amit a keresőrobotok ne járjanak be Bejelentkezés után látható oldalak Személyes információt tartalmazó oldalak: vásárlás Oldalon belüli keresési eredmények Korai algoritmusok: Szerepelnek-e a megadott szavak Kulcsszó-sűrűség Keyword meta-tag Könnyű volt kijátszani Search Engine Optimization

37/40 Önszerveződő adatbázisok Hosszu Éva A legtöbb keresőmotornál: fontosság = népszerűség Minél népszerűbb egy oldal, annál fontosabb kell legyen az infó, ami rajta van Algoritmusokkal szűrik és rangsorolják az oldalakat relevancia és népszerűség alapján Ranking faktorok Tartalom: Az oldal szövege, címek, ismertetők. Teljesitmény: Milyen gyors? Jól működik? Megbizhatóság: Elég jó a tartalom ahhoz, hogy más oldalak ide mutassanak? Más oldalak megjelölik referenciaként? Felhasználói élmény: Hogy néz ki? Könnyű eligazodni? Magas a bounce rate? Mennyire fontos egy oldal?

38/40 Önszerveződő adatbázisok Hosszu Éva SEO Success Factors

39/40 Önszerveződő adatbázisok Hosszu Éva Oda-vissza ható folyamat Algoritmus → helyezést javító trükkök → új algoritmus → új trükkök → … Hogy pontosan hogy működik, azt a tapsztalat alapján sejteni lehet On-the-page SEO  Ami az oldal szerzőjének befolyása alá tartozik Tartalom HTML Felépítés Off-the-page SEO  Az olvasókon, látogatókon és a többi oldal szerzőjén múlik Linkek Megbízhatóság Közösségi média Személyes paraméterek Search Engine Optimization

40/40 Önszerveződő adatbázisok Hosszu Éva White Hat technikák A felhasználónak szóljon az oldal, ne a keresőnek A weboldal struktúráját tagolttá kell tenni, megfelelő header használattal. A taget megfelelően kell kitölteni. Az oldalon elhelyezett szövegeket is érdemes optimalizálni. Helyezzünk el olyan linkeket, amik egyéb aloldalakra mutatnak. Hosszú távú eredmény Black Hat technikák Hogyan tévesszük meg a keresőt Láthatatlan tartalom Más oldal megjelenítése, ha a kereső kéri = cloaking Gyors eredmény, de: ha a kereső rájön: büntetés Search Engine Optimization