4-7. Előadás Véletlen gráfok, hálózatmodellek

Slides:



Advertisements
Hasonló előadás
Események formális leírása, műveletek
Advertisements

Készítette: Kosztyán Zsolt Tibor
KÉSZÍTETTE: Takács Sándor
Valószínűségszámítás
A TCP/IP hivatkozási modell
Tanárok kis világa Lehetőségek a tanári hálózatok kutatásában.
Nemlineáris és komplex rendszerek viselkedése
Hálózatok a fizikában és a fizika oktatásában
FRAKTÁLOK.
Kultúra mint kapcsolat Birher Nándor. „A tudás a világ alkotóelemeiről szerzett ismeret, a bölcsesség az elemek kapcsolódásának ismerete.” -szemléletmódváltozás-
Készítette: Tóth Enikő 11.A
Hálózatba kapcsolt adatbázisok – Hálózatelmélet I.
Előadó: Szabó Márton (iwiw) Katalógus → házi feladatnak beszámít
Címkézett hálózatok modellezése
MI 2003/ Alakfelismerés - még egy megközelítés: még kevesebbet tudunk. Csak a mintánk adott, de címkék nélkül. Csoportosítás (klaszterezés, clustering).
FRAKTÁLOK.
Hálózati Biológia A sejt funkcionális működésének megértése.
ELTE Matematikai Intézet
Véletlen logikai hálózatok. Bevezető Logikai változó: Bináris változó. Két lehetséges értéke van: 0 és 1, néha ±1 {σ 1, σ 2,..., σ N }, σ i : {0,1}, i.
Számítógép-hálózat • Önálló számítógépek összekapcsolt rendszere
A KOZMIKUS SZÖVEDÉK TULAJDONSÁGAI:
Dr. Szalka Éva, Ph.D.1 Statisztika II. IX.. Dr. Szalka Éva, Ph.D.2 Idősorok elemzése.
Hierarchikus klaszteranalízis
Evolúciósan stabil stratégiák előadás
Iskolahálózatok itthon és külföldön Pénziránytű műhelymunka MNB, november 10.
Valószínűségszámítás
Készítette: Kosztyán Zsolt Tibor
Az Alakfelismerés és gépi tanulás ELEMEI
Dinamikai rendszerek kaotikus viselkedése
ma már nem a vizsgált téma, hanem a használt módszerek teszik a fizikát dominál az átlagos viselkedés!!! alkalmazhatjuk a statisztikus fizika módszereit.
HÁLÓZATI TANULÁS Megújuló pedagógia: hálózati együttműködés Észak-Magyarországon TÁMOP nyitókonferencia EGER, szeptember 3.
Hálózati réteg.
Pénzügyi-gazdasági ismereteket oktató iskolák hálózatának kialakítása.
A Jövő Internet, ahogy mi látjuk: demo és poszter előzetes Sonkoly Balázs (BME-TMIT)
Idősor elemzés Idősor : időben ekvidisztáns elemekből álló sorozat
Gazdaságstatisztika 11. előadás.
Makai M.: Transzport51 A koordinátázás kérdése Ha a világban meg kell adni egy helyet: fizikai koordináták (x,y,z) (origó és egység) postai címzés pl.
Alapfogalmak.
Folytonos eloszlások.
Binomiális eloszlás.
Hálózatok modellezése. Hálózatok Many complex systems in nature and society can be successfully represented in terms of networks capturing the intricate.
Euler gráf Euler, 1736 Königsbergi hidak
Társadalmi hálózatok és modelljeik…
Társadalmi hálózatok és modelljeik…
Gráfok 1. Szlávi Péter ELTE IK Média- és Oktatásinformatika Tanszék
Hálózatok szerkezete és dinamikája
Rétegmodellek 1 Rendelje az alábbi hálózati fogalmakat a TCP/IP modell négy rétegéhez és a hibrid modell öt rétegéhez! Röviden indokolja döntését. ,
Valószínűségszámítás III.
2000. febr. 7. vezető webszolgáltatók (pl. Yahoo) működését megbénította egy hackercsoport. Az FBI szerint egy kanadai tini hetvenkedése volt csupán (MafiaBoy.
GRÁFOK Definíció: Gráfnak nevezzük véges vagy megszámlálhatóan végtelen sok pont és azokat összekötő szintén véges vagy megszámlálhatóan végtelen sok.
Valószínűségszámítás II.
Fraktálok. Motiváció Three-Dimensional Mapping of Dislocation Avalanches: Clustering and Space/Time Coupling Jérôme Weiss and David Marsan Science 3 January.
Nagyon nagy gráfok Lovász László Microsoft Research
Hálózatok: új nyelv a tudományban Lovász László Eötvös Loránd Tudományegyetem
GRÁFOK Marczis Ádám és Tábori Ármin. Kőnig Dénes ( ) Magyar matematikus Az első tudományos színvonalú gráfelmélet könyv írója.
1 / 28 High Speed Networks Laboratory Összefoglalás és gyakorlás.
1/40 High Speed Networks Laboratory Önszerveződő adatbázisok.
TANULNI AZ INTERNETET - TANULNI AZ INTERNETEN Sulyok Tamás.
Kontinuum modellek 1.  Bevezetés a kontinuum modellekbe  Numerikus számolás alapjai.
High Speed Networks Laboratory Hálózatok dinamikája 2 Gulyás András, Heszberger Zalán.
Logika szeminárium Barwise-Etchemendy: Language, Proof and Logic
Kapcsolati hálók és internetes közösségi rendszerek
Kapcsolati hálók és internetes közösségi rendszerek
Atomi mondatok Nevek Predikátum
PRIMUS INTER PARES (pipa)
Kockázat és megbízhatóság
Készült a HEFOP P /1.0 projekt keretében
Valószínűségi változó, eloszlásfüggvény
Hálózatok Robusztussága
Előadás másolata:

4-7. Előadás Véletlen gráfok, hálózatmodellek Kapcsolati hálók és Internetes közösségi rendszerek Gulyás András, Heszberger Zalán

Kronológia 1980 1990 2000 2010 1960 1970 Milgram kísérlet Klasszikus véletlen gráfok Erdős Pál és Rényi Alfréd 1959 Kisvilág modell Watts and Strogatz 1998 Általánosított véletlen gráf Newman, Watts and Strogatz 2001 Modellek fejlesztése 2001-2007 Skálafüggetlen modell Barabási and ALbert 1999 1980 1990 2000 2010 Königsberg 7 hídja Leonhard Euler 1736 1960 1970 Milgram kísérlet Stanley Milgram 1967 Arpanet 1969 Alkalmazások fejlesztése Electronic datasets

Klasszikus véletlen gráfok Erdős Pál és Rényi Alfréd 1959 Nagy komplex hálók jól közelíthetőek véletlen gráfokkal Hálózatok tudománya kialakul Valószínűségi eljárások a gráfelméletben Később számos általánosítás Minden gráf, aminek a fejlődési szabályaiban szerepet játszik a véletlen nevezhető véletlennek, de most speciálisan a klasszikus, legegyszerűbb véletlen-gráf modellről lesz szó. Véletlen gráfok  címkézett gráfok Néhány gráfelméleti fogalom jelentése módosul pl. isomorphia

Véletleg gráfok definíciója G(N,p) véletlen tér (S{Ω,2^Ω,P(2^Ω)R}) /itt most diszkrét/ N: csomópontok száma p: élvalószínűség 2. Definíció Olyan gráf, melyben a csomópontok közötti élek azonos p valószínűséggel vannak behúzva: élek szám p-től függő véletlen változó 2 4 1 3

Véletlen gráfok tulajdonságai Összes lehetséges élek száma: N(N-1)/2 Összes lehetséges gráfok száma: 2^[C(2,N)] (binomiális együttható: 2 kombinációja N elemnek), ahol n az élek száma vagy másképp írva: 2^[N(N-1)] Összes lehetséges n élet tartalmazó gráfok száma: C(n,N(N-1)/2) Ha p valószínűséggel jön létre él akkor az élek számának várható értéke a gráfban: E[élek száma]= p N(N-1)/2 p1 esetén E[élek száma]=N(N-1)/2 Egy konkrét gráfnak a valószínűsége: A véletlen gráfok elmélete N∞ esetén vizsgálja a lehetséges gráfok tulajdonságait Egy Q tulajdonság szinte mindig teljesül ha N∞ esetén P(Q)1

Véletlen gráf példa N=10-re

Klasszikus véletlen gráfok kritikus jelenségei Számos fontos Q tulajdonság igen gyorsan mejelenik p változtatásával Tehát egy N méretű gráfhoz található pc(N) kritikus valószínűség, ami alatt Q nem jelenik meg felette pedig igen. Fizikában perkoláció elmélet: egy csomópont éleinek száma korlátozott, ebben a rendszerben vizsgálja a pc –t rögzített N esetén Ha ez nincs akkor “természetes” Q tulajdonságok esetén: pc(N∞)0

Algráfok megjelenése G1 algráfja G-nek, ha csomópontjai és élei részhalmazai G-nek (címkézett gráfok!). k csomópontú fa algráfnak mindig k-1 éle van: az átlagos fokszáma 2(k-1)/k k körnek mindig k éle van: az átlagos fokszám 2 teljes k algráfoknak 2k(k-1)/2k=k-1 átlagos fokszáma van Általános esetben egy algráfnak k csomópontja és l éle lehet Mi a valószínűsége, hogy egy véletlen gráf adott paraméterekkel tartalmaz egy ilyen algráfot? Nézzük meg hány lehetőség van egyáltalán és ezeknek mennyi a valószínűsége, ebből megkaphatjuk tipikusan mennyi várható: ahol a a különböző sorrendben többször számolt ugyanazon algráfok száma

Algráfok megjelenése 2 Ebből látszik ha Nkpl(N) 0 akkor a várható érték is tart a 0-ba. Ha P(N)=cNk/l akkor a várható érték λ=cl/a, tehát c értékével tart a végtelenbe, de tetszőlegesen beállítható Bollobás 1995-ben meghatározta az algráfok számának pontos eloszlását is: Egyetlen F gráf megjelenése tehát:

Gráf evolúciója N=100 esetén: z -∞ -2 -3/2 -4/3 -5/4 -1 -2/3 -1/2 p p 0.0001 0.001 0.0021 0.00398 0.01 0.0464 0.1 1

Az óriás komponens megjelenése: fázisátmenet

Összefüggőség A gráf átlagos fokszáma <k>=2n/N=p(N-1)~pN Amikor p<<1/N a különböző komponenesek fák <k>~1 esetén a legnagyobb klaszter mérete N2/3 , az előző példa esetén: 21,54 <k> >> 1 estén a legnagyobb klaszter mérete [1-f(<k>)]N az f(<k>) exponenciális sebességel 0 lesz... p=1/N-nél tehát megjelenik az óriás komponens p=ln(N)/N –nél a gráf összefüggővé válik

Fokszámeloszlás Egy ki csomópont fokszámának eloszlása binomiális hiszen N-1 független másik ponthoz csatlakozhat p valószínűséggel: A gráf fokszámeloszlása Xk azt mondja meg hányad része a csomópontoknak k fokszámú. Hát azt most már látjuk, hogy ahol De vajon mi a pontos eloszlás? Bollobás 1995:

Fokszámeloszlás példa: N=10000, p=0.0015

Összefüggőség és átmérő Ha l az átmérője a véletlen gráfnak és tudjuk hogy tipikusan <k> a fokszáma akkor l lépés után érintjük az összes <k>l =N csomópontot. Így tehát l=Log<k> N=LogN/Log<k> Ha <k>=pN<1 esetén kis komponensek d a legnagyobb komponens átmérője, bár azok tipikusan egyméretűek Ha <k> > 1 akkor van óriás komponens és annak az átmérőjét mérjük < k> >3.5 felett jellemzően arányosnak mondhatjuk Log(N)/Log(<k>)-val. Ha <k> >= Log(N) az átmérő már elég pontosan Log(N)/Log(<k>) Átlagos távolság:

Átmérő valós és klasszikus véletlen hálózatokban

Klaszterezési együttható véletlen gráfokban és a valóság Mivel minden kapcsolódás függetlenül a többitől p valószínűséggel következik be így a barátaim barátok-e p valószínűséggel igaz:

Áttekintés

Perkoláció elmélet Valós rendszerekben: véges dimenzió Szomszédok száma helytől függően csak kevés lehet Kétdimenziós rácson (25x25), ha p valószínűséggel húzunk be élet:

Perkoláció elmélet kérdései Mekkora valószínűséggel tartozik egy csomópont az óriás klaszterhez? Mekkora az átlagos klaszterméret? Milyen a klaszterek méretének eloszlása? Az elmélet olyan dolgokra válaszol, amelyekre a véletlen gráfok elmélete általában nem tud egyszerűen. Az eredmények dimenzió  végtelen esetén alkalmazhatóak a véletlen gráfoknál is

Hat lépés távolság a társadalomban és máshol Karithy (1929) – Minden másképpen van: Láncszemek Milgram (1969) – Kísérlet (a másik) ...

A gyenge kapcsolatok ereje Mark Granovetter: Álláskeresés  A társadalom szerkezete Magas klaszterezettség  Nem random Távoli kapcsolatok! Különben az átmérő nem lesz kicsi.

Watts and Strogatz

Gyenge kapcsolatok általános modell Két rész: Körvonalon elosztva csomópontok, mindenkinek k távolságig minden szomszéddal kapcsolat: rövidtávú kapcsolat – klaszterezettség Véletlenszerű távoli kapcsolatok: kis átmérő

Véletlen kapcsolatok aránya A véletlen kapcsoltok növelésével lassan visszakapjuk az Erdős féle véletlen gráfokat

Kisvilág modell – Watts an Strogatz

Kisvilág modell paraméterei Klaszterezettség: két távolságban levő szomszédok esetén (előző fólia esete): C=3/6 Ha K legközelebbi szomszéddal van kapcsolatban akkor: K  végtelenben a C  0.75

Watts-Strogatz modell – általános észrevétel Minden csomópont K/2 szomszéddal mindkét oldalról, mondjuk: N>>K>>ln(N)>>1 Húzzunk újra p valószínűséggel néhány élet: pN K/2 él

Kisvilág működési tartomány Tehát a klaszterezettség széles skálán dacol a p újrahuzalozási valószínűséggel Az átlagos úthossz igen gyorsan lecsökken a “shortcutok” megjelenésével

Kisvilág fokszámeloszlás Ugyanakkor a kisvilág egy széles tartományb an továbbra is csúcsos jellegű Poisson eloszláshoz hasonló fokszámeloszlású

Vannak nem véletlen, szabályos kisvilágok? Lehetséges állapotok száma: 43,252,003,274,489,856,000 (2x2-esnek “csak” kb. 3 millió) Bizonyíthatóan favágó módszerrel 26 lépésből kirakható (átmérő), de sejtik, hogy 20 is elég sőt az un. színcsoportosítás módszere 16-ot jósol... 5x5 kocka esetén a lehetőségek száma 2.83x1073 (az atomok száma a világon 1078 ! az egész világ kisvilág ) . A szükséges forgatások száma 60 körül lehet...

Valós hálózati észrevételek

Skálafüggetlen hálózatok fokszámeloszlása A fokszámeloszlás power-law: Hub-ok, nagy fokszámú csomópontok vannak a rendszerben (az eloszlás farokrésze) A csomópontok többsége kis fokszámú

Skálafüggetlen hálózatok fokszámeloszlása

Áttekintés

Általánosított véletlen gráfok A fokszámeloszlás nem feltétlen poisson! A gráf konstrukció: Vegyünk izolált csomópontokat Húzzunk ‘tüskéket’ belőlük egy szabadon választott eloszlás szerint Kössük össze véletlenszerűen a tüskéket egymással Ha irányíthatjuk az eloszlást közelebb kerülhetünk valós hálózatok tulajdonságaihoz Skálafüggetlen eloszlásnál az útvonalhossz néhol jól közelíti a valós hálózatokat:

Barabási-Albert modell

Skálafüggetlen hálók kialakulása Barabási-Albert modell Két fontos lépés: Növekedés – minden lépésben egy új csomópontot adunk hozzá a rendszerhez Preferenciált kapcsolódás – az újonnan megjelenő csomópont annál nagyobb valószínűséggel kapcsolódik egy már meglévőhöz, minél népszerűbb

Oké, de be lehet-e látni, hogy tényleg ez van? Hivatkozások Internet Kollaborációs hálózatok

Útvonalhossz skálafüggetlen és véletlen gráf esetén A különbség kisebb tendenciális, általánosított véletlen gráf esetén csak addicionális (logaritmikus skálán – végül tehát multiplikatív)

Klaszterezési együttható skálafüggetlen hálózatban Klaszterezés a véletlen hálóval összehasonlítva hasonlóan (talán picit jobban) viselkedik:

Skálafüggetlen hálók gyártása Folyamatos növekedés Preferenciális kapcsódás Mi van ha valamelyik hiányzik? Csak növekedés: expnenciális fokszám csökkenés (új node – m új él) N állandó de prefrenciális kapcsolódás van: Gauss-i lesz és végül teljes gráf

Áttekintés

Hollywoodi színészek hálózata (Barabási 1999) Csomópontok: színészek Kapcsolatok: közös filmek Forrás: IMDB Cél: szinésztársadalom összetartásajobb filmek N <k> <l> C 225.226 61 3.65 0.79 A gazdag még gazdagabb lesz jelenség

Internet topológia (domain szinten) (Faloutsos 1999) Csomópontok: autonóm rendszerek, routing szinten egységesen kezelt IP prefixek, melyet egy vagy több operátor üzemeltet Kapcsolatok: összeköttetések Cél: IP csomagok szállítása Adatbázis: NLANR (National Laboratory for Applied Network Research www.nlanr.net 1997 óta Átlagos fokszám növekszik Növekszik a verseny

Internet domain szinten Dinamizmus Gazdag még gazdagabb

World wide web (Barabási 1999) Csomópontok: weboldalak Kapcsolatok: linkek Irányított gráf Adatbázis nd.edu körzet Többszöri mérések az időszakban Nemlineáris növekedés N <k> <l> C 325.729 7.85 11.2 0.29 N E 1999 május 203 millió 1466 millió 1999 október 271 millió 2130 millió

WWW Többféle illesztés van

Anyagcsere hálózat

Áttekintés

Összefoglalás I. Klasszikus véletlen gráf (E-R modell) egyszerű definíció egyszerű analizálhatóság Watts-Strogatz modell a kisvilág tulajdonság és a klaszterezettség összegyúrása lehető legegyszerűbben (korábbi alfa modell) Barabási-Albert B-A modell skálafüggetlen fokszámeloszlás és annak egy lehetséges magyarázata E-R modell W-S modell B-A modell Kisvilágság Klaszterezettség Fokszámeloszlás

Modell ami egyszerre skálafüggetlen, klaszterezett és kisvilág? A kisvilágság nem “nagy szám”  Klaszterezettség: Watts-Strogatz Skálafüggetlenség: Barabási-Albert Klaszterezettség+Skálafüggetlenség = nincs még rá jó modell (lehet?) Modularitás Több feladat megoldása egyszerre Biológia, gazdaság, informatika elosztott rendszerek Granovetter, W-S modell Közösségi portálok, nagyvállalatok outsourcing, számítógép, komplexitás Aggregálás, Barkochba és Flat routing

Tulajdonságok Determinisztikus. Kisvilág A fokszám-eloszlás skálafüggetlen. A klaszterezettség: Magas Fokszám-függő Nem függ a rendszer méretétől!! De túl szabályszerű Hasonló valós hálózatok: Filmszínészek Angol szinonimák WWW Internet domain-ek Eltérő valós hálózatok: Internet a router-ek szintjén Villamos hálózat Központok szerepe, dinamika, vezetők kialakulása

Fraktálok Koch görbe Mandelbrot halmaz

Ravasz-Barabási hierarchikus modell

Modularitás Kis modulok sok belső kapcsolattal Összekötők mint információs hidak a modulok között A híd viszont elősegítheti közvetlen kapcsolat kialakulását amennyiben intenzív kommunikáció kell Nagyvállalati struktúra Modularitás előnyei céhek-manufaktúra egymástól független fejlődés, evolúció, genetikai mutáció adaptivitás méretgazdaságosság  választékgazdaságosság Otthoni gyártás

Egyéb modellek Egyéb modellek (itt aztán van minden) Nemlineáris népszerűségi kapcsolódás Fitnesz modellek (Bose-Einstein) Hogy mérjük? Öregedés, költség Születés Stb.

Klasszikus véletlen gráfok Összefoglalás II. – Analitikus leírhatóság (A képleteket nem kell megtanulni ) Klasszikus véletlen gráfok nincsenek korrelációk a sztochasztikus jellemzők egyszerűen számolhatók Sajnos ok okozat a világban  W-S modell B-A modell

Szűkebb értelemben vett komplex hálózatok Speciális értelemben Nem véletlenszerű kapcsolatok, “csoportosuló” Kis átmérő, rövid utak, kisvilág Skálafüggetlen szerkezet: preferencia alapú kapcsolódás, gazdag még gazdagabb

Felhasznált irodalom Statistical mechanics of complex networks Albert Réka, Barabási Albert-László The structure and function of complex networks Honlapról letölthető!