4-7. Előadás Véletlen gráfok, hálózatmodellek Kapcsolati hálók és Internetes közösségi rendszerek Gulyás András, Heszberger Zalán
Kronológia 1980 1990 2000 2010 1960 1970 Milgram kísérlet Klasszikus véletlen gráfok Erdős Pál és Rényi Alfréd 1959 Kisvilág modell Watts and Strogatz 1998 Általánosított véletlen gráf Newman, Watts and Strogatz 2001 Modellek fejlesztése 2001-2007 Skálafüggetlen modell Barabási and ALbert 1999 1980 1990 2000 2010 Königsberg 7 hídja Leonhard Euler 1736 1960 1970 Milgram kísérlet Stanley Milgram 1967 Arpanet 1969 Alkalmazások fejlesztése Electronic datasets
Klasszikus véletlen gráfok Erdős Pál és Rényi Alfréd 1959 Nagy komplex hálók jól közelíthetőek véletlen gráfokkal Hálózatok tudománya kialakul Valószínűségi eljárások a gráfelméletben Később számos általánosítás Minden gráf, aminek a fejlődési szabályaiban szerepet játszik a véletlen nevezhető véletlennek, de most speciálisan a klasszikus, legegyszerűbb véletlen-gráf modellről lesz szó. Véletlen gráfok címkézett gráfok Néhány gráfelméleti fogalom jelentése módosul pl. isomorphia
Véletleg gráfok definíciója G(N,p) véletlen tér (S{Ω,2^Ω,P(2^Ω)R}) /itt most diszkrét/ N: csomópontok száma p: élvalószínűség 2. Definíció Olyan gráf, melyben a csomópontok közötti élek azonos p valószínűséggel vannak behúzva: élek szám p-től függő véletlen változó 2 4 1 3
Véletlen gráfok tulajdonságai Összes lehetséges élek száma: N(N-1)/2 Összes lehetséges gráfok száma: 2^[C(2,N)] (binomiális együttható: 2 kombinációja N elemnek), ahol n az élek száma vagy másképp írva: 2^[N(N-1)] Összes lehetséges n élet tartalmazó gráfok száma: C(n,N(N-1)/2) Ha p valószínűséggel jön létre él akkor az élek számának várható értéke a gráfban: E[élek száma]= p N(N-1)/2 p1 esetén E[élek száma]=N(N-1)/2 Egy konkrét gráfnak a valószínűsége: A véletlen gráfok elmélete N∞ esetén vizsgálja a lehetséges gráfok tulajdonságait Egy Q tulajdonság szinte mindig teljesül ha N∞ esetén P(Q)1
Véletlen gráf példa N=10-re
Klasszikus véletlen gráfok kritikus jelenségei Számos fontos Q tulajdonság igen gyorsan mejelenik p változtatásával Tehát egy N méretű gráfhoz található pc(N) kritikus valószínűség, ami alatt Q nem jelenik meg felette pedig igen. Fizikában perkoláció elmélet: egy csomópont éleinek száma korlátozott, ebben a rendszerben vizsgálja a pc –t rögzített N esetén Ha ez nincs akkor “természetes” Q tulajdonságok esetén: pc(N∞)0
Algráfok megjelenése G1 algráfja G-nek, ha csomópontjai és élei részhalmazai G-nek (címkézett gráfok!). k csomópontú fa algráfnak mindig k-1 éle van: az átlagos fokszáma 2(k-1)/k k körnek mindig k éle van: az átlagos fokszám 2 teljes k algráfoknak 2k(k-1)/2k=k-1 átlagos fokszáma van Általános esetben egy algráfnak k csomópontja és l éle lehet Mi a valószínűsége, hogy egy véletlen gráf adott paraméterekkel tartalmaz egy ilyen algráfot? Nézzük meg hány lehetőség van egyáltalán és ezeknek mennyi a valószínűsége, ebből megkaphatjuk tipikusan mennyi várható: ahol a a különböző sorrendben többször számolt ugyanazon algráfok száma
Algráfok megjelenése 2 Ebből látszik ha Nkpl(N) 0 akkor a várható érték is tart a 0-ba. Ha P(N)=cNk/l akkor a várható érték λ=cl/a, tehát c értékével tart a végtelenbe, de tetszőlegesen beállítható Bollobás 1995-ben meghatározta az algráfok számának pontos eloszlását is: Egyetlen F gráf megjelenése tehát:
Gráf evolúciója N=100 esetén: z -∞ -2 -3/2 -4/3 -5/4 -1 -2/3 -1/2 p p 0.0001 0.001 0.0021 0.00398 0.01 0.0464 0.1 1
Az óriás komponens megjelenése: fázisátmenet
Összefüggőség A gráf átlagos fokszáma <k>=2n/N=p(N-1)~pN Amikor p<<1/N a különböző komponenesek fák <k>~1 esetén a legnagyobb klaszter mérete N2/3 , az előző példa esetén: 21,54 <k> >> 1 estén a legnagyobb klaszter mérete [1-f(<k>)]N az f(<k>) exponenciális sebességel 0 lesz... p=1/N-nél tehát megjelenik az óriás komponens p=ln(N)/N –nél a gráf összefüggővé válik
Fokszámeloszlás Egy ki csomópont fokszámának eloszlása binomiális hiszen N-1 független másik ponthoz csatlakozhat p valószínűséggel: A gráf fokszámeloszlása Xk azt mondja meg hányad része a csomópontoknak k fokszámú. Hát azt most már látjuk, hogy ahol De vajon mi a pontos eloszlás? Bollobás 1995:
Fokszámeloszlás példa: N=10000, p=0.0015
Összefüggőség és átmérő Ha l az átmérője a véletlen gráfnak és tudjuk hogy tipikusan <k> a fokszáma akkor l lépés után érintjük az összes <k>l =N csomópontot. Így tehát l=Log<k> N=LogN/Log<k> Ha <k>=pN<1 esetén kis komponensek d a legnagyobb komponens átmérője, bár azok tipikusan egyméretűek Ha <k> > 1 akkor van óriás komponens és annak az átmérőjét mérjük < k> >3.5 felett jellemzően arányosnak mondhatjuk Log(N)/Log(<k>)-val. Ha <k> >= Log(N) az átmérő már elég pontosan Log(N)/Log(<k>) Átlagos távolság:
Átmérő valós és klasszikus véletlen hálózatokban
Klaszterezési együttható véletlen gráfokban és a valóság Mivel minden kapcsolódás függetlenül a többitől p valószínűséggel következik be így a barátaim barátok-e p valószínűséggel igaz:
Áttekintés
Perkoláció elmélet Valós rendszerekben: véges dimenzió Szomszédok száma helytől függően csak kevés lehet Kétdimenziós rácson (25x25), ha p valószínűséggel húzunk be élet:
Perkoláció elmélet kérdései Mekkora valószínűséggel tartozik egy csomópont az óriás klaszterhez? Mekkora az átlagos klaszterméret? Milyen a klaszterek méretének eloszlása? Az elmélet olyan dolgokra válaszol, amelyekre a véletlen gráfok elmélete általában nem tud egyszerűen. Az eredmények dimenzió végtelen esetén alkalmazhatóak a véletlen gráfoknál is
Hat lépés távolság a társadalomban és máshol Karithy (1929) – Minden másképpen van: Láncszemek Milgram (1969) – Kísérlet (a másik) ...
A gyenge kapcsolatok ereje Mark Granovetter: Álláskeresés A társadalom szerkezete Magas klaszterezettség Nem random Távoli kapcsolatok! Különben az átmérő nem lesz kicsi.
Watts and Strogatz
Gyenge kapcsolatok általános modell Két rész: Körvonalon elosztva csomópontok, mindenkinek k távolságig minden szomszéddal kapcsolat: rövidtávú kapcsolat – klaszterezettség Véletlenszerű távoli kapcsolatok: kis átmérő
Véletlen kapcsolatok aránya A véletlen kapcsoltok növelésével lassan visszakapjuk az Erdős féle véletlen gráfokat
Kisvilág modell – Watts an Strogatz
Kisvilág modell paraméterei Klaszterezettség: két távolságban levő szomszédok esetén (előző fólia esete): C=3/6 Ha K legközelebbi szomszéddal van kapcsolatban akkor: K végtelenben a C 0.75
Watts-Strogatz modell – általános észrevétel Minden csomópont K/2 szomszéddal mindkét oldalról, mondjuk: N>>K>>ln(N)>>1 Húzzunk újra p valószínűséggel néhány élet: pN K/2 él
Kisvilág működési tartomány Tehát a klaszterezettség széles skálán dacol a p újrahuzalozási valószínűséggel Az átlagos úthossz igen gyorsan lecsökken a “shortcutok” megjelenésével
Kisvilág fokszámeloszlás Ugyanakkor a kisvilág egy széles tartományb an továbbra is csúcsos jellegű Poisson eloszláshoz hasonló fokszámeloszlású
Vannak nem véletlen, szabályos kisvilágok? Lehetséges állapotok száma: 43,252,003,274,489,856,000 (2x2-esnek “csak” kb. 3 millió) Bizonyíthatóan favágó módszerrel 26 lépésből kirakható (átmérő), de sejtik, hogy 20 is elég sőt az un. színcsoportosítás módszere 16-ot jósol... 5x5 kocka esetén a lehetőségek száma 2.83x1073 (az atomok száma a világon 1078 ! az egész világ kisvilág ) . A szükséges forgatások száma 60 körül lehet...
Valós hálózati észrevételek
Skálafüggetlen hálózatok fokszámeloszlása A fokszámeloszlás power-law: Hub-ok, nagy fokszámú csomópontok vannak a rendszerben (az eloszlás farokrésze) A csomópontok többsége kis fokszámú
Skálafüggetlen hálózatok fokszámeloszlása
Áttekintés
Általánosított véletlen gráfok A fokszámeloszlás nem feltétlen poisson! A gráf konstrukció: Vegyünk izolált csomópontokat Húzzunk ‘tüskéket’ belőlük egy szabadon választott eloszlás szerint Kössük össze véletlenszerűen a tüskéket egymással Ha irányíthatjuk az eloszlást közelebb kerülhetünk valós hálózatok tulajdonságaihoz Skálafüggetlen eloszlásnál az útvonalhossz néhol jól közelíti a valós hálózatokat:
Barabási-Albert modell
Skálafüggetlen hálók kialakulása Barabási-Albert modell Két fontos lépés: Növekedés – minden lépésben egy új csomópontot adunk hozzá a rendszerhez Preferenciált kapcsolódás – az újonnan megjelenő csomópont annál nagyobb valószínűséggel kapcsolódik egy már meglévőhöz, minél népszerűbb
Oké, de be lehet-e látni, hogy tényleg ez van? Hivatkozások Internet Kollaborációs hálózatok
Útvonalhossz skálafüggetlen és véletlen gráf esetén A különbség kisebb tendenciális, általánosított véletlen gráf esetén csak addicionális (logaritmikus skálán – végül tehát multiplikatív)
Klaszterezési együttható skálafüggetlen hálózatban Klaszterezés a véletlen hálóval összehasonlítva hasonlóan (talán picit jobban) viselkedik:
Skálafüggetlen hálók gyártása Folyamatos növekedés Preferenciális kapcsódás Mi van ha valamelyik hiányzik? Csak növekedés: expnenciális fokszám csökkenés (új node – m új él) N állandó de prefrenciális kapcsolódás van: Gauss-i lesz és végül teljes gráf
Áttekintés
Hollywoodi színészek hálózata (Barabási 1999) Csomópontok: színészek Kapcsolatok: közös filmek Forrás: IMDB Cél: szinésztársadalom összetartásajobb filmek N <k> <l> C 225.226 61 3.65 0.79 A gazdag még gazdagabb lesz jelenség
Internet topológia (domain szinten) (Faloutsos 1999) Csomópontok: autonóm rendszerek, routing szinten egységesen kezelt IP prefixek, melyet egy vagy több operátor üzemeltet Kapcsolatok: összeköttetések Cél: IP csomagok szállítása Adatbázis: NLANR (National Laboratory for Applied Network Research www.nlanr.net 1997 óta Átlagos fokszám növekszik Növekszik a verseny
Internet domain szinten Dinamizmus Gazdag még gazdagabb
World wide web (Barabási 1999) Csomópontok: weboldalak Kapcsolatok: linkek Irányított gráf Adatbázis nd.edu körzet Többszöri mérések az időszakban Nemlineáris növekedés N <k> <l> C 325.729 7.85 11.2 0.29 N E 1999 május 203 millió 1466 millió 1999 október 271 millió 2130 millió
WWW Többféle illesztés van
Anyagcsere hálózat
Áttekintés
Összefoglalás I. Klasszikus véletlen gráf (E-R modell) egyszerű definíció egyszerű analizálhatóság Watts-Strogatz modell a kisvilág tulajdonság és a klaszterezettség összegyúrása lehető legegyszerűbben (korábbi alfa modell) Barabási-Albert B-A modell skálafüggetlen fokszámeloszlás és annak egy lehetséges magyarázata E-R modell W-S modell B-A modell Kisvilágság Klaszterezettség Fokszámeloszlás
Modell ami egyszerre skálafüggetlen, klaszterezett és kisvilág? A kisvilágság nem “nagy szám” Klaszterezettség: Watts-Strogatz Skálafüggetlenség: Barabási-Albert Klaszterezettség+Skálafüggetlenség = nincs még rá jó modell (lehet?) Modularitás Több feladat megoldása egyszerre Biológia, gazdaság, informatika elosztott rendszerek Granovetter, W-S modell Közösségi portálok, nagyvállalatok outsourcing, számítógép, komplexitás Aggregálás, Barkochba és Flat routing
Tulajdonságok Determinisztikus. Kisvilág A fokszám-eloszlás skálafüggetlen. A klaszterezettség: Magas Fokszám-függő Nem függ a rendszer méretétől!! De túl szabályszerű Hasonló valós hálózatok: Filmszínészek Angol szinonimák WWW Internet domain-ek Eltérő valós hálózatok: Internet a router-ek szintjén Villamos hálózat Központok szerepe, dinamika, vezetők kialakulása
Fraktálok Koch görbe Mandelbrot halmaz
Ravasz-Barabási hierarchikus modell
Modularitás Kis modulok sok belső kapcsolattal Összekötők mint információs hidak a modulok között A híd viszont elősegítheti közvetlen kapcsolat kialakulását amennyiben intenzív kommunikáció kell Nagyvállalati struktúra Modularitás előnyei céhek-manufaktúra egymástól független fejlődés, evolúció, genetikai mutáció adaptivitás méretgazdaságosság választékgazdaságosság Otthoni gyártás
Egyéb modellek Egyéb modellek (itt aztán van minden) Nemlineáris népszerűségi kapcsolódás Fitnesz modellek (Bose-Einstein) Hogy mérjük? Öregedés, költség Születés Stb.
Klasszikus véletlen gráfok Összefoglalás II. – Analitikus leírhatóság (A képleteket nem kell megtanulni ) Klasszikus véletlen gráfok nincsenek korrelációk a sztochasztikus jellemzők egyszerűen számolhatók Sajnos ok okozat a világban W-S modell B-A modell
Szűkebb értelemben vett komplex hálózatok Speciális értelemben Nem véletlenszerű kapcsolatok, “csoportosuló” Kis átmérő, rövid utak, kisvilág Skálafüggetlen szerkezet: preferencia alapú kapcsolódás, gazdag még gazdagabb
Felhasznált irodalom Statistical mechanics of complex networks Albert Réka, Barabási Albert-László The structure and function of complex networks Honlapról letölthető!