Az előadás letöltése folymat van. Kérjük, várjon

Az előadás letöltése folymat van. Kérjük, várjon

4-7. Előadás Véletlen gráfok, hálózatmodellek

Hasonló előadás


Az előadások a következő témára: "4-7. Előadás Véletlen gráfok, hálózatmodellek"— Előadás másolata:

1 4-7. Előadás Véletlen gráfok, hálózatmodellek
Kapcsolati hálók és Internetes közösségi rendszerek Gulyás András, Heszberger Zalán

2 Kronológia 1980 1990 2000 2010 1960 1970 Milgram kísérlet
Klasszikus véletlen gráfok Erdős Pál és Rényi Alfréd 1959 Kisvilág modell Watts and Strogatz 1998 Általánosított véletlen gráf Newman, Watts and Strogatz 2001 Modellek fejlesztése Skálafüggetlen modell Barabási and ALbert 1999 1980 1990 2000 2010 Königsberg 7 hídja Leonhard Euler 1736 1960 1970 Milgram kísérlet Stanley Milgram 1967 Arpanet 1969 Alkalmazások fejlesztése Electronic datasets

3 Klasszikus véletlen gráfok
Erdős Pál és Rényi Alfréd 1959 Nagy komplex hálók jól közelíthetőek véletlen gráfokkal Hálózatok tudománya kialakul Valószínűségi eljárások a gráfelméletben Később számos általánosítás Minden gráf, aminek a fejlődési szabályaiban szerepet játszik a véletlen nevezhető véletlennek, de most speciálisan a klasszikus, legegyszerűbb véletlen-gráf modellről lesz szó. Véletlen gráfok  címkézett gráfok Néhány gráfelméleti fogalom jelentése módosul pl. isomorphia

4 Véletleg gráfok definíciója
G(N,p) véletlen tér (S{Ω,2^Ω,P(2^Ω)R}) /itt most diszkrét/ N: csomópontok száma p: élvalószínűség 2. Definíció Olyan gráf, melyben a csomópontok közötti élek azonos p valószínűséggel vannak behúzva: élek szám p-től függő véletlen változó 2 4 1 3

5 Véletlen gráfok tulajdonságai
Összes lehetséges élek száma: N(N-1)/2 Összes lehetséges gráfok száma: 2^[C(2,N)] (binomiális együttható: 2 kombinációja N elemnek), ahol n az élek száma vagy másképp írva: 2^[N(N-1)] Összes lehetséges n élet tartalmazó gráfok száma: C(n,N(N-1)/2) Ha p valószínűséggel jön létre él akkor az élek számának várható értéke a gráfban: E[élek száma]= p N(N-1)/2 p1 esetén E[élek száma]=N(N-1)/2 Egy konkrét gráfnak a valószínűsége: A véletlen gráfok elmélete N∞ esetén vizsgálja a lehetséges gráfok tulajdonságait Egy Q tulajdonság szinte mindig teljesül ha N∞ esetén P(Q)1

6 Véletlen gráf példa N=10-re

7 Klasszikus véletlen gráfok kritikus jelenségei
Számos fontos Q tulajdonság igen gyorsan mejelenik p változtatásával Tehát egy N méretű gráfhoz található pc(N) kritikus valószínűség, ami alatt Q nem jelenik meg felette pedig igen. Fizikában perkoláció elmélet: egy csomópont éleinek száma korlátozott, ebben a rendszerben vizsgálja a pc –t rögzített N esetén Ha ez nincs akkor “természetes” Q tulajdonságok esetén: pc(N∞)0

8 Algráfok megjelenése G1 algráfja G-nek, ha csomópontjai és élei részhalmazai G-nek (címkézett gráfok!). k csomópontú fa algráfnak mindig k-1 éle van: az átlagos fokszáma 2(k-1)/k k körnek mindig k éle van: az átlagos fokszám 2 teljes k algráfoknak 2k(k-1)/2k=k-1 átlagos fokszáma van Általános esetben egy algráfnak k csomópontja és l éle lehet Mi a valószínűsége, hogy egy véletlen gráf adott paraméterekkel tartalmaz egy ilyen algráfot? Nézzük meg hány lehetőség van egyáltalán és ezeknek mennyi a valószínűsége, ebből megkaphatjuk tipikusan mennyi várható: ahol a a különböző sorrendben többször számolt ugyanazon algráfok száma

9 Algráfok megjelenése 2 Ebből látszik ha Nkpl(N) 0 akkor a várható érték is tart a 0-ba. Ha P(N)=cNk/l akkor a várható érték λ=cl/a, tehát c értékével tart a végtelenbe, de tetszőlegesen beállítható Bollobás 1995-ben meghatározta az algráfok számának pontos eloszlását is: Egyetlen F gráf megjelenése tehát:

10 Gráf evolúciója N=100 esetén: z -∞ -2 -3/2 -4/3 -5/4 -1 -2/3 -1/2 p
p 0.0001 0.001 0.0021 0.01 0.0464 0.1 1

11 Az óriás komponens megjelenése: fázisátmenet

12 Összefüggőség A gráf átlagos fokszáma <k>=2n/N=p(N-1)~pN
Amikor p<<1/N a különböző komponenesek fák <k>~1 esetén a legnagyobb klaszter mérete N2/3 , az előző példa esetén: 21,54 <k> >> 1 estén a legnagyobb klaszter mérete [1-f(<k>)]N az f(<k>) exponenciális sebességel 0 lesz... p=1/N-nél tehát megjelenik az óriás komponens p=ln(N)/N –nél a gráf összefüggővé válik

13 Fokszámeloszlás Egy ki csomópont fokszámának eloszlása binomiális hiszen N-1 független másik ponthoz csatlakozhat p valószínűséggel: A gráf fokszámeloszlása Xk azt mondja meg hányad része a csomópontoknak k fokszámú. Hát azt most már látjuk, hogy ahol De vajon mi a pontos eloszlás? Bollobás 1995:

14 Fokszámeloszlás példa: N=10000, p=0.0015

15 Összefüggőség és átmérő
Ha l az átmérője a véletlen gráfnak és tudjuk hogy tipikusan <k> a fokszáma akkor l lépés után érintjük az összes <k>l =N csomópontot. Így tehát l=Log<k> N=LogN/Log<k> Ha <k>=pN<1 esetén kis komponensek d a legnagyobb komponens átmérője, bár azok tipikusan egyméretűek Ha <k> > 1 akkor van óriás komponens és annak az átmérőjét mérjük < k> >3.5 felett jellemzően arányosnak mondhatjuk Log(N)/Log(<k>)-val. Ha <k> >= Log(N) az átmérő már elég pontosan Log(N)/Log(<k>) Átlagos távolság:

16 Átmérő valós és klasszikus véletlen hálózatokban

17 Klaszterezési együttható véletlen gráfokban és a valóság
Mivel minden kapcsolódás függetlenül a többitől p valószínűséggel következik be így a barátaim barátok-e p valószínűséggel igaz:

18 Áttekintés

19 Perkoláció elmélet Valós rendszerekben: véges dimenzió
Szomszédok száma helytől függően csak kevés lehet Kétdimenziós rácson (25x25), ha p valószínűséggel húzunk be élet:

20 Perkoláció elmélet kérdései
Mekkora valószínűséggel tartozik egy csomópont az óriás klaszterhez? Mekkora az átlagos klaszterméret? Milyen a klaszterek méretének eloszlása? Az elmélet olyan dolgokra válaszol, amelyekre a véletlen gráfok elmélete általában nem tud egyszerűen. Az eredmények dimenzió  végtelen esetén alkalmazhatóak a véletlen gráfoknál is

21 Hat lépés távolság a társadalomban és máshol
Karithy (1929) – Minden másképpen van: Láncszemek Milgram (1969) – Kísérlet (a másik) ...

22 A gyenge kapcsolatok ereje
Mark Granovetter: Álláskeresés  A társadalom szerkezete Magas klaszterezettség  Nem random Távoli kapcsolatok! Különben az átmérő nem lesz kicsi.

23 Watts and Strogatz

24 Gyenge kapcsolatok általános modell
Két rész: Körvonalon elosztva csomópontok, mindenkinek k távolságig minden szomszéddal kapcsolat: rövidtávú kapcsolat – klaszterezettség Véletlenszerű távoli kapcsolatok: kis átmérő

25 Véletlen kapcsolatok aránya
A véletlen kapcsoltok növelésével lassan visszakapjuk az Erdős féle véletlen gráfokat

26 Kisvilág modell – Watts an Strogatz

27 Kisvilág modell paraméterei
Klaszterezettség: két távolságban levő szomszédok esetén (előző fólia esete): C=3/6 Ha K legközelebbi szomszéddal van kapcsolatban akkor: K  végtelenben a C  0.75

28 Watts-Strogatz modell – általános észrevétel
Minden csomópont K/2 szomszéddal mindkét oldalról, mondjuk: N>>K>>ln(N)>>1 Húzzunk újra p valószínűséggel néhány élet: pN K/2 él

29 Kisvilág működési tartomány
Tehát a klaszterezettség széles skálán dacol a p újrahuzalozási valószínűséggel Az átlagos úthossz igen gyorsan lecsökken a “shortcutok” megjelenésével

30 Kisvilág fokszámeloszlás
Ugyanakkor a kisvilág egy széles tartományb an továbbra is csúcsos jellegű Poisson eloszláshoz hasonló fokszámeloszlású

31 Vannak nem véletlen, szabályos kisvilágok?
Lehetséges állapotok száma: 43,252,003,274,489,856,000 (2x2-esnek “csak” kb. 3 millió) Bizonyíthatóan favágó módszerrel 26 lépésből kirakható (átmérő), de sejtik, hogy 20 is elég sőt az un. színcsoportosítás módszere 16-ot jósol... 5x5 kocka esetén a lehetőségek száma 2.83x1073 (az atomok száma a világon 1078 ! az egész világ kisvilág ) . A szükséges forgatások száma 60 körül lehet...

32 Valós hálózati észrevételek

33 Skálafüggetlen hálózatok fokszámeloszlása
A fokszámeloszlás power-law: Hub-ok, nagy fokszámú csomópontok vannak a rendszerben (az eloszlás farokrésze) A csomópontok többsége kis fokszámú

34 Skálafüggetlen hálózatok fokszámeloszlása

35 Áttekintés

36 Általánosított véletlen gráfok
A fokszámeloszlás nem feltétlen poisson! A gráf konstrukció: Vegyünk izolált csomópontokat Húzzunk ‘tüskéket’ belőlük egy szabadon választott eloszlás szerint Kössük össze véletlenszerűen a tüskéket egymással Ha irányíthatjuk az eloszlást közelebb kerülhetünk valós hálózatok tulajdonságaihoz Skálafüggetlen eloszlásnál az útvonalhossz néhol jól közelíti a valós hálózatokat:

37 Barabási-Albert modell

38 Skálafüggetlen hálók kialakulása Barabási-Albert modell
Két fontos lépés: Növekedés – minden lépésben egy új csomópontot adunk hozzá a rendszerhez Preferenciált kapcsolódás – az újonnan megjelenő csomópont annál nagyobb valószínűséggel kapcsolódik egy már meglévőhöz, minél népszerűbb

39 Oké, de be lehet-e látni, hogy tényleg ez van?
Hivatkozások Internet Kollaborációs hálózatok

40 Útvonalhossz skálafüggetlen és véletlen gráf esetén
A különbség kisebb tendenciális, általánosított véletlen gráf esetén csak addicionális (logaritmikus skálán – végül tehát multiplikatív)

41 Klaszterezési együttható skálafüggetlen hálózatban
Klaszterezés a véletlen hálóval összehasonlítva hasonlóan (talán picit jobban) viselkedik:

42 Skálafüggetlen hálók gyártása
Folyamatos növekedés Preferenciális kapcsódás Mi van ha valamelyik hiányzik? Csak növekedés: expnenciális fokszám csökkenés (új node – m új él) N állandó de prefrenciális kapcsolódás van: Gauss-i lesz és végül teljes gráf

43 Áttekintés

44 Hollywoodi színészek hálózata (Barabási 1999)
Csomópontok: színészek Kapcsolatok: közös filmek Forrás: IMDB Cél: szinésztársadalom összetartásajobb filmek N <k> <l> C 61 3.65 0.79 A gazdag még gazdagabb lesz jelenség

45 Internet topológia (domain szinten) (Faloutsos 1999)
Csomópontok: autonóm rendszerek, routing szinten egységesen kezelt IP prefixek, melyet egy vagy több operátor üzemeltet Kapcsolatok: összeköttetések Cél: IP csomagok szállítása Adatbázis: NLANR (National Laboratory for Applied Network Research óta Átlagos fokszám növekszik Növekszik a verseny

46 Internet domain szinten
Dinamizmus Gazdag még gazdagabb

47 World wide web (Barabási 1999)
Csomópontok: weboldalak Kapcsolatok: linkek Irányított gráf Adatbázis nd.edu körzet Többszöri mérések az időszakban Nemlineáris növekedés N <k> <l> C 7.85 11.2 0.29 N E 1999 május 203 millió 1466 millió 1999 október 271 millió 2130 millió

48 WWW Többféle illesztés van

49 Anyagcsere hálózat

50 Áttekintés

51 Összefoglalás I. Klasszikus véletlen gráf (E-R modell)
egyszerű definíció egyszerű analizálhatóság Watts-Strogatz modell a kisvilág tulajdonság és a klaszterezettség összegyúrása lehető legegyszerűbben (korábbi alfa modell) Barabási-Albert B-A modell skálafüggetlen fokszámeloszlás és annak egy lehetséges magyarázata E-R modell W-S modell B-A modell Kisvilágság Klaszterezettség Fokszámeloszlás

52 Modell ami egyszerre skálafüggetlen, klaszterezett és kisvilág?
A kisvilágság nem “nagy szám”  Klaszterezettség: Watts-Strogatz Skálafüggetlenség: Barabási-Albert Klaszterezettség+Skálafüggetlenség = nincs még rá jó modell (lehet?) Modularitás Több feladat megoldása egyszerre Biológia, gazdaság, informatika elosztott rendszerek Granovetter, W-S modell Közösségi portálok, nagyvállalatok outsourcing, számítógép, komplexitás Aggregálás, Barkochba és Flat routing

53 Tulajdonságok Determinisztikus. Kisvilág
A fokszám-eloszlás skálafüggetlen. A klaszterezettség: Magas Fokszám-függő Nem függ a rendszer méretétől!! De túl szabályszerű Hasonló valós hálózatok: Filmszínészek Angol szinonimák WWW Internet domain-ek Eltérő valós hálózatok: Internet a router-ek szintjén Villamos hálózat Központok szerepe, dinamika, vezetők kialakulása

54 Fraktálok Koch görbe Mandelbrot halmaz

55 Ravasz-Barabási hierarchikus modell

56 Modularitás Kis modulok sok belső kapcsolattal
Összekötők mint információs hidak a modulok között A híd viszont elősegítheti közvetlen kapcsolat kialakulását amennyiben intenzív kommunikáció kell Nagyvállalati struktúra Modularitás előnyei céhek-manufaktúra egymástól független fejlődés, evolúció, genetikai mutáció adaptivitás méretgazdaságosság  választékgazdaságosság Otthoni gyártás

57 Egyéb modellek Egyéb modellek (itt aztán van minden)
Nemlineáris népszerűségi kapcsolódás Fitnesz modellek (Bose-Einstein) Hogy mérjük? Öregedés, költség Születés Stb.

58 Klasszikus véletlen gráfok
Összefoglalás II. – Analitikus leírhatóság (A képleteket nem kell megtanulni ) Klasszikus véletlen gráfok nincsenek korrelációk a sztochasztikus jellemzők egyszerűen számolhatók Sajnos ok okozat a világban  W-S modell B-A modell

59 Szűkebb értelemben vett komplex hálózatok
Speciális értelemben Nem véletlenszerű kapcsolatok, “csoportosuló” Kis átmérő, rövid utak, kisvilág Skálafüggetlen szerkezet: preferencia alapú kapcsolódás, gazdag még gazdagabb

60 Felhasznált irodalom Statistical mechanics of complex networks
Albert Réka, Barabási Albert-László The structure and function of complex networks Honlapról letölthető!


Letölteni ppt "4-7. Előadás Véletlen gráfok, hálózatmodellek"

Hasonló előadás


Google Hirdetések