Az evolúciós játék bonyolódik

Slides:



Advertisements
Hasonló előadás
Szén nanocsövek STM leképezésének elméleti vizsgálata
Advertisements

Potenciál játékok A játékoknál minden játékosnak saját nyereménye van és azt kívánják maximálni. A potenciál játékoknál létezik egy V(s1, …, sN) potenciálfüggvény,
Evolúciós potenciál játékok
Térbeli evolúciós mátrixjátékok
Az együttműködés természete Szabó György MTA Műszaki Fizikai és Anyagtudományi Kutatóintézet H-1525 Budapest, POB. 49. Honlap:
Tanárok kis világa Lehetőségek a tanári hálózatok kutatásában.
Pac-Man játék tanulása Megerősítéses Tanulással Mesterséges Intelligencia algoritmusok tesztelése játékokon Gyenes Viktor Eötvös Loránd Tudományegyetem.
A megbízó-ügynök modell (1)
Sorrendi (szekvenciális)hálózatok tervezése
MI 2003/9 - 1 Alakfelismerés alapproblémája: adott objektumok egy halmaza, továbbá osztályok (kategóriák) egy halmaza. Feladatunk: az objektumokat - valamilyen.
Energiatermelés külső költségei
Előadó: Szabó Márton (iwiw) Katalógus → házi feladatnak beszámít
Az együttműködés előnyei és hátrányai: játékelméleti elemzés
4. VÉGES HALMAZOK 4.1 Alaptulajdonságok
Címkézett hálózatok modellezése
MI 2003/ Alakfelismerés - még egy megközelítés: még kevesebbet tudunk. Csak a mintánk adott, de címkék nélkül. Csoportosítás (klaszterezés, clustering).
Hálózati Biológia A sejt funkcionális működésének megértése.
ELTE Matematikai Intézet
Véletlen logikai hálózatok. Bevezető Logikai változó: Bináris változó. Két lehetséges értéke van: 0 és 1, néha ±1 {σ 1, σ 2,..., σ N }, σ i : {0,1}, i.
Játékelmélet Nash, dominancia.
Lineáris programozás Modellalkotás Grafikus megoldás Feladattípusok
Előadó: Prof. Dr. Besenyei Lajos
Mintavételes eljárások
Vámossy Zoltán 2006 Gonzales-Woods, SzTE (Kató Zoltán) anyagok alapján
Matematika III. előadások MINB083, MILB083
Szabó Attila, Cross-entrópia alkalmazása a megerősítéses tanulásban.
Szélességi bejárás A szélességi bejárással egy irányított vagy irányítás nélküli véges gráfot járhatunk be a kezdőcsúcstól való távolságuk növekvő sorrendjében.
Regresszióanalízis 10. gyakorlat.
Fogolydilemma (3. előadás)
1 Fertőzés terjedése egydimenziós rácson (Contact Process) Az ismétlődő elemi folyamatok véletlenül választott x rácspontokon: gyógyulás: s x =1→0 1/(1+λ)
Evolúciósan stabil stratégiák előadás
Dinamikus klaszterközelítés Átlagtér illetve párközelítés kiterjesztése N játékos egy rácson helyezkedik el (periodikus határfeltétel) szimmetriák: transzlációs,
Játékelméleti alapfogalmak előadás
Fogolydilemma játékok három stratégiával önkéntes fogolydilemma játék Nyereménymátrix: A három stratégia ciklikusan dominálja egymást: C legyőzi L-t L.
1 Ismételt fogolydilemma játék sztochasztikus reaktív stratégiákkal 4. előadás Axelrod számítógépes versenyének megismétlése A nyereménymátrix és a stratégiák:
Ismételt fogolydilemma játék sztochasztikus reaktív stratégiákkal. 4
Az Alakfelismerés és gépi tanulás ELEMEI
Dinamikai rendszerek kaotikus viselkedése
ma már nem a vizsgált téma, hanem a használt módszerek teszik a fizikát dominál az átlagos viselkedés!!! alkalmazhatjuk a statisztikus fizika módszereit.
Aszexuális, szimpatrikus speciáció
Idősor elemzés Idősor : időben ekvidisztáns elemekből álló sorozat
Problémás függvények : lokális optimalizáció nem használható Globális optimalizáció.
Versengő társulások Mi történik egy olyan térbeli modellben, ahol sok stratégia létezik? Lokálisan csak a stratégiák kis hányada lehet jelen. => az evolúciós.
Evolúciós játékelmélet
A sztochasztikus kapcsolatok (Folyt). Korreláció, regresszió
Alapsokaság (populáció)
Két kvantitatív változó kapcsolatának vizsgálata
Belső állapotú bolyongások által meglátogatott pontok száma Nándori Péter (V.) Témavezető: Dr. Szász Domokos (BME MI)
Torlódás (Jamming) Kritikus pont-e a J pont? Szilva Attila 5. éves mérnök-fizikus hallgató.
Szemcsés anyag, ha folyik...
1 Szélességi Bejárás Györgyi Tamás – GYTNAAI.ELTE 2007 Március 22 Algoritmusok És Adatszerkezetek 2 Gráfalgoritmus S b a d e f h g c.
A Van der Waals-gáz molekuláris dinamikai modellezése Készítette: Kómár Péter Témavezető: Dr. Tichy Géza TDK konferencia
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Mintavételes Eljárások.
Stratégiai játékok. Mit nevezünk stratégiai játéknak? Az ilyen típusú játékokban a játékosok megadott szabály szerint lépnek. Általában kötelező lépni.
Populáció genetika Farkas János
A mozgás egy E irányú egyenletesen gyorsuló mozgás és a B-re merőleges síkban lezajló ciklois mozgás szuperpoziciója. Ennek igazolására először a nagyobb.
Valószínűségszámítás II.
Komplex rendszerek – Evolúciós modellek
Forgalom-szimuláció eltérő közegekben Max Gyula BMGE-AAIT 2008.
MI 2003/8 - 1 Alakfelismerés alapproblémája: adott objektumok egy halmaza, továbbá osztályok (kategóriák) egy halmaza. Feladatunk: az objektumokat - valamilyen.
Szélességi bejárás. Véges gráf összes csúcsának bejárása a kezdőcsúcstól való távolságuk szerinti növekvő sorrendben Egy csúcsot egyszer járunk be Egyenlő.
Megerősítéses tanulás 5. előadás
Hálózatok: új nyelv a tudományban Lovász László Eötvös Loránd Tudományegyetem
Kinetikus Monte Carlo  Bevezetés  Véletlen bolyongás  Residence time algoritmus.
1.Kanonikus felügyelt tanulási feladat definíciója (5p) 1.Input, output (1p) 2.Paraméterek (1p) 3.Hipotézisfüggvény (1p) 4.Hibafüggvény/költségfüggvény.
Mesterséges intelligencia 8. Stratégiai játékok A játék kimenetelére a játékosoknak ellenőrizhető módon van befolyásuk. Pl.: sakk, dáma, póker stb. A.
1 / 28 High Speed Networks Laboratory Összefoglalás és gyakorlás.
Bevezetés a játékelméletbe
Komplex rendszerek – Evolúciós modellek
Nem módosítható keresések
Előadás másolata:

Az evolúciós játék bonyolódik Hagyományos modell: N játékos egy rács vagy gráf x pontjain Mindegyik játékos (x) egy tiszta stratégiát követ, például x játékos nyereménye a szomszédoktól (x+δ) származik A szomszédos stratégia átvételének valószínűsége a szomszéd utánzásánál: Véletlen kezdőállapot → stacionáris állapot (ρ: C sűrűsége)

Bővülés az evolúciós szabályokban Eddig volt: - utánozd a legjobb szomszéd stratégiáját - nyereménnyel arányos választás a δ szomszédok közül [Ux+δ>0] - a sorrend lehet szinkronizált vagy véletlen - additív zaj: kis valószínűséggel a tanács ellenkezőjét választjuk - kihalás-születés vagy születés-kihalás - rövidlátó stratégiafrissítés (fifikás játékos) Újabbak: - A nyeremény γ hatványával arányos utánzási valószínűség - WSLS illetve a stochasztikus reaktív stratégiákban benne van egy dinamika - tanuló (adaptív) stratégiák véges memóriával - a másik nyereményének figyelembe vétele (pl. testvériesség) - büntetés - kötelező részvétel eltörlése (önkéntesség) - megkülönböztetés (családtag, tekintély, zöldszakáll hatás, stb.) - stb.

Testvériesség térbeli evolúciós 2x2-es mátrixjátékoknál N játékos helyezkedik el egy négyzetrács x pontjain (periodikus határfeltétel) Mindegyik játékos az alábbi két (tiszta) stratégia valamelyikét követi: Mindegyik játékos (x) játszik egy-egy játékot a négy szomszédjával (x+δ). A hasznossági függvényben figyelembe veszik a másik nyereményét is (önzetlenség), , ahol Evolúciós dinamika: „fifikás” x játékos az sx stratégiájáról K: zaj Q: önzetlenség mértéke Q=0: önző Q=1/2: testvéries Q=1: szerelmes valószínűséggel vált át s’x-re. Effektív nyereménymátrix:

MC szimuláció eredményei (K=0.25) Alrácsrendeződés: az A és B alrácsokban ρA és ρB a C stratégia hányada Q=0.0 Q=1/3 Q=1/2 önző „nagytestvéries” testvéries Alrácsrendeződés (szerepszétválás): kék és zöld vonalak jelzik C gyakoriságát Q=1/2: elérhető a társadalmi optimum a K → 0 határesetben Az átmenetek szélessége arányos K-val A fázishatárokat stabilitáselemzéssel is meghatározhatjuk a K → 0 határesetben

Alrácsrendezett eloszlás stabilitáselemzése Ponthiba: (P=0, R=1) D → C kedvező, ha Ux=4[(1-Q)T+QS] < Ux’=4 , azaz, ha QS < 1-(1-Q)T . alrácsrendezett → homogén C C → D kedvező, ha Ux=4[(1-Q)S+QT] < Ux’=0 , azaz, ha (1-Q)S < -QT . alrácsrendezett → homogén D A fenti ponthibák egymástól függetlenül is létrejöhetnek, azaz Az alrácsrendezett állapot átalakulhat homogén C vagy homogén D állapotba (vagy visszafelé) A fázishatárok: Q(S-1)=-(1-Q)(T-1) , illetve (1-Q)S=-QT

Invázió iránya a homogén C és D doménok találkozásánál A lépcső mozgása határozza meg az invázió jellegét a C (fehér) vagy D (szürke) tartományok között Ux=2[T (1-Q) +QS] ; R=1, P=0, Uy=2[1+S(1-Q) +QT], C invázió, ha Uy > Ux , azaz, ha 1+S(1-2Q) > T (1-2Q) Ugyanezt jósolja a hagyományos kockázati dominancia! Állapotábrák a K → 0 határesetben szerelmesek dilemmája

Koevolúciós játékok: a játékelméleti modell mindegyik eleme változhat Példák: a stratégiával együtt a kapcsolatrendszer is változhat a játékos másik társat választ vagy elköltözik egy-egy játékos ki- vagy beléphet a közösségbe a stratégiával együtt az egyéni tulajdonságok is módosulhatnak (örökölhetők) pl. tekintély, kor, szimpátia, stb. változhat még a nyereménymátrix, a dinamikai szabály és/vagy a stratégiahalmaz is A koevolúciós játékok bonyolultságát a paraméterek és a lehetséges viselkedések nagy száma okozza. A matematikai modellezés egyszerűsödik, ha az egyéni tulajdonság stratégiaként is értelmezhető és örökölhető. A sok paraméterből származó gondon segíthet a darwini kiválasztás, mert rátalál(hat) a legfontosabb értékekre vagy modellcsaládra.

Inhomogén szomszédság hatása Santos et al., PRL (2005) valós társadalmi kapcsolatrendszerben z változik modellek: hígított rács kisvilág modellek (Watts-Strogatz) skálamentes hálózatok [f(z)~z –3] (pl., BA and DM models) Monte Carlo eredmények összehasonlítása különböző hálózaton: (K) Dorogovstev-Mendes-Samukhin modell: Δ Barabási-Albert modell: + kagome rács (K=0): - - - - - négyzetrács:  (optimális K) Inhomogén fokszám (z) segíti az együttműködést!

C (▲) és D (■) stratégiák eloszlása egy skálamentes véletlen gráfon (Luthi et al. arXiv:0902.1447v1) A szimbólumok nagysága arányos a szomszédok számával

Az együttműködést támogató mechanizmus: Két összekapcsolt „Nagyfőnök” (hub), mindegyiknek sok szomszédja van Numerikus szimulációval vizsgálható a részrendszer A nem ábrázolt játékosok hatását véletlen stratégia-átvétellel modellezzük a résztvevőktől (vsz. R=0.5). Véletlen kezdőállapot, nx=ny=49 10000 futásra átlagolva Kezdetben: Ux>Uxn and Uy>Uyn Következmény: sxn→C and syn→D , és hamarosan sx=C válik a legeredményesebb, ill. követendő viselkedési mintává.

Befolyásos személyek hatása Ugyanaz az evolúciós FD játék, mint az előbb, de új tulajdonságok: két fajta játékos (erős vagy gyenge meggyőzőképesség) A stratégiaátadás vsz. y-tól x-hez függ ny -tól A játékosok ν hányada A típusú Az A és B típusú játékosok kezdeti eloszlása véletlen és a játék folyamán végig az is marad A befolyásos játékosok hatása emlékeztet a sokszomszédos (hub) játékosokra, emiatt hasonló hatást várunk.

Mozgó befolyásos játékosok hatása Kis sűrűségnél (ν) a befolyásos fickók nem tudják továbbadni a sikeres példát MC adatok ν=0.02-nél, ha w=1.0, 0.2, 0.05, 0.02, és 0.005 Jelentős javulás, ha az A játékosok 0.1 hányada minden MC lépés után helyet cserél egy szomszéddal Szimuláció rögzített A-kkal Szimuláció mozgó A-kkal

Stratégia-eloszlás és kapcsolatrendszer koevolúciója Több modell igazolja, hogy az együttműködés kialakulását segíti, ha az „átvágott” játékos új partnert választhat az élősködője helyett. Egy egyszerű modell (Pacheco et al. 2007-2008) Az x and y játékosok közötti kapcsolat (Φxy) megszűnhet vagy kialakulhat a stratégiáktól (sx , sy =C vagy D) függő valószínűséggel. - ha Φxy fejlődése jelentősen gyorsabb, mint a stratégiaváltozás, akkor a kapcsolatrendszer a Φij (ρ), (i,j= C, D) valószínűségekkel jellemezhető, és az átlagtér közelítésben (populációdinamikában) a C és D stratégiák hányadának fejlődését egy effektív nyereménymátrixszal vehetjük figyelembe, azaz Következmények:- a dilemma kitranszformálható kétféle időskála (τstrat and τconn ) Szimuláció: C gyakorisága (ρ) 0-ról 1-re nőhet, ha τstrat/τconn növekszik. Véletlen gráfon (vagy rácson) indított rendszerekben erősen irreguláris kapcsolatrendszer alakul ki, ha τstrat/τconn véges.

Stratégiák és dinamikus szabályok koevolúciója Az x játékos (stratégiája sx) az utánzás szabályát Kx zajjal használja a négyzetrácson Kezdetben (t=0) sx=C, vagy D, és a Kx  (Kmin,Kmax) értékeket is véletlenül választjuk Egy MC lépésen belül átlagosan egyszer vehetik át az egyik szomszéd stratégiáját és annak tanulását jellemző Kx értékét. Szimulációs eredmények rögzített T= b értéknél (S=0): Egy Kx szabály marad (négyzetek) A nyertes Kx közel van ahhoz a K értékhez (körök), ahol az átlagos nyeremény maximális A nyertes Kx=0 is lehet, pl. a kagome rácson. Homogén C (vagy D) állapotban Kx fejlődését a szavazó modell írja le. D C+D

Evolúciós FD játékoknál C fennmaradását segíti: - büntető stratégiák (pl. TfT) - központi büntetés, erkölcs, kiközösítés, b csökkentés (törvények) - testvériesség - többstratégiás modellek (C+D+L, C+D+gyengített TfT, stb.) - címkézett játékosok (pl. család, cég, maffia felismerése) csoport-szelekció is segíthet - rögzített kapcsolatrendszer (C+D esetén) szembesíti C-t és D-t a saját viselkedésének következményeivel alkalmas topológia is segítheti C terjedését (átfedő háromszögek) ha nem, akkor a zaj optimalizálható gyengén kapcsolt nagyfőnökök (inhomogén szomszédszám) inhomogenitás a stratégiaátadásban - kapcsolatrendszer változtatása (szabadulás az élősködőktől) - tanulási és kölcsönhatási gráf szétválása

Házi feladat 8.1. Mutassuk meg, hogy az evolúciós Fogolydilemma játékban egydimenziós rácson elsőszomszéd kölcsönhatás esetén kihalnak a kooperátorok, ha a stratégia átadását ugyanolyan szabály vezérli, mint azt definiáltuk az első oldalon. 8.2. A 6. oldalon a lépcső legvalószínűbb haladási irányából következtettünk a homogén C és homogén D állapotok közötti versengés végeredményére a négyzetrácson elsőszomszéd kölcsönhatás mellett. Mit mondhatunk abban az esetben (a Szarvasvadászat tartományon belül), amikor a stratégiaváltozást az 1. oldalon definiált szomszédutánzással írjuk le a K → 0 határesetben?