Ismételt fogolydilemma játék sztochasztikus reaktív stratégiákkal. 4

Slides:



Advertisements
Hasonló előadás
Potenciál játékok A játékoknál minden játékosnak saját nyereménye van és azt kívánják maximálni. A potenciál játékoknál létezik egy V(s1, …, sN) potenciálfüggvény,
Advertisements

Evolúciós potenciál játékok
4. Két összetartozó minta összehasonlítása
Térbeli evolúciós mátrixjátékok
Az együttműködés természete Szabó György MTA Műszaki Fizikai és Anyagtudományi Kutatóintézet H-1525 Budapest, POB. 49. Honlap:
EXIT.
KOOPERÁCIÓ ÉS VERSENGÉS
„Songlish” How not to be a „Bicky Chewnigh”. Lehet zöld az ég…
talp-1 This chapter is about the orthic triangle of the isosceles triamgle. This type of triangle is very interesting in itself. Now we will examine.
Számold meg a fekete pontokat!
1 KÖZÖSSÉG AZ ÚJ TESTAMENTUMBAN Romans 12:10 figyelem egymásra, gyengédség, tisztelet, szolgálatkészség, buzgóság, empátia, az Úr szolgálataRomans 12:10.
Matematikai Statisztika VIK Doktori Iskola
Az együttműködés előnyei és hátrányai: játékelméleti elemzés
Reconciliation of essential process parameters for an enhanced predictability of arctic stratospheric ozone loss and its climate interactions
Mérés és adatgyűjtés Virtuális méréstechnika Mingesz Róbert 9. Óra Idő és sokaságátlag November 7., 9.
Játékelmélet Nash, dominancia.
Lineáris programozás Modellalkotás Grafikus megoldás Feladattípusok
PPKE ITK 2008/09 tanév 8. félév (tavaszi) Távközlő rendszerek forgalmi elemzése Tájékoztatás
Fogolydilemma (3. előadás)
1 Fertőzés terjedése egydimenziós rácson (Contact Process) Az ismétlődő elemi folyamatok véletlenül választott x rácspontokon: gyógyulás: s x =1→0 1/(1+λ)
Evolúciósan stabil stratégiák előadás
Dinamikus klaszterközelítés Átlagtér illetve párközelítés kiterjesztése N játékos egy rácson helyezkedik el (periodikus határfeltétel) szimmetriák: transzlációs,
Játékelméleti alapfogalmak előadás
Az evolúciós játék bonyolódik
Fogolydilemma játékok három stratégiával önkéntes fogolydilemma játék Nyereménymátrix: A három stratégia ciklikusan dominálja egymást: C legyőzi L-t L.
1 Ismételt fogolydilemma játék sztochasztikus reaktív stratégiákkal 4. előadás Axelrod számítógépes versenyének megismétlése A nyereménymátrix és a stratégiák:
Az Alakfelismerés és gépi tanulás ELEMEI
Dinamikai rendszerek kaotikus viselkedése
Aszexuális, szimpatrikus speciáció
Torr-1 Pierre Fermat, the great French mathematician (and lawyer) asked the following problem from Torricelli, the physician living in Firense: Find.
Sims-1 This chapter is about Simson line. The question arises in connection with orthic triangles: from which points should we draw perpendicular lines.
Idősor elemzés Idősor : időben ekvidisztáns elemekből álló sorozat
Problémás függvények : lokális optimalizáció nem használható Globális optimalizáció.
A JÁTÉKTERVEZÉS PSZICHOLÓGIÁJA
Versengő társulások Mi történik egy olyan térbeli modellben, ahol sok stratégia létezik? Lokálisan csak a stratégiák kis hányada lehet jelen. => az evolúciós.
Evolúciós játékelmélet
TCT-RAJZI TESZT Kárpáti Andrea
Többváltozós adatelemzés
Molekuláris rátermettség tájképek Kun Ádám. Rátermettség tájkép  Minden genotípushoz rendeljünk egy fenotípust  Minden fenotípushoz rendeljünk egy valósz.
Van rá energiánk? Do we have enough energy? 1.School trip 2.Light pollution 3.In our school.
Stratégiai játékok. Mit nevezünk stratégiai játéknak? Az ilyen típusú játékokban a játékosok megadott szabály szerint lépnek. Általában kötelező lépni.
Cinema du look Posztmodern Neobarokk. Jean Jacques Beineix Luc Besson Leos Carax.
Komplex rendszerek – Evolúciós modellek
Csak olvasd el… Angol szöveg, magyar fordítással.
1 Megerősítéses tanulás 4. előadás Szita István, Lőrincz András.
Virgo Augustus 24. – September 23.. Virgo Symbols.
Indiai tanmese az elefántról …. “The Blind Men and the Elephant", by John Godfrey Saxe ( ). It was six men.
A világon elsőként: NEMZETKÖZI VIRTUÁLIS SAKKISKOLA (  Világszerte elfogadott tény, melyet számos kutatási eredmény is.
Mesterséges intelligencia 8. Stratégiai játékok A játék kimenetelére a játékosoknak ellenőrizhető módon van befolyásuk. Pl.: sakk, dáma, póker stb. A.
A dögeltakarító képei. Itt élni, azt nem lehet… a)Az alábbi képeken Pesti Emma Itt élni, azt nem lehet… I-III. című képsorozatát látjátok. Ezek felhasználásával.
Simon Péter főtitkár Bolyai János Matematikai Társulat
Genetikus algoritmusok
„Animal Integration in the Educational Programme „ZORO”
Intraspecifikus verseny
“Tudásmegosztás és szervezeti problémamegoldás a mesterséges intelligencia korában” Levente Szabados Technológiai Igazgató.
Hipotézisvizsgálatok általános kérdései Nemparaméteres próbák
Komplex rendszerek – Evolúciós modellek
FELSŐNYÉK, MAGYARORSZÁG
Intézményi szintű oktatási innovációk Magyarországon: az óvodáktól a doktori iskolákig Innováció, kutatás, pedagógusok HuCER május Halász.
Villogó delay függvény használata nélkül
FAZEKAS ANDRÁS ISTVÁN PhD c. egyetemi docens
„Animal Integration in the Educational Programme „ZORO”
Mici The Pooh But my favourite is….
Dr. Varga Beatrix egyetemi docens
Polymer Theory Why are we looking at polymer theory?
Túlfeszültség védelem a hálózaton
Ünnepre készülünk Preparing for Christmas
Mikrofonok Principles, constructions, characteristics and applications
Csurgalékvíz tisztítás
Acf, pacf, arima, arfima.
Előadás másolata:

Ismételt fogolydilemma játék sztochasztikus reaktív stratégiákkal. 4 Ismételt fogolydilemma játék sztochasztikus reaktív stratégiákkal 4. előadás Axelrod számítógépes versenyének megismétlése A nyereménymátrix és a stratégiák: Sztochasztikus reaktív stratégiák: a partner előző döntésétől függő döntést választ (mint a TFT) p vsz-gel választ C-t, ha partnere előzőleg C-t választott q vsz-gel választ C-t, ha partnere előzőleg D-t választott y vsz-gel választ C-t az első lépésben.

Stratégiatér 0≤p, q≤1 Minden (p,q) pont egy stratégiát képvisel. p=q=0 : AllD p=q=1 : AllC p=q: döntése független a partnertől p=q=1/2: fej vagy írás p=1, q=0: TFT, ha y=1 p=1, q>0: megbocsátó TFT p=1: barátságos (nice) stratégiák p=0, q=1: „hülye”

s(p,q,y) játszik s(p’,q’,y’) ellen Lépésenként (n=1,2,…) vizsgáljuk a C stratégia gyakoriságát (vsz-ét) Stacionáris megoldás, ha n→∞, és y-októl független, ha

Az egyenletrendszer megoldása: Az s stratégia nyereménye s’ ellenében az állandósult esetben: Ha a sztochasztikus stratégia önmagával játszik, akkor

Sztochasztikus reaktív stratégia gyakoriságának evolúciója A stratégiák egyenletesen oszlanak el a stratégiatérben (i=1, …, N) Kezdetben (t=0) az si(p,q) stratégiák gyakorisága: ρi(t=0)=1/N si stratégia nyereménye: t+1 időpontban megváltoztatjuk a stratégiák gyakoriságát a sikeres szaporodik, a sikertelen ritkul (Nowak és Sigmund 1992) vagyis a nyereménnyel arányos az új populáció nagysága Ez a dinamikai szabály megőrzi a teljes populáció nagyságát. Nowakék véletlenül választottak 100 stratégiát, és a rendszert numerikusan vizsgálták.

Numerikus megoldás i=1, …, N=15*15=225 (egyenletes eloszlás a stratégiatérben) Kezdetben (t=0) az si(p,q) stratégiák gyakorisága ρsi(t=0)=1/N) A stratégiák gyakoriságának (oszlopmagasság) időbeli változása

A legfontosabb stratégiák gyakoriságának időfüggése AllD: (folytonos vonal) kezdeti fellendülés után nagy bukás AllC: (szaggatott vonal) kipusztul, mert AllD felzabálja TFT: (pontozott vonal) feléled, amikor AllD felélte a környezetét GTFT: a végén az egyre megbocsátóbb TFT-k veszik át az uralmat egymástól

A megbocsátási folyamat leáll. Miért? Analitikus számolás AllD meghódíthatja a homogén populációt a sötét területen. Melyik irányba fejlődik a mutáns a homogén populációban?

A megbocsátás optimális mértéke Zaj esetén a TFT stratégiák összekülönböznek: az eredmény zajfüggő a nulla zajú határesetben (p→1): Ha a megbocsátás (q növekedése) addig folytatódik, hogy beleérünk a sötét tartományba, akkor az AllD újra meghódíthatja a populációt, amit TFT hódít vissza és a ciklikus viselkedés örökké folytatódik. Stacionáris viselkedés → határciklus Confucius (i.e. ~1000): Here the climax of the darkening is reached. The dark power at first held so high a place that it could wound all who were on the side of good and of the light. But in the end it perishes of its own darkness, for evil must itself fall at the very moment when it has wholly overcome the good, and thus consumed the energy to which it owed its duration.

Házi feladat 4.1. Határozzuk meg a (p,q) sík azon stratégiáit, amelyek homogén populációját egy AllD stratégia meghódíthatja. 4.2. Határozzuk meg a (p,q) stratégiatérben azt a határvonalat, ahol a lassú mutáció által keltett fejlődés leállhat. Konkrét esetként vizsgálhatjuk az Axelrod által használt nyereménymátrixot. 4.3. Ki nyer az alábbi stratégia-párok versengésében a δ→0 határesetben? a.) (p=1-δ, q) vs. (p’=1-δ, q’) (két barátságos stratégia) b.) (p, q=δ) vs. (p’, q’=δ) (két goromba) c.) (p, q=δ) vs. (p’=1-δ, q’) (goromba vs. megbocsátó TFT)