Fogolydilemma (3. előadás)

Slides:



Advertisements
Hasonló előadás
A Floyd-Warshall algoritmus
Advertisements

Potenciál játékok A játékoknál minden játékosnak saját nyereménye van és azt kívánják maximálni. A potenciál játékoknál létezik egy V(s1, …, sN) potenciálfüggvény,
Evolúciós potenciál játékok
Játékelmélet oktatása a középiskolában
Élete: Mosonmagyaróváron született én óta minden országos bajnokságot megnyert 100m-es gátfutásban. Nem volt szponzora, ezért szombaton.
Az artista sem ugrik védőháló nélkül avagy miben segíthet a jog ?
3. szabály A játékosok száma. A játékban két csapat vesz részt, legfeljebb öt-öt játékossal, akik közül egy-egy a kapus. A mérkőzés nem kezdhető el csapatonként.
Az együttműködés természete Szabó György MTA Műszaki Fizikai és Anyagtudományi Kutatóintézet H-1525 Budapest, POB. 49. Honlap:
„Régi jó földből – új erős hajtások”. Miért jelentkezek az SZMT Elnöki poziciójára? - Elvira •Mert nagyon sokat kaptam ettől a közösségtől, Tőletek és.
Evolúciós játékelmélet előadás
2006. február 17. Valószínűségszámítás és statisztika II. Telefonos feladat Egy kalapban van két korong, az egyiknek mindkét oldala piros, a másiknak.
HELLER ÁGNES: FILOZÓFIA MINT LUXUS
KOOPERÁCIÓ ÉS VERSENGÉS
Matematika és Tánc Felkészítő tanár: Komáromi Annamária
Kezdhetek mindent elölről…
A Vocatude program telepítése
É: Pali is, Pista is jól sakkozik. T: Nem igaz. É: Bizonyítsd be. Mi nem igaz? T: Nem igaz, hogy Pali jól sakkozik. Nyertem É: Pali vagy Pista.
Készítette: Novák Edvin
Benczúr Zsolt VBA gyorstalpaló Benczúr Zsolt
INFOÉRA Kombinatorikai algoritmusok (Horváth Gyula és Szlávi Péter előadásai felhasználásával) Juhász István-Zsakó László: Informatikai.
Rekurzió (Horváth Gyula és Szlávi Péter előadásai felhasználásával)
Az együttműködés előnyei és hátrányai: játékelméleti elemzés
KONFLIKTUSMODERÁLÁS n SZÜKSÉG- SZERŰEK n TERMÉSZETESEK n DEMOKRATIKUS EGYÜTTÉLÉS  TÖBB KONFLIKTUS  KRITIKUS ÉRTÉKIG!!
Játékelmélet Nash, dominancia.
Algoritmizálás Göncziné Kapros Katalin humaninformatika.ektf.hu.
Az ápolók etikai kódexének helye és szerepe a gyakorlatban
Lineáris programozás Modellalkotás Grafikus megoldás Feladattípusok
Az érvelés.
Matematika III. előadások MINB083, MILB083
Evolúciósan stabil stratégiák előadás
Játékelméleti alapfogalmak előadás
Az evolúciós játék bonyolódik
1 Ismételt fogolydilemma játék sztochasztikus reaktív stratégiákkal 4. előadás Axelrod számítógépes versenyének megismétlése A nyereménymátrix és a stratégiák:
Ismételt fogolydilemma játék sztochasztikus reaktív stratégiákkal. 4
Stratégiai kvízjáték, bajnoksággal, nyereményekkel.
Sipos Viktória & Motyovszki Gergő
Ismétlő struktúrák.
Rendezési algoritmusok
ismétlődő (azonos vagy hasonló) tevékenységek megvalósítására szolgál
„Egészségedre” témahét. „Egészségedre” témahét „Egészségedre” témahét.
Evolúciós játékelmélet
A TÉKOZLÓ FIÚ (Ötödik lecke) A döntés. Hogyan jutunk el a keskeny útra? Isten szentsége miatt lehetetlen, hogy a bűnnel közösségben legyünk mivel ez Isten.
Az élet igéje április „Testvérek, ne panaszkodjatok egymásra…” (Jak 5,9)
Henkin-Hintikka játék (részben ismétlés) Alapfelállás: -Két játékos van, Én és a Természet (TW képviseli). - A játék tárgya egy zárt mondat: P. - Választanom.
Játékelmélet - bevezetés
7. A társadalmi döntések elmélete
Bevezetés a biológiába Kooperáció Kooperáció az állatvilágtól az emberi társadalmakig Számadó Szabolcs
Mélységi bejárás Az algoritmus elve: Egy kezdőpontból kiindulva addig megyünk egy él mentén, ameddig el nem jutunk egy olyan csúcsba, amelyből már nem.
A kvantifikáció igazságfeltételei “  xA(x)” akkor és csak akkor igaz, ha van olyan objektum, amely kielégíti az A(x) nyitott mondatot. “  xA(x)” akkor.
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Mintavételes Eljárások.
Resztoratív megközelítés a konfliktuskezelésben
Stratégiai játékok. Mit nevezünk stratégiai játéknak? Az ilyen típusú játékokban a játékosok megadott szabály szerint lépnek. Általában kötelező lépni.
Valószínűségszámítás II.
A közösség ereje. Mi az e-demokrácia gép? Hogyan működik a gép? Mire szeretnénk használni ezt a gépet? Mi a 42? Kikből áll a 42? Mit szeretne a 42? Miről.
Komplex rendszerek – Evolúciós modellek
Társ a tanulásban. Marketingterv létrehozása 1. szakasz: Piaci verseny.
MI 2003/8 - 1 Alakfelismerés alapproblémája: adott objektumok egy halmaza, továbbá osztályok (kategóriák) egy halmaza. Feladatunk: az objektumokat - valamilyen.
Számítógépes Hálózatok 9. gyakorlat. Gyakorlatok Nov 18,20 - Socket Nov 25,27 - Socket Dec 2,4 - ZH Dec 9,11 - pótZH Számítógépes hálózatok GY2 Gombos.
Adalékok egy véges összegzési feladathoz
1 Megerősítéses tanulás 4. előadás Szita István, Lőrincz András.
Quick-Search algoritmus. Bevezet ő Az eljárás működése során két esetet különböztetünk meg: A szöveg minta utáni első karaktere nem fordul elő a mintában.
Kvantifikáció:  xA: az x változó minden értékére igaz, hogy…  a: értelmetlen. (Megállapodás volt: ̒a’, ̒b’, … individuumnevek.) Annak sincs értelme,
ZRINYI ILONA matematikaverseny
Mérő László egyetemi tanár ELTE Pszichológiai Intézet Kooperáció és versengés egyidejűleg Gyula, április 1.
Bevezetés a játékelméletbe
Monopolisztikus verseny, Oligopólium
Játékelméleti megközelítés Oligopol piacok
SZFP II Kompetenciamérés
Komplex rendszerek – Evolúciós modellek
Készítette: Pethő Eszter, Rácz Viktória, Tóth Anna Eszter
Előadás másolata:

Fogolydilemma (3. előadás) A legegyszerűbb és legkeményebb társadalmi dilemma Két stratégia: C és D Nyereménymátrix: P: Punishment for mutual defection R: Reward of cooperation T: Temptation to choose defection S: Sucker’s payoff A nyeremények sorrendje: T > R > P > S; NE: DD Ismétléses játéknál még feltételezzük, hogy 2R>T+S Az általánosság csökkenése nélkül feltételezhetjük, hogy R=1 és P=0

Fogolydilemma helyzetek a mindennapi életben: leszerelési tárgyalás döntés a tisztességes és tisztességtelen magatartás között átvágjam-e a másikat vagy ne végezzem-e a munkámat alaposan vagy ne megtanuljam-e a szakmámat alaposan vagy ne tolakodjak vagy várjak kíméljem-e környezetemet és egészségemet vagy ne vigyek-e piát a buliba vagy potyázzak beoltassam-e magam az influenza elleni vakcinával, vagy ne vállaljak-e áldozatot másodrendű élősködés vállaljam-e a büntetés fáradalmait és költségeit

A Fogolydilemma furcsaságait Merill Flood és Melvin Dresher ismerte fel 1950 előtt. Az elnevezés Albert Thuckertől származik (előadás joghallgatóknak) Sokak számára világos volt, hogy ez a helyzet a kapitalizmus alapdogmáit kérdőjelezi meg. A dilemma érvénytelensége mellett szóló érvek: a valóság sokkal bonyolultabb, a játék sokszereplős és ismétlik, vagyis bővebb stratégiahalmazból válogathatnak a játékosok A dilemma lényege: az önző egyéni érdek követése a Fogolydilemma helyzetekben a közösségi érdek ellen hat. Hasonló helyzettel szembesülünk a többszereplős Közlegelő (Public goods) játékban, ahol a falu gazdái arról döntenek egymástól függetlenül, hogy a télen született fiatal teheneiket is kihajtsák-e a közös legelőre annak tudatában, hogy az nem képes több tehén táplálására. A játék egyszerűbb változatában 10 játékos egymástól függetlenül dönt arról, hogy befizet-e 1000-1000 forintot egy közös kasszába úgy, hogy a befizetett összeg ötszörösét egyenlően (azaz a befizetéstől függetlenül) osztják el a játékosok között. A befizetés elmulasztása mindenkinek előnyös, mert annak Ő csak a felét kapná vissza, vagyis a befizetésének igazi haszna a többieknél képződik. Sokszereplős Fogolydilemma párkölcsönhatással = Közlegelő játék

Robert Axelrod számítógépes versenye (~1980) N versenyző játszik ismételt Fogolydilemma játékot egymással M körmérkőzés úgy, hogy M→∞, de a nyertest egy véges szakasz után hirdetik ki. A nyereménymátrix: Minden játékos ismeri társai korábbi döntését. Cél: javasolni egy olyan algoritmust (stratégiát), amelyik megnyeri ezt a versenyt. Axelrod benevezett egy véletlen stratégiát: sT=(0.5, 0.5), ezen kívül mindegyik játékos játszik még egy partit saját hasonmásával. A nyereményt a 200. és 300. forduló közötti tartományra átlagolva határozták meg a K=600 fordulós játékban, de K értékét nem adták meg. Így kívánták elkerülni a Jövő árnya hatást: az utolsó lépés = klasszikus FD => D-t kell választani az utolsó előtti lépésben ugyanezt kell csinálni, stb.

Stratégiák ismétléses játéknál: AllD: mindig D-t választ (megátalkodott élősködő) AllC: mindig C-t választ („jó fiú” és/vagy balek) Véletlen: q valószínűséggel D, (1-q) vsz-gel C (q egy paraméter). TFT: kölcsönkenyér visszajár: először C, utána ismétli partnere előző lépését Gyanakvó TFT: (először D, utána ismétli partnere előző lépését) Megbocsátó TFT: TFT, de valamilyen valószínűséggel D-re C-t válaszol WSLS (win-stay-lose-shift) avagy „Nyertes csapaton ne változtass” stratégiák először C vagy D, utána változtat, ha elégedetlen, azaz ha Ux<a Sztochasztikus stratégiák, amelyek döntése a partner előző döntésétől függ, de az valamilyen valószínűséggel lehet C vagy D. Stratégiák hosszabb memóriával: Etc. Példák: hogyan játszik egymás ellen AllD-AllC, AllD-TFT, TFT-WSLS, stb.

Axelrod játékába 14 stratégiát neveztek be. A nyertes: a TFT (ez volt a legegyszerűbb algoritmus) az ismétlésekben is a TFT nyert. A stratégiák és eredmények ismertetése után lehetőség volt új stratégiák benevezésére több, mint 50 új stratégia, (közülük sokan megnyerték volna az első versenyt) a nyertes azonban a második versenyben is a TFT lett. Axelrod tanácsai: Don’t be envious Don’t be the first to defect Recipricate both cooperation and defection Don’t be too clever Az egyének egymással szemben használják a TFT stratégiát Kis lépések stratégiája (Kissinger): nagy FD-ból csináljuk ismétléses FD-t, a játék végét pedig „lebegtessük”.

Axelrod játszott a stratégiahalmazával Következtetései: - Az ellenfelek stratégiáinak ismeretében lehetünk hatékonyabbak, mint a TFT, de ennek hiányában a TFT-t érdemes követni. - A darwini evolúciós szabályok is TFT kulcsszerepét hangsúlyozták Hamilton javaslata: építsük be a darwini kiválasztást, azaz minden forduló után a legkisebb nyereményt elérő játékos átveszi a legeredményesebb stratégiáját Az evolúciós versengés végeredménye: (kulcsszereplő lett a TFT) TFT le tudta győzni az AllD-t és kikényszerítette a kölcsönös együttműködést TFT hiányában AllD győzedelmeskedett

Hiányosságok: - A fenti következtetéseket néhány tucat „ad hoc” stratégia versengéséből származtattuk Mennyire általánosak a következtetések? -TFT rosszul szerepel a zajos környezetben játékosaink összetéveszthetik egymást és emiatt két TFT játékos között az ideális, mindig C választása helyett ezt láthatjuk: hiba hiba hiba hiba ↓ ↓ ↓ ↓ C C C C C C D C D C D C D C D C D D D D D D D D D C D C D C D C C C C C C C C C C C C C D C D C D C D C D C D D D D D D D D D C D C D C D C C C C C normális leckéztetés eldurvult leckéztetés normális jelentős csökkenés az átlagos nyereményben → hátrány a szaporodásban - Ha 2R<T+S, akkor érdemesebb váltakozva játszani C-t és D-t (ellentétesen)

Mikor nyerhetünk a TfT stratégia ellen a sokszereplős ismételt játékoknál? 1.) Ha a közösségben vannak AllC jellegű játékosok, akkor azok kizsákmányolásával megelőzhető a TFT. Ilyen stratégia pl. a WSLS. Minden ilyen eset feltételez valamilyen ismeretet a közösség összetételéről, vagy egy algoritmust, amivel a megfelelő játékosok azonosíthatóak. Csapatjáték: A játékosok egy csoportja feláldozza magát a vezér érdekében. Számítógépes szimulációban egy jelsorozat felismerésére kidolgozott algoritmus segítségével ismerték fel egymást a „bennfentesek”. Valós példa: kerékpár- vagy futó-versenyek.

Házi feladat 3.1. Mutassuk meg hogy a Fogolydilemma helyzetekben a WSLS stratégia nyerhet egy olyan közösségben, ahol a játékosok AllC, TFT és WSLS stratégia közül választhatnak. Hogyan változik a helyzet, ha az AllD stratégia is jelen lehet?

Kísérletek A játékelmélet egyszerűsítő szemlélete alkalmas arra, hogy az állati és emberi viselkedés okait felderítsük. Állati kísérletek Milinski halakkal (guppi, durbincs) kísérletezett (1979) A durbincsoknak időnként ellenőrizni, kell, hogy a közelben levő ragadozó éhes-e vagy nem, vagyis folytathatják-e a nyugodt táplálkozást. Az ellenőrzést egyszerre két durbincs végzi, mert így nagyobb az esélyük a túlélésre. A két halacska ismételt fogolydilemma játékká alakította a ragadozó megvizsgálását és TfT stratégiát követnek. A kísérletben fából készült csuka volt, a társ magatartását pedig az elforgatható tükörben látszódó tükörkép mutatta. Egy későbbi kísérlet azt is igazolta, hogy a megvizsgálást nagyon gyakran állandósult párok végezték (UV-vel megfestett halak, számítógépes elemzés).

Példák állati együttműködésre Erre lehetőséget teremt: közös táplálkozás (baktériumtól kezdődik a sor) közös hőtermelés (összebújnak) védekezés ragadozóval szemben (halraj, csorda, stb.) Közös zsákmányszerzés (oroszlánfalka) Utódok felnevelése Segítség az éhezőnek (vámpírdenevér) Szerepszétválás, specializálódás (méhek, hangyák) Növények is segíthetik egymást. Pézsmatulkok a farkasok ellen Hangyák hidat alkotnak Majmok

Kísérletetek az emberi magatartás felderítésére Merill Flood és Melvin Dreshel (RAND Corporation, ~1950) A Fogolydilemma helyzetek felfedezése után arra voltak kíváncsiak, hogyan viselkedünk a társadalmi dilemma helyzetekben (racionálisak vagyunk-e). Első kísérlet: végigkérdezték kollégáikat, hogy mennyiért vásárolták meg távozó kollégáiktól a használt autójukat, amiért az autókereskedő 2000 $-t fizet, majd ugyanezt 3000 $-ért árulja. Tipikus válasz: 2500 $, holott a racionalitás mást diktál. Második kísérlet: ismételt fogolydilemma játékot játszattak két kollégájukkal, akik elkülönítve, gombok nyomogatásával játszottak. Válasz: kb. 75 % volt a közös C választás (az aszimmetria miatt leckéztetés). A kísérleteket később Chicagóban folytatták katonai kutatás keretein belül. Irodalom: Poundstone, Prisoner’s Dilemma (Anchor Books, 1992)

Ultimátum játék (Güth et al. 1982) Két játékos közül az első arra tesz javaslatot, hogyan osszanak el 100 eurót. A második ezt elfogadhatja vagy nem. Ha igen, akkor a javaslat szerint osztozkodnak, ha nem, akkor semmit sem kapnak. Játékelmélet tanács: Felajánlani 1 eurót a másiknak, akinek ezt célszerű elfogadni, mert ez is több a semminél. Kísérleti eredmény: - Az emberek nagy része (kb. fele) „testvéries” osztozkodást ajánl. - Ajánlat átlaga kb. 30-40 % - Ritka volt a 10%-nál alacsonyabb vagy a 60 %-nál magasabb ajánlat. - Ha az ajánlat kisebb volt, mint 20 %, akkor a második játékosok kb. 80 %-a nemet mondott, vagyis büntetett. Ezt a játékot a világ különböző területein, teljesen eltérő kultúrát követő népcsoportokkal megismételték, és néhány kivételtől eltekintve nagyon hasonló eredményt kaptak. Magyarázat: ez a viselkedés egy evolúciós folyamat végeredménye (elméleti vizsgálatok). Agyvizsgálat: agyunk örömérzést keltő hormonnal jutalmazza a büntetés bevállalását.

Diktátor játék Az első játékos tesz egy javaslatot a X $ elosztására és eszerint osztozkodnak, a második nem tehet semmit sem, vagyis ez nem igazi játék. Eredmény: a felajánlott összeg átlagértéke 20 % körül van. viszonylag gyakran feleztek. az ajánlattevő viszonylag gyakran tartotta meg a teljes összeget. Bizalom játék (Berg et al. 1995) Az első játékos arról dönt, hogy a kapott 10 $ hányad részét fekteti be, a második a befektetett összeg 3-szorosából juttat vissza az elsőnek egy részt. Eredmény: az első játékosok átlagos befektetése 5 $ (50 %). 32-ből 5 játékos a teljes összeget fektette be a második játékosok fele semmit sem fizetett vissza (nagy a szórás). az átlagos visszafizetés kisebb, mint a befektetés. Irodalom: Camerer, Behavioral Game Theory, (Princeton Univ. Press, 2003)

Berg et al. kísérlete 32 páros eredménye Befektetés nagysága szerint rendezve

Közlegelő játék: Hasonló emberi viselkedést mutattak azok az emberi kísérletek, ahol a játékosok ismételt közlegelő játékot játszottak, de a 6-dik lépés után lehetővé tették, hogy egy büntetési költség befizetés után megbüntessék az élősködőket. A befektetett összeg változása az egymást követő lépésekben:

Fehr és Gachter (1998) kísérletében 0-tól 20-ig ajánlhattak fel a játékosok (20-ból) Lehetőség volt a befizetés eloszlásának számszerűsítésére is. Az eredmény az utolsó körben:

Mi történik az agyban? Neurobiológiai agyi aktivitás (tomográfos) vizsgálata ultimátum játék közben különböző személyiségű játékosokkal Növekvő kutatási érdeklődés. Takahashi et al., PNAS 109 (2012 March) 4281.

Odafigyeléssel javítható a „tisztességes” magatartás Beteson és munkatársai kísérlete [Biol. Lett. 2 (2006) 412] A kollégiumi diákok a hűtőgépből kivett és elfogyasztott tej árát egy becsületkasszába fizették be. A „becsületességet” a tej befizetett átlagárával számszerűsítették. A becsületkassza fölé képcsíkot helyeztek. Páratlan heteken: figyelő szempár Páros heteken: virágos kép Az eredmény: