Fogolydilemma (3. előadás) A legegyszerűbb és legkeményebb társadalmi dilemma Két stratégia: C és D Nyereménymátrix: P: Punishment for mutual defection R: Reward of cooperation T: Temptation to choose defection S: Sucker’s payoff A nyeremények sorrendje: T > R > P > S; NE: DD Ismétléses játéknál még feltételezzük, hogy 2R>T+S Az általánosság csökkenése nélkül feltételezhetjük, hogy R=1 és P=0
Fogolydilemma helyzetek a mindennapi életben: leszerelési tárgyalás döntés a tisztességes és tisztességtelen magatartás között átvágjam-e a másikat vagy ne végezzem-e a munkámat alaposan vagy ne megtanuljam-e a szakmámat alaposan vagy ne tolakodjak vagy várjak kíméljem-e környezetemet és egészségemet vagy ne vigyek-e piát a buliba vagy potyázzak beoltassam-e magam az influenza elleni vakcinával, vagy ne vállaljak-e áldozatot másodrendű élősködés vállaljam-e a büntetés fáradalmait és költségeit
A Fogolydilemma furcsaságait Merill Flood és Melvin Dresher ismerte fel 1950 előtt. Az elnevezés Albert Thuckertől származik (előadás joghallgatóknak) Sokak számára világos volt, hogy ez a helyzet a kapitalizmus alapdogmáit kérdőjelezi meg. A dilemma érvénytelensége mellett szóló érvek: a valóság sokkal bonyolultabb, a játék sokszereplős és ismétlik, vagyis bővebb stratégiahalmazból válogathatnak a játékosok A dilemma lényege: az önző egyéni érdek követése a Fogolydilemma helyzetekben a közösségi érdek ellen hat. Hasonló helyzettel szembesülünk a többszereplős Közlegelő (Public goods) játékban, ahol a falu gazdái arról döntenek egymástól függetlenül, hogy a télen született fiatal teheneiket is kihajtsák-e a közös legelőre annak tudatában, hogy az nem képes több tehén táplálására. A játék egyszerűbb változatában 10 játékos egymástól függetlenül dönt arról, hogy befizet-e 1000-1000 forintot egy közös kasszába úgy, hogy a befizetett összeg ötszörösét egyenlően (azaz a befizetéstől függetlenül) osztják el a játékosok között. A befizetés elmulasztása mindenkinek előnyös, mert annak Ő csak a felét kapná vissza, vagyis a befizetésének igazi haszna a többieknél képződik. Sokszereplős Fogolydilemma párkölcsönhatással = Közlegelő játék
Robert Axelrod számítógépes versenye (~1980) N versenyző játszik ismételt Fogolydilemma játékot egymással M körmérkőzés úgy, hogy M→∞, de a nyertest egy véges szakasz után hirdetik ki. A nyereménymátrix: Minden játékos ismeri társai korábbi döntését. Cél: javasolni egy olyan algoritmust (stratégiát), amelyik megnyeri ezt a versenyt. Axelrod benevezett egy véletlen stratégiát: sT=(0.5, 0.5), ezen kívül mindegyik játékos játszik még egy partit saját hasonmásával. A nyereményt a 200. és 300. forduló közötti tartományra átlagolva határozták meg a K=600 fordulós játékban, de K értékét nem adták meg. Így kívánták elkerülni a Jövő árnya hatást: az utolsó lépés = klasszikus FD => D-t kell választani az utolsó előtti lépésben ugyanezt kell csinálni, stb.
Stratégiák ismétléses játéknál: AllD: mindig D-t választ (megátalkodott élősködő) AllC: mindig C-t választ („jó fiú” és/vagy balek) Véletlen: q valószínűséggel D, (1-q) vsz-gel C (q egy paraméter). TFT: kölcsönkenyér visszajár: először C, utána ismétli partnere előző lépését Gyanakvó TFT: (először D, utána ismétli partnere előző lépését) Megbocsátó TFT: TFT, de valamilyen valószínűséggel D-re C-t válaszol WSLS (win-stay-lose-shift) avagy „Nyertes csapaton ne változtass” stratégiák először C vagy D, utána változtat, ha elégedetlen, azaz ha Ux<a Sztochasztikus stratégiák, amelyek döntése a partner előző döntésétől függ, de az valamilyen valószínűséggel lehet C vagy D. Stratégiák hosszabb memóriával: Etc. Példák: hogyan játszik egymás ellen AllD-AllC, AllD-TFT, TFT-WSLS, stb.
Axelrod játékába 14 stratégiát neveztek be. A nyertes: a TFT (ez volt a legegyszerűbb algoritmus) az ismétlésekben is a TFT nyert. A stratégiák és eredmények ismertetése után lehetőség volt új stratégiák benevezésére több, mint 50 új stratégia, (közülük sokan megnyerték volna az első versenyt) a nyertes azonban a második versenyben is a TFT lett. Axelrod tanácsai: Don’t be envious Don’t be the first to defect Recipricate both cooperation and defection Don’t be too clever Az egyének egymással szemben használják a TFT stratégiát Kis lépések stratégiája (Kissinger): nagy FD-ból csináljuk ismétléses FD-t, a játék végét pedig „lebegtessük”.
Axelrod játszott a stratégiahalmazával Következtetései: - Az ellenfelek stratégiáinak ismeretében lehetünk hatékonyabbak, mint a TFT, de ennek hiányában a TFT-t érdemes követni. - A darwini evolúciós szabályok is TFT kulcsszerepét hangsúlyozták Hamilton javaslata: építsük be a darwini kiválasztást, azaz minden forduló után a legkisebb nyereményt elérő játékos átveszi a legeredményesebb stratégiáját Az evolúciós versengés végeredménye: (kulcsszereplő lett a TFT) TFT le tudta győzni az AllD-t és kikényszerítette a kölcsönös együttműködést TFT hiányában AllD győzedelmeskedett
Hiányosságok: - A fenti következtetéseket néhány tucat „ad hoc” stratégia versengéséből származtattuk Mennyire általánosak a következtetések? -TFT rosszul szerepel a zajos környezetben játékosaink összetéveszthetik egymást és emiatt két TFT játékos között az ideális, mindig C választása helyett ezt láthatjuk: hiba hiba hiba hiba ↓ ↓ ↓ ↓ C C C C C C D C D C D C D C D C D D D D D D D D D C D C D C D C C C C C C C C C C C C C D C D C D C D C D C D D D D D D D D D C D C D C D C C C C C normális leckéztetés eldurvult leckéztetés normális jelentős csökkenés az átlagos nyereményben → hátrány a szaporodásban - Ha 2R<T+S, akkor érdemesebb váltakozva játszani C-t és D-t (ellentétesen)
Mikor nyerhetünk a TfT stratégia ellen a sokszereplős ismételt játékoknál? 1.) Ha a közösségben vannak AllC jellegű játékosok, akkor azok kizsákmányolásával megelőzhető a TFT. Ilyen stratégia pl. a WSLS. Minden ilyen eset feltételez valamilyen ismeretet a közösség összetételéről, vagy egy algoritmust, amivel a megfelelő játékosok azonosíthatóak. Csapatjáték: A játékosok egy csoportja feláldozza magát a vezér érdekében. Számítógépes szimulációban egy jelsorozat felismerésére kidolgozott algoritmus segítségével ismerték fel egymást a „bennfentesek”. Valós példa: kerékpár- vagy futó-versenyek.
Házi feladat 3.1. Mutassuk meg hogy a Fogolydilemma helyzetekben a WSLS stratégia nyerhet egy olyan közösségben, ahol a játékosok AllC, TFT és WSLS stratégia közül választhatnak. Hogyan változik a helyzet, ha az AllD stratégia is jelen lehet?
Kísérletek A játékelmélet egyszerűsítő szemlélete alkalmas arra, hogy az állati és emberi viselkedés okait felderítsük. Állati kísérletek Milinski halakkal (guppi, durbincs) kísérletezett (1979) A durbincsoknak időnként ellenőrizni, kell, hogy a közelben levő ragadozó éhes-e vagy nem, vagyis folytathatják-e a nyugodt táplálkozást. Az ellenőrzést egyszerre két durbincs végzi, mert így nagyobb az esélyük a túlélésre. A két halacska ismételt fogolydilemma játékká alakította a ragadozó megvizsgálását és TfT stratégiát követnek. A kísérletben fából készült csuka volt, a társ magatartását pedig az elforgatható tükörben látszódó tükörkép mutatta. Egy későbbi kísérlet azt is igazolta, hogy a megvizsgálást nagyon gyakran állandósult párok végezték (UV-vel megfestett halak, számítógépes elemzés).
Példák állati együttműködésre Erre lehetőséget teremt: közös táplálkozás (baktériumtól kezdődik a sor) közös hőtermelés (összebújnak) védekezés ragadozóval szemben (halraj, csorda, stb.) Közös zsákmányszerzés (oroszlánfalka) Utódok felnevelése Segítség az éhezőnek (vámpírdenevér) Szerepszétválás, specializálódás (méhek, hangyák) Növények is segíthetik egymást. Pézsmatulkok a farkasok ellen Hangyák hidat alkotnak Majmok
Kísérletetek az emberi magatartás felderítésére Merill Flood és Melvin Dreshel (RAND Corporation, ~1950) A Fogolydilemma helyzetek felfedezése után arra voltak kíváncsiak, hogyan viselkedünk a társadalmi dilemma helyzetekben (racionálisak vagyunk-e). Első kísérlet: végigkérdezték kollégáikat, hogy mennyiért vásárolták meg távozó kollégáiktól a használt autójukat, amiért az autókereskedő 2000 $-t fizet, majd ugyanezt 3000 $-ért árulja. Tipikus válasz: 2500 $, holott a racionalitás mást diktál. Második kísérlet: ismételt fogolydilemma játékot játszattak két kollégájukkal, akik elkülönítve, gombok nyomogatásával játszottak. Válasz: kb. 75 % volt a közös C választás (az aszimmetria miatt leckéztetés). A kísérleteket később Chicagóban folytatták katonai kutatás keretein belül. Irodalom: Poundstone, Prisoner’s Dilemma (Anchor Books, 1992)
Ultimátum játék (Güth et al. 1982) Két játékos közül az első arra tesz javaslatot, hogyan osszanak el 100 eurót. A második ezt elfogadhatja vagy nem. Ha igen, akkor a javaslat szerint osztozkodnak, ha nem, akkor semmit sem kapnak. Játékelmélet tanács: Felajánlani 1 eurót a másiknak, akinek ezt célszerű elfogadni, mert ez is több a semminél. Kísérleti eredmény: - Az emberek nagy része (kb. fele) „testvéries” osztozkodást ajánl. - Ajánlat átlaga kb. 30-40 % - Ritka volt a 10%-nál alacsonyabb vagy a 60 %-nál magasabb ajánlat. - Ha az ajánlat kisebb volt, mint 20 %, akkor a második játékosok kb. 80 %-a nemet mondott, vagyis büntetett. Ezt a játékot a világ különböző területein, teljesen eltérő kultúrát követő népcsoportokkal megismételték, és néhány kivételtől eltekintve nagyon hasonló eredményt kaptak. Magyarázat: ez a viselkedés egy evolúciós folyamat végeredménye (elméleti vizsgálatok). Agyvizsgálat: agyunk örömérzést keltő hormonnal jutalmazza a büntetés bevállalását.
Diktátor játék Az első játékos tesz egy javaslatot a X $ elosztására és eszerint osztozkodnak, a második nem tehet semmit sem, vagyis ez nem igazi játék. Eredmény: a felajánlott összeg átlagértéke 20 % körül van. viszonylag gyakran feleztek. az ajánlattevő viszonylag gyakran tartotta meg a teljes összeget. Bizalom játék (Berg et al. 1995) Az első játékos arról dönt, hogy a kapott 10 $ hányad részét fekteti be, a második a befektetett összeg 3-szorosából juttat vissza az elsőnek egy részt. Eredmény: az első játékosok átlagos befektetése 5 $ (50 %). 32-ből 5 játékos a teljes összeget fektette be a második játékosok fele semmit sem fizetett vissza (nagy a szórás). az átlagos visszafizetés kisebb, mint a befektetés. Irodalom: Camerer, Behavioral Game Theory, (Princeton Univ. Press, 2003)
Berg et al. kísérlete 32 páros eredménye Befektetés nagysága szerint rendezve
Közlegelő játék: Hasonló emberi viselkedést mutattak azok az emberi kísérletek, ahol a játékosok ismételt közlegelő játékot játszottak, de a 6-dik lépés után lehetővé tették, hogy egy büntetési költség befizetés után megbüntessék az élősködőket. A befektetett összeg változása az egymást követő lépésekben:
Fehr és Gachter (1998) kísérletében 0-tól 20-ig ajánlhattak fel a játékosok (20-ból) Lehetőség volt a befizetés eloszlásának számszerűsítésére is. Az eredmény az utolsó körben:
Mi történik az agyban? Neurobiológiai agyi aktivitás (tomográfos) vizsgálata ultimátum játék közben különböző személyiségű játékosokkal Növekvő kutatási érdeklődés. Takahashi et al., PNAS 109 (2012 March) 4281.
Odafigyeléssel javítható a „tisztességes” magatartás Beteson és munkatársai kísérlete [Biol. Lett. 2 (2006) 412] A kollégiumi diákok a hűtőgépből kivett és elfogyasztott tej árát egy becsületkasszába fizették be. A „becsületességet” a tej befizetett átlagárával számszerűsítették. A becsületkassza fölé képcsíkot helyeztek. Páratlan heteken: figyelő szempár Páros heteken: virágos kép Az eredmény: