Játékelméleti alapfogalmak 2. előadás Mátrixjátékok Két játékos, x és y, egyszerre és egymástól függetlenül választ az n illetve m döntési lehetőségek közül (továbbiakban n=m), amiket egységvektorokkal jelölve: Nyereménymátrixban aij az x játékos nyereménye, ha Ő az i-dik, társa pedig a j-dik stratégiát választja. Hasonló igaz y játékosra. Nyeremények:
a tiszta stratégiák általánosítása (mindkét játékos esetén) Kevert stratégiák: a tiszta stratégiák általánosítása (mindkét játékos esetén) Ezt az (n-1) dimenziós alteret hívjuk szimplexnek. Valószínűségi értelmezés: az x játékos exj valószínűséggel választja a j-ik stratégiát Populációs értelmezés: x és y társulás N→∞ egyedből áll és tagjaik egymás ellen játszanak. Az x társulás tagjainak exj hányada választja a j-ik stratégiát, ill. ue. y-ra A nyeremények matematikai alakja változatlanul: Valószínűségi értelmezés (nyeremény várható értéke):
További fogalmak: Szigorú Nash-egyensúly esetén csak egyenlőtlenség lehet. NE esetén mindkét játékos elégedett, mert az adott körülmények (társa stratégiája) mellett maximális nyereményt ért el. Ez a játékelméleti javallat. (sx(P) ,sy(P)) Pareto-optimális: ha új stratégia-pár (vagy -profil) választásával egyik játékos jövedelme sem növekedhet a másik kárára. (Nem igazi „optimum”, mert sok ilyen állapot létezhet!)
Példák 1. Harmónia játék Egy NE: (1,1) és ez PO Két NE: (1,1) és (0,0) a főátlóban, Az első szigorú NE és PO Két ekvivalens NE: (1,1) és (1,1) Mindkettő PO Két Nash-egyensúly: (4,2) és (2,3) mindkettő PO 2. Koordinációs játék 3. Nemek háborúja
4. Fogolydilemma 5. Héja-galamb (vagy Gyáva nyúl vagy Hólapátolás) Nash-egyensúly: héja-galamb, galamb-héja, kevert stratégiapár 6. Kő-papír-olló játék
A dominált stratégiák sorozatos elhagyása Nash-egyensúlyhoz vezet. NE általánosítása N játékosra: egyik játékos számára sem előnyös, ha egyoldalúan eltér a javallott stratégia-profiltól. Nash-tétel: Minden normál (mátrix) játékban létezik (legalább egy) Nash-egyensúlyi állapot. Normál játék: kétszemélyes mátrixjáték általánosítása n (véges) szereplőre, akik véges számú tiszta stratégiával rendelkeznek. A dominált stratégiák sorozatos elhagyása Nash-egyensúlyhoz vezet. Több Nash-egyensúly esetén további kritériumok kellenek. Például: - előnyt élvez az, amelyik Pareto optimális vagy ahol az össznyeremény a legmagasabb. - Kockázati dominancia minimalizálása (Harsányi-Selten): Feltételezzük, hogy partnerünk azonos valószínűséggel választ a lehetséges stratégiái közül, és ennek tudatában választjuk ki a magasabb jövedelmet biztosító döntésünket. A NE-ok száma gyorsan növekszik a stratégiák számával (a játékosok számával pedig exponenciálisan növekszik). Véletlen nyeremények esetén kb. 1/3 valószínűséggel dilemma helyzet.
Nash-egyensúly meghatározása 1.) Dominált stratégiák elhagyása működik, ha csak egy tiszta NE létezik. 2.) A nyereménymátrixban sorról-sorra megkeressük az x játékos maximális nyereményét és ellenőrizzük, hogy az adott stratégia-pár maximális nyereményt biztosít-e y számára, ha x ezt választaná. Ha igen, akkor NE. Házi feladat 2.1. Keresd meg a tiszta NE-okat az alábbi mátrixjátékban: 3.) A kevert stratégiák körében is meg kell keresni a NE-t, különösen ha a fenti eljárások sikertelenek voltak.
Héja-galamb játék kevert Nash-egyensúlya: v haszonért marakodnak, de a „héják” egymásnak c kárt tudnak okozni. x játékos nyereménye: Hasonlóan kapjuk:
Lokális maximum keresése a paraméter-tartomány belsejében (0<p,q<1): Ebből következik, hogy A végeredmény egy szimmetrikus megoldás: A három NE a Héja-Galamb játékban:
Belső NE meghatározása variációszámítással szimmetrikus mátrixjátéknál Az x és y játékosok a saját nyereményüket maximálják az xi ill. yi értékek optimális megválasztásával úgy, hogy a normálás is teljesüljön. A nyeremények: Variációszámítás: Keressük meg az függvények lokális szélsőértékét, majd a λx és λy paraméterek (Lagrange multiplikátorok) értékét válasszuk meg úgy, hogy teljesüljön a normálás.
Azaz, A differenciálás után kapjuk: ami vektoros jelölésmódban így írható fel: Az A baloldali inverzével szorozva megkapjuk a megoldást, azaz λx=λy=1/Ω (Ω a normálási együttható). Ellenőrizni kell: - az xi és yi együtthatók részei-e a szimplexnek? ha nem, akkor tiszta NE-t kell keresni - a nyeremény tényleg lokális maximum
Zéró vagy állandó összegű kétszemélyes játékok Ezzel kezdődött a játékelmélet Az állandó összegű játék zéró összegű játékká alakul, ha minden nyereményt csökkentünk az átlaggal. Választásunkat ez nem módosítja. Nyeremény bimátrix formában Neumann: nem jó, ha a maximális nyereményt célozzuk meg, mert a többiek választhatnak olyan stratégiát, ami számunkra nagyon hátrányos. Javaslat: minimax stratégia, vagyis azt a stratégiát válasszuk, ahol a minimális nyereményünk a legnagyobb. Kérdés: mi a minimax stratégia a fenti példánál, és mindez hogyan néz ki az ellenfél szempontjából? (nyeregpont analógia)
2x2-es szimmetrikus mátrix játék Társadalmi dilemmák 2x2-es szimmetrikus mátrix játék Mindegyik játékos az alábbi két (tiszta) stratégia valamelyikét követi: : D = Defector = élősködő, vagy : C = Cooperator = önzetlen P: Punishment for mutual defection T: Temptation to choose defection S: Sucker’s payoff R: Reward for mutual cooperation Nyereménymátrix: R > P : kölcsönös C előnyben. Mégis lehet két ok arra, hogy D-t válasszunk: - Ha T>R, akkor megéri az élősködést választani önzetlen társunkkal szemben, vagyis a CC választás instabil - Ha S<P, akkor nem éri meg önzetlennek lenni élősködő társunkkal szemben, vagyis a DD stratégiapár NE. Átskálázott nyeremény: P=0; R=1; (A → α A + β, α > 0) Fogolydilemma: T>1; S<0; NE ≡ „társadalmi tragédia” Szarvasvadászat: T<1; S<0; Héja-Galamb: T>1; 0<S;
Adományozó játék a Fogolydilemma mai (modern) változata Két játékos, x és y, egymástól függetlenül dönt arról, hogy hajlandó-e c (>0) költséget befizetni, hogy társa b (>c) összeget kapjon. Ha döntésük csak igen és nem lehet, akkor a nyereménymátrix: A nyeremények átskálázásával kapjuk: Ez egy egyparaméteres nyereménymátrix.
Társadalmi dilemmák a T-S paramétertérben Kétszemélyes, kétstratégiás, szimmetrikus mátrixjátékok, ha Optimális átlagos nyeremény: R=1 , vagy ismételt játéknál lehet Nash-egyensúly (CD → DC → CD → DC …. ): (T+S)/2
Házi feladat 2.2. Határozzuk meg a (kevert) Nash-egyensúlyt az alábbi két mátrixjátékban: 2.3. A Kisebbségi játékban (Minority game) az N számú (páratlan) játékos mindegyike két lehetőség között választ egyszerre egymástól függetlenül [pl. vesz vagy elad, a jobb- vagy baloldali úton megy A-ból B-be, elmennek-e este az El Farol Bárba (Santa Fe) ír zenét hallgatni vagy otthon maradnak]. A választás után a kisebbséghez tartozók számszerűsített nyereménye +1, a többséghez tartozóké pedig -1. Hány Nash-egyensúly létezik ebben a játékban? 2.4. Ellenőrizzük, hogy van-e kevert Nash-egyensúly a 2x2-es szimmetrikus játékban (1,0,T,S) paraméterezésnél a szarvas vadászat (stag hunt) tartományban. 2.5. Sorolj fel 10 élethelyzetet, amivel naponta találkozhatunk és többé-kevésbé emlékeztet a Fogolydilemmára, az Adományozó vagy a Közlegelő játékra, ami az Adományozó játék N-szereplős változata!