Trinh Anh Tuan trinh@tmit.bme.hu Játékelmélet Trinh Anh Tuan trinh@tmit.bme.hu
Áttekintés Bevezetés Nem-kooperatív játékok Kooperatív játékok Alkalmazások
Bevezetés Mi a játékelmélet Történeti áttekintés A játék komponensei Többszemélyes döntéselmélet Racionális választások elmélete Történeti áttekintés Von Neumann és Morgenstein könyve John Nash munkája Modern játékelmélet és alkalmazásai A játék komponensei Játékosok (kettő, véges, végtelen) Stratégiák (tiszta, kevert) Kifizetési függvények (szimmetrikus, nem szimmetrikus) Információ (teljes, nem teljes, tökéletes, nem tökéletes) Az idő szerepe (statikus, dinamikus) A véletlen szerepe (determinisztikus, stochasztikus) A játék fajtái Nem-kooperatív játékok Kooperatív játékok
Nem-kooperatív játékok
Stratégiai játékok n véges Definíció G={S1, S2,…, Sn ; f1, f2, …, fn} Játékosok halmaza N={1,2,…,n} n véges Stratégiahalmazok S1, S2,…, Sn Stratégiai döntések halmazai Szimmetria Kifizetési függvények fi: S → R, i=1,2,…,n G={S1, S2,…, Sn ; f1, f2, …, fn}
Jelölések
1. Példa: Fogoly dilemma 2. 1. A játék N V (-2,-2) (-10,-1) (-1,-10) Játékosok a foglyok Stratégiai döntések Vall (V) Nem vall (N) Kifizetési függvények Évek a börtönben f1(N,N) = -2, f1(N,V) = -10, f1(V,N) = -1, f1(V,V) = -5 f2(N,N) = -2, f2(N,V) = -1, f2(V,N) = -10, f2(V,V) = -5 2. N V (-2,-2) (-10,-1) (-1,-10) (-5,-5) 1.
A fogoly-dilemma játékkal modellezhető szituációk Együtt dolgozni egy projekten Kemény munkával Laza munkával Duopólium Magas ár Alacsony ár A fegyverkezési verseny A H-bombát gyártani Vagy nem
Házi feladat Kétnemű halak viselkedésének modellezése a fogoly-dilemma játék segítségével Minden halnak van egy preferált szerepe (H) és egy kevésbé preferált szerepe (L) H > L Ha két hasonló preferált szereppel rendelkező hal találkozik/párzik egymással (H+L)/2 S – minél nagyobb annak a valószínűsége, hogy találkozik egy új partnerrel, annál nagyobb az S. Mi az összefüggés H, L, és S között, hogy a problémát fogoly-dilemma játékkal modellezhető?
2. Példa: Bach vagy Stravinsky (Nemek harca) A játék Játékosok: egy pár Stratégiai döntések Bach-ot vagy Stravinsky-t Kifizetési függvények Preferencia f1(Bach,Bach) = 2, f1(Bach,Stravinsky) = 0, f1(Stravinsky,Bach) = 0, f1(Stravinsky,Stravinsky) = 1 f2(Bach,Bach) = 1, f2(Bach,Stravinsky) = 0, f2(Stravinsky,Bach) = 0, f2(Stravinsky,Stravinsky) = 2 2. Bach Stravinsky (2,1) (0,0) (1,2) 1.
3. Példa: Érmepárosítás 2. 1. A játék Fej Írás (1,-1) (-1,1) Játékosok Stratégiai döntések Fejet vagy Írást választani Kifizetési függvények f1(Fej,Fej) = 1, f1(Fej,Írás) = -1, f1(Írás,Fej) = -1, f1(Írás,Írás) = 1 f2(Fej,Fej) = -1, f2(Fej,Írás) = 1, f2(Írás,Fej) = 1, f2(Írás,Írás) = -1 2. Fej Írás (1,-1) (-1,1) 1.
fi(si*, s-i*) ≥ fi(si, s-i*) Nash-egyensúly Definíció Legyen G={S1, S2,…, Sn ; f1, f2, …, fn} egy n-személyes stratégiai játék. Egy s* stratégiaprofilt Nash- egyensúlypontnak (NEP) nevezünk, ha fi(si*, s-i*) ≥ fi(si, s-i*) minden si-re és minden i=1,2,…,n esetén. Illusztrációk Fogoly dilemma Bach vagy Stravinsky Érmepárosítás
Fogoly-dilemma játék elemzése 2. A játék Játékosok a foglyok Stratégiai döntések Vall (V) Nem vall (N) Kifizetési függvények Elemzés (N,N) stratégiaprofil nem Nash-egyensúly, mert 1. játékosnak jobban jár, ha V stratégiát választ, feltéve, hogy 2. játékos nem változtatja a N stratégiáját. Hasonlóan, 2. játékosnak jobban jár, ha V stratégiát választ, feltéve, hogy 1. játékos nem változtatja a N stratégiáját. (N,V) és (V,N) sem Nash-egyensúly (V,V) a Nash-egyensúly Konklúzió A fogoly-dilemma játék létezik egyértelmű Nash-egyensúlya (V,V) stratégiaprofilban N V (-2,-2) (-10,-1) (-1,-10) (-5,-5) 1.
Bach-vagy-Stravinsky játék elemzése A játék Játékosok: egy pár Stratégiai döntések Bach-ot vagy Stravinsky-t Kifizetési függvények Elemzés (Bach, Stravinsky) és (Stravinsky, Bach) nem Nash-egyensúlyok (Bach,Bach) és (Stravinsky, Stravinsky) Nash-egyensúlyok Konkluzió A Bach-vagy-Stravinsky játéknak létezik, és nem csak egy, Nash-egyensúlya 2. Bach Stravinsky (2,1) (0,0) (1,2) 1.
Érmepárosítás-játék elemzése 2. A játék Játékosok Stratégiai döntések Fejet vagy Írást választani Kifizetési függvények Elemzés (Fej, Fej) nem Nash-egyensúly, mert 2 játékos jobban jár, ha Irás-t választ, feltéve, hogy az 1 játékos Fej-nél marad Hasonlóan (Írás, Írás), (Fej, Írás), (Írás, Fej) stratégiaprofilok sem Nash-egyensúlyok Konklúzió Az érmepárosítás-játéknak nincs Nash-egyensúly pontja Fej Írás (1,-1) (-1,1) 1.
Megjegyzések Nash-egyensúly pontok száma egy játéknak Vagy egyetlen egy (1) Vagy több (>1) Vagy nem létezik (0) Mindengyik lehetőség lehetséges Algoritmusok a Nash-egyensúly pontok megkeresésére (ha egyáltalán létezik)?!
fi(si, s-i) > fi(ti, s-i) Dominált stragtégiák Definíció: A G={S1, S2,…, Sn ; f1, f2, …, fn} stratégiai játékban legyen az si, ti a i játékos két stratégiája. Azt mondjuk, hogy a si stratégia szigorúan dominálja a ti stratégiát, ha fi(si, s-i) > fi(ti, s-i) minden s-i-re. Hasonlóan az si stratégia gyengén dominálja a a ti stratégiát, ha fi(si, s-i) ≥ fi(ti, s-i)
Nash-egyensúly pontok megkeresése dominált stratégiák iteratív kiküszöbölésével Fogoly dilemma játék 2. játékosnál V dominálja N-t 1. játékosnál V dominálja N-t (V,V) 2. játékosnál K szigorúan dominálja J-t A megmaradt játékban F szigorúan dominálja L-t A megmaradt játékban K szigorúan dominálja B-t (F,K) a játék NEP-je 2. N V (-2,-2) (-10,-1) (-1,-10) (-5,-5) 1. B K J F (1,0) (1,2) (0,1) L (0,3) (2,0) 1.
Házi feladat Feladat: Bizonyítsuk be, hogy véges játékok esetén, szigorúan domináns stratégiák kiküszöbölésének sorrendje nem befolyásolja a végeredményt. Feladat: Igaz-e az állítás, ha “szigorúan” helyett “gyengén”-t írunk?
Szigorúan dominált stratégiák Bach-vagy-Stravinsky játék és érmepárosítás-játék Mind a két játékban, egyik játékosnak sincs szigorúan dominált stratégiája! Bach-vagy-Stravinsky játéknak viszont több Nash-egyensúly pontja van Megoldás?! Bach Stravinsky (2,1) (0,0) (1,2) Fej Írás (1,-1) (-1,1)
A legjobbválasz-leképezés Definíció Legyen G={S1, S2,…, Sn ; f1, f2, …, fn} egy n-személyes stratégiai játék. Az i. játékos Bi : S → Si legjobbválasz-leképzés a következő: Megyjegyzés Bi(s) a i játékos legjobb stratégiát tartalmazza, ha a többi játékos a s-i csonka stratégiaprofilban szereplő stratégiákat játssza. Bi(s) akár üres is lehet
A legjobbválasz-leképezés Definíció Az egész játékra vonatkozó B: S → S legjobbválasz-leképezést a következőképpen definiáljuk: Megjegyzés A definíció szerint
Házi feladat* Bizonyítsuk be, hogy akkor és csak akkor NEP-je a G játéknak, ha fixpontja a B legjobbválasz-leképezésnek, vagyis .
Nash-egyensúly pontok megkeresése a legjobbválasz-leképezés segítségével Bach vagy Stravinsky játék B1(Bach) = Bach, B1(Stravinsky) = Stravinsky B2(Bach) = Bach, B2(Stravinsky) = Stravinsky (Bach,Bach), (Stravinsky, Stravinsky) Nash-egyensúly pontok 2. Bach Stravinsky (2*,1*) (0,0) (1*,2*) 1.
Házi feladat Fogoly-dilemma és érmepárosítás játékoknál Nash-egyensúly pontoknak megkeresése a legjobbválasz-leképezés segítségével.
Az első előadás összefoglalása Klasszikus játékok Fogoly dilemma Bach vagy Stravinsky Érmepárosítás Nash-egyensúly (NEP) Dominált stratégiák (szigorúan/gyengén) NEP-ek megkeresése (szigorúan) dominált stratégiák iteratív kiküszöbölésével A legjobbválasz-leképezés NEP-ek megkeresése a legjobbválasz-leképezésével
Példák a Nash-egyensúlyokról 2. előadás
Cournot oligopólium Oligopólium Cournot Oligópóliumról akkor beszélünk amikor “néhány” vállalat van a piacon vagyis, a vállatok száma nagyobb, mint egy, de olyan kicsi, hogy nem lehet elhanyagolni az egyes szereplők döntései közötti kölcsönhatásokat. Cournot A vállalatok az termelési mennyiségről döntenek Inverz keresleti fv Minél nagyobb az össztermelés, annál kisebb lesz a termék ára
Cournot-oligopólium Általános modell
Cournot-oligopólium – folyt. Cournot-oligopólium, mint egy játék Játékosok – a vállalatok Stratégiai döntések – a termelési volumene/mennyisége Kifizetési függvény – a profit A Cournot-duopólium játék Két meghatározó vállalat van Konstans egységár Lineáris inverz keresleti függvény
Cournot-duopólium játék
Cournot-duopólium játék elemzése Az 1. vállalat profitja Az 1. vállalat legjobbválasz-leképezése
Cournot-duopólium játék elemzése (q1*,q2*) stratégiaprofil NEP, ha q1* a legjobbválasza q2*-nak és q2* a legjobbválasza q1*-nak, vagyis Helyettesítve
Cournot-duopólium játék elemzése
Cournot-duopólium játék elemzése A Cournot-duopólium játéknak létezik egyértelmű NEP-je Az termék ára egyensúlyi állapotban
Házi feladat
Betrand-oligopólium Általános modell
Betrand-oligopólium – folyt. Betrand-oligopólium, mint egy játék Játékosok – vállalatok Stratégiai döntések – az ár Kifizetési függvények – a profit A Betrand-duopólium játék Két meghatározó vállalat van Konstans egységár Lineáris keresleti függvény
Betrand-duopólium játék
Betrand-duopólium játék elemzése A i. játékos legjobbválasz-lepképezése
Megjegyzések a Cournot, Betrand, és Nash-féle egyensúlyokról Cournot (közgazdász) 19. évszázad elején Cournot-féle “egyensúly” helyzet Betrand (matematikus) 19. évszázad végén Cournot munkájának kritikusa Betrand-féle “egyensúly” helyzet Nash Általánosítás
Megjegyzés az alkalmazásokról P2P fájlcsere rendszerek elemzése Fogoly dilemma játékkal Fájl illetve hálózati erőforrások osztása, mint kooperáció Free-riding (büntetés, mint megoldás, de függ a P2P rendszer architekturájától is) White-washing (cheap pseudo-name) – quite open issue! Hálózati biztonság Támadások stratégiája Védekezések stratégiája Játékelméleti elemzés Módszertan Modellezés
Választási versenyhelyzetek elemzése – Hotelling-játék Hotelling modellje Játékosok – a jelöltek Stratégiai döntések – a jelöltek “pozicionálása” Az nyer, aki a legtöbb szavazatot kapott Kifizetési függvény n ha egyedüli nyertes m ha első helyen szerepel (n – m) többi jelölttel együtt (0 < m < n) 0 ha vesztes
Példa – 3 jelölt esetén
Hotelling-játék elemzése 2 játékos (jelölt) esetén Felező pozició (m: median favorite position) A szavazók favorit pozicióinak pontosan a fele legfeljebb m A szavazók favorit pozicióinak pontosan a fele legalább m Feltételezzük, csak egy olyan van! Az 1. jelölt legjobb válasza Szimmetrikus játék
Hotelling-játék elemzése – folyt. (m,m) az egyetlen Nash-egyensúly To quote Hotelling, the game is “extremely simplified”, but “The competition for votes between the Republican and Democratic parties [in the United States] does not lead to clear drawing of issues, an adoption of two strongly contrasted positions between which the voter may choose. Instead, each party strives to make its platform as much like the other’s as possible.”
Alkalmazási lehetőségek Pozícionálási feladatok Vevőkért harcolnak WLAN-oknál (konkurenciában részesülő) hot spotok pozícionálása (pl. reptéreken, várakozó termekben) Mobil szolgáltatóknál a bázis állomások helyezése, fedettségi terület (jelerősség) meghatározása
Házi feladat A Hotelling játék általánosítása több jelölt esetén 3 jelölttel Kimaradási lehetőséggel Belép és vesztes < kimarad < belép és nyertes Kérdés: Létezik-e NEP-je a játéknak, ha igen, melyek azok? A Hotelling játék általánosítása önjelölt esetén Játékosok: maguk a szavazó polgárok Önjelölés költsége c Kifizetési függvények x* a nyertes pozíciója x a szavazó favorit pozíciója Létezik-e NEP, mikor?
Nash-egyensúly létezéséről
Fixponttételek Brower-fixponttétel Kakutani-fixponttétel
Magyarázatok Halmazelmélet Felülről félig folytonosság? Kompaktság zárt és korlátos Konvexitás Felülről félig folytonosság?
Felülről félig folytonosság Definíció A Gf (az f gráfja) zárt
Házi feladat Legyen G=(N, (Si), (fi)) egy stratégiai játék, és minden 1 ≤ i ≤ N-re Bi(s-i) a legjobbválasz-leképezés. Bizonyítsuk be, hogy minden 1 ≤ i ≤ N-re, Bi(s-i) Nem üres,ha fi folytonos és Si halmaz kompakt Konvex ha továbbá fi konkáv függvény Si halmazán
Tétel a Nash egyensúly létezéséről Nikaido-Isoda tétel. A G=(N, (Si), (fi)) stratégiai játéknak van Nash- egyensúly pontja, ha minden 1 ≤ i ≤ N-re Si egy véges dimenziós Euklédeszi tér nem üres, konvex és kompakt részhalmaza A kifizetési függvény fi Folytonos Konkáv a Si halmazon
Nikaido-Isoda tétel Bizonyítás vázlata Legyen B: S → S az egész játékra legjobbválasz-leképzés Minden 1 ≤ i ≤ N-re, Bi(s-i) Nem üres, mert fi folytonos és Si halmaz kompakt Konvex mert fi konkáv függvény Si halmazán B gráfja zárt mert minden fi folytonos Kakutani-tétel szerint B-nek fixpontja van, amely NEP-je a játéknak
A legjobbválasz-leképezés Definíció Legyen G={S1, S2,…, Sn ; f1, f2, …, fn} egy n-személyes stratégiai játék. Az i. játékos Bi : S → Si legjobbválasz-leképzés a következő: Megyjegyzés Bi(s) a i játékos legjobb stratégiát tartalmazza, ha a többi játékos a s-i csonka stratégiaprofilban szereplő stratégiákat játssza. Bi(s) akár üres is lehet
A legjobbválasz-leképezés Definíció Az egész játékra vonatkozó B: S → S legjobbválasz-leképezést a következőképpen definiáljuk: Megjegyzés A definíció szerint
Stratégiai játékok kevert bővítése
Példa: Érmepárosítás 2. 1. Nincs Nash-egyensúly pontja a játéknak. Játékosok Stratégiai döntések Fejet vagy Írást választani Kifizetési függvények f1(Fej,Fej) = 1, f1(Fej,Írás) = -1, f1(Írás,Fej) = -1, f1(Írás,Írás) = 1 f2(Fej,Fej) = -1, f2(Fej,Írás) = 1, f2(Írás,Fej) = 1, f2(Írás,Írás) = -1 Nincs Nash-egyensúly pontja a játéknak. 2. Fej Írás (1,-1) (-1,1) 1.
Érmepárosítás-játék kevert bővítése “Randomization” Megengedett, hogy a játékosok nem egy konkrét stratégiát választanak determinsztikusan, hanem szubjektív valószínűségek szerint véletlenül választják meg a stratégiájukat. Stochasztikus egyensúly állapot p=1/2, q=1/2 Nincs több 2. q 1 - q Fej Írás (1,-1) (-1,1) p 1. 1 - p
Érmepárosítás-játék elemzése legjobbválasz-leképezés segítségével
Bach-vagy-Stravinsky játék kevert bővítése
Várható kifizetés (expected payoff) 2. pq p(1-q) (1-p)q (1-p)(1-q) L(q) R(1 – q) 1. T(p) B(1 – p)
Megjegyzés - 1 Az 1-es játékos várható kifizetése (p szerinti) lineáris függvény
Megjegyzés - 2
Nash tétele a Nash egyensúly létezéséről Minden véges játéknak van legalább egy Nash egyensúlypontja. Biz. 1. Astratégiai halmazok nem üres, kompakt (zárt és korlátos), és konvex halmazok 2. A (várható) kifizetési függvények folytonosak 3. Nikaido-Isoda tétel alkalmazása
Nash Equilibrium in Auctions
Auctions History of auctions From Babylonia To eBay Auctions of spectrum In an “auction”, a good is sold to the party who submits the highest bid Types of auctions Methods of bidding Sequential (auctions for works of art) Sealed envelopes Price paid Highest bid Other bids (e.g. second highest bid) The good/service itself Single unit Multiple units A game-theoretic analysis helps us to understand the consequences of various designs
Second-price sealed-bid auctions Background Players’ valuations of the object v1>v2>…vn> 0 Each player i submits a (sealed) bid bi Player i payoff is vi-bj , where bj is the highest bid submitted by a player other than i if either bi is higher than every other bid, or bi is at least as high as every other bid and the number of every other player who bids bi is greater than i. Otherwise player i’s payoff is 0.
Second-price sealed-bid auctions – cont. (b1,b2,…,bn)=(v1,0,…,0) is a Nash equilibrium This game admits multiple Nash equilibria (b1,b2,…,bn)=(v1,v2,…,vn) is also a Nash equilibrium In a second-price sealed-bid auction, a player’s bid equal to her valuation weakly dominates all her other bids. This equilibrium is distinguished by the fact that every player’s action weakly dominates all her other actions
Explanation on Weakly Dominated Strategies – Player i’s payoff
First-price sealed-bid auctions Background Differs from second-price sealed-bid auction only in that the winner pay the price she bids, not the second highest bid The game The players: n bidders, n >1 Actions: the sets of actions of each player is the set of possible bids (nonnegative numbers) Payoff: Player i payoff is vi-bj , if either bj is the higher than any other bid, or bi is at least as high as every other bid and the number of every other player who bids bi is greater than i. Otherwise player i’s payoff is 0.
Nash equilibria of first-price sealed-bid auctions (b1,b2,…,bn)=(v2,v2,…,vn) is a Nash equilibrium The game admits multiple equilibria In all Nash equilibria of the game, the winner is the player who values the subject the most (player 1) In all Nash equilibria of the game, the two highest bids are the same, one of these bids are submitted by player 1, and the highest bid is at least v2 and at most v1 Any action profile satisfying these conditions is a Nash equilbrium (b1,b2,…,bn)=(v2,v2,b3…,bn) with bj ≤ vj for j=3,…,n as a “distinguished” Nash equilibria if bids are discrete (not continuous) values While both second-price and first-price auctions have many Nash equilibria, yielding a variety of outcome, their distinguished equilibria yield the same outcome The object is sold to player 1 at the price v2
Multiunit auctions Background Types of multiunit auctions Many (k) units of an object are available (b1,b2,…,bk)-tuple as a bid The player who submits the highest bid for any given unit obtains that unit Types of multiunit auctions Discriminatory auction – the price paid for each unit is the winning bid for that unit Uniform-price auction – the price paid for each unit is the same, equal to the highest rejected bid among all the bids for all units Vickrey auction – a bidder who wins k objects pays the sum of the k highest rejected bids submitted by other bidders
An example of multiunit auctions Two-unit auction Two units of an object is available n bidders Bidding Bidder i’s valuation vi for the first unit, wi for the second unit, vi > wi > 0 Two highest bids win Does player’s i’s action of bidding vi and wi dominate all her other actions?
Analysis Discriminatory auction Uniform-price auction All other players submit two bids of 0 (bi(1),bi(2)) where 0 < bi(1) < vi , 0 < bi(2)) < wi would still be the winning bid, but by paying less! The answer is NO Uniform-price auction Suppose bidder j ≠ i has (bj(1),0) where wi < bi(1) < vi and the rest submits two bids of 0 Bidder i wins one unit, and pays the price wi If she replaces her bid of wi with a bid between 0 and wi then she pays a lower price
Homework How about Vickrey auction? The answer is YES, but how?