Az előadás letöltése folymat van. Kérjük, várjon

Az előadás letöltése folymat van. Kérjük, várjon

Játékelmélet Trinh Anh Tuan Áttekintés Bevezetés Nem-kooperatív játékok Kooperatív játékok Alkalmazások.

Hasonló előadás


Az előadások a következő témára: "Játékelmélet Trinh Anh Tuan Áttekintés Bevezetés Nem-kooperatív játékok Kooperatív játékok Alkalmazások."— Előadás másolata:

1 Játékelmélet Trinh Anh Tuan

2 Áttekintés Bevezetés Nem-kooperatív játékok Kooperatív játékok Alkalmazások

3 Bevezetés Mi a játékelmélet  Többszemélyes döntéselmélet  Racionális választások elmélete Történeti áttekintés  Von Neumann és Morgenstein könyve  John Nash munkája  Modern játékelmélet és alkalmazásai A játék komponensei  Játékosok (kettő, véges, végtelen)  Stratégiák (tiszta, kevert)  Kifizetési függvények (szimmetrikus, nem szimmetrikus)  Információ (teljes, nem teljes, tökéletes, nem tökéletes)  Az idő szerepe (statikus, dinamikus)  A véletlen szerepe (determinisztikus, stochasztikus) A játék fajtái  Nem-kooperatív játékok  Kooperatív játékok

4 Nem-kooperatív játékok

5 Stratégiai játékok Definíció  Játékosok halmaza N={1,2,…,n} n véges  Stratégiahalmazok S 1, S 2,…, S n Stratégiai döntések halmazai Szimmetria  Kifizetési függvények f i : S → R, i=1,2,…,n  G={S 1, S 2,…, S n ; f 1, f 2, …, f n }

6 Jelölések

7 1. Példa: Fogoly dilemma A játék  Játékosok a foglyok  Stratégiai döntések Vall (V) Nem vall (N)  Kifizetési függvények Évek a börtönben f 1 (N,N) = -2, f 1 (N,V) = -10, f 1 (V,N) = -1, f 1 (V,V) = -5 f 2 (N,N) = -2, f 2 (N,V) = -1, f 2 (V,N) = -10, f 2 (V,V) = -5 NV N(-2,-2)(-10,-1) V(-1,-10)(-5,-5) 2. 1.

8 A fogoly-dilemma játékkal modellezhető szituációk Együtt dolgozni egy projekten  Kemény munkával  Laza munkával Duopólium  Magas ár  Alacsony ár A fegyverkezési verseny  A H-bombát gyártani  Vagy nem

9 Házi feladat Kétnemű halak viselkedésének modellezése a fogoly- dilemma játék segítségével  Minden halnak van egy preferált szerepe (H) és egy kevésbé preferált szerepe (L)  H > L  Ha két hasonló preferált szereppel rendelkező hal találkozik/párzik egymással (H+L)/2 S – minél nagyobb annak a valószínűsége, hogy találkozik egy új partnerrel, annál nagyobb az S.  Mi az összefüggés H, L, és S között, hogy a problémát fogoly-dilemma játékkal modellezhető?

10 2. Példa: Bach vagy Stravinsky (Nemek harca) A játék  Játékosok: egy pár  Stratégiai döntések Bach-ot vagy Stravinsky-t  Kifizetési függvények Preferencia f 1 (Bach,Bach) = 2, f 1 (Bach,Stravinsky) = 0, f 1 (Stravinsky,Bach) = 0, f 1 (Stravinsky,Stravinsky) = 1 f 2 (Bach,Bach) = 1, f 2 (Bach,Stravinsky) = 0, f 2 (Stravinsky,Bach) = 0, f 2 (Stravinsky,Stravinsky) = 2 BachStravinsky Bach (2,1)(0,0) Stravinsky (0,0)(1,2) 2. 1.

11 3. Példa: Érmepárosítás A játék  Játékosok  Stratégiai döntések Fejet vagy Írást választani  Kifizetési függvények f 1 (Fej,Fej) = 1, f 1 (Fej,Írás) = -1, f 1 (Írás,Fej) = -1, f 1 (Írás,Írás) = 1 f 2 (Fej,Fej) = -1, f 2 (Fej,Írás) = 1, f 2 (Írás,Fej) = 1, f 2 (Írás,Írás) = -1 FejÍrás Fej(1,-1)(-1,1) Írás(-1,1)(1,-1) 2. 1.

12 Nash-egyensúly Definíció Legyen G={S 1, S 2,…, S n ; f 1, f 2, …, f n } egy n- személyes stratégiai játék. Egy s* stratégiaprofilt Nash- egyensúlypontnak (NEP) nevezünk, ha f i (s i *, s -i * ) ≥ f i (s i, s -i * ) minden s i -re és minden i=1,2,…,n esetén. Illusztrációk  Fogoly dilemma  Bach vagy Stravinsky  Érmepárosítás

13 Fogoly-dilemma játék elemzése A játék  Játékosok a foglyok  Stratégiai döntések Vall (V) Nem vall (N)  Kifizetési függvények Elemzés  (N,N) stratégiaprofil nem Nash-egyensúly, mert 1. játékosnak jobban jár, ha V stratégiát választ, feltéve, hogy 2. játékos nem változtatja a N stratégiáját. Hasonlóan, 2. játékosnak jobban jár, ha V stratégiát választ, feltéve, hogy 1. játékos nem változtatja a N stratégiáját.  (N,V) és (V,N) sem Nash-egyensúly  (V,V) a Nash-egyensúly Konklúzió  A fogoly-dilemma játék létezik egyértelmű Nash-egyensúlya (V,V) stratégiaprofilban NV N(-2,-2)(-10,-1) V(-1,-10)(-5,-5) 1. 2.

14 Bach-vagy-Stravinsky játék elemzése A játék  Játékosok: egy pár  Stratégiai döntések Bach-ot vagy Stravinsky-t  Kifizetési függvények Elemzés  (Bach, Stravinsky) és (Stravinsky, Bach) nem Nash- egyensúlyok  (Bach,Bach) és (Stravinsky, Stravinsky) Nash-egyensúlyok Konkluzió  A Bach-vagy-Stravinsky játéknak létezik, és nem csak egy, Nash-egyensúlya BachStravinsky Bach (2,1)(0,0) Stravinsky (0,0)(1,2) 2. 1.

15 Érmepárosítás-játék elemzése A játék  Játékosok  Stratégiai döntések Fejet vagy Írást választani  Kifizetési függvények Elemzés  (Fej, Fej) nem Nash-egyensúly, mert 2 játékos jobban jár, ha Irás-t választ, feltéve, hogy az 1 játékos Fej-nél marad  Hasonlóan (Írás, Írás), (Fej, Írás), (Írás, Fej) stratégiaprofilok sem Nash-egyensúlyok Konklúzió  Az érmepárosítás-játéknak nincs Nash-egyensúly pontja FejÍrás Fej(1,-1)(-1,1) Írás(-1,1)(1,-1) 2. 1.

16 Megjegyzések Nash-egyensúly pontok száma egy játéknak  Vagy egyetlen egy (1)  Vagy több (>1)  Vagy nem létezik (0)  Mindengyik lehetőség lehetséges Algoritmusok a Nash-egyensúly pontok megkeresésére (ha egyáltalán létezik)?!

17 Dominált stragtégiák Definíció: A G={S 1, S 2,…, S n ; f 1, f 2, …, f n } stratégiai játékban legyen az s i, t i a i játékos két stratégiája. Azt mondjuk, hogy a s i stratégia szigorúan dominálja a t i stratégiát, ha f i (s i, s -i ) > f i (t i, s -i ) minden s -i - re. Hasonlóan az s i stratégia gyengén dominálja a a t i stratégiát, ha f i (s i, s -i ) ≥ f i (t i, s -i ) minden s -i - re.

18 Nash-egyensúly pontok megkeresése dominált stratégiák iteratív kiküszöbölésével Fogoly dilemma játék  2. játékosnál V dominálja N-t  1. játékosnál V dominálja N-t  (V,V) 2. játékosnál K szigorúan dominálja J-t A megmaradt játékban F szigorúan dominálja L-t A megmaradt játékban K szigorúan dominálja B-t (F,K) a játék NEP-je NV N (-2,-2)(-10,-1) V (-1,-10)(-5,-5) BKJ F(1,0)(1,2)(0,1) L(0,3)(0,1)(2,0) 2. 1.

19 Házi feladat Feladat: Bizonyítsuk be, hogy véges játékok esetén, szigorúan domináns stratégiák kiküszöbölésének sorrendje nem befolyásolja a végeredményt. Feladat: Igaz-e az állítás, ha “szigorúan” helyett “gyengén”-t írunk?

20 Szigorúan dominált stratégiák Bach-vagy-Stravinsky játék és érmepárosítás-játék Mind a két játékban, egyik játékosnak sincs szigorúan dominált stratégiája!  Bach-vagy-Stravinsky játéknak viszont több Nash- egyensúly pontja van Megoldás?! BachStravinsky Bach (2,1)(0,0) Stravinsky (0,0)(1,2) FejÍrás Fej(1,-1)(-1,1) Írás(-1,1)(1,-1)

21 A legjobbválasz-leképezés Definíció Legyen G={S 1, S 2,…, S n ; f 1, f 2, …, f n } egy n- személyes stratégiai játék. Az i. játékos B i : S → S i legjobbválasz-leképzés a következő: Megyjegyzés  B i (s) a i játékos legjobb stratégiát tartalmazza, ha a többi játékos a s -i csonka stratégiaprofilban szereplő stratégiákat játssza.  B i (s) akár üres is lehet

22 A legjobbválasz-leképezés Definíció Az egész játékra vonatkozó B: S → S legjobbválasz-leképezést a következőképpen definiáljuk: Megjegyzés  A definíció szerint

23 Házi feladat* Bizonyítsuk be, hogy akkor és csak akkor NEP-je a G játéknak, ha fixpontja a B legjobbválasz-leképezésnek, vagyis.

24 Nash-egyensúly pontok megkeresése a legjobbválasz-leképezés segítségével Bach vagy Stravinsky játék  B 1 (Bach) = Bach, B 1 (Stravinsky) = Stravinsky  B 2 (Bach) = Bach, B 2 (Stravinsky) = Stravinsky  (Bach,Bach), (Stravinsky, Stravinsky) Nash-egyensúly pontok BachStravinsky Bach (2*,1*)(0,0) Stravinsky (0,0)(1*,2*) 2. 1.

25 Házi feladat Fogoly-dilemma és érmepárosítás játékoknál Nash-egyensúly pontoknak megkeresése a legjobbválasz-leképezés segítségével.

26 Az első előadás összefoglalása Klasszikus játékok  Fogoly dilemma  Bach vagy Stravinsky  Érmepárosítás Nash-egyensúly (NEP) Dominált stratégiák (szigorúan/gyengén) NEP-ek megkeresése (szigorúan) dominált stratégiák iteratív kiküszöbölésével A legjobbválasz-leképezés NEP-ek megkeresése a legjobbválasz- leképezésével

27 Példák a Nash-egyensúlyokról 2. előadás

28 Cournot oligopólium Oligopólium  Oligópóliumról akkor beszélünk amikor “néhány” vállalat van a piacon  vagyis, a vállatok száma nagyobb, mint egy, de olyan kicsi, hogy nem lehet elhanyagolni az egyes szereplők döntései közötti kölcsönhatásokat. Cournot  A vállalatok az termelési mennyiségről döntenek  Inverz keresleti fv Minél nagyobb az össztermelés, annál kisebb lesz a termék ára

29 Cournot-oligopólium Általános modell

30 Cournot-oligopólium – folyt. Cournot-oligopólium, mint egy játék  Játékosok – a vállalatok  Stratégiai döntések – a termelési volumene/mennyisége  Kifizetési függvény – a profit A Cournot-duopólium játék  Két meghatározó vállalat van  Konstans egységár  Lineáris inverz keresleti függvény

31 Cournot-duopólium játék

32 Cournot-duopólium játék elemzése Az 1. vállalat profitja Az 1. vállalat legjobbválasz-leképezése

33 Cournot-duopólium játék elemzése ( q 1 *,q 2 * ) stratégiaprofil NEP, ha q 1 * a legjobbválasza q 2 * -nak és q 2 * a legjobbválasza q 1 * - nak, vagyis Helyettesítve

34 Cournot-duopólium játék elemzése

35 A Cournot-duopólium játéknak létezik egyértelmű NEP-je Az termék ára egyensúlyi állapotban

36 Házi feladat

37 Betrand-oligopólium Általános modell

38 Betrand-oligopólium – folyt. Betrand-oligopólium, mint egy játék  Játékosok – vállalatok  Stratégiai döntések – az ár  Kifizetési függvények – a profit A Betrand-duopólium játék  Két meghatározó vállalat van  Konstans egységár  Lineáris keresleti függvény

39 Betrand-duopólium játék

40 Betrand-duopólium játék elemzése A i. játékos legjobbválasz-lepképezése

41 Megjegyzések a Cournot, Betrand, és Nash-féle egyensúlyokról Cournot (közgazdász)  19. évszázad elején  Cournot-féle “egyensúly” helyzet Betrand (matematikus)  19. évszázad végén  Cournot munkájának kritikusa  Betrand-féle “egyensúly” helyzet Nash  Általánosítás

42 Megjegyzés az alkalmazásokról P2P fájlcsere rendszerek elemzése Fogoly dilemma játékkal  Fájl illetve hálózati erőforrások osztása, mint kooperáció  Free-riding (büntetés, mint megoldás, de függ a P2P rendszer architekturájától is)  White-washing (cheap pseudo-name) – quite open issue! Hálózati biztonság  Támadások stratégiája  Védekezések stratégiája  Játékelméleti elemzés Módszertan  Modellezés

43 Választási versenyhelyzetek elemzése – Hotelling-játék Hotelling modellje  Játékosok – a jelöltek  Stratégiai döntések – a jelöltek “pozicionálása” Az nyer, aki a legtöbb szavazatot kapott  Kifizetési függvény n ha egyedüli nyertes m ha első helyen szerepel ( n – m ) többi jelölttel együtt (0 < m < n) 0 ha vesztes

44 Példa – 3 jelölt esetén

45 Hotelling-játék elemzése 2 játékos (jelölt) esetén Felező pozició ( m : median favorite position)  A szavazók favorit pozicióinak pontosan a fele legfeljebb m  A szavazók favorit pozicióinak pontosan a fele legalább m  Feltételezzük, csak egy olyan van! Az 1. jelölt legjobb válasza Szimmetrikus játék

46 Hotelling-játék elemzése – folyt. (m,m) az egyetlen Nash-egyensúly To quote Hotelling, the game is “extremely simplified”, but “The competition for votes between the Republican and Democratic parties [in the United States] does not lead to clear drawing of issues, an adoption of two strongly contrasted positions between which the voter may choose. Instead, each party strives to make its platform as much like the other’s as possible.”

47 Alkalmazási lehetőségek Pozícionálási feladatok  Vevőkért harcolnak  WLAN-oknál (konkurenciában részesülő) hot spotok pozícionálása (pl. reptéreken, várakozó termekben)  Mobil szolgáltatóknál a bázis állomások helyezése, fedettségi terület (jelerősség) meghatározása

48 Házi feladat A Hotelling játék általánosítása több jelölt esetén  3 jelölttel  Kimaradási lehetőséggel  Belép és vesztes < kimarad < belép és nyertes  Kérdés: Létezik-e NEP-je a játéknak, ha igen, melyek azok? A Hotelling játék általánosítása önjelölt esetén  Játékosok: maguk a szavazó polgárok  Önjelölés költsége c  Kifizetési függvények x * a nyertes pozíciója x a szavazó favorit pozíciója  Létezik-e NEP, mikor?

49 Nash-egyensúly létezéséről

50 Fixponttételek Brower-fixponttétel Kakutani-fixponttétel

51 Magyarázatok Halmazelmélet  Kompaktság zárt és korlátos  Konvexitás Felülről félig folytonosság?

52 Felülről félig folytonosság Definíció A G f (az f gráfja) zárt

53 Házi feladat Legyen G=(N, (S i ), (f i )) egy stratégiai játék, és minden 1 ≤ i ≤ N -re B i (s -i ) a legjobbválasz- leképezés. Bizonyítsuk be, hogy minden 1 ≤ i ≤ N -re, B i (s -i )  Nem üres,ha f i folytonos és S i halmaz kompakt  Konvex ha továbbá f i konkáv függvény S i halmazán

54 Tétel a Nash egyensúly létezéséről Nikaido-Isoda tétel. A G=(N, (S i ), (f i )) stratégiai játéknak van Nash- egyensúly pontja, ha minden 1 ≤ i ≤ N -re  S i egy véges dimenziós Euklédeszi tér nem üres, konvex és kompakt részhalmaza  A kifizetési függvény f i Folytonos Konkáv a S i halmazon

55 Nikaido-Isoda tétel Bizonyítás vázlata  Legyen B: S → S az egész játékra legjobbválasz- leképzés  Minden 1 ≤ i ≤ N -re, B i (s -i ) Nem üres, mert f i folytonos és S i halmaz kompakt Konvex mert f i konkáv függvény S i halmazán  B gráfja zárt mert minden f i folytonos  Kakutani-tétel szerint B -nek fixpontja van, amely NEP-je a játéknak

56 A legjobbválasz-leképezés Definíció Legyen G={S 1, S 2,…, S n ; f 1, f 2, …, f n } egy n- személyes stratégiai játék. Az i. játékos B i : S → S i legjobbválasz-leképzés a következő: Megyjegyzés  B i (s) a i játékos legjobb stratégiát tartalmazza, ha a többi játékos a s -i csonka stratégiaprofilban szereplő stratégiákat játssza.  B i (s) akár üres is lehet

57 A legjobbválasz-leképezés Definíció Az egész játékra vonatkozó B: S → S legjobbválasz-leképezést a következőképpen definiáljuk: Megjegyzés  A definíció szerint

58 Stratégiai játékok kevert bővítése

59 Példa: Érmepárosítás A játék  Játékosok  Stratégiai döntések Fejet vagy Írást választani  Kifizetési függvények f 1 (Fej,Fej) = 1, f 1 (Fej,Írás) = -1, f 1 (Írás,Fej) = -1, f 1 (Írás,Írás) = 1 f 2 (Fej,Fej) = -1, f 2 (Fej,Írás) = 1, f 2 (Írás,Fej) = 1, f 2 (Írás,Írás) = -1  Nincs Nash-egyensúly pontja a játéknak. FejÍrás Fej(1,-1)(-1,1) Írás(-1,1)(1,-1) 2. 1.

60 Érmepárosítás-játék kevert bővítése “Randomization”  Megengedett, hogy a játékosok nem egy konkrét stratégiát választanak determinsztikusan, hanem szubjektív valószínűségek szerint véletlenül választják meg a stratégiájukat. Stochasztikus egyensúly állapot  p=1/2, q=1/2  Nincs több FejÍrás Fej(1,-1)(-1,1) Írás(-1,1)(1,-1) p 1 - p q1 - q 1. 2.

61 Érmepárosítás-játék elemzése legjobbválasz-leképezés segítségével

62 Bach-vagy-Stravinsky játék kevert bővítése

63 Várható kifizetés (expected payoff) pqp(1-q) (1-p)q(1-p)(1-q) T(p) B(1 – p) L(q)R(1 – q) 1. 2.

64 Megjegyzés - 1 Az 1-es játékos várható kifizetése ( p szerinti) lineáris függvény

65 Megjegyzés - 2

66 Nash tétele a Nash egyensúly létezéséről Minden véges játéknak van legalább egy Nash egyensúlypontja. Biz. 1. Astratégiai halmazok nem üres, kompakt (zárt és korlátos), és konvex halmazok 2. A (várható) kifizetési függvények folytonosak 3. Nikaido-Isoda tétel alkalmazása

67 Nash Equilibrium in Auctions

68 Auctions History of auctions  From Babylonia  To eBay  Auctions of spectrum In an “auction”, a good is sold to the party who submits the highest bid Types of auctions  Methods of bidding Sequential (auctions for works of art) Sealed envelopes  Price paid Highest bid Other bids (e.g. second highest bid)  The good/service itself Single unit Multiple units A game-theoretic analysis helps us to understand the consequences of various designs

69 Second-price sealed-bid auctions Background  Players’ valuations of the object v 1 >v 2 >…v n > 0  Each player i submits a (sealed) bid b i  Player i payoff is v i -b j, where b j is the highest bid submitted by a player other than i if either b i is higher than every other bid, or b i is at least as high as every other bid and the number of every other player who bids b i is greater than i. Otherwise player i ’s payoff is 0.

70 Second-price sealed-bid auctions – cont. ( b 1,b 2,…,b n )=( v 1,0,…,0) is a Nash equilibrium This game admits multiple Nash equilibria ( b 1,b 2,…,b n )=( v 1,v 2,…,v n ) is also a Nash equilibrium  In a second-price sealed-bid auction, a player’s bid equal to her valuation weakly dominates all her other bids.  This equilibrium is distinguished by the fact that every player’s action weakly dominates all her other actions

71 Explanation on Weakly Dominated Strategies – Player i ’s payoff

72 First-price sealed-bid auctions Background  Differs from second-price sealed-bid auction only in that the winner pay the price she bids, not the second highest bid  The game The players: n bidders, n >1 Actions: the sets of actions of each player is the set of possible bids (nonnegative numbers) Payoff: Player i payoff is v i -b j, if either b j is the higher than any other bid, or b i is at least as high as every other bid and the number of every other player who bids b i is greater than i. Otherwise player i ’s payoff is 0.

73 Nash equilibria of first-price sealed-bid auctions ( b 1,b 2,…,b n )=( v 2,v 2,…,v n ) is a Nash equilibrium The game admits multiple equilibria  In all Nash equilibria of the game, the winner is the player who values the subject the most (player 1)  In all Nash equilibria of the game, the two highest bids are the same, one of these bids are submitted by player 1, and the highest bid is at least v 2 and at most v 1  Any action profile satisfying these conditions is a Nash equilbrium ( b 1,b 2,…,b n )=( v 2,v 2,b 3 …,b n ) with b j ≤ v j for j=3,…,n as a “distinguished” Nash equilibria if bids are discrete (not continuous) values While both second-price and first-price auctions have many Nash equilibria, yielding a variety of outcome, their distinguished equilibria yield the same outcome  The object is sold to player 1 at the price v 2

74 Multiunit auctions Background  Many ( k ) units of an object are available  ( b 1,b 2,…,b k )-tuple as a bid  The player who submits the highest bid for any given unit obtains that unit Types of multiunit auctions  Discriminatory auction – the price paid for each unit is the winning bid for that unit  Uniform-price auction – the price paid for each unit is the same, equal to the highest rejected bid among all the bids for all units  Vickrey auction – a bidder who wins k objects pays the sum of the k highest rejected bids submitted by other bidders

75 An example of multiunit auctions Two-unit auction  Two units of an object is available  n bidders  Bidding Bidder i’ s valuation  v i for the first unit, w i for the second unit, v i > w i > 0 Two highest bids win Does player’s i’ s action of bidding v i and w i dominate all her other actions?

76 Analysis Discriminatory auction  All other players submit two bids of 0  ( b i (1),b i (2) ) where 0 < b i (1) < v i, 0 < b i (2) ) < w i would still be the winning bid, but by paying less!  The answer is NO Uniform-price auction  Suppose bidder j ≠ i has ( b j (1),0) where w i < b i (1 ) < v i and the rest submits two bids of 0  Bidder i wins one unit, and pays the price w i  If she replaces her bid of w i with a bid between 0 and w i then she pays a lower price  The answer is NO

77 Homework How about Vickrey auction?  The answer is YES, but how?


Letölteni ppt "Játékelmélet Trinh Anh Tuan Áttekintés Bevezetés Nem-kooperatív játékok Kooperatív játékok Alkalmazások."

Hasonló előadás


Google Hirdetések