Az előadás letöltése folymat van. Kérjük, várjon

Az előadás letöltése folymat van. Kérjük, várjon

Trinh Anh Tuan trinh@tmit.bme.hu Játékelmélet Trinh Anh Tuan trinh@tmit.bme.hu.

Hasonló előadás


Az előadások a következő témára: "Trinh Anh Tuan trinh@tmit.bme.hu Játékelmélet Trinh Anh Tuan trinh@tmit.bme.hu."— Előadás másolata:

1 Trinh Anh Tuan trinh@tmit.bme.hu
Játékelmélet Trinh Anh Tuan

2 Áttekintés Bevezetés Nem-kooperatív játékok Kooperatív játékok
Alkalmazások

3 Bevezetés Mi a játékelmélet Történeti áttekintés A játék komponensei
Többszemélyes döntéselmélet Racionális választások elmélete Történeti áttekintés Von Neumann és Morgenstein könyve John Nash munkája Modern játékelmélet és alkalmazásai A játék komponensei Játékosok (kettő, véges, végtelen) Stratégiák (tiszta, kevert) Kifizetési függvények (szimmetrikus, nem szimmetrikus) Információ (teljes, nem teljes, tökéletes, nem tökéletes) Az idő szerepe (statikus, dinamikus) A véletlen szerepe (determinisztikus, stochasztikus) A játék fajtái Nem-kooperatív játékok Kooperatív játékok

4 Nem-kooperatív játékok

5 Stratégiai játékok n véges Definíció G={S1, S2,…, Sn ; f1, f2, …, fn}
Játékosok halmaza N={1,2,…,n} n véges Stratégiahalmazok S1, S2,…, Sn Stratégiai döntések halmazai Szimmetria Kifizetési függvények fi: S → R, i=1,2,…,n G={S1, S2,…, Sn ; f1, f2, …, fn}

6 Jelölések

7 1. Példa: Fogoly dilemma 2. 1. A játék N V (-2,-2) (-10,-1) (-1,-10)
Játékosok a foglyok Stratégiai döntések Vall (V) Nem vall (N) Kifizetési függvények Évek a börtönben f1(N,N) = -2, f1(N,V) = -10, f1(V,N) = -1, f1(V,V) = -5 f2(N,N) = -2, f2(N,V) = -1, f2(V,N) = -10, f2(V,V) = -5 2. N V (-2,-2) (-10,-1) (-1,-10) (-5,-5) 1.

8 A fogoly-dilemma játékkal modellezhető szituációk
Együtt dolgozni egy projekten Kemény munkával Laza munkával Duopólium Magas ár Alacsony ár A fegyverkezési verseny A H-bombát gyártani Vagy nem

9 Házi feladat Kétnemű halak viselkedésének modellezése a fogoly-dilemma játék segítségével Minden halnak van egy preferált szerepe (H) és egy kevésbé preferált szerepe (L) H > L Ha két hasonló preferált szereppel rendelkező hal találkozik/párzik egymással (H+L)/2 S – minél nagyobb annak a valószínűsége, hogy találkozik egy új partnerrel, annál nagyobb az S. Mi az összefüggés H, L, és S között, hogy a problémát fogoly-dilemma játékkal modellezhető?

10 2. Példa: Bach vagy Stravinsky (Nemek harca)
A játék Játékosok: egy pár Stratégiai döntések Bach-ot vagy Stravinsky-t Kifizetési függvények Preferencia f1(Bach,Bach) = 2, f1(Bach,Stravinsky) = 0, f1(Stravinsky,Bach) = 0, f1(Stravinsky,Stravinsky) = 1 f2(Bach,Bach) = 1, f2(Bach,Stravinsky) = 0, f2(Stravinsky,Bach) = 0, f2(Stravinsky,Stravinsky) = 2 2. Bach Stravinsky (2,1) (0,0) (1,2) 1.

11 3. Példa: Érmepárosítás 2. 1. A játék Fej Írás (1,-1) (-1,1)
Játékosok Stratégiai döntések Fejet vagy Írást választani Kifizetési függvények f1(Fej,Fej) = 1, f1(Fej,Írás) = -1, f1(Írás,Fej) = -1, f1(Írás,Írás) = 1 f2(Fej,Fej) = -1, f2(Fej,Írás) = 1, f2(Írás,Fej) = 1, f2(Írás,Írás) = -1 2. Fej Írás (1,-1) (-1,1) 1.

12 fi(si*, s-i*) ≥ fi(si, s-i*)
Nash-egyensúly Definíció Legyen G={S1, S2,…, Sn ; f1, f2, …, fn} egy n-személyes stratégiai játék. Egy s* stratégiaprofilt Nash- egyensúlypontnak (NEP) nevezünk, ha fi(si*, s-i*) ≥ fi(si, s-i*) minden si-re és minden i=1,2,…,n esetén. Illusztrációk Fogoly dilemma Bach vagy Stravinsky Érmepárosítás

13 Fogoly-dilemma játék elemzése
2. A játék Játékosok a foglyok Stratégiai döntések Vall (V) Nem vall (N) Kifizetési függvények Elemzés (N,N) stratégiaprofil nem Nash-egyensúly, mert 1. játékosnak jobban jár, ha V stratégiát választ, feltéve, hogy 2. játékos nem változtatja a N stratégiáját. Hasonlóan, 2. játékosnak jobban jár, ha V stratégiát választ, feltéve, hogy 1. játékos nem változtatja a N stratégiáját. (N,V) és (V,N) sem Nash-egyensúly (V,V) a Nash-egyensúly Konklúzió A fogoly-dilemma játék létezik egyértelmű Nash-egyensúlya (V,V) stratégiaprofilban N V (-2,-2) (-10,-1) (-1,-10) (-5,-5) 1.

14 Bach-vagy-Stravinsky játék elemzése
A játék Játékosok: egy pár Stratégiai döntések Bach-ot vagy Stravinsky-t Kifizetési függvények Elemzés (Bach, Stravinsky) és (Stravinsky, Bach) nem Nash-egyensúlyok (Bach,Bach) és (Stravinsky, Stravinsky) Nash-egyensúlyok Konkluzió A Bach-vagy-Stravinsky játéknak létezik, és nem csak egy, Nash-egyensúlya 2. Bach Stravinsky (2,1) (0,0) (1,2) 1.

15 Érmepárosítás-játék elemzése
2. A játék Játékosok Stratégiai döntések Fejet vagy Írást választani Kifizetési függvények Elemzés (Fej, Fej) nem Nash-egyensúly, mert 2 játékos jobban jár, ha Irás-t választ, feltéve, hogy az 1 játékos Fej-nél marad Hasonlóan (Írás, Írás), (Fej, Írás), (Írás, Fej) stratégiaprofilok sem Nash-egyensúlyok Konklúzió Az érmepárosítás-játéknak nincs Nash-egyensúly pontja Fej Írás (1,-1) (-1,1) 1.

16 Megjegyzések Nash-egyensúly pontok száma egy játéknak
Vagy egyetlen egy (1) Vagy több (>1) Vagy nem létezik (0) Mindengyik lehetőség lehetséges Algoritmusok a Nash-egyensúly pontok megkeresésére (ha egyáltalán létezik)?!

17 fi(si, s-i) > fi(ti, s-i)
Dominált stragtégiák Definíció: A G={S1, S2,…, Sn ; f1, f2, …, fn} stratégiai játékban legyen az si, ti a i játékos két stratégiája. Azt mondjuk, hogy a si stratégia szigorúan dominálja a ti stratégiát, ha fi(si, s-i) > fi(ti, s-i) minden s-i-re. Hasonlóan az si stratégia gyengén dominálja a a ti stratégiát, ha fi(si, s-i) ≥ fi(ti, s-i)

18 Nash-egyensúly pontok megkeresése dominált stratégiák iteratív kiküszöbölésével
Fogoly dilemma játék 2. játékosnál V dominálja N-t 1. játékosnál V dominálja N-t (V,V) 2. játékosnál K szigorúan dominálja J-t A megmaradt játékban F szigorúan dominálja L-t A megmaradt játékban K szigorúan dominálja B-t (F,K) a játék NEP-je 2. N V (-2,-2) (-10,-1) (-1,-10) (-5,-5) 1. B K J F (1,0) (1,2) (0,1) L (0,3) (2,0) 1.

19 Házi feladat Feladat: Bizonyítsuk be, hogy véges játékok esetén, szigorúan domináns stratégiák kiküszöbölésének sorrendje nem befolyásolja a végeredményt. Feladat: Igaz-e az állítás, ha “szigorúan” helyett “gyengén”-t írunk?

20 Szigorúan dominált stratégiák
Bach-vagy-Stravinsky játék és érmepárosítás-játék Mind a két játékban, egyik játékosnak sincs szigorúan dominált stratégiája! Bach-vagy-Stravinsky játéknak viszont több Nash-egyensúly pontja van Megoldás?! Bach Stravinsky (2,1) (0,0) (1,2) Fej Írás (1,-1) (-1,1)

21 A legjobbválasz-leképezés
Definíció Legyen G={S1, S2,…, Sn ; f1, f2, …, fn} egy n-személyes stratégiai játék. Az i. játékos Bi : S → Si legjobbválasz-leképzés a következő: Megyjegyzés Bi(s) a i játékos legjobb stratégiát tartalmazza, ha a többi játékos a s-i csonka stratégiaprofilban szereplő stratégiákat játssza. Bi(s) akár üres is lehet

22 A legjobbválasz-leképezés
Definíció Az egész játékra vonatkozó B: S → S legjobbválasz-leképezést a következőképpen definiáljuk: Megjegyzés A definíció szerint

23 Házi feladat* Bizonyítsuk be, hogy akkor és csak akkor NEP-je a G játéknak, ha fixpontja a B legjobbválasz-leképezésnek, vagyis

24 Nash-egyensúly pontok megkeresése a legjobbválasz-leképezés segítségével
Bach vagy Stravinsky játék B1(Bach) = Bach, B1(Stravinsky) = Stravinsky B2(Bach) = Bach, B2(Stravinsky) = Stravinsky (Bach,Bach), (Stravinsky, Stravinsky) Nash-egyensúly pontok 2. Bach Stravinsky (2*,1*) (0,0) (1*,2*) 1.

25 Házi feladat Fogoly-dilemma és érmepárosítás játékoknál Nash-egyensúly pontoknak megkeresése a legjobbválasz-leképezés segítségével.

26 Az első előadás összefoglalása
Klasszikus játékok Fogoly dilemma Bach vagy Stravinsky Érmepárosítás Nash-egyensúly (NEP) Dominált stratégiák (szigorúan/gyengén) NEP-ek megkeresése (szigorúan) dominált stratégiák iteratív kiküszöbölésével A legjobbválasz-leképezés NEP-ek megkeresése a legjobbválasz-leképezésével

27 Példák a Nash-egyensúlyokról
2. előadás

28 Cournot oligopólium Oligopólium Cournot
Oligópóliumról akkor beszélünk amikor “néhány” vállalat van a piacon vagyis, a vállatok száma nagyobb, mint egy, de olyan kicsi, hogy nem lehet elhanyagolni az egyes szereplők döntései közötti kölcsönhatásokat. Cournot A vállalatok az termelési mennyiségről döntenek Inverz keresleti fv Minél nagyobb az össztermelés, annál kisebb lesz a termék ára

29 Cournot-oligopólium Általános modell

30 Cournot-oligopólium – folyt.
Cournot-oligopólium, mint egy játék Játékosok – a vállalatok Stratégiai döntések – a termelési volumene/mennyisége Kifizetési függvény – a profit A Cournot-duopólium játék Két meghatározó vállalat van Konstans egységár Lineáris inverz keresleti függvény

31 Cournot-duopólium játék

32 Cournot-duopólium játék elemzése
Az 1. vállalat profitja Az 1. vállalat legjobbválasz-leképezése

33 Cournot-duopólium játék elemzése
(q1*,q2*) stratégiaprofil NEP, ha q1* a legjobbválasza q2*-nak és q2* a legjobbválasza q1*-nak, vagyis Helyettesítve

34 Cournot-duopólium játék elemzése

35 Cournot-duopólium játék elemzése
A Cournot-duopólium játéknak létezik egyértelmű NEP-je Az termék ára egyensúlyi állapotban

36 Házi feladat

37 Betrand-oligopólium Általános modell

38 Betrand-oligopólium – folyt.
Betrand-oligopólium, mint egy játék Játékosok – vállalatok Stratégiai döntések – az ár Kifizetési függvények – a profit A Betrand-duopólium játék Két meghatározó vállalat van Konstans egységár Lineáris keresleti függvény

39 Betrand-duopólium játék

40 Betrand-duopólium játék elemzése
A i. játékos legjobbválasz-lepképezése

41 Megjegyzések a Cournot, Betrand, és Nash-féle egyensúlyokról
Cournot (közgazdász) 19. évszázad elején Cournot-féle “egyensúly” helyzet Betrand (matematikus) 19. évszázad végén Cournot munkájának kritikusa Betrand-féle “egyensúly” helyzet Nash Általánosítás

42 Megjegyzés az alkalmazásokról
P2P fájlcsere rendszerek elemzése Fogoly dilemma játékkal Fájl illetve hálózati erőforrások osztása, mint kooperáció Free-riding (büntetés, mint megoldás, de függ a P2P rendszer architekturájától is) White-washing (cheap pseudo-name) – quite open issue! Hálózati biztonság Támadások stratégiája Védekezések stratégiája Játékelméleti elemzés Módszertan Modellezés

43 Választási versenyhelyzetek elemzése – Hotelling-játék
Hotelling modellje Játékosok – a jelöltek Stratégiai döntések – a jelöltek “pozicionálása” Az nyer, aki a legtöbb szavazatot kapott Kifizetési függvény n ha egyedüli nyertes m ha első helyen szerepel (n – m) többi jelölttel együtt (0 < m < n) 0 ha vesztes

44 Példa – 3 jelölt esetén

45 Hotelling-játék elemzése 2 játékos (jelölt) esetén
Felező pozició (m: median favorite position) A szavazók favorit pozicióinak pontosan a fele legfeljebb m A szavazók favorit pozicióinak pontosan a fele legalább m Feltételezzük, csak egy olyan van! Az 1. jelölt legjobb válasza Szimmetrikus játék

46 Hotelling-játék elemzése – folyt.
(m,m) az egyetlen Nash-egyensúly To quote Hotelling, the game is “extremely simplified”, but “The competition for votes between the Republican and Democratic parties [in the United States] does not lead to clear drawing of issues, an adoption of two strongly contrasted positions between which the voter may choose. Instead, each party strives to make its platform as much like the other’s as possible.”

47 Alkalmazási lehetőségek
Pozícionálási feladatok Vevőkért harcolnak WLAN-oknál (konkurenciában részesülő) hot spotok pozícionálása (pl. reptéreken, várakozó termekben) Mobil szolgáltatóknál a bázis állomások helyezése, fedettségi terület (jelerősség) meghatározása

48 Házi feladat A Hotelling játék általánosítása több jelölt esetén
3 jelölttel Kimaradási lehetőséggel Belép és vesztes < kimarad < belép és nyertes Kérdés: Létezik-e NEP-je a játéknak, ha igen, melyek azok? A Hotelling játék általánosítása önjelölt esetén Játékosok: maguk a szavazó polgárok Önjelölés költsége c Kifizetési függvények x* a nyertes pozíciója x a szavazó favorit pozíciója Létezik-e NEP, mikor?

49 Nash-egyensúly létezéséről

50 Fixponttételek Brower-fixponttétel Kakutani-fixponttétel

51 Magyarázatok Halmazelmélet Felülről félig folytonosság? Kompaktság
zárt és korlátos Konvexitás Felülről félig folytonosság?

52 Felülről félig folytonosság
Definíció A Gf (az f gráfja) zárt

53 Házi feladat Legyen G=(N, (Si), (fi)) egy stratégiai játék, és minden 1 ≤ i ≤ N-re Bi(s-i) a legjobbválasz-leképezés. Bizonyítsuk be, hogy minden 1 ≤ i ≤ N-re, Bi(s-i) Nem üres,ha fi folytonos és Si halmaz kompakt Konvex ha továbbá fi konkáv függvény Si halmazán

54 Tétel a Nash egyensúly létezéséről
Nikaido-Isoda tétel. A G=(N, (Si), (fi)) stratégiai játéknak van Nash- egyensúly pontja, ha minden 1 ≤ i ≤ N-re Si egy véges dimenziós Euklédeszi tér nem üres, konvex és kompakt részhalmaza A kifizetési függvény fi Folytonos Konkáv a Si halmazon

55 Nikaido-Isoda tétel Bizonyítás vázlata
Legyen B: S → S az egész játékra legjobbválasz-leképzés Minden 1 ≤ i ≤ N-re, Bi(s-i) Nem üres, mert fi folytonos és Si halmaz kompakt Konvex mert fi konkáv függvény Si halmazán B gráfja zárt mert minden fi folytonos Kakutani-tétel szerint B-nek fixpontja van, amely NEP-je a játéknak

56 A legjobbválasz-leképezés
Definíció Legyen G={S1, S2,…, Sn ; f1, f2, …, fn} egy n-személyes stratégiai játék. Az i. játékos Bi : S → Si legjobbválasz-leképzés a következő: Megyjegyzés Bi(s) a i játékos legjobb stratégiát tartalmazza, ha a többi játékos a s-i csonka stratégiaprofilban szereplő stratégiákat játssza. Bi(s) akár üres is lehet

57 A legjobbválasz-leképezés
Definíció Az egész játékra vonatkozó B: S → S legjobbválasz-leképezést a következőképpen definiáljuk: Megjegyzés A definíció szerint

58 Stratégiai játékok kevert bővítése

59 Példa: Érmepárosítás 2. 1. Nincs Nash-egyensúly pontja a játéknak.
Játékosok Stratégiai döntések Fejet vagy Írást választani Kifizetési függvények f1(Fej,Fej) = 1, f1(Fej,Írás) = -1, f1(Írás,Fej) = -1, f1(Írás,Írás) = 1 f2(Fej,Fej) = -1, f2(Fej,Írás) = 1, f2(Írás,Fej) = 1, f2(Írás,Írás) = -1 Nincs Nash-egyensúly pontja a játéknak. 2. Fej Írás (1,-1) (-1,1) 1.

60 Érmepárosítás-játék kevert bővítése
“Randomization” Megengedett, hogy a játékosok nem egy konkrét stratégiát választanak determinsztikusan, hanem szubjektív valószínűségek szerint véletlenül választják meg a stratégiájukat. Stochasztikus egyensúly állapot p=1/2, q=1/2 Nincs több 2. q 1 - q Fej Írás (1,-1) (-1,1) p 1. 1 - p

61 Érmepárosítás-játék elemzése legjobbválasz-leképezés segítségével

62 Bach-vagy-Stravinsky játék kevert bővítése

63 Várható kifizetés (expected payoff)
2. pq p(1-q) (1-p)q (1-p)(1-q) L(q) R(1 – q) 1. T(p) B(1 – p)

64 Megjegyzés - 1 Az 1-es játékos várható kifizetése (p szerinti) lineáris függvény

65 Megjegyzés - 2

66 Nash tétele a Nash egyensúly létezéséről Minden véges játéknak van legalább egy Nash egyensúlypontja. Biz. 1. Astratégiai halmazok nem üres, kompakt (zárt és korlátos), és konvex halmazok 2. A (várható) kifizetési függvények folytonosak 3. Nikaido-Isoda tétel alkalmazása

67 Nash Equilibrium in Auctions

68 Auctions History of auctions
From Babylonia To eBay Auctions of spectrum In an “auction”, a good is sold to the party who submits the highest bid Types of auctions Methods of bidding Sequential (auctions for works of art) Sealed envelopes Price paid Highest bid Other bids (e.g. second highest bid) The good/service itself Single unit Multiple units A game-theoretic analysis helps us to understand the consequences of various designs

69 Second-price sealed-bid auctions
Background Players’ valuations of the object v1>v2>…vn> 0 Each player i submits a (sealed) bid bi Player i payoff is vi-bj , where bj is the highest bid submitted by a player other than i if either bi is higher than every other bid, or bi is at least as high as every other bid and the number of every other player who bids bi is greater than i. Otherwise player i’s payoff is 0.

70 Second-price sealed-bid auctions – cont.
(b1,b2,…,bn)=(v1,0,…,0) is a Nash equilibrium This game admits multiple Nash equilibria (b1,b2,…,bn)=(v1,v2,…,vn) is also a Nash equilibrium In a second-price sealed-bid auction, a player’s bid equal to her valuation weakly dominates all her other bids. This equilibrium is distinguished by the fact that every player’s action weakly dominates all her other actions

71 Explanation on Weakly Dominated Strategies – Player i’s payoff

72 First-price sealed-bid auctions
Background Differs from second-price sealed-bid auction only in that the winner pay the price she bids, not the second highest bid The game The players: n bidders, n >1 Actions: the sets of actions of each player is the set of possible bids (nonnegative numbers) Payoff: Player i payoff is vi-bj , if either bj is the higher than any other bid, or bi is at least as high as every other bid and the number of every other player who bids bi is greater than i. Otherwise player i’s payoff is 0.

73 Nash equilibria of first-price sealed-bid auctions
(b1,b2,…,bn)=(v2,v2,…,vn) is a Nash equilibrium The game admits multiple equilibria In all Nash equilibria of the game, the winner is the player who values the subject the most (player 1) In all Nash equilibria of the game, the two highest bids are the same, one of these bids are submitted by player 1, and the highest bid is at least v2 and at most v1 Any action profile satisfying these conditions is a Nash equilbrium (b1,b2,…,bn)=(v2,v2,b3…,bn) with bj ≤ vj for j=3,…,n as a “distinguished” Nash equilibria if bids are discrete (not continuous) values While both second-price and first-price auctions have many Nash equilibria, yielding a variety of outcome, their distinguished equilibria yield the same outcome The object is sold to player 1 at the price v2

74 Multiunit auctions Background Types of multiunit auctions
Many (k) units of an object are available (b1,b2,…,bk)-tuple as a bid The player who submits the highest bid for any given unit obtains that unit Types of multiunit auctions Discriminatory auction – the price paid for each unit is the winning bid for that unit Uniform-price auction – the price paid for each unit is the same, equal to the highest rejected bid among all the bids for all units Vickrey auction – a bidder who wins k objects pays the sum of the k highest rejected bids submitted by other bidders

75 An example of multiunit auctions
Two-unit auction Two units of an object is available n bidders Bidding Bidder i’s valuation vi for the first unit, wi for the second unit, vi > wi > 0 Two highest bids win Does player’s i’s action of bidding vi and wi dominate all her other actions?

76 Analysis Discriminatory auction Uniform-price auction
All other players submit two bids of 0 (bi(1),bi(2)) where 0 < bi(1) < vi , 0 < bi(2)) < wi would still be the winning bid, but by paying less! The answer is NO Uniform-price auction Suppose bidder j ≠ i has (bj(1),0) where wi < bi(1) < vi and the rest submits two bids of 0 Bidder i wins one unit, and pays the price wi If she replaces her bid of wi with a bid between 0 and wi then she pays a lower price

77 Homework How about Vickrey auction? The answer is YES, but how?


Letölteni ppt "Trinh Anh Tuan trinh@tmit.bme.hu Játékelmélet Trinh Anh Tuan trinh@tmit.bme.hu."

Hasonló előadás


Google Hirdetések