Játékelméleti alapfogalmak előadás

Slides:



Advertisements
Hasonló előadás
Lineáris egyenletrendszerek
Advertisements

Potenciál játékok A játékoknál minden játékosnak saját nyereménye van és azt kívánják maximálni. A potenciál játékoknál létezik egy V(s1, …, sN) potenciálfüggvény,
Készítette: Kosztyán Zsolt Tibor
Evolúciós potenciál játékok
Játékelmélet oktatása a középiskolában
Adatbázisrendszerek elméleti alapjai 2. előadás
Az együttműködés természete Szabó György MTA Műszaki Fizikai és Anyagtudományi Kutatóintézet H-1525 Budapest, POB. 49. Honlap:

Evolúciós játékelmélet előadás
Készítette: Szinai Adrienn
A megbízó-ügynök modell (1)
Függvények Egyenlőre csak valós-valós függvényekkel foglalkozunk.
MI 2003/9 - 1 Alakfelismerés alapproblémája: adott objektumok egy halmaza, továbbá osztályok (kategóriák) egy halmaza. Feladatunk: az objektumokat - valamilyen.
MI 2003/ A következőkben más megközelítés: nem közvetlenül az eloszlásokból indulunk ki, hanem a diszkriminancia függvényeket keressük. Legegyszerűbb:
Kötelező alapkérdések
Kalman-féle rendszer definíció
Matematika II. 2. előadás Geodézia szakmérnöki szak 2012/2013. tanév Műszaki térinformatika ágazat őszi félév.
Illés Tibor – Hálózati folyamok
Prímtesztelés Témavezető: Kátai Imre Komputeralgebra Tanszék Nagy Gábor:
Térbeli niche szegregáció kétfoltos környezetben
Az együttműködés előnyei és hátrányai: játékelméleti elemzés
4. VÉGES HALMAZOK 4.1 Alaptulajdonságok
Operációkutatás szeptember 18 –október 2.
Játékelmélet Nash, dominancia.
Lineáris programozás Modellalkotás Grafikus megoldás Feladattípusok
Operációkutatás Kalmár János, Hiperbolikus és kvadratikus programozás.
OPERÁCIÓKUTATÁS Kalmár János, 2011 Tartalom Több lineáris célfüggvényes LP Tiszta egészértékű LP.
Differenciál számítás
Kis-Duna Csoport 2014 Üdvözöljük! Játék
Regresszióanalízis 10. gyakorlat.
MATEMATIKA ÉS INFORMATIKA I.
Fogolydilemma (3. előadás)
Evolúciósan stabil stratégiák előadás
Dinamikus klaszterközelítés Átlagtér illetve párközelítés kiterjesztése N játékos egy rácson helyezkedik el (periodikus határfeltétel) szimmetriák: transzlációs,
Fogolydilemma játékok három stratégiával önkéntes fogolydilemma játék Nyereménymátrix: A három stratégia ciklikusan dominálja egymást: C legyőzi L-t L.
1 Ismételt fogolydilemma játék sztochasztikus reaktív stratégiákkal 4. előadás Axelrod számítógépes versenyének megismétlése A nyereménymátrix és a stratégiák:
Ismételt fogolydilemma játék sztochasztikus reaktív stratégiákkal. 4
Miért hozzuk a döntést, mi a cél?
Az Alakfelismerés és gépi tanulás ELEMEI
Sipos Viktória & Motyovszki Gergő
Scenáriók készítése Dr. Kollár József Magyar Coachszövetség Közhasznú Alapítvány.
Játékelmélet Kovács Dániel László Intelligens Rendszerek kutatócsoport
Érték és etika a szociális munka gyakorlatában / F. Loewenberg-R
Lineáris programozás.
Lineáris programozás Elemi példa Alapfogalmak Általános vizsg.
Versengő társulások Mi történik egy olyan térbeli modellben, ahol sok stratégia létezik? Lokálisan csak a stratégiák kis hányada lehet jelen. => az evolúciós.
A differenciálszámtás alapjai Készítette : Scharle Miklósné
Hernyák Zoltán Programozási Nyelvek II.
Henkin-Hintikka játék (részben ismétlés) Alapfelállás: -Két játékos van, Én és a Természet (TW képviseli). - A játék tárgya egy zárt mondat: P. - Választanom.
3. Előadás: Döntés bizonytalanság mellett
Szűrés A rosszul informált fél lehetőségei a jobban informált fél ösztönzésére.
Játékelmélet - bevezetés
1. MATEMATIKA ELŐADÁS Halmazok, Függvények.
1 Vektorok, mátrixok.
Dr. Bánkuti Gyöngyi Klingné Takács Anna
Stratégiai játékok. Mit nevezünk stratégiai játéknak? Az ilyen típusú játékokban a játékosok megadott szabály szerint lépnek. Általában kötelező lépni.
Dodekaéder Hamilton köre
előadások, konzultációk
Valószínűségszámítás II.
Komplex rendszerek – Evolúciós modellek
MI 2003/8 - 1 Alakfelismerés alapproblémája: adott objektumok egy halmaza, továbbá osztályok (kategóriák) egy halmaza. Feladatunk: az objektumokat - valamilyen.
1 Relációs kalkulusok Tartománykalkulus (DRC) Sorkalkulus (TRC) - deklaratív lekérdezőnyelvek - elsőrendű logikát használnak - relációs algebra kifejezhető.
Oligopólium Monopolisztikus verseny A piaci koncentráció mérése
Megerősítéses tanulás 2. előadás
Mesterséges intelligencia 8. Stratégiai játékok A játék kimenetelére a játékosoknak ellenőrizhető módon van befolyásuk. Pl.: sakk, dáma, póker stb. A.
Bevezetés a játékelméletbe
Játékelméleti megközelítés Oligopol piacok
Komplex rendszerek – Evolúciós modellek
Miért egyre bonyolultabb az elektronikus bizonylatok kezelése?
Gazdaságinformatikus MSc
Előadás másolata:

Játékelméleti alapfogalmak 2. előadás Mátrixjátékok Két játékos, x és y, egyszerre és egymástól függetlenül választ az n illetve m döntési lehetőségek közül (továbbiakban n=m), amiket egységvektorokkal jelölve: Nyereménymátrixban aij az x játékos nyereménye, ha Ő az i-dik, társa pedig a j-dik stratégiát választja. Hasonló igaz y játékosra. Nyeremények:

a tiszta stratégiák általánosítása (mindkét játékos esetén) Kevert stratégiák: a tiszta stratégiák általánosítása (mindkét játékos esetén) Ezt az (n-1) dimenziós alteret hívjuk szimplexnek. Valószínűségi értelmezés: az x játékos exj valószínűséggel választja a j-ik stratégiát Populációs értelmezés: x és y társulás N→∞ egyedből áll és tagjaik egymás ellen játszanak. Az x társulás tagjainak exj hányada választja a j-ik stratégiát, ill. ue. y-ra A nyeremények matematikai alakja változatlanul: Valószínűségi értelmezés (nyeremény várható értéke):

További fogalmak: Szigorú Nash-egyensúly esetén csak egyenlőtlenség lehet. NE esetén mindkét játékos elégedett, mert az adott körülmények (társa stratégiája) mellett maximális nyereményt ért el. Ez a játékelméleti javallat. (sx(P) ,sy(P)) Pareto-optimális: ha új stratégia-pár (vagy -profil) választásával egyik játékos jövedelme sem növekedhet a másik kárára. (Nem igazi „optimum”, mert sok ilyen állapot létezhet!)

Példák 1. Harmónia játék Egy NE: (1,1) és ez PO Két NE: (1,1) és (0,0) a főátlóban, Az első szigorú NE és PO Két ekvivalens NE: (1,1) és (1,1) Mindkettő PO Két Nash-egyensúly: (4,2) és (2,3) mindkettő PO 2. Koordinációs játék 3. Nemek háborúja

4. Fogolydilemma 5. Héja-galamb (vagy Gyáva nyúl vagy Hólapátolás) Nash-egyensúly: héja-galamb, galamb-héja, kevert stratégiapár 6. Kő-papír-olló játék

A dominált stratégiák sorozatos elhagyása Nash-egyensúlyhoz vezet. NE általánosítása N játékosra: egyik játékos számára sem előnyös, ha egyoldalúan eltér a javallott stratégia-profiltól. Nash-tétel: Minden normál (mátrix) játékban létezik (legalább egy) Nash-egyensúlyi állapot. Normál játék: kétszemélyes mátrixjáték általánosítása n (véges) szereplőre, akik véges számú tiszta stratégiával rendelkeznek. A dominált stratégiák sorozatos elhagyása Nash-egyensúlyhoz vezet. Több Nash-egyensúly esetén további kritériumok kellenek. Például: - előnyt élvez az, amelyik Pareto optimális vagy ahol az össznyeremény a legmagasabb. - Kockázati dominancia minimalizálása (Harsányi-Selten): Feltételezzük, hogy partnerünk azonos valószínűséggel választ a lehetséges stratégiái közül, és ennek tudatában választjuk ki a magasabb jövedelmet biztosító döntésünket. A NE-ok száma gyorsan növekszik a stratégiák számával (a játékosok számával pedig exponenciálisan növekszik). Véletlen nyeremények esetén kb. 1/3 valószínűséggel dilemma helyzet.

Nash-egyensúly meghatározása 1.) Dominált stratégiák elhagyása működik, ha csak egy tiszta NE létezik. 2.) A nyereménymátrixban sorról-sorra megkeressük az x játékos maximális nyereményét és ellenőrizzük, hogy az adott stratégia-pár maximális nyereményt biztosít-e y számára, ha x ezt választaná. Ha igen, akkor NE. Házi feladat 2.1. Keresd meg a tiszta NE-okat az alábbi mátrixjátékban: 3.) A kevert stratégiák körében is meg kell keresni a NE-t, különösen ha a fenti eljárások sikertelenek voltak.

Héja-galamb játék kevert Nash-egyensúlya: v haszonért marakodnak, de a „héják” egymásnak c kárt tudnak okozni. x játékos nyereménye: Hasonlóan kapjuk:

Lokális maximum keresése a paraméter-tartomány belsejében (0<p,q<1): Ebből következik, hogy A végeredmény egy szimmetrikus megoldás: A három NE a Héja-Galamb játékban:

Belső NE meghatározása variációszámítással szimmetrikus mátrixjátéknál Az x és y játékosok a saját nyereményüket maximálják az xi ill. yi értékek optimális megválasztásával úgy, hogy a normálás is teljesüljön. A nyeremények: Variációszámítás: Keressük meg az függvények lokális szélsőértékét, majd a λx és λy paraméterek (Lagrange multiplikátorok) értékét válasszuk meg úgy, hogy teljesüljön a normálás.

Azaz, A differenciálás után kapjuk: ami vektoros jelölésmódban így írható fel: Az A baloldali inverzével szorozva megkapjuk a megoldást, azaz λx=λy=1/Ω (Ω a normálási együttható). Ellenőrizni kell: - az xi és yi együtthatók részei-e a szimplexnek? ha nem, akkor tiszta NE-t kell keresni - a nyeremény tényleg lokális maximum

Zéró vagy állandó összegű kétszemélyes játékok Ezzel kezdődött a játékelmélet Az állandó összegű játék zéró összegű játékká alakul, ha minden nyereményt csökkentünk az átlaggal. Választásunkat ez nem módosítja. Nyeremény bimátrix formában Neumann: nem jó, ha a maximális nyereményt célozzuk meg, mert a többiek választhatnak olyan stratégiát, ami számunkra nagyon hátrányos. Javaslat: minimax stratégia, vagyis azt a stratégiát válasszuk, ahol a minimális nyereményünk a legnagyobb. Kérdés: mi a minimax stratégia a fenti példánál, és mindez hogyan néz ki az ellenfél szempontjából? (nyeregpont analógia)

2x2-es szimmetrikus mátrix játék Társadalmi dilemmák 2x2-es szimmetrikus mátrix játék Mindegyik játékos az alábbi két (tiszta) stratégia valamelyikét követi: : D = Defector = élősködő, vagy : C = Cooperator = önzetlen P: Punishment for mutual defection T: Temptation to choose defection S: Sucker’s payoff R: Reward for mutual cooperation Nyereménymátrix: R > P : kölcsönös C előnyben. Mégis lehet két ok arra, hogy D-t válasszunk: - Ha T>R, akkor megéri az élősködést választani önzetlen társunkkal szemben, vagyis a CC választás instabil - Ha S<P, akkor nem éri meg önzetlennek lenni élősködő társunkkal szemben, vagyis a DD stratégiapár NE. Átskálázott nyeremény: P=0; R=1; (A → α A + β, α > 0) Fogolydilemma: T>1; S<0; NE ≡ „társadalmi tragédia” Szarvasvadászat: T<1; S<0; Héja-Galamb: T>1; 0<S;

Adományozó játék a Fogolydilemma mai (modern) változata Két játékos, x és y, egymástól függetlenül dönt arról, hogy hajlandó-e c (>0) költséget befizetni, hogy társa b (>c) összeget kapjon. Ha döntésük csak igen és nem lehet, akkor a nyereménymátrix: A nyeremények átskálázásával kapjuk: Ez egy egyparaméteres nyereménymátrix.

Társadalmi dilemmák a T-S paramétertérben Kétszemélyes, kétstratégiás, szimmetrikus mátrixjátékok, ha Optimális átlagos nyeremény: R=1 , vagy ismételt játéknál lehet Nash-egyensúly (CD → DC → CD → DC …. ): (T+S)/2

Házi feladat 2.2. Határozzuk meg a (kevert) Nash-egyensúlyt az alábbi két mátrixjátékban: 2.3. A Kisebbségi játékban (Minority game) az N számú (páratlan) játékos mindegyike két lehetőség között választ egyszerre egymástól függetlenül [pl. vesz vagy elad, a jobb- vagy baloldali úton megy A-ból B-be, elmennek-e este az El Farol Bárba (Santa Fe) ír zenét hallgatni vagy otthon maradnak]. A választás után a kisebbséghez tartozók számszerűsített nyereménye +1, a többséghez tartozóké pedig -1. Hány Nash-egyensúly létezik ebben a játékban? 2.4. Ellenőrizzük, hogy van-e kevert Nash-egyensúly a 2x2-es szimmetrikus játékban (1,0,T,S) paraméterezésnél a szarvas vadászat (stag hunt) tartományban. 2.5. Sorolj fel 10 élethelyzetet, amivel naponta találkozhatunk és többé-kevésbé emlékeztet a Fogolydilemmára, az Adományozó vagy a Közlegelő játékra, ami az Adományozó játék N-szereplős változata!