Pókerkártya játék algoritmusa

Slides:



Advertisements
Hasonló előadás
Logók és logfájlok Az online közönségmérés kihívásai.
Advertisements

Meteorológiai Előrejelzés Adatbányászati Támogatással Putnoki Gyula GTK ISZAM II.évf. Társszerzők: az ISZAM-os Meteor-team TDK-konferencia 2007 Gödöllő.
Szent István Egyetem Általános Kutatásmódszertan Doktori (PhD) kurzusa
Játékelmélet Gyáva nyúl.
Az üzleti rendszer komplex döntési modelljei (Modellekkel, számítógéppel támogatott üzleti tervezés) Hanyecz Lajos.
Az elemzés és tervezés módszertana
96 csatornás QAM modulátor 96 csatornás QAM modulátor Kötetlen beszélgetés arról, hogy milyen irányba fejlődik a híradástechnika Készítette: Zigó József.
14. Az infláció kezelésének lehetséges módjai
Pac-Man játék tanulása Megerősítéses Tanulással Mesterséges Intelligencia algoritmusok tesztelése játékokon Gyenes Viktor Eötvös Loránd Tudományegyetem.
Képességszintek.
4. Kreatív döntéshozatal
INFORMÁCIÓRENDSZEREK FEJLESZTÉSÉNEK IRÁNYÍTÁSA.. Alkalmazás - projekt Alkalmazás - a vállalat tökéletesítésére irányuló új munkamódszer projekt - az új.
Döntés-előkészítő változatelemzések egy jogosultság kezelő alkalmazás Identity Management rendszerré alakítása kapcsán Készítette: Papp Zsuzsanna Belső.
Lapcsere stratégiák FIFO, LRU, OPT, SC
Készítette: Bajkó Balázs Hullár Péter
Hálózati Biológia A sejt funkcionális működésének megértése.
Matematika Eredete és története Kaszás Tamás.
A matematikai kompetencia jellemzői, fejlesztése, módszerei
Fuzzy rendszerek mérnöki megközelítésben I
Kétszemélyes játékok Előadó: Nagy Sára.
Gazdálkodási modul Gazdaságtudományi ismeretek II. Vezetés és kommunikációs ismeretek KÖRNYEZETGAZDÁLKODÁSI MÉRNÖKI MSc TERMÉSZETVÉDELMI MÉRNÖKI MSc.
Online hasonlóságelemzések: Online hasonlóságelemzések: Totó-automata?! Pitlik László, SZIE Gödöllő (Forrás: My-X.hu Hírlevél) október INNOCSEKK.
Statisztikai alapok Egy kis matematika nem csak fizikához… Ezeket a lapokat hamarosan átdolgozzuk. A benne foglalt ismeretek szükségesek a fizikai mérési.
Szoftvertechnológia Ember-gép rendszerek. Mit értünk rendszer alatt? Kapcsolódó komponensek halmaza – egy közös cél érdekében működnek együtt A rendszer.
A döntés Dr. Ternovszky Ferenc: Nemzetközi menedzsment európai szemmel
Miért hozzuk a döntést, mi a cél?
Bizonytalanság melletti döntések
Orosházi Evangélikus Általános Iskola és Gimnázium
Corvinus Egyetem 1 Az önerős vállalati fejlesztő tevékenység és a vállalat köré szerveződő hálózatok tevékenységének összehangolása MTA Vezetés- és Szervezéstudományi.
Szervezeti kultúra A szervezeti kultúrát meghatározó kategóriák
Készítette: Gergó Márton Konzulens: Engedy István 2009/2010 tavasz.
Gépi tanulás Tanuló ágens, döntési fák, általános logikai leirások tanulása.
Adatbányászat és WEB2 Németh Bottyán Web2.0 Symposium.
Problémás függvények : lokális optimalizáció nem használható Globális optimalizáció.
Matematika I. 1. heti előadás Műszaki Térinformatika 2013/2014. tanév szakirányú továbbképzés tavaszi félév Deák Ottó mestertanár.
Kötvényárazási hibák intelligens javítóalgoritmusának tervezése és fejlesztése GELLÉN ÁGNES IUFQ58.
2. Döntéselméleti irányzatok
Controlling tevékenységek kritériumai Jelentésdialógus A jelentésben fontos tényezők ELŐADÁS ÁTTEKINTÉSE.
Az osztály tanulmányi előmenetelének tanulmányozása vizsgálata! Függvények magyarázata!
Az üzleti rendszer komplex döntési modelljei (Modellekkel, számítógéppel támogatott üzleti tervezés) II. Hanyecz Lajos.
Az elvben figyelembe veendő kapcsolási rendek számáról képet kaphatunk, ha felmérjük az adott N és M áramok és egy-egy fűtő- és hűtőközeg.
XXI. Századi Közoktatás (fejlesztés, koordináció) II. szakasz TÁMOP / VÁLTOZTATÁSI TERVEK A MATEMATIKAÉRETTSÉGI VIZSGAKÖVETELMÉNYEKBEN.
Mesterséges Intelligencia 1. Eddig a környezet teljesen megfigyelhető és determinisztikus volt, az ágens tisztában volt minden cselekvésének következményével.
WP-Dyna: tervezés és megerősítéses tanulás jól tervezhető környezetekben Szita István és Takács Bálint ELTE TTK témavezető: dr. Lőrincz András Információs.
Megerősítéses tanulás 5. előadás
Megerősítéses tanulás 2. előadás
Táblázatkezelés Képletek és függvények. Képletek A képletek olyan egyenletek, amelyek a munkalapon szereplő értékekkel számításokat hajtanak végre. A.
A TŐKEKÖLTSÉG. Tőkeköltség a tőkepiacról  Tőkepiac: pénzt cserélünk pénzre  Pl. pénzt adok egy vállalatnak valamilyen jövőbeli (várható) kifizetésekért.
Kinetikus Monte Carlo  Bevezetés  Véletlen bolyongás  Residence time algoritmus.
Mesterséges intelligencia 8. Stratégiai játékok A játék kimenetelére a játékosoknak ellenőrizhető módon van befolyásuk. Pl.: sakk, dáma, póker stb. A.
Csapó Benő SZTE Neveléstudományi Intézet MTA-SZTE Képességfejlesztés Kutatócsoport A PISA céljai, tudományos alapjai.
Miből áll a tehetség? William Stern (1871–1938) hamburgi egyetem Intelligencia kvóciens: IQ =(mentális kor / biológiai kor )*100.
Kontinuum modellek 1.  Bevezetés a kontinuum modellekbe  Numerikus számolás alapjai.
Az amőba játék algoritmusa. A játék  Az amőba játék, vagy ahogy Magyarországon sokan ismerik, az ötödölő, az egyik legnépszerűbb logikai játék. Sikerét.
A szem színe készítette: Szekeres Kinga. Mitől függ a szem színe? A szem színéért a szivárvámnyhártya pigmentjei a felelősek. A világoskék és a sötétbarna.
Bevezetés a játékelméletbe
Póker.
Programozás alapjai Készítette: Csiszár Nóra Anita
Póker kártyajáték algoritmusa
Eredetileg a statisztika matematikai eszközöket igénybe vevő államháztartástant jelentett, vagyis azon módszerek gyűjteményét és elméletét, amelyek segítségével.
A fej vagy írás játék algoritmusa
Sakk algoritmus.
Számítógépes algoritmusok
Márkakereskedői helyzetkép
Matematika I. BGRMA1GNNC BGRMA1GNNB 7. előadás.
Mérések adatfeldolgozási gyakorlata vegyész technikusok számára
A mesterséges neuronhálók alapjai
Készletek – Állandó felhasználási mennyiség (folyamatos)
Készletek - Rendelési tételnagyság számítása -1
Algoritmusok és Adatszerkezetek I.
Előadás másolata:

Pókerkártya játék algoritmusa

Póker out számítás A legnagyobb problémát (főleg az online póker során) az jelenti, hogy kevés az időnk a matematikai műveletekre, számolásokra. Mindössze az outok (megmutatja az esélyét, hogy milyen gyakran jön turnben vagy riverben egy várt lap) vagy a biztos nyerést jelentő [nut]? lap érkezési esélyének számítására van időnk optimális esetben. A számítás tehát csak annyit árul el, mennyi eséllyel javul a meglévő lapunk Jó lap érkezési esélyének kiszámítása: Számunkra jó outok száma × 2 × hátralévő lapok száma

Matematika és póker A matematika pókerben való hasznosítása tehát több korlátba ütközik. A biztos valószínűség kiszámítása jelenlegi tudásunk szerint szinte lehetetlen, csak egyszerű műveletek elvégzésére van lehetőségünk. A komolyabb matematikai műveletek alkalmazása a póker játék során azért is nehézkes, mert a matematikai képletek, algoritmusok nem „számolnak” az ellenfelek irracionális vagy váratlan döntéseivel. Az értékelési folyamat nagyon bonyolult, és a mostani törvényszerűségek szerint nem lehet egzakt algoritmusokkal leírni. A pókerben tehát nincs is pontos valószínűség, mert az ellenfelek is irracionális vagy intuitív döntéseket hoznak gyakran, amiket racionális eszközökkel nehéz megfogni. A pókerben tehát inkább a játékrutin és az outok tippelése segíthet.

Kanadai és finn kutatók lényegében verhetetlen pókerjátékost konstruáltak. A matematikusok most egy valós játék megoldásáig jutottak el – a Texas hold’em póker HULHE nevű változatát vizsgálták meg. Michael Bowling és társai egy viszonylag új algoritmussal estek neki a feladatnak, mely a CFR+ nevet viseli (counterfactual regret minimization – kb. "utólagos megbánás minimalizálása", a + pedig az eredeti algoritmus fejlesztett változatára utal). Ez az algoritmus azonban nem maga a nyerő stratégia volt, hanem egy tanulási eljárás, amely egy sor gépi játék lejátszása során a teljesen véletlenszerű működéstől indulva finomította a viselkedését.

Végül nem sokkal több, mint 1500 edzőmérkőzés után lényegében legyőzhetetlenné vált, miközben teljes természetességgel belejött a blöffölésbe is. A tanulás lényegét az adta, hogy az algoritmus minden játék végén kiértékelte a döntéseit, és ha valami ballépésnek bizonyult, valamekkora “megbánásértéket” rendelt hozzá. A stratégia (ellenfél általi) “kihasználhatóságát” folyamatosan mérték, míg egy olyan kicsiny érték alá szorult, hogy statisztikai értelemben verhetetlennek nyilváníthatták. Az algoritmus legnagyobb kihívása az volt, hogy átlássa a játék lehetséges állapotait, melyek száma 1017 nagyságrendű. Ez ugyan nagyságrendekkel kevesebb a dámajátékban kapott állapotszámhoz képest, a véletlenszerűség azonban rengeteg többletszámítást igényel, mivel az állapotok bizonytalanságot is tartalmaznak.