Az előadás letöltése folymat van. Kérjük, várjon

Az előadás letöltése folymat van. Kérjük, várjon

Pac-Man játék tanulása Megerősítéses Tanulással Mesterséges Intelligencia algoritmusok tesztelése játékokon Gyenes Viktor Eötvös Loránd Tudományegyetem.

Hasonló előadás


Az előadások a következő témára: "Pac-Man játék tanulása Megerősítéses Tanulással Mesterséges Intelligencia algoritmusok tesztelése játékokon Gyenes Viktor Eötvös Loránd Tudományegyetem."— Előadás másolata:

1 Pac-Man játék tanulása Megerősítéses Tanulással Mesterséges Intelligencia algoritmusok tesztelése játékokon Gyenes Viktor Eötvös Loránd Tudományegyetem Neural Information Processing Group

2 Gyenes Viktor - ELTE 2 Mesterséges Intelligencia – játékok A játékok valós döntéshelyzeteket modelleznek  Hasonló megoldási módszerek szükségesek  Jó tesztfeladatok MI algoritmusok fejlesztésére  Könnyen demonstrálható, magáért beszélő eredmény  Vannak sikertörténetek (pl. backgammon, sakk) Miért Pac-Man?  Közepes nehézségi szint Nem túlságosan egyszerű, de azért még kezelhető bonyolultság  Nemzetközi verseny lett meghirdetve  Kezdeti sikereink vannak…

3 Gyenes Viktor - ELTE 3 Megerősítéses Tanulás Népszerű tanulási keretrendszer  Környezetben tevékenykedő ügynök Megfigyeléseket kap a környezettől Akciókat választhat amik befolyásolják az állapotát Büntetéseket / jutalmakat kap visszajelzésként  Felügyelet nélküli tanulás Döntési mechanizmus: hosszú távú összjutalom maximalizálása  Kiforrott matematikai alapok Konvergencia tételek a tanulási folyamatra Újabb eredmények komplex feladatokra is alkalmazhatóvá teszik, hatékony algoritmusok

4 Gyenes Viktor - ELTE 4 Miért nehéz a feladat? – Megoldás? Brute-force megoldás:  Minden lehetséges állapotra tanuljuk meg a helyes döntést!  Hihetetlenül nagy állapottér… Pl. sakk: 8x8-as tábla, minden mezőn 12 féle bábu, vagy üres: ≈ Általánosítás szükséges  Magasabb szintű leírás (fontos észleleteket leíró változók)  Feladat struktúra figyelembe vétele Az állapottér változók direktszorzata, közöttük kevés függés  A tanult tapasztalatok hasznosítása eddig nem látott állapotban Mik a jó állapotleíró változók? Hogyan találjuk meg?  A Mesterséges Intelligencia nagy kérdései…

5 Gyenes Viktor - ELTE 5 Pac-Man verseny Feladat: a gép irányítsa az embereknek írt játékot!  Megfigyelés: a képernyő  Akciók: billentyűk nyomogatása Képfeldolgozás szükséges az állapot kinyeréséhez Döntés: magas szintű megfigyelések és akciók  Pl. szellemek távolsága; mozgás a legközelebbi pötty felé, stb.

6 Gyenes Viktor - ELTE 6 Eredmények Az első pályán átlagos humán teljesítmény elérése!  egy korábbi verzióval; szabály alapú vezérlést tanuló rendszer (Szita & Lőrincz, JAIR 2007) A jelenlegi verzió fejlesztés alatt áll  Egyelőre szabály alapú kézzel drótozott viselkedés  Terv: helyzet-értékelés alapú előretekintő rendszer Köszönöm a figyelmet!


Letölteni ppt "Pac-Man játék tanulása Megerősítéses Tanulással Mesterséges Intelligencia algoritmusok tesztelése játékokon Gyenes Viktor Eötvös Loránd Tudományegyetem."

Hasonló előadás


Google Hirdetések