Pac-Man játék tanulása Megerősítéses Tanulással Mesterséges Intelligencia algoritmusok tesztelése játékokon Gyenes Viktor Eötvös Loránd Tudományegyetem.

Slides:



Advertisements
Hasonló előadás
MESTERSÉGES INTELLIGENCIA (ARTIFICIAL INTELLIGENCE)
Advertisements

5. hét: Solow-modell Csortos Orsolya
Korai fejlesztés a bölcsődénkben
A felsőoktatási minőségbiztosítás európai A felsőoktatási minőségbiztosítás európai sztenderdjei Szántó Tibor Magyar Felsőoktatási Akkreditációs Bizottság.
I. AZ EMBERI ERŐFORRÁS MENEDZSMENT SZEREPE A SZERVEZETEKBEN
A tervezés mint menedzsment funkció
Piacképes programozói tudás a középiskolában
Képességszintek.
Az Egyetem, mint az innováció motorja ELTE Innovációs Nap Az Egyetem, mint az innováció motorja Fábián István, rektor Debrecen, február 26.
Bevezetés a gépi tanulásba február 16.. Mesterséges Intelligencia „A számítógépes tudományok egy ága, amely az intelligens viselkedés automatizálásával.
Számítógépes nyelvészeti alkalmazások Farkas Richárd szept 7.
Informatika matematika speciális tagozat - tematika évfolyam -
Mesterséges neuronhálózatok
Tudományos szoftverek tervezése
Persa György Témavezető: Szabó Csanád Pázmány Péter Katolikus Egyetem Információs Technológiai Kar 1.
Feladatok - BAR K+F Vámossy Zoltán 2010 Summer School on Image Processing (SSIP) nyári egyetem feladatai és saját ötletek alapján.
Kétszemélyes játékok Előadó: Nagy Sára.
Mesterséges intelligencia
Szabó Attila, Cross-entrópia alkalmazása a megerősítéses tanulásban.
Online hasonlóságelemzések: Online hasonlóságelemzések: Tapasztalatok (kukorica) hozamfüggvények levezetése kapcsán Pitlik László, SZIE Gödöllő (Forrás:
Online hasonlóságelemzések: Online hasonlóságelemzések: Totó-automata?! Pitlik László, SZIE Gödöllő (Forrás: My-X.hu Hírlevél) október INNOCSEKK.
Szoftvertechnológia Ember-gép rendszerek. Mit értünk rendszer alatt? Kapcsolódó komponensek halmaza – egy közös cél érdekében működnek együtt A rendszer.
ISMERETALAPÚ RENDSZEREK SZAKÉRTŐ RENDSZEREK
Élet a Ságvári Bence digitális VII. Nemzetközi Médiakonferencia, Balatonalmádi, szeptember 25. ökoszisztémában kisgyerekként...
Hálózati Bombermen Belicza András Konzulens: Rajacsics Tamás BME-AAIT.
Hálózati Bombermen Belicza András Konzulens: Rajacsics Tamás BME-AAIT.
A közoktatás „dobbantási” esélye Dobbantó Programindító Konferencia Setényi János 2008 Budapest.
Közlekedésmodellezés Készítette: Láng Péter Konzulens: Mészáros Tamás.
Készítette: Gergó Márton Konzulens: Engedy István 2009/2010 tavasz.
Mobilis robot (e-puck) robot és a Webots szimulációs rendszer megismerése szimulációs rendszer robot közepesen nehéz feladat megoldása például: vonalkövetés.
Gépi tanulás Tanuló ágens, döntési fák, általános logikai leirások tanulása.
Önálló labor munka Csillag Kristóf 2005/2006. őszi félév Téma: „Argument Mapping (és hasonló) technológiákon alapuló döntéstámogató rendszerek vizsgálata”
Befogadó iskolák, befogadó pedagógus-közösségek
A KTI az EU és a hazai közlekedéspolitika irányelveit követve a fenntartható fejlődés szempontjait figyelembe véve folyamatosan fejlődő,
Többváltozós adatelemzés
1 EÖTVÖS LORÁND TUDOMÁNYEGYETEM EGYETEMI KÖNYVTÁRI SZOLGÁLAT K-21 MINŐSÉGIRÁNYÍTÁSI PROJEKT A projekt eredményeinek bevezetéséért felelős csoport bemutatkozása.
Előadó: Nagy Sára Mesterséges intelligencia Kereső rendszerek.
Kooperatív oktatással a befogadás támogatásáért
Funkciós blokkok A funkciós blokkok áttekintése Az alkalmazás előnyei.
Döntsön a kard! Mesterséges intelligencia a játékokban Szita István Eötvös Collegium.
F IGYELMI ALGORITMUSOKKAL VEZÉRELT HELYSZÍNANALÍZIS Persa György.
WP-Dyna: tervezés és megerősítéses tanulás jól tervezhető környezetekben Szita István és Takács Bálint ELTE TTK témavezető: dr. Lőrincz András Információs.
TEROTECHNOLÓGIA Az állóeszközök újratermelési folyamata.
1 Megerősítéses tanulás 7. előadás Szita István, Lőrincz András.
1 Business marketing. 2 3 kevesebb, de nagyobb vevő szoros eladó-vevő kapcsolat származtatott kereslet rugalmatlan kereslet ingadozó kereslet versenytárgyalás.
Megerősítéses tanulás 5. előadás
Vizuális programozás Előadó: Csapó Gábor.
Megerősítéses tanulás 2. előadás
1/19 Hogyan tájékozódnak a robotok? Koczka Levente Eötvös Collegium.
1 Megerősítéses tanulás 9. előadás Szita István, Lőrincz András.
kialakulása, fejlődése, generációk
Csapó Benő SZTE Neveléstudományi Intézet MTA-SZTE Képességfejlesztés Kutatócsoport A PISA céljai, tudományos alapjai.
Az amőba játék algoritmusa. A játék  Az amőba játék, vagy ahogy Magyarországon sokan ismerik, az ötödölő, az egyik legnépszerűbb logikai játék. Sikerét.
A malomjáték algoritmusa
Pókerkártya játék algoritmusa
Tervezési folyamat.
Sudoku.
Mesterséges intelligencia
SZFP II Kompetenciamérés
Sakk algoritmus.
Mesterséges intelligencia
Nem módosítható keresések
Nagy Roland | Robotika PMB2530, PMB2530L Nagy Roland |
C/C++, hobbi játékprogramozás
Gépi tanulás.
Kompetenciamérés eredményei évfolyam 2013
Szűcs Imre - Dr. Pitlik László (OTKA T049013)
Készítette: Pethő Eszter, Rácz Viktória, Tóth Anna Eszter
I-QRS ÉletjelfigyelőTelemetriás Rendszer
Csúszógyűrűs aszinkronmotor három fokozatú ellenállásos indítása
Előadás másolata:

Pac-Man játék tanulása Megerősítéses Tanulással Mesterséges Intelligencia algoritmusok tesztelése játékokon Gyenes Viktor Eötvös Loránd Tudományegyetem Neural Information Processing Group

Mesterséges Intelligencia – játékok A játékok valós döntéshelyzeteket modelleznek Hasonló megoldási módszerek szükségesek Jó tesztfeladatok MI algoritmusok fejlesztésére Könnyen demonstrálható, magáért beszélő eredmény Vannak sikertörténetek (pl. backgammon, sakk) Miért Pac-Man? Közepes nehézségi szint Nem túlságosan egyszerű, de azért még kezelhető bonyolultság Nemzetközi verseny lett meghirdetve http://cswww.essex.ac.uk/staff/sml/pacman/PacManContest.html Kezdeti sikereink vannak… Gyenes Viktor - ELTE

Megerősítéses Tanulás Népszerű tanulási keretrendszer Környezetben tevékenykedő ügynök Megfigyeléseket kap a környezettől Akciókat választhat amik befolyásolják az állapotát Büntetéseket / jutalmakat kap visszajelzésként Felügyelet nélküli tanulás Döntési mechanizmus: hosszú távú összjutalom maximalizálása Kiforrott matematikai alapok Konvergencia tételek a tanulási folyamatra Újabb eredmények komplex feladatokra is alkalmazhatóvá teszik, hatékony algoritmusok Gyenes Viktor - ELTE

Miért nehéz a feladat? – Megoldás? Brute-force megoldás: Minden lehetséges állapotra tanuljuk meg a helyes döntést! Hihetetlenül nagy állapottér… Pl. sakk: 8x8-as tábla, minden mezőn 12 féle bábu, vagy üres: 1364 ≈ 1071 Általánosítás szükséges Magasabb szintű leírás (fontos észleleteket leíró változók) Feladat struktúra figyelembe vétele Az állapottér változók direktszorzata, közöttük kevés függés A tanult tapasztalatok hasznosítása eddig nem látott állapotban Mik a jó állapotleíró változók? Hogyan találjuk meg? A Mesterséges Intelligencia nagy kérdései… Gyenes Viktor - ELTE

Pac-Man verseny Feladat: a gép irányítsa az embereknek írt játékot! Megfigyelés: a képernyő Akciók: billentyűk nyomogatása Képfeldolgozás szükséges az állapot kinyeréséhez Döntés: magas szintű megfigyelések és akciók Pl. szellemek távolsága; mozgás a legközelebbi pötty felé, stb. Gyenes Viktor - ELTE

Eredmények Köszönöm a figyelmet! Az első pályán átlagos humán teljesítmény elérése! egy korábbi verzióval; szabály alapú vezérlést tanuló rendszer (Szita & Lőrincz, JAIR 2007) A jelenlegi verzió fejlesztés alatt áll Egyelőre szabály alapú kézzel drótozott viselkedés Terv: helyzet-értékelés alapú előretekintő rendszer Köszönöm a figyelmet! Gyenes Viktor - ELTE