Automatikus modellalkotás PDDL tanulás. Problémák PDDL leírásokkal Statikus, a környezet (domain) változását nem képes figyelembe venni Új igények is.

Slides:



Advertisements
Hasonló előadás
Egyszerű oszthatósági problémák
Advertisements

Statisztika II. I. Dr. Szalka Éva, Ph.D..
Képességszintek.
a szülői elégedettségmérés legfontosabb eredményeiről
Mi látszik egy jéghegyből?
A webes tesztelés jövője
Készítette: Mester Tamás METRABI.ELTE.  Adott egy G irányított vagy irányítás nélküli, véges gráf. Az eljárás célja a G gráf összes csúcsának bejárása.
Számítógépes algebrai problémák a geodéziában
Készítette: Glisics Sándor
Készítette: Glisics Sándor
Programozás alapjai A programozás azt a folyamatot jelenti, melynek során a feladatot a számítógép számára érthető formában írjuk le. C++, Delphi, Java,
Gráf Szélességi bejárás
7. előadás (2005. április 12.) Láncolt lista File kezelés 1.
Városok és a vizek.
Értékesítési ajánlat elemei február. A termék koncepciója Tisztázandó a termék vagy szolgáltatás célpiaca.
DÖNTÉSELMÉLET A DÖNTÉS = VÁLASZTÁS A döntéshozatal feltételei:
Mutatók, tömbök, függvények
SZÁMÍTÓGÉP ARCHITEKTÚRÁK
Előadó: Prof. Dr. Besenyei Lajos
A les Edzőtábor j úli u s Egy játékos leshelyzetben van ha: közelebb van az ellenfél kapuvonalához, mint a labda és az utolsó előtti ellenfél.
Lénárt Anett egyetemi adjunktus - PTE PMMK Rendszer- és Szoftvertechnológia Tanszék Előadás JavaScript Tananyag: W eb - programozás.
Szélességi bejárás A szélességi bejárással egy irányított vagy irányítás nélküli véges gráfot járhatunk be a kezdőcsúcstól való távolságuk növekvő sorrendjében.
Online hasonlóságelemzések: Online hasonlóságelemzések: Tapasztalatok (kukorica) hozamfüggvények levezetése kapcsán Pitlik László, SZIE Gödöllő (Forrás:
Online hasonlóságelemzések: Online hasonlóságelemzések: Tapasztalatok elítéltek képzésének engedélyezése kapcsán Pitlik László, SZIE Gödöllő (Forrás: My-X.hu.
Evapotranspiráció elõrejelzése mesterséges neuronális halózatok segitségével Wójcicki Andrzej, GTK V. konzulens: Dr. Pitlik László Gazdasági Informatika.
R. S. Kaplan, R. Cooper Költség és hatás Készítette: Kele Katalin Május 15.
Szervezeti formák Dr. Ternovszky Ferenc: Nemzetközi menedzsment európai szemmel BGF - Külkereskedelmi Főiskolai Kar Vállalkozások és Emberi Erőforrás.
A rezgő mozgás kvantummechanikai leírása 1. Miért kell foglalkoznunk ezzel a problémával? 2. Mi a legegyszerűbb modell? 3. Mi a várható eredménye a legegyszerűbb.
Forgási állapotok kvantummechanikai leírása 1. Forgás két dimenzióban 2. Forgómozgás három dimenzióban; térbeli forgás - Míért fontos ez a témakör? - Miért.
Készítette: Hován Adrienn
Gráf szélességi bejárása
A problémamegoldás lépései
Hasznos információk a kétszintű kémia érettségiről
Közlekedésmodellezés Készítette: Láng Péter Konzulens: Mészáros Tamás.
Készítette: Gergó Márton Konzulens: Engedy István 2009/2010 tavasz.
Pókerágens fejlesztése játékelméleti alapokon
Tervkészítés PDDL alapon Konzulens: Kovács Dániel László Intelligens rendszerek tanszék Budapest Műszaki és Gazdaságtudományi.
Alprogramok paraméterei. Procedure ( ); Function ( ): ; [var] p1,...,pn:típus1; q1,...,q2:típus2; cím szerinti parméterátadaás (értékváltozás hatással.
Egy perc az élet – It’s Now Or Never Egy perc az élet. Ne menj tovább! Ígérd meg, drágám, az éjszakát! Tán holnap elszáll a vágy. Egy perc az élet, ölelj.
Sapientia-Csíkszereda ILLYES LÁSZLÓ Grundfoci-csapatválasztás. A Pál utcai fiúk és két célfüggvény.
Gépi tanulás Tanuló ágens, döntési fák, általános logikai leirások tanulása.
Matematikai eszközök a környezeti modellezésben
Számítógéppel támogatott pályaorientáció. Számítógéppel támogatott orientáció szerepe a munka- pályatanácsadásban Előnyei: Előnyei: A kutatások nagy része.
Az első és második nyelv elsajátítás elméletei
Gráf Szélességi bejárás/keresés algoritmusa
Logika szeminárium Előadó: Máté András docens Demonstrátorok:
Mérő László egyetemi tanár ELTE Gazdaságpszichológiai Szakcsoport Az üzleti gondolkodó tudománya február 25.
Geotechnikai feladatok véges elemes
A komplex tehetségfejlesztő program
Budapest University of Technology and Economics Department of Measurement and Information Systems Monitor komponensek fejlesztése okostelefon platformra.
Ugrás az első oldalra Folyamatközpontútanácsadás/ 1 1 Folyamatközpontú tanácsadás Folyamat = ember + tevékenység feltételek Folyamat = a tevékenységek.
Kruskal-algoritmus.
Programozás III KOLLEKCIÓK.
Programozás III KIVÉTEL.
A probléma gyökere: a szuperpozíció elve
Adatbáziskezelés. Adat és információ Információ –Új ismeret Adat –Az információ formai oldala –Jelsorozat.
A projekt az Európai Unió támogatásával, az Európai Szociális Alap társfinanszírozásával valósul meg. Pannon Egyetem Georgikon Kar Szegedi Tudományegyetem.
Függvények a C nyelvben 1 Függvényeket a következő esetekben szokás írni: Ha ugyanazt a tevékenységet többször is el kell végeznünk ugyanolyan típusú,
Mohó algoritmusok Szlávi Péter ELTE IK
PROJEKT-TERV Youth 2 Youth Innovációs Verseny Keretében Megvalósítandó Közösségi Készítette: Harmati Katalin, Lázi Alexandra, Perge Gábor /Sorsfordítók.
Diszjunkt halmazok adatszerkezete A diszjunkt halmaz adatszerkezet diszjunkt dinamikus halmazok S={S 1,…,S n } halmaza. Egy halmazt egy képviselője azonosít.
Gráf szélességi bejárása. Cél Az algoritmus célja az, hogy bejárjuk egy véges gráf összes csúcsát és kiírjuk őket a kezdőcsúcstól való távolságuk szerint.
Gráf szélességi bejárása. A szélességi bejárás elmélete Célja egy véges gráf összes csúcsának bejárása a kezdőcsúcstól való távolságuk szerinti növekvő.
Gráf Szélességi bejárás Készítette: Giligor Dávid Neptun : HSYGGS.
Megerősítéses tanulás 2. előadás
Programozási nyelvek típusossága.
Hernyák Zoltán Programozási Nyelvek II.
Érvelések (helyességének) cáfolata
A évi kompetenciamérés FIT-jelentéseinek új elemei
Velünk élő középkor Forrás:
Előadás másolata:

Automatikus modellalkotás PDDL tanulás

Problémák PDDL leírásokkal Statikus, a környezet (domain) változását nem képes figyelembe venni Új igények is megjelenhetnek, változhatnak a feltételek Cél nem mindig fogalmazható meg egyértelműen, esetleg csak a cselekvések közben tisztázódik Megoldás: kiegészíteni tanulással!

PDDL tanulás I. Az akciók megfeleltethetőek cselekvéseknek, az aktuális predikátumok összességei állapotoknak Ha a cél nem tiszta, egyfajta megerősítést/visszajelzést akkor is elvárhatunk Gyakran egyszerűbb megerősítések formájában megfogalmazni a célt, mint az explicit megfogalmazás

PDDL tanulás II. Q-tanulással a megerősítések alapján az adott állapotban a cselekvésekhez hasznossági értékeket tudunk rendelni Ezeket felhasználhatjuk tervkészítéshez (metrika) Illetve további következtetéseket vonhatunk le: Összetartozó cselekvések Cselekvések feltételeinek kiegészítése Cél pontosabb megfogalmazása

Egyszerű példa Különböző sorszámú dobozok, különböző súlyú golyók Ágens célja a golyók növekvő súly szerinti elhelyezése Visszajelzés: a megfelelő helyen levő golyók száma Első próbálkozás: egyszerű RAK cselekvés (szabad helyre rak egy még fel nem használt golyót)

Eredmény rak golyo1 doboz1, 1.92 rak golyo3 doboz1, 0.36 rak golyo1 doboz3, 0.36 rak golyo2 doboz2, 1.70 rak golyo2 doboz1, 0.37 rak golyo1 doboz2, 0.36 rak golyo3 doboz2, 0.36 rak golyo2 doboz3, 0.40 rak golyo3 doboz3, 1.80

Egyszerű példa másként A több különböző cselekvés, attól függően, hogy hova rakjuk a golyót (elejére, végére, középre), és a szomszédai alapján megfelelő-e a súlybeli sorrend (jól raktuk-e, ha szomszédai szabadok, vagy sem) A továbbiakban a cselekvéseket nem különböztetjük meg paramétereiben

Tisztán felfedező, 0.2 bátorsági faktor

Tisztán felfedező, 0.6 bátorsági faktor

Mohó, 0.98 felfedezői faktor

Mohó, felfedezői faktor

5 golyó, felfedező, 0.2 bátorsági faktor (2 perc futási idő)

5 golyó, mohó tanulási faktor (7 sec futási idő)

“Egyszerű rak, helyesen rak” kisérlet I. (egyszerű megerősítés)

“Egyszerű rak, helyesen rak” kisérlet II. (inv. száma megerősítés)

Kisérlet konklúziói Hiába volt helyesebb a JólRak cselekvés, az eredmény nem ezt bizonyította Hiába változtattunk a megerősítésen a JólRak javára, nem javult a helyzet Hibás kisérlet? NEM! A feltétel nélküli Rak megtanulta helyesen rakni a kisérlet közben a golyókat! A JólRak cselekvés pontosabb előfeltételei sem jelentettek számára tényleges előnyt

Hova tovább? Felfedező tanulás helyes, de lassú Mohó tanulás gyors, de szuboptimális DE! Mohó tanulással így is elég jó eredményeket lehet kapni, akár tervkészítőként is használható Felfedező tanulással pontosabb következtetéseket lehet levonni, ezzel a PDDL modell átalakítására van lehetőségünk: – Csökkenthetjük a komplexitást – Pontosabbá tehetjük a modellt – Helyesebben fogalmazhatjuk meg a célokat

Köszönöm a figyelmet! Készítette: Láng Péter