Gépi tanulás Tanuló ágens, döntési fák, általános logikai leirások tanulása
Tanuló ágens
Tanuló elem tervezése n a végrehajtó elem javitandó komponensei n a komponensek reprezentációja n a visszacsatolás tanulás tanitóval megerősités (reinforcement) tanulás tanitó nélkül n előzetes információ
Végrehajtó elem komponensei n feltételek az aktuális helyzetben - akciók n információ a világ előrehaladásáról n információ az ágens lehetséges akcióinak eredményéről n információ “hasznos helyzetek”ről
A tanulás tekinthető függvény-reprezentáció tanulásaként.
Induktiv tanulás n Példa (x, f(x) ) n Feladat: adott f példáinak egy halmaza n Cél: hipotézis függvény (h), amely f-t közeliti
(Bináris) Döntési fák n egy cél-predikátum megtanulása n bemenet: egy objektum vagy helyzet leirása (tulajdonságok) n kimenet: igen/nem döntés
Bináris döntési fák jellemzői n Nem lehet 2 vagy több különböző objektumra vonatkozó teszteket alkalmazni. n Cél-predikátum értéke = példa osztályozása n Cél-predikátum igaz - pozitiv példa n Cél-predikátum hamis - negativ példa
Döntési fa - példa
Döntési fát tanuló algoritmus
Döntési fák alkalmazása n Sok példa begyűjtése. n A példákat két csoportba soroljuk: tanitó példák teszt példák. n Alkalmazzuk a tanitó algoritmust a tanitó példákra - generáljuk a H hipotézist. n Teszt példák osztályozása H-val. n Az előző lépések ismétlése különböző (véletlenszerű) példa csoportositásokra.
Általános logikai leirások tanulása
Pillanatnyi legjobb hipotézis keresése konzisztens hamis hipotézis hamis hipotézis negativ kiterjesztése pozitiv specializáció
Műveletek n kiterjesztés, általánositás (generalization) n specializáció Jellemzők n egyetlen hipotézis fenntartása n a hipotézis javitása új példák érkezésekor a konzisztencia megmaradása céljából
Leirás változatok tere n A hipotézis tér parciálisan rendezett. n Határhalmazok: legáltalánosabb határ legspecifikusabb határ n Minden ami a két határ között van, konzisztens a példákkal.
Algoritmus