Mesterséges Intelligencia 1. Eddig a környezet teljesen megfigyelhető és determinisztikus volt, az ágens tisztában volt minden cselekvésének következményével.

Slides:



Advertisements
Hasonló előadás
Készítette: Kosztyán Zsolt Tibor
Advertisements

Lineáris egyenletrendszerek megoldása Gauss elimináció, Cramer-szabály Dr. Kovács Sándor DE GVK Gazdaságelemzési és Statiszikai Tanszék.
Készítette: Kosztyán Zsolt Tibor
Nevezetes algoritmusok
Stacionárius és instacionárius áramlás
Másodfokú egyenlőtlenségek
KÉSZÍTETTE: Takács Sándor
Statisztika II. I. Dr. Szalka Éva, Ph.D..
4. Előadás: A mohó algoritmus
Eseményalgebra Eseményalgebra.
Függvények Egyenlőre csak valós-valós függvényekkel foglalkozunk.
Matematika és Tánc Felkészítő tanár: Komáromi Annamária
Determinisztikus programok. Szintaxis: X : Pvalt program változók E : Kifkifejezések B : Lkiflogikai kifejezések C : Utsutasítások.
MI 2003/ A következőkben más megközelítés: nem közvetlenül az eloszlásokból indulunk ki, hanem a diszkriminancia függvényeket keressük. Legegyszerűbb:
Kötelező alapkérdések
Kalman-féle rendszer definíció
GNSS elmélete és felhasználása Fázismérések lineáris kombinációi. A ciklustöbbértelműség feloldása.
Illés Tibor – Hálózati folyamok
Euklidészi gyűrűk Definíció.
Csoport részcsoport invariáns faktorcsoport részcsoport
4. VÉGES HALMAZOK 4.1 Alaptulajdonságok
Térbeli infinitezimális izometriák
Programozási alapismeretek 8. előadás. ELTE 2/  További programozási tételek További programozási tételek 
Algebra a matematika egy ága
Állapottér-reprezentáljunk!
Bársony Kristóf számítástechnika IV. évfolyam
Dr. Szalka Éva, Ph.D.1 Statisztika II. VII.. Dr. Szalka Éva, Ph.D.2 Mintavétel Mintavétel célja: következtetést levonni a –sokaságra vonatkozóan Mintavétel.
SZÉCHENYI ISTVÁN EGYETEM
Ideális kontinuumok kinematikája
AZ INFORMÁCIÓ Forrás: Dr. Haig Zsolt: Hadviselés az információs hadszíntéren [Zrínyi Kiadó]
OPERÁCIÓKUTATÁS Kalmár János, 2012 Tartalom A nulla-egy LP megoldása Hátizsák feladat.
A digitális számítás elmélete
A digitális számítás elmélete
A lokális szélsőérték és a derivált kapcsolata
A számfogalom bővítése
Miskolci Egyetem Informatikai Intézet Általános Informatikai Tanszé k Pance Miklós Adatstruktúrák, algoritmusok előadásvázlat Miskolc, 2004 Technikai közreműködő:
Metaverzum A jövő virtuális univerzuma. Videójátékok, virtuális világok, web 2.0, Földet ábrázoló online térképek kereszteződése Szimuláció és realitás.
A kvantummechanika alapegyenlete, a Schrödinger-féle egyenlet és a hullámfüggvény Born-féle értelmezése Előzmények Az általános hullámegyenlet Megoldás.
1 TARTALOM: 0. Kombinatorika elemei (segédeszközök) 1. Eseményalgebra 2. A valószínűség: a) axiómák és következményeik b) klasszikus (=kombinatorikus)
Készítette: Kosztyán Zsolt Tibor
Előrendezéses edényrendezés – RADIX „vissza”
Scenáriók készítése Dr. Kollár József Magyar Coachszövetség Közhasznú Alapítvány.
Kooperáció és intelligencia, Dobrowiecki T., BME-MIT 1 Kooperáció és intelligencia kis HF-ok/ 2013.
Készítette: Gergó Márton Konzulens: Engedy István 2009/2010 tavasz.
Számegyenesek, intervallumok
Gépi tanulás Tanuló ágens, döntési fák, általános logikai leirások tanulása.
Készségfejlesztő és viselkedésmódosító csoportok tervezési modellje I. I. A csoporttagok fejlődésének tervezése 1.Mérd fel, hogy milyen deficitekkel és/vagy.
Gazdaságstatisztika 10. előadás.
Alapfogalmak.
A kondicionális törvényei
Instacionárius hővezetés
Háló- (gráf-) algoritmusok
A HATÁROZOTT INTEGRÁL FOGALMA
Valószínűségszámítás II.
Többdimenziós valószínűségi eloszlások
Programozási alapismeretek 8. előadás. ELTE Szlávi-Zsakó: Programozási alapismeretek 8.2/  További programozási.
Szimuláció.
Keresés részleges információ mellett Eddig a környezet teljesen megfigyelhető és determinisztikus volt, az ágens tisztában volt minden cselekvésének következményével.
Diszjunkt halmazok adatszerkezete A diszjunkt halmaz adatszerkezet diszjunkt dinamikus halmazok S={S 1,…,S n } halmaza. Egy halmazt egy képviselője azonosít.
ADATBÁZIS- RENDSZEREK 12. rész: Konkurenciavezérlés.
Kiterjesztések szemantikája: Szemantikai tartomány : Adatoknak, vagy értékeknek egy nem üres halmazát szemantikai tartománynak nevezzük. Jelölése: D. Egy.
Struktúra predikció Struktúra lehet Felügyelt tanulási probléma
Adalékok egy véges összegzési feladathoz
1 Megerősítéses tanulás 4. előadás Szita István, Lőrincz András.
Megerősítéses tanulás 2. előadás
Genetikus algoritmusok
Mediánok és rendezett minták
Példa: Dinteger = {..., -1,0,1,...}; Dboolean = {true, false};
Mesterséges intelligencia
Állapottér-reprezentáljunk!
Előadás másolata:

Mesterséges Intelligencia 1

Eddig a környezet teljesen megfigyelhető és determinisztikus volt, az ágens tisztában volt minden cselekvésének következményével. Ebből kifolyólag az ágens pontosan ki tudja számítani, hogy egy tetszőleges cselekvésszekvenciának milyen állapot az eredménye, és azt is tudja, hogy ő maga milyen állapotban van. Az érzékelései nem nyújtanak új információt az egyes cselekvések után. De mi van akkor, ha a cselekvésekről és állapotokról alkotott tudás nem teljes? 2

A nem teljesség különböző formái három problématípushoz vezetnek: Szenzor nélküli (conformant) problémák: Ha az ágensnek egyáltalán nincsenek szenzorjai, akkor a több lehetséges kezdeti állapot egyikében lehet, és minden cselekvése a lehetséges követő állapotok egyikéhez vezethet. 3

Eshetőségi (contingency) problémák: Ha a környezet részben megfigyelhető, vagy ha a cselekvések bizonytalanok, akkor az ágens érzékszervei új információt nyújtanak minden cselekvés után. Minden lehetséges érzékelés egy eshetőséget határoz meg, amire az ágensnek terveznie kell. A problémát ellenfél problémának (adversarial) hívják, ha a bizonytalanságot egy másik ágens cselekvései okozzák. 4

Felfedezéses (explorational) probléma: Ha a környezet állapotai nem ismertek, az ágensnek külön cselekednie kell, hogy azokat felderíthesse. A felfedezési problémákat az eshetőségi problémák szélsőséges változatának lehet tekinteni. 5

3.1. ábra: A porszívóvilág 8 lehetséges állapota. 6

 Tegyük fel, hogy a porszívóágens ismeri az összes cselekvésének a hatását, de szenzorokkal nem rendelkezik. Ekkor csak azt tudja, hogy kezdeti állapota a (1,2,3,4,5,6,7,8) halmaz egy eleme.  Mivel tudja, hogy cselekvései mire képesek, kiszámíthatja, hogy a Jobbra cselekvés a (2,4,6,8) állapotok egyikébe viszi, a Jobbra,Szív cselekvéssorozat eredményeképpen a (4,8) állapot egyikében köt ki. A Jobbra, Szív, Balra, Szív sorozattal garantáltan eléri a (7) célállapotot függetlenül a kezdeti állapottól. Erre azt mondjuk, hogy az ágens a világot a 7. állapotba bele tudja kényszeríteni (coerce) akkor is, ha nem tudja honnan indult. 7

Mely lépésekkel lehet az ágenset az 1-es mezőbe kényszeriteni?

Ha a világ nem teljesen megfigyelhető, az ágensnek az egyedi állapotokkal szemben azon állapothalmazokra kell tudni következtetni, amely halmazok állapotaiba eljuthat. Minden ilyen állapothalmazt egy hiedelmi állapotnak nevezünk (belief state), amely az ágens pillanatnyi hiedelmét fejezi ki, hogy ő maga vajon milyen fizikai állapotban lehet most. A teljesen megfigyelhető környezetben minden hiedelmi állapot egyetlen fizikai állapotból áll. 9

Ahhoz, hogy egy szenzor nélküli problémát megoldhassunk, a fizikai állapotok terében történő keresés helyett a hiedelmi állapotok terében kell keresni. A kezdeti állapot egy hiedelmi állapot, és minden cselekvés egy hiedelmi állapotot egy másik hiedelmi állapotba képez le. 10

3.2. ábra: A determinisztikus szenzor nélküli porszívóvilág hiedelmi állapotterének hozzáférhető része. 11

 Csak 12 hozzáférhető hiedelmi állapot létezik, az egész hiedelmi állapottér azonban tartalmazza a fizikai állapotok minden lehetséges halmazát, azaz 2 8 =256 hiedelmi állapotot.  Ha a fizikai állapottérnek S állapota van, a hiedelmi állapottér állapotainak száma 2 S. 12

 Ha a környezet jellege olyan, hogy az ágens a cselekvéseit követően szerezhet új információt a szenzorjai réven, eshetőségi problémáról (contingency problem) beszélünk.  Egy eshetőségi probléma megoldása sokszor egy fa alakját veszi fel, ahol egy-egy ágnak a kiválasztása azon múlik, hogy odáig az ágens milyen érzékelésekhez jutott. 13

 Tegyük fel, hogy az ágens rendelkezik helyzetérzékelővel és lokális koszérzékelővel, de nincs olyan szenzorja, amely detektálná a koszt más négyzetekben.  A [B,kosz] érzékelés azt jelenti, hogy az ágens az [1,3] állapotok egyikében van.  A [szív, jobbra, szív] cselekvéssorozat biztosan feltakarítja mind a két helyiséget, de lehet, hogy felesleges lépést is végre fog hajtani. 14

Cél: mind a két helyiség tiszta [B,kosz](1,3) állapotok valamelyike szív(5,7) állapotok egyike jobbra(6,8) állapotok egyike szívha (6) akkor cél, ha (8) akkor felesleges szívás Egy rögzített cselekvéssorozat se garantálja a probléma megoldását. 15

Akkor lesz megoldásunk ha lemondunk a cselekvések szigorú sorrendjéről: [szív, jobbra, ha(jobbra,kosz) akkor szív] A megoldások terét azzal a lehetőséggel bővítjük, hogy a cselekvéseket a végrehajtás alatt megjelenő eshetőségek alapján választjuk. Mivel a pontos előrejelzés sűrűn lehetetlen, a valós világ számos problémája eshetőségi probléma. 16

17