Tudásalapú rendszerek Előadó: Kovács Zita 2016/2017. I. félév Következtetési technikák
Fejtörő E K 4 7 Ha egy kártya betűs oldalán magánhangzó van, akkor annak a számos oldalán páros szám áll. Minimálisan mely kártyákat kell megfordítani, hogy az állítás helyességéről meggyőződjünk? Forrás: Mérő László: Észjárások
Statisztika 46 % E és 4 33% E 4% E és 7 -helyes 17% egyéb
Fejtörő 2. elöl 50$ elöl 10$ megfordítandó hátul aláírás nélkül hátul aláírva hátul aláírás nélkül Tudjuk, hogy mindegyik csekk egyik oldalán az értéke szerepel, a másikon pedig az aláírás helye. Harminc dollár alatti csekk aláírás nélkül is érvényes, e fölött csak aláírással. Döntsük el, hogy érvényesek-e ezek a csekkek. Melyiket kell ehhez megfordítani, és melyiket nem kell? Forrás: Mérő László: Észjárások
Izomorfak! az előző két feladat logikailag izomorf az első feladatot kevesebben oldják meg helyesen, aki pedig helyesen oldja meg mindkettőt, a második megoldását gyorsabban megtalálja
Következtetés Vagy Anna, vagy Balázs bűnös. Ha Balázs bűnös, akkor Anna is. Ezért Anna bűnös.
R. M. Smullyan: Mi a címe ennek a könyvnek c. könyve alapján Hatalmas mennyiségű árút loptak el egy áruházból. A tettes (vagy tettesek) autóval szállította (vagy szállították) el a zsákmányt. Három jól ismert bűnözőt vittek be a Scotland Yard-ra kihallgatni, P-t, Q-t és R-t. A következők derültek ki: 1. P-n, Q-n és R-n kívül senki nem vehetett részt a rablásban. 2. R sosem dolgozik P (és esetleg más) tettestársak nélkül. 3. Q nem tud autót vezetni. P bűnös, vagy ártatlan?
Tartalom A következtetési technikák részletes ismertetése A következtetési módszerek osztályozása Az eset-alapú következtetés
Következtető rendszerek a szakértő rendszerek motorja ismeretelemek láncolatán keresztül vezet a keresett cél felé számos következtetőrendszer használható bizonyítás, meggyőzés, elhatározás, igazolás, magyarázat, stb
Következtető rendszerek eljárások csoportosítása: a következtetéshez való viszony alapján (hipotézisen alapuló, analóg, stb.) az ismeretekhez való viszony alapján (közelítő, kvalitatív, temporális, stb.)
Következtetési módok formális következtetés Procedurális következtetés egy szimbolikus adatszerkezet szintaktikus műveletein alapul, adott szabályok szerint bizonyos szemantikus keretben pl. elsőrendű predikátum kalkulus Procedurális következtetés minden ismeretnek a felhasználása és maga a következtetés is eljárásokon alapul
Következtetési módok Analógián alapuló következtetés egy struktúrált tudásbázis alstruktúráinak hasonlóságán alapul megvalósításához egyeztetés, a hasonlóság és a függőségi kapcsolatok kiértékelése szükséges
Következtetési módok Általánosításon és absztrakción alapuló következtetés az öröklődési mechanizmust megvalósító eljárás közvetlenül kapcsolódik az osztályozáson alapuló következtetéshez, amelyben az elemi ismereteket hierarchiába rendezett tulajdonságok írják le
Következtetési módok Eset-alapú következtetés Közelítő következtetés lehetővé teszi kevésbé formalizált problémák kezelését valamint új ismeretek megtanulását és gyakorlati tapasztalatok alapján történő továbbfejlesztését Közelítő következtetés képes figyelembe venni bizonytalan és pontatlan ismereteket és adatokat
Következtetési módok Hipotetikus következtetés a hiányzó adatokat, amelyek különböző értékeket vehetnek fel hipotézisként kezeli valamennyi szóba jöhető értékkel továbbdolgozik, s ha valamelyikkel ellentmondásra jut, azt elveti Alapértelmezésen alapuló következtetés a hiányzó adatokat alapértelmezésük szerint kezeli Kvalitatív következtetés a fizikai törvények kvalitatív modelljén alapul, amikor a mennyiségi adatok hiányában a minőségi változásokat használja fel
Következtetési módok Három fő kategória: levezetés jellegű (deduktív) egyediből az általános felé haladó (induktív) hasonlóságot figyelembe vevő (analóg)
Hasonlóságon alapuló következtetés formalizmus: legyenek P és T adatstruktúrák, A és B alstruktúra P-ben, C és D alstruktúra T-ben az analógián alapuló következtetés megfelelteti egymásnak az A és a C alstruktúrákat amennyiben C-ből D-re előzőleg levontunk valamilyen következtetést, akkor ennek mintájára A-ból következtetünk B-re
Hasonlóságon alapuló következtetés ez az eljárás két kapcsolatot tételez fel: A és B, illetve C és D közötti függést A és C, illetve B és D közötti hasonlóságot Kérdés: milyen következtetési módot használunk, amikor C-ből D viselkedését írjuk le?
Hasonlóságon alapuló következtetés minél nagyobb A és C között a hasonlóság (határesetben A azonos C-vel) és minél erősebb a függés C és D között (határesetben deduktív levezetés): A-ból B-re vonatkozó analóg következtetés annál inkább tart a deduktív levezetéshez
Hasonlóságon alapuló következtetés T adatstruktúra P adatstruktúra Forrás probléma (C) Célprobléma (A) Forrás megoldás (D) Célmegoldás (B) hasonlóság függés
Eset alapú következtetés a hasonlóságon alapuló következtetés egyik formája Case Based Reasoning, CBR az előzőleg már megismert eseteket (precedens) használjuk fel az új problémák megoldása során egyes szakmákban a tanulás nem más, mint a különböző esetek sokaságának memorizálása
Eset alapú következtetés egy eset nem más, mint: a probléma leírása (a probléma keletkezésének leírásával együtt), az adott probléma megoldásának leírása, valamint a megoldott probléma hatásának, eredményességének leírása
Eset alapú következtetés olyan modell felállítását teszi lehetővé, amely magában foglalja a probléma megértését már megoldott más problémákhoz való viszonyát megoldását tanulását alkalmas hiányosan vagy pontatlanul definiált szituációk kezelésére olyan kiértékelések elvégzésére, amelyekre nem létezik jól definiált algoritmus
Eset alapú következtetés szükség van: a problémát megfelelően reprezentáló alapesetekre jó adaptáló mechanizmusra eset-bázis: sikeres és sikertelen próbálkozások egy cél eléréséhez sikeres esetek: segítséget nyújtanak a probléma megoldására sikertelen esetek: felhasználhatjuk a hibák elkerülésére a sikeres esetek segítséget nyújtanak a probléma megoldására, a sikerteleneket felhasználhatjuk a lehetséges hibák elkerülésére Az új szituáció megértésének képessége a régi tapasztalatok függvényében két fő részből áll: - emlékezni kell a régi tapasztalatra, felidézni azt valamilyen jellemzői alapján
Eset alapú következtetés az új szituáció megértésének képessége a régi tapasztalatok függvényében két fő részből áll: emlékezni kell a régi tapasztalatra (felidézni azt valamilyen jellemzői alapján) interpretálni az új szituációt a visszakeresett függvényében ezután egy adaptációs eljárással módosítjuk a régi megoldást az új szituáció által támasztott követelmények figyelembe vételével
Eset alapú következtetés az eset alapú következtető rendszerek egyik jellegzetessége, hogy képesek tanulni a tapasztalatokból ehhez szükség van egy bizonyos visszacsatolásra, hogy a rendszer értelmezni tudja, mi működött jól és rosszul az általa szolgáltatott megoldásban
Eset alapú következtetés az eset alapú következtetés célja formálisan: a P célproblémához hozzárendeljen egy Megoldás(P) megoldást, felhasználva az eset-bázisban talált P’ forrásproblémának a Megoldás(P’) megoldását Eset: (P, megoldás-menete (o1,…,ol), megoldás(P)) ahol P: a probléma valamilyen reprezentációja; megoldás-menete(o1,…ol) az o1,…ol operátorok azon sorozatát jelöli, amelyek a P problémára, mint kezdeti állapotra előállítják a megoldás(P) megoldást, azaz a végállapotot
Eset alapú következtetés Eset bázis: az esetek egy véges halmaza, azaz Eset-bázis = {esetk: k=1,…,n}, ahol esetk=(Pk,megoldás-menete(o1k, …, olk), megoldás(Pk)) különféle típusú problémák – diagnózis, konfiguráció, tervezés – megoldását állíthatjuk elő
A CBR életciklusa
A CBR életciklusa – 1. az eset visszakeresése ez a lépés egy keresési és egy illesztési eljárás kombinációja két probléma: az esetek indexelése és a hasonlósági kérdések az indexelés, azaz az esetek jellemzésére szolgáló attribútumok kialakításának problémája során az indexeknek eléggé általánosnak kell lenniük, hogy lehetővé tegyék az esetek alkalmazását a különböző szituációkban, ugyanakkor megfelelő módon specifikusnak, hogy a visszakeresés során találjunk illeszthető eseteket az eset-bázisban az illesztéshez szükséges a hasonlóság megállapítása, ehhez viszont be kell vezetni valamilyen távolság definíciót, melynek alapján választunk a jelöltek közül
A CBR életciklusa – 2. egyeztetés, a közelítő megoldás javaslata az előbbiek szerint megtalált esetekből kiindulva egy előzetes, közelítő megoldást konstruálunk általában kiválasztjuk a legjobb visszakeresett eset megoldását, mint első közelítést itt az a kérdés, hogy a régi megoldás mely részeit használjuk fel
A CBR életciklusa – 3. Illesztés, adaptáció mivel az új szituáció ritkán azonos valamely régivel, ezért annak megoldását módosítanunk kell az aktuális szituáció sajátos feltételeivel például valamilyen helyettesítő eljárással meg kell oldanunk az aktuális paraméterek illesztését két megközelítési mód: generáló adaptáció és átalakító adaptáció generáló adaptáció esetén minden szükséges ismeret a rendelkezésünkre áll a tudásbázisban a feladat megoldásához átalakító adaptáció esetén hiányosak az ismereteink, a tudásbázisból nem vagyunk képesek a megoldás generálására
A CBR életciklusa – 4. Felülvizsgálat, igazolás az illesztés során kialakult közelítő megoldás értelmezése során ellenőrizzük az esetleges alternatív megoldásokat és a sikertelen megoldásokra magyarázatot szolgáltatunk
A CBR életciklusa – 5. Tanulás, memorizálás az eset-bázist kiegészítjük a kialakult új eset (probléma, megoldás, megoldás-menete) hármassal megtörténik az új ismeretek szintézisének beépítése ez a lépés nem feltétlenül kapcsolódik közvetlenül a CBR következtetési eljáráshoz
Modell-alapú rendszerek Model-Based Reasoning - MBR a szakértő ismereteit nehezen tudja átadni, ösztönösen cselekszik (pl. autószerelő) a mélyszintű ismeretek kezelésére alkalmas a fizikai rendszereket - akár a természet, akár az ember alkotta azokat - saját szerkezetükben és funkcionalitásukban ragadja meg
Modell-alapú rendszerek egy fizikai rendszer modellje lehet: funkcionális sztochasztikus oksági egy funkcionális modell matematikai eszközökkel szimulálja a működést lehetőséget ad arra, hogy megfelelő paraméterek megváltoztatásával beavatkozzunk a rendszer működésébe
Modell-alapú rendszerek egy sztochasztikus modell statisztikai eszközökkel dolgozik egy oksági modell a részegységek ok-okozati kapcsolatokkal leírt rendszerén dolgozik példa: KATE (Knowledge-based Autonomous Test Engineer) a NASA fejlesztette ki folyamatok online monitorozására struktúrált (keretalapú) reprezentációval írja le az egyes komponensek funkcióit és a komponensek kapcsolatát
Modell-alapú rendszerek előnyei: kiiktatható a tudásszerzés nem kell az összes hiba tovaterjedésének hatását explicit módon megadni hátrányai: ha mégis szükség lenne heurisztikus tudásra, azt nehéz beépíteni nehéz a bizonytalanságot kezelni a legtöbb rendszer feltételezi, hogy egyetlen ok áll a hiba mögött a rendszer hatékonysága nem éri el a klasszikus tudásalapú rendszerekét
Kvalitatív következtetést biztosító rendszerek Qualitative Reasoning – QR sok olyan probléma van, amely esetén nem lehet kvantitatív, számszerű következtetést alkalmazni fizikai rendszerek esetében ilyen helyzetek például: nincs általános megoldó képlet nem végezhető el numerikus szimuláció vannak ismeretlen paraméter-értékek (amelyek nem mérhetők vagy sok munka lenne megmérni)
Kvalitatív következtetést biztosító rendszerek túl sok az adat túl sok számítást kellene elvégezni csak a viselkedés jellegét ismerjük, illetve csak azt akarjuk megjósolni kezdetben (a tervezés indításakor) még nem tudjuk a feladatot numerikusan leírni
Kvalitatív következtetést biztosító rendszerek a kvalitatív következtetések más szóval a kvalitatív szimuláció módszerei még nincsenek eléggé kidolgozva sok mérnöki döntés alapszik ilyen jellegű megfontolásokon például egy atomerőmű tervezésénél fontos tudni azt, hogy egy kritikus tényező (pl. a mag hőmérséklete) hogyan reagál az alapvető rendszer-beállítások megváltozására – melyekre nő, melyekre csökken az értéke
Kvalitatív következtetést biztosító rendszerek Kupier QSIM nyelve (Qualitative SIMulation language) előnyei: segít a hétköznapi gondolkodás megfogásában, valamint a feladat szervezési struktúrájának meghatározásában hátránya: természetéből fakad: nem ad pontos választ a vizsgált problémára
Temporális következtetést biztosító rendszerek Temporal Reasoning – TR az időbeni következtésekre képes, ún. temporális rendszerek lehetővé teszik események közötti időkapcsolatok ábrázolását, illetve ennek alapján következtetések elvégzését ez az ember számára természetes következtetési mód
Temporális következtetést biztosító rendszerek az MI sok rendszertípusa (pl. diagnózis, tevékenységtervezés, intelligens szimuláció) megkívánja az idő explicit kezelését a temporális logika, amely az ok-okozati kapcsolatokat a szóban forgó változásokat kiváltó szabályokkal ábrázolja, több ilyen esetben jól alkalmazható
Temporális következtetést biztosító rendszerek legelterjedtebb módszer az idő reprezentálására és manipulálására az intervallum-alapú közelítés ez hét primitív bináris relációval dolgozik (átlapol, megelőz, bennfoglal, találkozik, egyszerre kezdődik, egyszerre végződik, azonos; két esemény összesen 13-féle kapcsolatban lehet)
Temporális következtetést biztosító rendszerek gyakran szükség van diszkrét időpontok ábrázolására és kezelésére is (intervallum-kezelés esetén az 1 óra az 1 évhez viszonyítva időponttá „zsugorodik”) más rendszerek időegységek kezelését kívánják meg; a digitális óra analógiájára képzelhetjük ezt el, ahol egész számokból álló, megfelelően rendezett sorozat reprezentálja az évet, hónapot, stb.
Mesterséges neuronhálózatok (Artifical) Neural Networks – NN az emberi agy működését elég jól modellező, funkcionális, adaptív tanuló rendszerek e rendszerek példák alapján tanulnak, azonban nem szimbolikus eszközökkel, mint az induktív rendszerek és nem is generálnak döntési fát
Mesterséges neuronhálózatok a neuronhálózatok egyszerű átviteli függvénnyel jellemezhető processzorokból változtatható súlytényezőkkel ellátott összeköttetések hálózatán keresztül kommunikálnak egymással a tárgyterületi ismeretanyag ábrázolás a hálózatban elosztott módon, a súlytényezők közvetítésével történik (elosztott párhuzamos reprezentáció)
Mesterséges neuronhálózatok a neuronhálózatok programozása tanítással – tanító mintákkal, példákkal történik a tanítási módszerek osztályozása: tanítás felügyelet mellett vagy anélkül (ekkor önszerveződésről beszélünk) a tanítás célja a tanító mintáknak megfelelő súlytényező beállítása (nem döntési fa generálása)
Mesterséges neuronhálózatok egy neuronhálózat viselkedését a processzorok átviteli függvénye a hálózat súlytényezőkkel ellátott összeköttetési sémája a (szakértő segítségével összeállított) tanító minták – példák – és az alkalmazott tanítási módszer határozza meg
Mesterséges neuronhálózatok sokféle típusa létezik mindegyiknek megvan az az óriási előnye, hogy nem kell heurisztikus ismereteket a szakértőtől megszerezni; csupán a tanító mintákat kell (a szakértő irányításával) összeállítani – minél szisztematikusabb és kimerítőbb módon ez az adathalmaz nem kell, hogy teljes legyen, továbbá lehet hibás, valamint tartalmazhat ellentmondó adatokat is (mivel a neuronhálózatok hibatűrő rendszerek)
Mesterséges neuronhálózatok teljesítményük túlszárnyalhatja tanítójuk képességeit legnagyobb hátrányuk az, hogy feladatmegoldás közben, illetve végén nem tudnak magyarázatot, indoklást adni