Előadást letölteni
Az előadás letöltése folymat van. Kérjük, várjon
1
Mesterséges intelligenciák
Neurális hálózati struktúrájú mesterséges intelligenciák Készítette: Ormos László
2
Felhasznált irodalom James, William: Psychology (Brief Course), Holt, New York,1890 Rummelhart, D. E., D. A. Norman: Accreation, tuning and restructuring: three modes of learning, „Semantic Factors in Cognition, (J.W. Cotton and R.I. Klatzky, eds.) Lawrence Erlbraum, Hillsdale, NJ, 1978. Fodor J.: The Modularity of Mind, MIT Press, Cambridge, MA, 1983 Michalski, R.S., J.G. Carbonell, T.M. Mitchell (eds.): Machine Learning, (An Arificial Intelligence Approach), Vol II, Morgan Kaufmann Publ., Los Altos, CA, 1986 Carbonell, J., P. Langley: „Machine Learning” in Encyclopedia of Artificial Intelligence, (Saphiro, ed.), Vol. I, John Wiley, 1987
3
Felhasznált irodalom Yoshiaki Shirai, Jun-Ichi Tsujii: Mesterséges intelligencia, Novotrade Rt., Budapest, 1987 Robert J. Schalkoff: Artificial Intelligence: An Engineering Approach, McGraw-Hill Inc.,1990 Dr. Vörös Gábor: Bevezetés a neurális és minősítő számítástechnikába (Alapismeretek a neurális hálókról és a fuzzy logikáról), LSI Oktatóközpont, A Mikroelektronika Alkalmazásának Kultúrájáért Alapítvány, Budapest, 1997 Roger Miles, Michael Moulton, Max Bramer (eds.):Research and Development in Expert Systems XV, Proceedings of ES98, the Eighteenth Annual International Conference of the British Computer Society Specialist Group on Expert Systemy, Springer, London, 1999
4
Az intelligencia …képesség mesterséges objektumok létrehozására, legfőképpen eszköz új eszközök készítéséhez. Henri Bergson L’Evolution Creatrice (1907)
5
Intelligencia kutatás
A mesterséges intelligencia kutatás célja az intelligencia matematikai eszközökkel történő leírása. A matematikai módszereknek azonban szüksége van a valóság valamilyen leírására (numerikus mennyiségként), valamint egy manipulációs eljárásra. A leírás (reprezentáció) és a manipuláció a mesterséges intelligencia tudományának kulcsai.
6
Intelligencia kutatás
Az intelligencia kutatás elért egy olyan szintre, ahol már láthatjuk, hogy az általános problémák nagyon nagyok, és emiatt csak a jól meghatározott, alkalmazás-orientált feladatokat tudjuk megoldani. Az elméleti kutatás az intelligencia alapvető kérdéseire koncentrál, az alkalmazott kutatás pedig az új területeket keresi a kutatás számára.
7
A mesterséges intelligencia
A mesterséges intelligencia az a tudományterület, amely matematikai módszerekre alapozva keresi az intelligens viselkedés lényegét és fejlődését.
8
A mesterséges intelligencia
A mesterséges intelligencia módszertana fejlődésben van. Sok más szakterület kapcsolatrendszerére támaszkodik : a logikára, a neurális hálózatokra, objektum-orientált programozásra, formális leírásra és még sorolhatnánk.
9
A mesterséges intelligencia
A mesterséges intelligencia nem csupán matematika, számítógép tudomány, műszaki vagy pszichológiai szakterület, sokkal inkább ezeknek a diszciplináknak potenciális alkotó része. A mesterséges intelligencia a kognitív tudomány műszaki tudományra vetített másolata. A kognitív tudomány a filozófia, a nyelvészet és a pszichológia keveréke.
10
A mesterséges intelligencia fogalma a műszaki tudományokban
A mesterséges intelligencia azoknak a mesterségesen létrehozott ábrázolásoknak és eljárásoknak az összessége, amelyek automatikusan megoldanak olyan problémákat, melyeket mindezideig emberek oldottak meg.
11
A műszaki tudomány és a kognitív tudomány
A műszaki tudomány megközelítésében a mesterséges intelligencia létrehozásához szükség van programok fejlesztésére, azaz algoritmusokra és adatbázisokra, amelyek kifejezik és leírják az intelligens viselkedést.
12
A műszaki tudomány és a kognitív tudomány
Mivel az intelligens viselkedést mint autonóm képességet a fejlett számítástudomány fogalmazta meg, ezt a gépi intelligencia egy alternatív leírási módjának tekinthetjük, ami megerősíti korábban tett megállapításainkat, hogy az intelligencia gépesítése magába foglalja egy kifejező és kvantitatív leírás szükségességét, a megfogalmazott szakértői ismeret az intelligencia kifejezése.
13
A műszaki tudomány és a kognitív tudomány
Intelligens viselkedés emulálása (a legfőb célkitűzés) útvonal egy kép leírása keresése vizuális adatok alapján egy „mondat” egy elmélet értelmezése bizonyítása Intelligens viselkedési formák, amelyek nem igénylik az intelligencia általános meghatározását vagy jellemzését
14
A három legfontosabb kérdés
Műszaki szempontból a mesterséges intelligencia fejlesztés alapja a jól meghatározott és átfogó tudásbázis, valamint a megfelelő hatékonyságú, sokrétű és gyakorlatias manipulációs stratégia. Eszerint meg kell határozni, mi a tudás, hogyan lehet megjeleníteni, hogyan lehet manipulálni?
15
Mesterséges intelligencia alkalmazások
Robottechnika útvonal és mozdulat tervezés, alakfelismerés, gyártásirányítás (CAM), gyártás-diagnosztikai rendszerek, gyártás ütemezés.
16
Mesterséges intelligencia alkalmazások
Szakértői rendszerek gyógyászati diagnosztika (MYCIN), harcászati irányítás, geológiai kutatás (PROSPECTOR), számítógép konfigurálás (XCON), energetikai rendszerek irányítása, gyártástervezés és ütemezés, tervezés.
17
Mesterséges intelligencia alkalmazások
Játékok Természetes nyelvek értelmezése Tétel bizonyítás Számítógéppel segített oktatás/tanulás (CAE) Automatizált döntés Automatizált programkészítés
18
A pszichológusok nézőpontja
A pszichlógusok Aristoteles óta figyelik az emberi döntés és viselkedés folyamatait. William James (Psychology, 1890) észrevette, hogy a biológiai döntéshozó rendszerek - beleértve az emberi agyat is, - nem az absztrakt gondolkodás, hanem a túlélési lehetőség felismerésének céljából fejlődtek ki.
19
A pszichológusok nézőpontja
A viselkedést, a döntés folyamatát mentális szempontból abban az összefüggésben és abban a sajátos környezetben kell tanulmányozni, ahol a döntés születeik. Eszerint a döntési folyamat nem fejlődhet a semmiben, a döntési folyamat a megelőző stratégiák adaptációja lehet, a döntési folyamat gyakran alkalmazásfüggő.
20
A pszichológusok nézőpontja
James feltételezte, hogy a diszkrimináció és asszociáció elve egyformán fontos az emberi agy döntési folyamatában, amely elv a lebontás és felépítés koncepcióját tartalmazza. E felismerés a mesterséges intelligencia kutatásban a tudásbázis fejlesztés egyik alapvető stratégiai elve.
21
A pszichológusok nézőpontja
Az előbbiek alapján ajánlja a hierarchikus struktúrák alkalmazását, felhasználja a gondolatok összefüggésének vagy asszociációjának elvét. Az emberi intelligencia nemcsak a változtathatatlan eseményekre, vagy igazságokra és a logikára épül, hanem a tapasztalat és az intuíció is fontos szerepet játszik.
22
Mesterséges intelligencia alkalmazások
tudásreprezentáció, struktúra, „értelem”, ismeret szerzés.
23
Mesterséges intelligencia alkalmazások
Egyéb alapvető és kapcsolódó témák: következtetési és irányítási (manipulációs) stratégiák, tanulási és adaptációs képesség (kísérletekből, példákból, vagy egy „tanártól”), bizonytalanság és befejezetlen döntési folyamat megjelenítése, keresési és illesztési technkák, egyesítés és felbontás,
24
Mesterséges intelligencia alkalmazások
nem-monoton döntési folyamat (következtetések visszavonása ellenőrzött információk alapján), tapasztalat szerzés („generálás és ellenőrzés”), probléma dekompozíció, vagy elsődleges célok redukálása részfeladatokká, döntésformák (pl. dedukció, indukció, józan ész), a „jó” elfogadása az optimális megoldással szemben, célszerű programozási és leíró nyelvek.
25
Matematikai alapok: tárolt tudás, leírás és kapcsolatok
Tételezzük fel, hogy az x és y változók közötti kapcsolat szimbólumokkal, számokkal, műveletekkel vagy fogalmakkal leírható, mint például az x objektum R tulajdonságának értéke y Ez alapján x és R az ƒy függvény argumentumai, melyek az y értékét határozzák meg: y = ƒy(x, R)
26
Matematikai alapok: tárolt tudás, leírás és kapcsolatok
Ha x és R véges halmazok, a kapcsolat a következő hármassal írható le: (R, x, y ), mely megfelel a (attribútum, objektum, érték) formátumnak, amit úgy olvasunk, hogy „az objektum attribútuma az érték”, vagy „x és y relációja R”. Grafikusan R x y
27
Matematikai alapok: tárolt tudás, leírás és kapcsolatok
Relációk és példák Ha A és B halmazok, akkor A és B relációja az A X B részhalmaz. Az összefüggés felfogható bináris relációként is, mert csak két halmazt tartalmaz, és a halmazok elemeinek egyfajta „összekapcsolását” eredményezi. A halmazok összekapcsolódásának módja, az összekapcsolódás tulajdonságai vagy viszonya az, ami fontos.
28
Matematikai alapok: tárolt tudás, leírás és kapcsolatok
Relációk és tulajdonságok reflexív: R reflexív, ha minden a A esetén (a,a) R, szimmetrikus: R szimmetrikus, ha minden (a,b) R esetén (b,a) R igaz, tranzitív: R tranzitív, ha minden (a,b) R és (b,c) R esetén (a,c) R igaz.
29
Matematikai alapok: tárolt tudás, leírás és kapcsolatok
Harmadrendű (és magasabb rendű) relációk és kényszerek A bináris relációk a párba rendezett objektumok (objektum-párok) közötti kapcsolatrendszert írják le. De vannak relációk (és természetesen kényszerek is) objetktum-hármasok, objektum-négyesek, stb. között is.
30
Matematikai alapok: tárolt tudás, leírás és kapcsolatok
Az A, B, C halmazhármas objektumai közötti relációt definiálja a két részhalmazra bontott (A X B) X C összefüggés, amelyet az ((a,b),c) hármassal lehet leírni. Hasonló módon az A, B, C, D halmaznégyes is definiálható részhalmazokkal az (((A X B) X C) X D) összefüggés szerint, amely a (((a,b),c),d) négyessel írható le.
31
Matematikai alapok: tárolt tudás, leírás és kapcsolatok
Relációs táblázatok A bináris és magasabb (harmad-, negyed-) rendű relációkat kényelmesebben lehet leírni relációs táblázatok felhasználásával. Ezek a táblázatok n-ed rendű relációkat sorolnak fel táblázatos formában. A következő ábrán egy relációs táblázat látható.
32
Matematikai alapok: tárolt tudás, leírás és kapcsolatok
Relációs táblázatok
33
Matematikai alapok: tárolt tudás, leírás és kapcsolatok
A szemantikus hálózat objektumok, fogalmak, szituációk vagy műveletek összefüggéseinek (és tulajdonságainak) leírására szolgáló gráf. A koncepcionális gráf a szemantikus hálózatokhoz hasonlóan elképzelések, műveletek és szituációk koncepcionális kapcsolatait szemlélteti a „ki mit csinál, kinek” meghatározás szerint.
34
Matematikai alapok: tárolt tudás, leírás és kapcsolatok
A szemantikus hálózat objektumokat és relációkat tartalmaz, és a „valós világ” ábrázolása elég bonyolult. Néhány észrevétel ezzel kapcsolatban: 1. A szemantikus háló gyakran több különböző relációt is tartalmaz, mint „ez egy...”, „a tulajdonsága,hogy...”, „arra alkalmas, hogy...”, „hasonlít…”, stb. 2. A szemantikus háló tartalmazhat redundáns vagy „leszármaztatható” információt, mint „a tőle balra…”, vagy „tőle jobbra…”, stb.
35
Matematikai alapok: tárolt tudás, leírás és kapcsolatok
3. Megjegyzendő, hogy célunk a szemantikus hálózat információ tartalmának redukálása egyszerűen kezelhető szimbólikus reprezentációvá. 4. A szemantikus hálózatok egyszerűbbé tételéhez operátorokat használhatunk, melyekkel az állapotok közötti átmenetek megváltoztathatók, ezáltal egyszerűsödik a szemantikus hálózat.
36
A tudásreprezentáció szerepe és számítógépes modellje
A „szűk keresztmetszet” modell Nem mindig lehet felállítani egy explicit modellt a mesterséges intelligencia fejlesztésekor. Ennek oka az alkalmazás szükségleteihez képest túlméretezett tudás, beleértve a be/kimeneti adatokat vagy az ok-okozati összefüggéseket, az „a priori” információkat, a heurisztikát, és így tovább...
37
A tudásreprezentáció szerepe és számítógépes modellje
Mesterséges intelligencia modell fejlesztésének szintjei Modell fejlesztési szintek: koncepcionális (M), reprezentációs (R), implementációs (I).
38
A tudásreprezentáció szerepe és számítógépes modellje
Modell bázisú döntési folyamat (MBR) A modell bázisú döntési folyamatokban az első művelet a diagnózis felállítása, a második pedig a probléma megértése, értelmezése. „Intelligens” válasz a válaszadás alapjául szolgáló megértés szintjeinek variálásával keletkezik.
39
A tudásreprezentáció szerepe és számítógépes modellje
Intuitív döntési folyamat ...Az emberek általában elkerülik az összeütközést a környezetükben lévő tárgyakkal… Ez egy intelligens válaszadás a környezeti jellemzőkre, - de ami ennél fontosabb, - nem modell-bázisú válaszadás.
40
A tudásreprezentáció szerepe és számítógépes modellje
Mesterséges intelligencia mint reprezentáció és manipuláció A (tudás)reprezentáció olyan eljárás vagy eszköz, amely összekapcsolja egy problémakör alapvető elemeit. A manipulálható reprezentáció megkönnyíti a számítást, mert a manipulálható reprezentációkban az információ más probléma megoldó objektumok számára is elérhető, melyek a reprezentációt a számítás részeként kezelik.
41
A tudásreprezentáció szerepe és számítógépes modellje
Az intelligens viselkedéshez felhasználható tudásreprezentációt és algoritmikus stratégiákat tartalmazó modell felépítésének módszertana a következő kérdéseket veti fel: könnyen kiterjeszthető-e a modell az adott alkalmazásra vagy bármely másikra? hol vannak a modell korlátai?
42
A tudásreprezentáció szerepe és számítógépes modellje
a modell hatékonyan tárolja a kívánt információkat? az ember számára érthető és könnyen kezelhető a modell? tartalmaz a modell ellentmondást vagy oda nem illő információt?
43
A tudásreprezentáció szerepe és számítógépes modellje
Tudás reprezentáció osztályozás Megerősítő tudás a másodlagos jelentésnek, az absztrakt jelentésnek vagy egy koncepció felhasználásának az ismerete. Kiterjesztett tudás a koncepció által kifejezett dolgok halmazának ismerete. Meta-tudás ismeret a tudásról.
44
A tudásreprezentáció szerepe és számítógépes modellje
Környezetfüggő tudás a speciális probléma megoldására vonatkozó (koncepciókat és relációkat tartalmazó) körülmények és eljárások ismerete. Környezetfüggetlen tudás több általános, a problémától független körülménynek és eljárásnak az ismerete. Hierarchikus reprezentáció lehetővé teszi állapotok közötti struktúrák és komplex összefüggések modellezését.
45
A tudásreprezentáció szerepe és számítógépes modellje
A reprezentáció korlátai A kognitív tudományban sok filozófikus kérdés, mint amilyen az emberi viselkedés teljes emulációja elérhetőségének kérdése, még megválaszolatlan. Magától értetődik, hogy a természetben működő pszichológiai folyamatok tipikusan számítógépre vihetők, és ezért a megismerés számítógépes modellje felhasználható az emberi viselkedés emulálására (Fodor 1983).
46
A tudásreprezentáció szerepe és számítógépes modellje
A felvetődő kérdések: Egy komplex tudásbázissal összekapcsolt, viszonylag egyszerű irányítási stratégia elérheti-e ugyanazt a teljesítményt, mint amit egy kifinomult irányítási stratégia és egy egyszerűbb tudásbázis? Hogyan lehet egy kezdeti reprezentációt és irányítási stratégiát szisztematikusan finomítani új ismeretek, tanulás és természetesen hibák felismerése alapján?
47
A tudásreprezentáció szerepe és számítógépes modellje
A megfigyelt adatok értelmezése A reprezentáció egyik legfontosabb feladata a megfigyelések értelmezése, vagy a megfigyelt adatok egyesítése egy vagy több reprezentációval. Egy alternatív, mintavételezésen alapuló nézőpont alapján keressük a választ arra, melyik az a reprezentáció, amellyel a legjobban értelmezhetők a megfigyelt adatok.
48
A tudásreprezentáció szerepe és számítógépes modellje
A reprezentáció jellemzői Koncepció mint a teljes rendszer logikai felosztása alrendszerekre, Lét mint individuális komponens, vagy mint objektumhoz rendelt összetevő, Tulajdonságok, attribútumok és értékek mint például egy objektum színe, egy alrendszer funkciója, egy érzékelő jele, stb.
49
A tudásreprezentáció szerepe és számítógépes modellje
Kényszerek és összefüggések az objektumok között, mint relációk és oksági kapcsolatok. Alkalmazhatóság, mely szerint a reprezentáció pontosan jellemző a rendszerre vagy a környezetre. Teljesség, amely szerint a reprezentáció széles körben és átfogóan jellemzi a rendszert. Rugalmasság és bővíthetőség, mely szerint a model vagy a reprezentáció általában alkalmazható a egy szituációban.
50
A tudásreprezentáció szerepe és számítógépes modellje
Konzisztencia, mely szerint a reprezentáció nem támogatja a konfliktus feloldását, és nem használja a tudásbázist sem. Rugalmasság és manipulálhatóság, mely szerint a reprezentáció kizárja a tudásnak a cél elérése érdekében végzett manipulálását. Integrálhatóság a megfigyelhető környezet adataival. Gyakorlatiasság - ez a legnehezebben teljesíthető követelmény.
51
Tanulás A tanulás célja: az önképzés,
új vagy megváltozott körülmények adaptációja, viselkedés változtatás, a koncepció alakítása és finomítása, beleértve a koncepció modelljének általánosítását vagy specializálását.
52
Tanulás Tanulás mint modell finomítás
A tárolt tudás reprezentáció változásán alapuló tanulás kategóriái (Rummelhart/Norman, 1978): fejlődés: alapvetően ugyanaz, mint az asszimiláció, a séma hangolása: struktúra kis mértékű változtatása megengedett, szerkezet változtatás: a sémának új koncepció felállításához alkalmas nagy mértékű változtatása.
53
Tanulás Az automatizált tanulás paradigmái
1. Neurális modellezés: a tanulás a hálózatban lévő csatlakozások adaptációja. 2. Dötéselméleti technika: nyilvánvaló, hogy A1, A2,…, An változókkal aktualizálható a P(EA1, A2,…, An) predikátum. 3. Szimbólikus koncepció elsajátítás: a koncepció tárolt reprezentációjának átalakítása,megváltoztatása. 4. Konstruktív indukció (Michalski et al., 1986): megfigyelések és minták analógiájára alapozott tanulás.
54
Koncepció (hipotézis) generátor
Tanulás A bizonyításból eredő tanulási koncepció paradigmája Koncepció ellenőrzés/cáfolás algoritmusa Koncepció (hipotézis) generátor Mesterséges intelligencia tudásreprezentáció Bizonyíték (megfigyelések/adatok)
55
Tanulás Analógián alapuló tanulás paradigmája (Carbonell/Langley,1987)
Új probléma Előzőleg megoldott probléma Megoldás új problémára Megoldás régi problémára Részleges tervezés Folyamat transzformálás
56
Tanulási algoritmusok
Az egyediről az általánosra való áttérés során az indukció magába foglalja az információk összevonását vagy átszervezését, vagy szabályok fejlesztését. Az általánosítás alapján történő tanulási paradigma a következő műveleteket tartalmazza: kényszerek bizonyos kifejezésekből történő kiküszöbölését, változók állandókkal történő helyettesítését.
57
Tanulási algoritmusok
A tanulási algoritmus a mesterséges intelligencia rendszer kereteként integrálható a mesterséges intelligenciába, vagy annak integráns részeként fejleszthető. A tanulási paradigma elemi modellje: Tanulási algoritmus Tudásbázis Teljesítmény index Külső környezet Mesterséges intelligencia
58
Tanulási algoritmusok
A teljesítmény index a következők alapján számítható: az adatbázisban található információ (esetek és szabályok) mennyisége alapján, az adatbázisban található információ (esetek és szabályok) részletessége alapján, az adatbázisban található információ (esetek és szabályok) általánossága alapján, az adatbázisban található információ (esetek és szabályok) koncepcionális szervezettsége alapján.
59
Tanulási algoritmusok
Tanulás az általános-egyedi/egyedi-általános megközelítés módszerével Az algoritmus célja: egyedi-általános esetben: általános koncepcionális leírások halmazát eredményezi, általános-egyedi esetben: az egyedire legjellemzőbb koncepcionális leírások halmazát eredményezi.
60
Tanulási algoritmusok
Induktív döntés és igaz/hamis állapot Ha egy részletre vonatkozó állítás IGAZ, akkor ez a részletet tartalmazó egészre is következtetehtő. Ha azonban az állítás HAMIS, akkor az egész is az.
61
Tanulási algoritmusok
Általánosító operátorok Az általánosítás folyamata olyan, mint általánosító operátor alkalmazása a közbenső lépésekben. Legyen S1 kifejezésre G az általánosító operátor, amely a sokkal általánosabb S2 állítást eredményezi az E kumultatív tudás és tapasztalat felhasználásával. Eszerint: S2 = G(S1, E) S2 S1 Megállapítható, hogy S1 egyedi esete az általánosabb S2-nek.
62
Tanulási algoritmusok
Nem-konstruktív általánosító operátorok Számos nem-konstruktív operátor létezik, amelyekkel sokkal szélesebb körű általánosítás érhető el, ilyenek: feltételt elvető operátor, konstansokat változókkal helyettesítő operátor, diszjunktív operátor, intervallum lezáró operátor, hierarchia-generáló operátor, speciális kivétel operátor
63
Tanulási algoritmusok
Konstruktív indukciós általánosítás A tanulás ezen típusa sokkal nehezebben vizsgálható, és megvalósítása is nehezebb. A konstruktív általánosító operátor egy vagy több új leírást eredményez, így megváltoztatja a probléma reprezentációs terét.
64
Tanulási algoritmusok
Tanulás felépített modellek és strukturális csatolások felhasználásával A tanulás mint modellépítés során egy folyamat kényszer vagy modell alapján létrejött példáit vagy megvalósulásait mint tapasztalatot használjuk fel. A nagyobb koncepcionális modellek kisebb építőkockákból építhatők fel. A koncepció kialakításához felhasznált szabályok és mechanizmusok alkotják a sémát.
65
Tudásfelhasználás Bármely tudás felhasználásához valamilyen más tudás szükséges. A problémák megoldásához tudás szükséges, amely az operátorok halmazából és egy alkalmas sorrend megállapítására képes stratégiából áll.
66
Tudásfelhasználás A procedurális tudás tipikus példája a számítógépes program, ahol az egész problémamegoldó eljárás programként jelenik meg, mint a LISP és a PROLOG nyelvben. A deklaratív tudás jellegzetes esete a predikátum logikával kifejezett tudás, amikor az előre deklarált minták közül kereséssel választjuk ki a probléma megoldásához legjobb választ, mert a megoldások száma több is lehet.
67
Tudásfelhasználás A démonok (demon) folyamatosan figyelik a problémamegoldás menetét, állapotát, és amikor egy előre definiált helyzet fordul elő, belépnek a végrehajtásba, elvégzik feladatukat és inaktiválják magukat. A démon-koncepció igen elterjedt, a valósidejű operációs rendszerű számítógépek watch-dog rendszere ehhez hasonlóan működik, melynek feladata a hiba folyamatos figyelése és jelzése, minden más esetben “rejtve marad”.
68
Tudásfelhasználás A produkciós rendszerek kizárólag démonok halmazával írják le a feldolgozás folyamatát. A produkciós rendszer modelljének elemei: a produkciós szabályok halmaza, munkamemória, a szabályok alkalmazási sorrendjét meghatározó vezérlőeszközök.
69
Tudásfelhasználás A produkciós szabályokat használó rendszer jellemzői a következők: a tudás hozzáadása vagy módosítása egyszerű, könnyű megállapítani, milyen tudást tartalmaz a rendszer, a bemenő adatoktól függően a feldolgozás rugalmassá tehető,
70
Tudásfelhasználás a következtetés kidolgozása nyomon követhető, szükség esetén a szabályok megváltoztathatók, a szabályok halmazából a rendszer viselkedése nem jósolható meg, egy eljárás sorrendet nem lehet közvetlenül ábrázolni.
71
Tudásfelhasználás A felismerés - cselekvés ciklusa:
a munkamemória állapotának és aszabályok előfeltételeinek összehasonlítása, az illesztést megvalósító szabályok alkalmazása.
72
Tudásfelhasználás Konfliktusfeloldásnak nevezzük azt az eljárást, amelynek során kiválasztjuk az egyetlen alkalmazásra kerülő szabályt. A lehetséges kiválasztási módszerek a következők: a szabályokhoz prioritást kell rendelni, minél több klózt tartalmaz egy szabály, annál magasabb prioritást krll hozzárendelni, a gyakran használt szabálynak magasabb prioritást kell adni,
73
Tudásfelhasználás a leggyakrabban használt változóval rendelkező szabálynak magasabb prioritást kell adni, a szabályok halmazához legutoljára hozzáadott szabálynak magas prioritást kell adni, a végrehajtáskor minden szabályhoz prioritást kell rendelni, és a legmagasabb prioritású szabályt kell kiválasztani.
74
Neurális hálózatok Az idegsejtek - neuronok - funkciói:
jelátvétel a szomszédos neuronoktól, idegimpulzusok létrehozása, impulzusok vezetése, impulzusok átadása más neuronoknak.
75
Neurális hálózatok A neuron általános modellje: Sejttest Összegzés
Dendritek Sejttest Összegzés Küszöbérték Axon
76
Neurális hálózatok A neurális modellek általános jellemzői:
a bemeneti jelek súlyozott összegét határozzák meg, küszöblogikás feldolgozás, a bemeneti jelek alapján megváltoztathatják viselkedésüket.
77
Neurális hálózatok McCulloch és Pitts neuron modellje
Jelölések: E=h(e1,... en) a teljes bemenet, A=ƒ(E) a neuron állapota, S=g(A) a neuron kimenete. E A=(E) S=g(A) in i1 S
78
Neurális hálózatok A neuron működését leíró függvény:
h(e1,... en)= Wi ei h(e1,... en)= Wi ei - a, ahol Wi az i-dik bemenet súlyozása, - a a neuronok közötti negatív jelátviteli tényező.
79
Neurális hálózatok Matematikai modellek:
A Boole-féle neurális automata bemenetei Boole-változók, kimenete a bemenetek Boole.függvénye. A küszöbérték automaták kimenete bináris, függetlenül attól, hogy a bemeneti jelek binárisak, folytonos függvények, aktivációs függvény, egységugrás függvény (Heaviside-függvény), vagy előjelfüggvény. S=ƒ( Wi ei - a)
80
Neurális hálózatok A lineáris automata bemenetei és kimenetei folytonos függvények, a bemenet lineáris, a kimenet pedig egységugrás függvény. S= Wi ei A telítődő automata bemeneti és kimeneti értékei csak adott küszöbértékek között lehetnek, a bemenet lineáris, a kimenet pedig SATUR minősítő függvény.
81
Neurális hálózatok A folyamatos automatának valós értékű be- és kimenetei vannak, a bemeneti függvény lineáris, az aktivációs függvény a SIGMOID függvény, amelynél az átmenet exponenciális, nincs benne törés. A valósznűségi automata bemenetei és kimenetei binárisak, az aktivációs függvény stochasztikus.
82
Neurális hálózatok A SATUR(x) függvény: A SIGMOID(x) függvény: u v x
83
Neurális hálózatok A Hebb szabály - az állapotfüggő visszacsatolás
Ha két összekapcsolt neuron egyidejűleg aktiválódik, a kapcsolatuk megerősítést nyer. Minden más esetben a kapcsolat változatlan marad. A kapcsolat erősödik A kapcsolat nem változik
84
Neurális hálózatok A kapcsolat megerősítése a tanulás, ezért ennek a kapcsolatnak a súlyozása növekszik. Ha nincs megerősítés, akkor a két neuron közötti kapcsolat súlyozása kicsi. Az i-dik és a j-dik neuron közötti kapcsolat súlyozása egy t időpontban Wi j (t). Az i-dik neuron aktivációs állapota Ai a j-dik neuron aktivációs állapota Aj, ahol Ai és Aj logikai állapotok.
85
Wi j (t +t)= Wi j (t) + Ai Aj
Neurális hálózatok A Hebb szabály szerint a neurális hálózat elemeinek állapota az alábbi összefüggés szerint határozható meg a (t+t) időpontban: Wi j (t +t)= Wi j (t) + Ai Aj ahol a >0 tényező a tanulás súlyozása.
86
Neurális hálózati modellek
A perceptron Rosenblatt perceptronjának elemei: a retina, amely a stimulusokat fogadó afferens neuron cellákat tartalmazza, az asszociatív cellák rétege, amelynek egyes cellái a retina cellákhoz és más asszociatív cellákhoz és a döntési cellákhoz kapcsolódnak, a döntési cellák rétege, amelyben a kimeneti jel képződik, és amelyben a cellák az asszociatív réteg celláival azonosan működnek.
87
Neurális hálózati modellek
Egyszerűsített szerkezetű perceptronban nem lehet kapcsolat az asszociatív rétegen belül és a döntési rétegen belül a réteg cellái között. Az asszociatív és a döntési réteg cellái közötti kapcsolatokhoz súlyok vannak hozzárendelve. A Hebb szabály szerint a súlyok változtatásával „tanulhat” - helyesebben tanítható be - a háló.
88
Neurális hálózati modellek
A perceptron működési szabálya: Wi Wi+k(d - s)ei ahol k>0, d a kívánt kimenet, s pedig a tényleges kimenet. Ha d=s, akkor a súlyok nem változnak. Ha (d - s)=1, akkor Wi Wi+k ei .
89
Neurális hálózati modellek
Egyrétegű asszociatív hálózatok A lineáris küszöbértékes, két bemeneti cellához kapcsolódó döntési cella felépítése: E1 W1 W0 Q W2 E2 Döntési cella
90
Neurális hálózati modellek
Jelölések: E az osztályozandó példák halmaza, Eh a h-dik példa, Ehj az Eh példa j-dik elemének értéke, Wj a döntési cella j-dik bemenetének súlyozása, W0 a döntési cella küszöbértéke.
91
Neurális hálózati modellek
Legyen Qh a döntési cella kimeneti állapota a h-dik példa esetére. 1, ha Wj Ej W0 Qh= 0 minden más esetben
92
Neurális hálózati modellek
A perceptron tanulási algoritmusa Az algoritmus lépései: az Eh feladatot kell a hálózat bemenetére kapcsolni, meg kell határozni a h=Th - Qh értéket, módosítani kell valamennyi Wj súlyozást a Wj=k h Ehj egyenletnek megfelelően.
93
Neurális hálózati modellek
Ez az algoritmus akkor konvergens, ha a probléma megoldásai lineárisan szétválaszthatók. Ellenkező esetben az algoritmus működése bizonytalanná válhat, nem biztos, hogy a megoldás megközelíti a helyes értéket. Több megoldás esetén nehezen vagy egyáltalán nem dönthető el, melyik a helyes.
94
Neurális hálózati modellek
A Widrow-Hoff tanuló algoritmus szétválasztották az osztálybasorolást és a tanulási szabályok műveleteit, az osztálybasorolásnál a perceptronnal azonos küszöbérték elemet alkalmaztak, a tanuláskor a hibajel képzése a h=Th - Wj Ehj egyenlet szerint történik, nem pedig a perceptronnál alkalmazott h=Th - Qh összefüggéssel.
95
Neurális hálózati modellek
A „visszafelé terjesztés” elve A cél a kívánt és a tényleges kimenet közötti különbség négyzetének minimalizálása. A hibajel visszafelé terjed, értéke mindig az előző rétegek hibajeleinek súlyozott összege. A bemeneti rétegektől a kimenetek felé haladva kell figyelmbe venni az aktuális súlyozásokat, ez a relaxációs fázis, valamennyi cella hibájának négyzetösszegével mint teljes hibával visszafelé haladva kell módosítani a súlyozást.
96
Neurális hálózati modellek
A Kohonen modell a tanulási fázis csak a bemenethez legközelebbi referencia súlyozást módosítja, a módosítás helyes és hibás osztályozás esetén is megtörténik, a korrekciós eljárás numerikusan kompatíbilis az azonosítási kritériumokkal.
97
Neurális hálózati modellek
A neuron dinamikus állapotegyenlete ahol E a teljes bemenet, p(S) nem-lineáris veszteség, amely a neuron működési sebességére jellemző. dS = E – p(S) dt
98
Neurális hálózati modellek
dS A neuron állapota stabilizálódott, ha , azaz a neuron felvette a „megtanult állapotot”. Az egyenlet megoldása adja a neuron működésének leírását: S = p-1(E) = p Wj Ej , ahol p-1 függvény a SIGMOID. = 0 dt j=1 n
99
Neurális hálózati modellek
A tanulási mechanizmust leíró Kohonen-féle összefüggés az előbiek alapján: ahol (S)>0 jelenti a felejtést, és általában k0. A tanulás ebben az esetben is a Hebb szabály szerint történik. dWj = k Sej – (S) Wj dt
100
Neurális hálózati modellek
A Kohonen-hálózat egyidejűleg veszi figyelembe a külső adatokat és a belső kapcsolódásokat. Bemenetek E Kimenetek S M N
101
Neurális hálózati modellek
Az ábra jelölései: S=(SI,…,Si,…,Sn) a hálózat n kimeneti neuronjának kimeneti vektora, E=(EI,…,Ei,…,Em) a hálózat m bemeneti neuronjának kimeneti vektora, M a bemeneti neuronok bemeneteinek súlyozó vektora, N a neuronok közti kapcsolódások súlyozó vektora.
102
Neurális hálózati modellek
A Kohonen modell működését és tanulását leíró állapotegyenletek: dM dt dS dN = F(E, S, M, N) = G(E, S, M) = H(S, N) általános működést jellemző leírás külső kapcsolatok leírása belső kapcsolatok leírása
103
Neurális hálózati modellek
Időkésleltetéses neurális hálózatok A hálózat csomópontjai között nemcsak egyetlen súlyozó tényezővel jellemezhető kapcsolat van, hanem a korábbi állapotot kifejező súlyozó tényezők is hatással vannak a hálózat állapotaira. A visszafelé terjesztésnél az azonos késleltetésű szomszédos csomópontok súlyozó tényezői egyszerre változnak.
104
Neurális hálózati modellek
Változó topológiájú hálózatok A változó topológiájú hálózatok a betanítás során nyerik el végső összekapcsolódásaikat és súlyozó értékeiket, a hierarchia azonban nem feltétlenül változik: alapállapot: a pillanatnyi kiindulás, jutalmazás: új kapcsolat létesítése, létező kapcsolat jóváhagyása, megerősítése vagy gyengítése, büntetés: nem létesítünk új kapcsolatokat, tanítás: új kapcsolat létesítése, létező kapcsolat jóváhagyása, megerősítése vagy gyengítése.
105
Neurális hálózati modellek
Neuro-fuzzy rendszer A fuzzy és a neurális rendszerek alapvető különbsége a tudásreprezentáció megvalósításában van. A neurális rendszer jellemzői: a betanítás számításigényes, egymáshoz rendelhető be/kimeneti állapotokat nem táblázatosan kezeli, alkalmazások a nem struktúrált feldolgozás területén.
106
Neurális hálózati modellek
A fuzzy rendszer jellemzői: minősítő Hebb-szabály alkalmazása, kis számítási igény, alkalmazások a struktúrált feldolgozás területén.
107
Neurális hálózati modellek
Neuro-fuzzy hálózat definiálása: be/kimenetek meghatározása, minősítő részhalmazok meghatározása, hovatartozási függvények meghatározása, minták betanítása.
Hasonló előadás
© 2024 SlidePlayer.hu Inc.
All rights reserved.