Az előadás letöltése folymat van. Kérjük, várjon

Az előadás letöltése folymat van. Kérjük, várjon

Mesterséges intelligenciák Neurális hálózati struktúrájú mesterséges intelligenciák Készítette: Ormos László.

Hasonló előadás


Az előadások a következő témára: "Mesterséges intelligenciák Neurális hálózati struktúrájú mesterséges intelligenciák Készítette: Ormos László."— Előadás másolata:

1 Mesterséges intelligenciák Neurális hálózati struktúrájú mesterséges intelligenciák Készítette: Ormos László

2 Felhasznált irodalom  James, William: Psychology (Brief Course), Holt, New York,1890  Rummelhart, D. E., D. A. Norman: Accreation, tuning and restructuring: three modes of learning, „Semantic Factors in Cognition, (J.W. Cotton and R.I. Klatzky, eds.) Lawrence Erlbraum, Hillsdale, NJ,  Fodor J.: The Modularity of Mind, MIT Press, Cambridge, MA, 1983  Michalski, R.S., J.G. Carbonell, T.M. Mitchell (eds.): Machine Learning, (An Arificial Intelligence Approach), Vol II, Morgan Kaufmann Publ., Los Altos, CA, 1986  Carbonell, J., P. Langley: „Machine Learning” in Encyclopedia of Artificial Intelligence, (Saphiro, ed.), Vol. I, John Wiley, 1987

3 Felhasznált irodalom  Yoshiaki Shirai, Jun-Ichi Tsujii: Mesterséges intelligencia, Novotrade Rt., Budapest, 1987  Robert J. Schalkoff: Artificial Intelligence: An Engineering Approach, McGraw-Hill Inc.,1990  Dr. Vörös Gábor: Bevezetés a neurális és minősítő számítástechnikába (Alapismeretek a neurális hálókról és a fuzzy logikáról), LSI Oktatóközpont, A Mikroelektronika Alkalmazásának Kultúrájáért Alapítvány, Budapest, 1997  Roger Miles, Michael Moulton, Max Bramer (eds.):Research and Development in Expert Systems XV, Proceedings of ES98, the Eighteenth Annual International Conference of the British Computer Society Specialist Group on Expert Systemy, Springer, London, 1999

4 Az intelligencia …képesség mesterséges objektumok létrehozására, legfőképpen eszköz új eszközök készítéséhez. Henri Bergson L’Evolution Creatrice (1907)

5 Intelligencia kutatás A mesterséges intelligencia kutatás célja az intelligencia matematikai eszközökkel történő leírása. A matematikai módszereknek azonban szüksége van a valóság valamilyen leírására (numerikus mennyiségként), valamint egy manipulációs eljárásra. A leírás (reprezentáció) és a manipuláció a mesterséges intelligencia tudományának kulcsai.

6 Intelligencia kutatás Az intelligencia kutatás elért egy olyan szintre, ahol már láthatjuk, hogy az általános problémák nagyon nagyok, és emiatt csak a jól meghatározott, alkalmazás-orientált feladatokat tudjuk megoldani. Az elméleti kutatás az intelligencia alapvető kérdéseire koncentrál, az alkalmazott kutatás pedig az új területeket keresi a kutatás számára.

7 A mesterséges intelligencia A mesterséges intelligencia az a tudományterület, amely matematikai módszerekre alapozva keresi az intelligens viselkedés lényegét és fejlődését.

8 A mesterséges intelligencia A mesterséges intelligencia módszertana fejlődésben van. Sok más szakterület kapcsolatrendszerére támaszkodik : a logikára, a neurális hálózatokra, objektum-orientált programozásra, formális leírásra és még sorolhatnánk.

9 A mesterséges intelligencia A mesterséges intelligencia nem csupán matematika, számítógép tudomány, műszaki vagy pszichológiai szakterület, sokkal inkább ezeknek a diszciplináknak potenciális alkotó része. A mesterséges intelligencia a kognitív tudomány műszaki tudományra vetített másolata. A kognitív tudomány a filozófia, a nyelvészet és a pszichológia keveréke.

10 A mesterséges intelligencia fogalma a műszaki tudományokban A mesterséges intelligencia azoknak a mesterségesen létrehozott ábrázolásoknak és eljárásoknak az összessége, amelyek automatikusan megoldanak olyan problémákat, melyeket mindezideig emberek oldottak meg.

11 A műszaki tudomány és a kognitív tudomány A műszaki tudomány megközelítésében a mesterséges intelligencia létrehozásához szükség van programok fejlesztésére, azaz algoritmusokra és adatbázisokra, amelyek kifejezik és leírják az intelligens viselkedést.

12 A műszaki tudomány és a kognitív tudomány Mivel az intelligens viselkedést mint autonóm képességet a fejlett számítástudomány fogalmazta meg, ezt a gépi intelligencia egy alternatív leírási módjának tekinthetjük, ami megerősíti korábban tett megállapításainkat, hogy u az intelligencia gépesítése magába foglalja egy kifejező és kvantitatív leírás szükségességét, u a megfogalmazott szakértői ismeret az intelligencia kifejezése.

13 A műszaki tudomány és a kognitív tudomány Intelligens viselkedés emulálása (a legfőb célkitűzés) útvonal egy kép leírása keresése vizuális adatok alapján egy „mondat” egy elmélet értelmezése bizonyítása Intelligens viselkedési formák, amelyek nem igénylik az intelligencia általános meghatározását vagy jellemzését

14 A három legfontosabb kérdés Műszaki szempontból a mesterséges intelligencia fejlesztés alapja a jól meghatározott és átfogó tudásbázis, valamint a megfelelő hatékonyságú, sokrétű és gyakorlatias manipulációs stratégia. Eszerint meg kell határozni, u mi a tudás, u hogyan lehet megjeleníteni, u hogyan lehet manipulálni?

15 Mesterséges intelligencia alkalmazások Robottechnika  útvonal és mozdulat tervezés,  alakfelismerés,  gyártásirányítás (CAM),  gyártás-diagnosztikai rendszerek,  gyártás ütemezés.

16 Mesterséges intelligencia alkalmazások Szakértői rendszerek  gyógyászati diagnosztika (MYCIN),  harcászati irányítás,  geológiai kutatás (PROSPECTOR),  számítógép konfigurálás (XCON),  energetikai rendszerek irányítása,  gyártástervezés és ütemezés,  tervezés.

17 Mesterséges intelligencia alkalmazások Játékok Természetes nyelvek értelmezése Tétel bizonyítás Számítógéppel segített oktatás/tanulás (CAE) Automatizált döntés Automatizált programkészítés

18 A pszichológusok nézőpontja A pszichlógusok Aristoteles óta figyelik az emberi döntés és viselkedés folyamatait. William James (Psychology, 1890) észrevette, hogy a biológiai döntéshozó rendszerek - beleértve az emberi agyat is, - nem az absztrakt gondolkodás, hanem a túlélési lehetőség felismerésének céljából fejlődtek ki.

19 A pszichológusok nézőpontja A viselkedést, a döntés folyamatát mentális szempontból abban az összefüggésben és abban a sajátos környezetben kell tanulmányozni, ahol a döntés születeik. Eszerint u a döntési folyamat nem fejlődhet a semmiben, u a döntési folyamat a megelőző stratégiák adaptációja lehet, u a döntési folyamat gyakran alkalmazásfüggő.

20 A pszichológusok nézőpontja James feltételezte, hogy a diszkrimináció és asszociáció elve egyformán fontos az emberi agy döntési folyamatában, amely elv a lebontás és felépítés koncepcióját tartalmazza. E felismerés a mesterséges intelligencia kutatásban a tudásbázis fejlesztés egyik alapvető stratégiai elve.

21 A pszichológusok nézőpontja Az előbbiek alapján u ajánlja a hierarchikus struktúrák alkalmazását, u felhasználja a gondolatok összefüggésének vagy asszociációjának elvét. Az emberi intelligencia nemcsak a változtathatatlan eseményekre, vagy igazságokra és a logikára épül, hanem a tapasztalat és az intuíció is fontos szerepet játszik.

22 Mesterséges intelligencia alkalmazások  tudásreprezentáció,  struktúra,  „értelem”,  ismeret szerzés.

23 Mesterséges intelligencia alkalmazások Egyéb alapvető és kapcsolódó témák: u következtetési és irányítási (manipulációs) stratégiák, u tanulási és adaptációs képesség (kísérletekből, példákból, vagy egy „tanártól”), u bizonytalanság és befejezetlen döntési folyamat megjelenítése, u keresési és illesztési technkák, u egyesítés és felbontás,

24 Mesterséges intelligencia alkalmazások u nem-monoton döntési folyamat (következtetések visszavonása ellenőrzött információk alapján), u tapasztalat szerzés („generálás és ellenőrzés”), u probléma dekompozíció, vagy elsődleges célok redukálása részfeladatokká, u döntésformák (pl. dedukció, indukció, józan ész), u a „jó” elfogadása az optimális megoldással szemben, u célszerű programozási és leíró nyelvek.

25 Matematikai alapok: tárolt tudás, leírás és kapcsolatok Tételezzük fel, hogy az x és y változók közötti kapcsolat szimbólumokkal, számokkal, műveletekkel vagy fogalmakkal leírható, mint például az x objektum R tulajdonságának értéke y Ez alapján x és R az ƒ y függvény argumentumai, melyek az y értékét határozzák meg: y = ƒ y (x, R)

26 Matematikai alapok: tárolt tudás, leírás és kapcsolatok Ha x és R véges halmazok, a kapcsolat a következő hármassal írható le: (R, x, y ), mely megfelel a (attribútum, objektum, érték) formátumnak, amit úgy olvasunk, hogy „az objektum attribútuma az érték”, vagy „x és y relációja R”. Grafikusan R x  y

27 Matematikai alapok: tárolt tudás, leírás és kapcsolatok Relációk és példák Ha A és B halmazok, akkor A és B relációja az A X B részhalmaz. Az összefüggés felfogható bináris relációként is, mert csak két halmazt tartalmaz, és a halmazok elemeinek egyfajta „összekapcsolását” eredményezi. A halmazok összekapcsolódásának módja, az összekapcsolódás tulajdonságai vagy viszonya az, ami fontos.

28 Matematikai alapok: tárolt tudás, leírás és kapcsolatok Relációk és tulajdonságok  reflexív: R reflexív, ha minden a  A esetén (a,a)  R,  szimmetrikus: R szimmetrikus, ha minden (a,b)  R esetén (b,a)  R igaz,  tranzitív: R tranzitív, ha minden (a,b)  R és (b,c)  R esetén (a,c)  R igaz.

29 Matematikai alapok: tárolt tudás, leírás és kapcsolatok Harmadrendű (és magasabb rendű) relációk és kényszerek A bináris relációk a párba rendezett objektumok (objektum-párok) közötti kapcsolatrendszert írják le. De vannak relációk (és természetesen kényszerek is) objetktum-hármasok, objektum-négyesek, stb. között is.

30 Matematikai alapok: tárolt tudás, leírás és kapcsolatok Az A, B, C halmazhármas objektumai közötti relációt definiálja a két részhalmazra bontott (A X B) X C összefüggés, amelyet az ((a,b),c) hármassal lehet leírni. Hasonló módon az A, B, C, D halmaznégyes is definiálható részhalmazokkal az (((A X B) X C) X D) összefüggés szerint, amely a (((a,b),c),d) négyessel írható le.

31 Matematikai alapok: tárolt tudás, leírás és kapcsolatok Relációs táblázatok A bináris és magasabb (harmad-, negyed-) rendű relációkat kényelmesebben lehet leírni relációs táblázatok felhasználásával. Ezek a táblázatok n-ed rendű relációkat sorolnak fel táblázatos formában. A következő ábrán egy relációs táblázat látható.

32 Matematikai alapok: tárolt tudás, leírás és kapcsolatok Relációs táblázatok

33 Matematikai alapok: tárolt tudás, leírás és kapcsolatok A szemantikus hálózat objektumok, fogalmak, szituációk vagy műveletek összefüggéseinek (és tulajdonságainak) leírására szolgáló gráf. A koncepcionális gráf a szemantikus hálózatokhoz hasonlóan elképzelések, műveletek és szituációk koncepcionális kapcsolatait szemlélteti a „ki mit csinál, kinek” meghatározás szerint.

34 Matematikai alapok: tárolt tudás, leírás és kapcsolatok A szemantikus hálózatobjektumokat és relációkat tartalmaz, és a „valós világ” ábrázolása elég bonyolult. Néhány észrevétel ezzel kapcsolatban: 1. A szemantikus háló gyakran több különböző relációt is tartalmaz, mint „ez egy...”, „a tulajdonsága,hogy...”, „arra alkalmas, hogy...”, „hasonlít…”, stb. 2. A szemantikus háló tartalmazhat redundáns vagy „leszármaztatható” információt, mint „a tőle balra…”, vagy „tőle jobbra…”, stb.

35 Matematikai alapok: tárolt tudás, leírás és kapcsolatok 3. Megjegyzendő, hogy célunk a szemantikus hálózat információ tartalmának redukálása egyszerűen kezelhető szimbólikus reprezentációvá. 4. A szemantikus hálózatok egyszerűbbé tételéhez operátorokat használhatunk, melyekkel az állapotok közötti átmenetek megváltoztathatók, ezáltal egyszerűsödik a szemantikus hálózat.

36 A tudásreprezentáció szerepe és számítógépes modellje A „szűk keresztmetszet” modell Nem mindig lehet felállítani egy explicit modellt a mesterséges intelligencia fejlesztésekor. Ennek oka az alkalmazás szükségleteihez képest túlméretezett tudás, beleértve a be/kimeneti adatokat vagy az ok-okozati összefüggéseket, az „a priori” információkat, a heurisztikát, és így tovább...

37 A tudásreprezentáció szerepe és számítógépes modellje Mesterséges intelligencia modell fejlesztésének szintjei Modell fejlesztési szintek: u koncepcionális (M), u reprezentációs (R), u implementációs (I).

38 A tudásreprezentáció szerepe és számítógépes modellje Modell bázisú döntési folyamat (MBR) A modell bázisú döntési folyamatokban az első művelet a diagnózis felállítása, a második pedig a probléma megértése, értelmezése. „Intelligens” válasz a válaszadás alapjául szolgáló megértés szintjeinek variálásával keletkezik.

39 A tudásreprezentáció szerepe és számítógépes modellje Intuitív döntési folyamat...Az emberek általában elkerülik az összeütközést a környezetükben lévő tárgyakkal… Ez egy intelligens válaszadás a környezeti jellemzőkre, - de ami ennél fontosabb, - nem modell-bázisú válaszadás.

40 A tudásreprezentáció szerepe és számítógépes modellje Mesterséges intelligencia mint reprezentáció és manipuláció A (tudás)reprezentáció olyan eljárás vagy eszköz, amely összekapcsolja egy problémakör alapvető elemeit. A manipulálható reprezentáció megkönnyíti a számítást, mert a manipulálható reprezentációkban az információ más probléma megoldó objektumok számára is elérhető, melyek a reprezentációt a számítás részeként kezelik.

41 A tudásreprezentáció szerepe és számítógépes modellje Az intelligens viselkedéshez felhasználható tudásreprezentációt és algoritmikus stratégiákat tartalmazó modell felépítésének módszertana a következő kérdéseket veti fel: u könnyen kiterjeszthető-e a modell az adott alkalmazásra vagy bármely másikra? u hol vannak a modell korlátai?

42 A tudásreprezentáció szerepe és számítógépes modellje  a modell hatékonyan tárolja a kívánt információkat?  az ember számára érthető és könnyen kezelhető a modell?  tartalmaz a modell ellentmondást vagy oda nem illő információt?

43 A tudásreprezentáció szerepe és számítógépes modellje Tudás reprezentáció osztályozás  Megerősítő tudás a másodlagos jelentésnek, az absztrakt jelentésnek vagy egy koncepció felhasználásának az ismerete.  Kiterjesztett tudás a koncepció által kifejezett dolgok halmazának ismerete.  Meta-tudás ismeret a tudásról.

44 A tudásreprezentáció szerepe és számítógépes modellje  Környezetfüggő tudás a speciális probléma megoldására vonatkozó (koncepciókat és relációkat tartalmazó) körülmények és eljárások ismerete.  Környezetfüggetlen tudás több általános, a problémától független körülménynek és eljárásnak az ismerete.  Hierarchikus reprezentáció lehetővé teszi állapotok közötti struktúrák és komplex összefüggések modellezését.

45 A tudásreprezentáció szerepe és számítógépes modellje A reprezentáció korlátai A kognitív tudományban sok filozófikus kérdés, mint amilyen az emberi viselkedés teljes emulációja elérhetőségének kérdése, még megválaszolatlan. Magától értetődik, hogy a természetben működő pszichológiai folyamatok tipikusan számítógépre vihetők, és ezért a megismerés számítógépes modellje felhasználható az emberi viselkedés emulálására (Fodor 1983).

46 A tudásreprezentáció szerepe és számítógépes modellje A felvetődő kérdések:  Egy komplex tudásbázissal összekapcsolt, viszonylag egyszerű irányítási stratégia elérheti-e ugyanazt a teljesítményt, mint amit egy kifinomult irányítási stratégia és egy egyszerűbb tudásbázis?  Hogyan lehet egy kezdeti reprezentációt és irányítási stratégiát szisztematikusan finomítani új ismeretek, tanulás és természetesen hibák felismerése alapján?

47 A tudásreprezentáció szerepe és számítógépes modellje A megfigyelt adatok értelmezése A reprezentáció egyik legfontosabb feladata a megfigyelések értelmezése, vagy a megfigyelt adatok egyesítése egy vagy több reprezentációval. Egy alternatív, mintavételezésen alapuló nézőpont alapján keressük a választ arra, melyik az a reprezentáció, amellyel a legjobban értelmezhetők a megfigyelt adatok.

48 A tudásreprezentáció szerepe és számítógépes modellje A reprezentáció jellemzői  Koncepció mint a teljes rendszer logikai felosztása alrendszerekre,  Lét mint individuális komponens, vagy mint objektumhoz rendelt összetevő,  Tulajdonságok, attribútumok és értékek mint például egy objektum színe, egy alrendszer funkciója, egy érzékelő jele, stb.

49 A tudásreprezentáció szerepe és számítógépes modellje  Kényszerek és összefüggések az objektumok között, mint relációk és oksági kapcsolatok.  Alkalmazhatóság, mely szerint a reprezentáció pontosan jellemző a rendszerre vagy a környezetre.  Teljesség, amely szerint a reprezentáció széles körben és átfogóan jellemzi a rendszert.  Rugalmasság és bővíthetőség, mely szerint a model vagy a reprezentáció általában alkalmazható a egy szituációban.

50 A tudásreprezentáció szerepe és számítógépes modellje  Konzisztencia, mely szerint a reprezentáció nem támogatja a konfliktus feloldását, és nem használja a tudásbázist sem.  Rugalmasság és manipulálhatóság, mely szerint a reprezentáció kizárja a tudásnak a cél elérése érdekében végzett manipulálását.  Integrálhatóság a megfigyelhető környezet adataival.  Gyakorlatiasság - ez a legnehezebben teljesíthető követelmény.

51 Tanulás A tanulás célja: u az önképzés, u új vagy megváltozott körülmények adaptációja, u viselkedés változtatás, u a koncepció alakítása és finomítása, beleértve a koncepció modelljének általánosítását vagy specializálását.

52 Tanulás Tanulás mint modell finomítás A tárolt tudás reprezentáció változásán alapuló tanulás kategóriái (Rummelhart/Norman, 1978):  fejlődés: alapvetően ugyanaz, mint az asszimiláció,  a séma hangolása: struktúra kis mértékű változtatása megengedett,  szerkezet változtatás: a sémának új koncepció felállításához alkalmas nagy mértékű változtatása.

53 Tanulás Az automatizált tanulás paradigmái 1. Neurális modellezés: a tanulás a hálózatban lévő csatlakozások adaptációja. 2. Dötéselméleti technika: nyilvánvaló, hogy A 1, A 2,…, A n változókkal aktualizálható a P(E  A 1, A 2,…, A n ) predikátum. 3. Szimbólikus koncepció elsajátítás: a koncepció tárolt reprezentációjának átalakítása,megváltoztatása. 4. Konstruktív indukció (Michalski et al., 1986): megfigyelések és minták analógiájára alapozott tanulás.

54 Tanulás A bizonyításból eredő tanulási koncepció paradigmája Koncepció ellenőrzés/cáfolás algoritmusa Koncepció (hipotézis) generátor Mesterséges intelligencia tudásreprezentáció Bizonyíték (megfigyelések/adatok)

55 Tanulás Analógián alapuló tanulás paradigmája (Carbonell/Langley,1987) Folyamat transzformálás Új probléma Előzőleg megoldott probléma Megoldás új problémára Megoldás régi problémára Részleges tervezés

56 Tanulási algoritmusok Az egyediről az általánosra való áttérés során az indukció magába foglalja az információk összevonását vagy átszervezését, vagy szabályok fejlesztését. Az általánosítás alapján történő tanulási paradigma a következő műveleteket tartalmazza: u kényszerek bizonyos kifejezésekből történő kiküszöbölését, u változók állandókkal történő helyettesítését.

57 Tanulási algoritmusok A tanulási algoritmus a mesterséges intelligencia rendszer kereteként integrálható a mesterséges intelligenciába, vagy annak integráns részeként fejleszthető. A tanulási paradigma elemi modellje: Tanulási algoritmus Tudásbázis Teljesítmény index Külső környezet Mesterséges intelligencia

58 Tanulási algoritmusok A teljesítmény index a következők alapján számítható: u az adatbázisban található információ (esetek és szabályok) mennyisége alapján, u az adatbázisban található információ (esetek és szabályok) részletessége alapján, u az adatbázisban található információ (esetek és szabályok) általánossága alapján, u az adatbázisban található információ (esetek és szabályok) koncepcionális szervezettsége alapján.

59 Tanulási algoritmusok Tanulás az általános-egyedi/egyedi-általános megközelítés módszerével Az algoritmus célja: u egyedi-általános esetben: általános koncepcionális leírások halmazát eredményezi, u általános-egyedi esetben: az egyedire legjellemzőbb koncepcionális leírások halmazát eredményezi.

60 Tanulási algoritmusok Induktív döntés és igaz/hamis állapot Ha egy részletre vonatkozó állítás IGAZ, akkor ez a részletet tartalmazó egészre is következtetehtő. Ha azonban az állítás HAMIS, akkor az egész is az.

61 Tanulási algoritmusok Általánosító operátorok Az általánosítás folyamata olyan, mint általánosító operátor alkalmazása a közbenső lépésekben. Legyen S 1 kifejezésre G az általánosító operátor, amely a sokkal általánosabb S 2 állítást eredményezi az E kumultatív tudás és tapasztalat felhasználásával. Eszerint: S 2 = G(S 1, E) S 2  S 1 Megállapítható, hogy S 1 egyedi esete az általánosabb S 2 -nek.

62 Tanulási algoritmusok Nem-konstruktív általánosító operátorok Számos nem-konstruktív operátor létezik, amelyekkel sokkal szélesebb körű általánosítás érhető el, ilyenek: u feltételt elvető operátor, u konstansokat változókkal helyettesítő operátor, u diszjunktív operátor, u intervallum lezáró operátor, u hierarchia-generáló operátor, u speciális kivétel operátor

63 Tanulási algoritmusok Konstruktív indukciós általánosítás A tanulás ezen típusa sokkal nehezebben vizsgálható, és megvalósítása is nehezebb. A konstruktív általánosító operátor egy vagy több új leírást eredményez, így megváltoztatja a probléma reprezentációs terét.

64 Tanulási algoritmusok Tanulás felépített modellek és strukturális csatolások felhasználásával A tanulás mint modellépítés során egy folyamat kényszer vagy modell alapján létrejött példáit vagy megvalósulásait mint tapasztalatot használjuk fel. A nagyobb koncepcionális modellek kisebb építőkockákból építhatők fel. A koncepció kialakításához felhasznált szabályok és mechanizmusok alkotják a sémát.

65 Tudásfelhasználás Bármely tudás felhasználásához valamilyen más tudás szükséges. A problémák megoldásához tudás szükséges, amely az operátorok halmazából és egy alkalmas sorrend megállapítására képes stratégiából áll.

66 Tudásfelhasználás A procedurális tudás tipikus példája a számítógépes program, ahol az egész problémamegoldó eljárás programként jelenik meg, mint a LISP és a PROLOG nyelvben. A deklaratív tudás jellegzetes esete a predikátum logikával kifejezett tudás, amikor az előre deklarált minták közül kereséssel választjuk ki a probléma megoldásához legjobb választ, mert a megoldások száma több is lehet.

67 Tudásfelhasználás A démonok (demon) folyamatosan figyelik a problémamegoldás menetét, állapotát, és amikor egy előre definiált helyzet fordul elő, belépnek a végrehajtásba, elvégzik feladatukat és inaktiválják magukat. A démon-koncepció igen elterjedt, a valósidejű operációs rendszerű számítógépek watch-dog rendszere ehhez hasonlóan működik, melynek feladata a hiba folyamatos figyelése és jelzése, minden más esetben “rejtve marad”.

68 Tudásfelhasználás A produkciós rendszerek kizárólag démonok halmazával írják le a feldolgozás folyamatát. A produkciós rendszer modelljének elemei: u a produkciós szabályok halmaza, u munkamemória,  a szabályok alkalmazási sorrendjét meghatározó vezérlőeszközök.

69 Tudásfelhasználás A produkciós szabályokat használó rendszer jellemzői a következők: u a tudás hozzáadása vagy módosítása egyszerű, u könnyű megállapítani, milyen tudást tartalmaz a rendszer, u a bemenő adatoktól függően a feldolgozás rugalmassá tehető,

70 Tudásfelhasználás  a következtetés kidolgozása nyomon követhető, szükség esetén a szabályok megváltoztathatók,  a szabályok halmazából a rendszer viselkedése nem jósolható meg,  egy eljárás sorrendet nem lehet közvetlenül ábrázolni.

71 Tudásfelhasználás A felismerés - cselekvés ciklusa: u a munkamemória állapotának és aszabályok előfeltételeinek összehasonlítása,  az illesztést megvalósító szabályok alkalmazása.

72 Tudásfelhasználás Konfliktusfeloldásnak nevezzük azt az eljárást, amelynek során kiválasztjuk az egyetlen alkalmazásra kerülő szabályt. A lehetséges kiválasztási módszerek a következők: u a szabályokhoz prioritást kell rendelni, u minél több klózt tartalmaz egy szabály, annál magasabb prioritást krll hozzárendelni, u a gyakran használt szabálynak magasabb prioritást kell adni,

73 Tudásfelhasználás  a leggyakrabban használt változóval rendelkező szabálynak magasabb prioritást kell adni,  a szabályok halmazához legutoljára hozzáadott szabálynak magas prioritást kell adni,  a végrehajtáskor minden szabályhoz prioritást kell rendelni, és a legmagasabb prioritású szabályt kell kiválasztani.

74 Neurális hálózatok Az idegsejtek - neuronok - funkciói:  jelátvétel a szomszédos neuronoktól,  idegimpulzusok létrehozása,  impulzusok vezetése,  impulzusok átadása más neuronoknak.

75 Neurális hálózatok A neuron általános modellje:  Dendritek Sejttest ÖsszegzésKüszöbérték Axon

76 Neurális hálózatok A neurális modellek általános jellemzői:  a bemeneti jelek súlyozott összegét határozzák meg,  küszöblogikás feldolgozás,  a bemeneti jelek alapján megváltoztathatják viselkedésüket.

77 Neurális hálózatok McCulloch és Pitts neuron modellje Jelölések:E=h(e 1,... e n ) a teljes bemenet, A=ƒ(E)a neuron állapota, S=g(A)a neuron kimenete. E A=  (E) S=g(A) inin i1i1 S

78 Neurális hálózatok A neuron működését leíró függvény: h(e 1,... e n )=  W i e i h(e 1,... e n )=  W i e i - a, ahol W i az i-dik bemenet súlyozása, - a a neuronok közötti negatív jelátviteli tényező.

79 Neurális hálózatok Matematikai modellek:  A Boole-féle neurális automata bemenetei Boole- változók, kimenete a bemenetek Boole.függvénye.  A küszöbérték automaták kimenete bináris, függetlenül attól, hogy a bemeneti jelek binárisak, folytonos függvények, aktivációs függvény, egységugrás függvény (Heaviside-függvény), vagy előjelfüggvény. S=ƒ(  W i e i - a)

80 Neurális hálózatok  A lineáris automata bemenetei és kimenetei folytonos függvények, a bemenet lineáris, a kimenet pedig egységugrás függvény. S= W i e i  A telítődő automata bemeneti és kimeneti értékei csak adott küszöbértékek között lehetnek, a bemenet lineáris, a kimenet pedig SATUR minősítő függvény.

81 Neurális hálózatok  A folyamatos automatának valós értékű be- és kimenetei vannak, a bemeneti függvény lineáris, az aktivációs függvény a SIGMOID függvény, amelynél az átmenet exponenciális, nincs benne törés.  A valósznűségi automata bemenetei és kimenetei binárisak, az aktivációs függvény stochasztikus.

82 Neurális hálózatok A SATUR(x) függvény:A SIGMOID(x) függvény: u v x SATUR(x) x u v SIGMOID(x)

83 Neurális hálózatok A Hebb szabály - az állapotfüggő visszacsatolás Ha két összekapcsolt neuron egyidejűleg aktiválódik, a kapcsolatuk megerősítést nyer. Minden más esetben a kapcsolat változatlan marad. A kapcsolat erősödik A kapcsolat nem változik

84 Neurális hálózatok A kapcsolat megerősítése a tanulás, ezért ennek a kapcsolatnak a súlyozása növekszik. Ha nincs megerősítés, akkor a két neuron közötti kapcsolat súlyozása kicsi. Az i-dik és a j-dik neuron közötti kapcsolat súlyozása egy t időpontban W i j (t). Az i-dik neuron aktivációs állapota A i a j-dik neuron aktivációs állapota A j, ahol A i és A j logikai állapotok.

85 Neurális hálózatok A Hebb szabály szerint a neurális hálózat elemeinek állapota az alábbi összefüggés szerint határozható meg a (t+  t) időpontban: W i j (t +  t)= W i j (t) +  A i A j ahol a  >0 tényező a tanulás súlyozása.

86 Neurális hálózati modellek A perceptron Rosenblatt perceptronjának elemei:  a retina, amely a stimulusokat fogadó afferens neuron cellákat tartalmazza,  az asszociatív cellák rétege, amelynek egyes cellái a retina cellákhoz és más asszociatív cellákhoz és a döntési cellákhoz kapcsolódnak,  a döntési cellák rétege, amelyben a kimeneti jel képződik, és amelyben a cellák az asszociatív réteg celláival azonosan működnek.

87 Neurális hálózati modellek Egyszerűsített szerkezetű perceptronban nem lehet kapcsolat az asszociatív rétegen belül és a döntési rétegen belül a réteg cellái között. Az asszociatív és a döntési réteg cellái közötti kapcsolatokhoz súlyok vannak hozzárendelve. A Hebb szabály szerint a súlyok változtatásával „tanulhat” - helyesebben tanítható be - a háló.

88 Neurális hálózati modellek A perceptron működési szabálya: W i  W i +k(d - s)e i ahol k>0, d a kívánt kimenet, s pedig a tényleges kimenet. Ha d=s, akkor a súlyok nem változnak. Ha (d - s)=1, akkor W i  W i +k e i.

89 Neurális hálózati modellek Egyrétegű asszociatív hálózatok A lineáris küszöbértékes, két bemeneti cellához kapcsolódó döntési cella felépítése:  W1W1 W2W2 W0W0 E1E1 E2E2 Döntési cella Q

90 Neurális hálózati modellek Jelölések: Eaz osztályozandó példák halmaza, E h a h-dik példa, E h j az E h példa j-dik elemének értéke, W j a döntési cella j-dik bemenetének súlyozása, W 0 a döntési cella küszöbértéke.

91 Neurális hálózati modellek Legyen Q h a döntési cella kimeneti állapota a h-dik példa esetére. 1, ha  W j E j  W 0 Q h = 0 minden más esetben

92 Neurális hálózati modellek A perceptron tanulási algoritmusa Az algoritmus lépései:  az E h feladatot kell a hálózat bemenetére kapcsolni,  meg kell határozni a  h =T h - Q h értéket,  módosítani kell valamennyi W j súlyozást a  W j =k  h E h j egyenletnek megfelelően.

93 Neurális hálózati modellek Ez az algoritmus akkor konvergens, ha a probléma megoldásai lineárisan szétválaszthatók. Ellenkező esetben az algoritmus működése bizonytalanná válhat, nem biztos, hogy a megoldás megközelíti a helyes értéket. Több megoldás esetén nehezen vagy egyáltalán nem dönthető el, melyik a helyes.

94 Neurális hálózati modellek A Widrow-Hoff tanuló algoritmus  szétválasztották az osztálybasorolást és a tanulási szabályok műveleteit,  az osztálybasorolásnál a perceptronnal azonos küszöbérték elemet alkalmaztak,  a tanuláskor a hibajel képzése a  h =T h -  W j E h j egyenlet szerint történik, nem pedig a perceptronnál alkalmazott  h =T h - Q h összefüggéssel.

95 Neurális hálózati modellek A „visszafelé terjesztés” elve A cél a kívánt és a tényleges kimenet közötti különbség négyzetének minimalizálása. A hibajel visszafelé terjed, értéke mindig az előző rétegek hibajeleinek súlyozott összege. u A bemeneti rétegektől a kimenetek felé haladva kell figyelmbe venni az aktuális súlyozásokat, ez a relaxációs fázis, u valamennyi cella hibájának négyzetösszegével mint teljes hibával visszafelé haladva kell módosítani a súlyozást.

96 Neurális hálózati modellek A Kohonen modell  a tanulási fázis csak a bemenethez legközelebbi referencia súlyozást módosítja,  a módosítás helyes és hibás osztályozás esetén is megtörténik,  a korrekciós eljárás numerikusan kompatíbilis az azonosítási kritériumokkal.

97 Neurális hálózati modellek A neuron dinamikus állapotegyenlete ahol E a teljes bemenet, p(S)nem-lineáris veszteség, amely a neuron működési sebességére jellemző. dS = E – p(S) dt

98 Neurális hálózati modellek A neuron állapota stabilizálódott, ha, azaz a neuron felvette a „megtanult állapotot”. Az egyenlet megoldása adja a neuron működésének leírását: S = p -1 (E) = p -1 W j E j, ahol p -1 függvény a SIGMOID. dS = 0 dt  j=1 n

99 Neurális hálózati modellek A tanulási mechanizmust leíró Kohonen-féle összefüggés az előbiek alapján: ahol  (S)>0 jelenti a felejtést, és általában k  0. A tanulás ebben az esetben is a Hebb szabály szerint történik. dW j = k Se j –  (S) W j dt

100 Neurális hálózati modellek A Kohonen-hálózat egyidejűleg veszi figyelembe a külső adatokat és a belső kapcsolódásokat. Bemenetek E Kimenetek S M N

101 Neurális hálózati modellek Az ábra jelölései: S=(SI,…,S i,…,S n ) a hálózat n kimeneti neuronjának kimeneti vektora, E=(EI,…,E i,…,E m ) a hálózat m bemeneti neuronjának kimeneti vektora, M a bemeneti neuronok bemeneteinek súlyozó vektora, N a neuronok közti kapcsolódások súlyozó vektora.

102 Neurális hálózati modellek A Kohonen modell működését és tanulását leíró állapotegyenletek: dM dt dS dt dN dt = F(E, S, M, N) = G(E, S, M) = H(S, N) általános működést jellemző leírás külső kapcsolatok leírása belső kapcsolatok leírása

103 Neurális hálózati modellek Időkésleltetéses neurális hálózatok A hálózat csomópontjai között nemcsak egyetlen súlyozó tényezővel jellemezhető kapcsolat van, hanem a korábbi állapotot kifejező súlyozó tényezők is hatással vannak a hálózat állapotaira. A visszafelé terjesztésnél az azonos késleltetésű szomszédos csomópontok súlyozó tényezői egyszerre változnak.

104 Neurális hálózati modellek Változó topológiájú hálózatok A változó topológiájú hálózatok a betanítás során nyerik el végső összekapcsolódásaikat és súlyozó értékeiket, a hierarchia azonban nem feltétlenül változik: u alapállapot: a pillanatnyi kiindulás, u jutalmazás: új kapcsolat létesítése, létező kapcsolat jóváhagyása, megerősítése vagy gyengítése, u büntetés: nem létesítünk új kapcsolatokat, u tanítás: új kapcsolat létesítése, létező kapcsolat jóváhagyása, megerősítése vagy gyengítése.

105 Neurális hálózati modellek Neuro-fuzzy rendszer A fuzzy és a neurális rendszerek alapvető különbsége a tudásreprezentáció megvalósításában van. A neurális rendszer jellemzői: u a betanítás számításigényes, u egymáshoz rendelhető be/kimeneti állapotokat nem táblázatosan kezeli, u alkalmazások a nem struktúrált feldolgozás területén.

106 Neurális hálózati modellek A fuzzy rendszer jellemzői: u minősítő Hebb-szabály alkalmazása, u kis számítási igény, u alkalmazások a struktúrált feldolgozás területén.

107 Neurális hálózati modellek Neuro-fuzzy hálózat definiálása: u be/kimenetek meghatározása, u minősítő részhalmazok meghatározása, u hovatartozási függvények meghatározása, u minták betanítása.


Letölteni ppt "Mesterséges intelligenciák Neurális hálózati struktúrájú mesterséges intelligenciák Készítette: Ormos László."

Hasonló előadás


Google Hirdetések