Mesterséges intelligenciák

Mesterséges intelligenciák
Neurális hálózati struktúrájú mesterséges intelligenciák Készítette: Ormos László

Felhasznált irodalom James, William: Psychology (Brief Course), Holt, New York,1890 Rummelhart, D. E., D. A. Norman: Accreation, tuning and restructuring: three modes of learning, „Semantic Factors in Cognition, (J.W. Cotton and R.I. Klatzky, eds.) Lawrence Erlbraum, Hillsdale, NJ, 1978. Fodor J.: The Modularity of Mind, MIT Press, Cambridge, MA, 1983 Michalski, R.S., J.G. Carbonell, T.M. Mitchell (eds.): Machine Learning, (An Arificial Intelligence Approach), Vol II, Morgan Kaufmann Publ., Los Altos, CA, 1986 Carbonell, J., P. Langley: „Machine Learning” in Encyclopedia of Artificial Intelligence, (Saphiro, ed.), Vol. I, John Wiley, 1987

Felhasznált irodalom Yoshiaki Shirai, Jun-Ichi Tsujii: Mesterséges intelligencia, Novotrade Rt., Budapest, 1987 Robert J. Schalkoff: Artificial Intelligence: An Engineering Approach, McGraw-Hill Inc.,1990 Dr. Vörös Gábor: Bevezetés a neurális és minősítő számítástechnikába (Alapismeretek a neurális hálókról és a fuzzy logikáról), LSI Oktatóközpont, A Mikroelektronika Alkalmazásának Kultúrájáért Alapítvány, Budapest, 1997 Roger Miles, Michael Moulton, Max Bramer (eds.):Research and Development in Expert Systems XV, Proceedings of ES98, the Eighteenth Annual International Conference of the British Computer Society Specialist Group on Expert Systemy, Springer, London, 1999

Az intelligencia …képesség mesterséges objektumok létrehozására, legfőképpen eszköz új eszközök készítéséhez. Henri Bergson L’Evolution Creatrice (1907)

Intelligencia kutatás
A mesterséges intelligencia kutatás célja az intelligencia matematikai eszközökkel történő leírása. A matematikai módszereknek azonban szüksége van a valóság valamilyen leírására (numerikus mennyiségként), valamint egy manipulációs eljárásra. A leírás (reprezentáció) és a manipuláció a mesterséges intelligencia tudományának kulcsai.

Intelligencia kutatás
Az intelligencia kutatás elért egy olyan szintre, ahol már láthatjuk, hogy az általános problémák nagyon nagyok, és emiatt csak a jól meghatározott, alkalmazás-orientált feladatokat tudjuk megoldani. Az elméleti kutatás az intelligencia alapvető kérdéseire koncentrál, az alkalmazott kutatás pedig az új területeket keresi a kutatás számára.

A mesterséges intelligencia
A mesterséges intelligencia az a tudományterület, amely matematikai módszerekre alapozva keresi az intelligens viselkedés lényegét és fejlődését.

A mesterséges intelligencia módszertana fejlődésben van. Sok más szakterület kapcsolatrendszerére támaszkodik : a logikára, a neurális hálózatokra, objektum-orientált programozásra, formális leírásra és még sorolhatnánk.

A mesterséges intelligencia nem csupán matematika, számítógép tudomány, műszaki vagy pszichológiai szakterület, sokkal inkább ezeknek a diszciplináknak potenciális alkotó része. A mesterséges intelligencia a kognitív tudomány műszaki tudományra vetített másolata. A kognitív tudomány a filozófia, a nyelvészet és a pszichológia keveréke.

A mesterséges intelligencia fogalma a műszaki tudományokban
A mesterséges intelligencia azoknak a mesterségesen létrehozott ábrázolásoknak és eljárásoknak az összessége, amelyek automatikusan megoldanak olyan problémákat, melyeket mindezideig emberek oldottak meg.

A műszaki tudomány és a kognitív tudomány
A műszaki tudomány megközelítésében a mesterséges intelligencia létrehozásához szükség van programok fejlesztésére, azaz algoritmusokra és adatbázisokra, amelyek kifejezik és leírják az intelligens viselkedést.

Mivel az intelligens viselkedést mint autonóm képességet a fejlett számítástudomány fogalmazta meg, ezt a gépi intelligencia egy alternatív leírási módjának tekinthetjük, ami megerősíti korábban tett megállapításainkat, hogy az intelligencia gépesítése magába foglalja egy kifejező és kvantitatív leírás szükségességét, a megfogalmazott szakértői ismeret az intelligencia kifejezése.

Intelligens viselkedés emulálása (a legfőb célkitűzés) útvonal egy kép leírása keresése vizuális adatok alapján egy „mondat” egy elmélet értelmezése bizonyítása Intelligens viselkedési formák, amelyek nem igénylik az intelligencia általános meghatározását vagy jellemzését

A három legfontosabb kérdés
Műszaki szempontból a mesterséges intelligencia fejlesztés alapja a jól meghatározott és átfogó tudásbázis, valamint a megfelelő hatékonyságú, sokrétű és gyakorlatias manipulációs stratégia. Eszerint meg kell határozni, mi a tudás, hogyan lehet megjeleníteni, hogyan lehet manipulálni?

Mesterséges intelligencia alkalmazások
Robottechnika útvonal és mozdulat tervezés, alakfelismerés, gyártásirányítás (CAM), gyártás-diagnosztikai rendszerek, gyártás ütemezés.

Szakértői rendszerek gyógyászati diagnosztika (MYCIN), harcászati irányítás, geológiai kutatás (PROSPECTOR), számítógép konfigurálás (XCON), energetikai rendszerek irányítása, gyártástervezés és ütemezés, tervezés.

Játékok Természetes nyelvek értelmezése Tétel bizonyítás Számítógéppel segített oktatás/tanulás (CAE) Automatizált döntés Automatizált programkészítés

A pszichológusok nézőpontja
A pszichlógusok Aristoteles óta figyelik az emberi döntés és viselkedés folyamatait. William James (Psychology, 1890) észrevette, hogy a biológiai döntéshozó rendszerek - beleértve az emberi agyat is, - nem az absztrakt gondolkodás, hanem a túlélési lehetőség felismerésének céljából fejlődtek ki.

A viselkedést, a döntés folyamatát mentális szempontból abban az összefüggésben és abban a sajátos környezetben kell tanulmányozni, ahol a döntés születeik. Eszerint a döntési folyamat nem fejlődhet a semmiben, a döntési folyamat a megelőző stratégiák adaptációja lehet, a döntési folyamat gyakran alkalmazásfüggő.

James feltételezte, hogy a diszkrimináció és asszociáció elve egyformán fontos az emberi agy döntési folyamatában, amely elv a lebontás és felépítés koncepcióját tartalmazza. E felismerés a mesterséges intelligencia kutatásban a tudásbázis fejlesztés egyik alapvető stratégiai elve.

Az előbbiek alapján ajánlja a hierarchikus struktúrák alkalmazását, felhasználja a gondolatok összefüggésének vagy asszociációjának elvét. Az emberi intelligencia nemcsak a változtathatatlan eseményekre, vagy igazságokra és a logikára épül, hanem a tapasztalat és az intuíció is fontos szerepet játszik.

tudásreprezentáció, struktúra, „értelem”, ismeret szerzés.

Egyéb alapvető és kapcsolódó témák: következtetési és irányítási (manipulációs) stratégiák, tanulási és adaptációs képesség (kísérletekből, példákból, vagy egy „tanártól”), bizonytalanság és befejezetlen döntési folyamat megjelenítése, keresési és illesztési technkák, egyesítés és felbontás,

nem-monoton döntési folyamat (következtetések visszavonása ellenőrzött információk alapján), tapasztalat szerzés („generálás és ellenőrzés”), probléma dekompozíció, vagy elsődleges célok redukálása részfeladatokká, döntésformák (pl. dedukció, indukció, józan ész), a „jó” elfogadása az optimális megoldással szemben, célszerű programozási és leíró nyelvek.

Matematikai alapok: tárolt tudás, leírás és kapcsolatok
Tételezzük fel, hogy az x és y változók közötti kapcsolat szimbólumokkal, számokkal, műveletekkel vagy fogalmakkal leírható, mint például az x objektum R tulajdonságának értéke y Ez alapján x és R az ƒy függvény argumentumai, melyek az y értékét határozzák meg: y = ƒy(x, R)

Ha x és R véges halmazok, a kapcsolat a következő hármassal írható le: (R, x, y ), mely megfelel a (attribútum, objektum, érték) formátumnak, amit úgy olvasunk, hogy „az objektum attribútuma az érték”, vagy „x és y relációja R”. Grafikusan R x  y

Relációk és példák Ha A és B halmazok, akkor A és B relációja az A X B részhalmaz. Az összefüggés felfogható bináris relációként is, mert csak két halmazt tartalmaz, és a halmazok elemeinek egyfajta „összekapcsolását” eredményezi. A halmazok összekapcsolódásának módja, az összekapcsolódás tulajdonságai vagy viszonya az, ami fontos.

Relációk és tulajdonságok reflexív: R reflexív, ha minden a  A esetén (a,a)  R, szimmetrikus: R szimmetrikus, ha minden (a,b)  R esetén (b,a)  R igaz, tranzitív: R tranzitív, ha minden (a,b)  R és (b,c)  R esetén (a,c)  R igaz.

Harmadrendű (és magasabb rendű) relációk és kényszerek A bináris relációk a párba rendezett objektumok (objektum-párok) közötti kapcsolatrendszert írják le. De vannak relációk (és természetesen kényszerek is) objetktum-hármasok, objektum-négyesek, stb. között is.

Az A, B, C halmazhármas objektumai közötti relációt definiálja a két részhalmazra bontott (A X B) X C összefüggés, amelyet az ((a,b),c) hármassal lehet leírni. Hasonló módon az A, B, C, D halmaznégyes is definiálható részhalmazokkal az (((A X B) X C) X D) összefüggés szerint, amely a (((a,b),c),d) négyessel írható le.

Relációs táblázatok A bináris és magasabb (harmad-, negyed-) rendű relációkat kényelmesebben lehet leírni relációs táblázatok felhasználásával. Ezek a táblázatok n-ed rendű relációkat sorolnak fel táblázatos formában. A következő ábrán egy relációs táblázat látható.

Relációs táblázatok

A szemantikus hálózat objektumok, fogalmak, szituációk vagy műveletek összefüggéseinek (és tulajdonságainak) leírására szolgáló gráf. A koncepcionális gráf a szemantikus hálózatokhoz hasonlóan elképzelések, műveletek és szituációk koncepcionális kapcsolatait szemlélteti a „ki mit csinál, kinek” meghatározás szerint.

A szemantikus hálózat objektumokat és relációkat tartalmaz, és a „valós világ” ábrázolása elég bonyolult. Néhány észrevétel ezzel kapcsolatban: 1. A szemantikus háló gyakran több különböző relációt is tartalmaz, mint „ez egy...”, „a tulajdonsága,hogy...”, „arra alkalmas, hogy...”, „hasonlít…”, stb. 2. A szemantikus háló tartalmazhat redundáns vagy „leszármaztatható” információt, mint „a tőle balra…”, vagy „tőle jobbra…”, stb.

3. Megjegyzendő, hogy célunk a szemantikus hálózat információ tartalmának redukálása egyszerűen kezelhető szimbólikus reprezentációvá. 4. A szemantikus hálózatok egyszerűbbé tételéhez operátorokat használhatunk, melyekkel az állapotok közötti átmenetek megváltoztathatók, ezáltal egyszerűsödik a szemantikus hálózat.

A tudásreprezentáció szerepe és számítógépes modellje
A „szűk keresztmetszet” modell Nem mindig lehet felállítani egy explicit modellt a mesterséges intelligencia fejlesztésekor. Ennek oka az alkalmazás szükségleteihez képest túlméretezett tudás, beleértve a be/kimeneti adatokat vagy az ok-okozati összefüggéseket, az „a priori” információkat, a heurisztikát, és így tovább...

Mesterséges intelligencia modell fejlesztésének szintjei Modell fejlesztési szintek: koncepcionális (M), reprezentációs (R), implementációs (I).

Modell bázisú döntési folyamat (MBR) A modell bázisú döntési folyamatokban az első művelet a diagnózis felállítása, a második pedig a probléma megértése, értelmezése. „Intelligens” válasz a válaszadás alapjául szolgáló megértés szintjeinek variálásával keletkezik.

Intuitív döntési folyamat ...Az emberek általában elkerülik az összeütközést a környezetükben lévő tárgyakkal… Ez egy intelligens válaszadás a környezeti jellemzőkre, - de ami ennél fontosabb, - nem modell-bázisú válaszadás.

Mesterséges intelligencia mint reprezentáció és manipuláció A (tudás)reprezentáció olyan eljárás vagy eszköz, amely összekapcsolja egy problémakör alapvető elemeit. A manipulálható reprezentáció megkönnyíti a számítást, mert a manipulálható reprezentációkban az információ más probléma megoldó objektumok számára is elérhető, melyek a reprezentációt a számítás részeként kezelik.

Az intelligens viselkedéshez felhasználható tudásreprezentációt és algoritmikus stratégiákat tartalmazó modell felépítésének módszertana a következő kérdéseket veti fel: könnyen kiterjeszthető-e a modell az adott alkalmazásra vagy bármely másikra? hol vannak a modell korlátai?

a modell hatékonyan tárolja a kívánt információkat? az ember számára érthető és könnyen kezelhető a modell? tartalmaz a modell ellentmondást vagy oda nem illő információt?

Tudás reprezentáció osztályozás Megerősítő tudás a másodlagos jelentésnek, az absztrakt jelentésnek vagy egy koncepció felhasználásának az ismerete. Kiterjesztett tudás a koncepció által kifejezett dolgok halmazának ismerete. Meta-tudás ismeret a tudásról.

Környezetfüggő tudás a speciális probléma megoldására vonatkozó (koncepciókat és relációkat tartalmazó) körülmények és eljárások ismerete. Környezetfüggetlen tudás több általános, a problémától független körülménynek és eljárásnak az ismerete. Hierarchikus reprezentáció lehetővé teszi állapotok közötti struktúrák és komplex összefüggések modellezését.

A reprezentáció korlátai A kognitív tudományban sok filozófikus kérdés, mint amilyen az emberi viselkedés teljes emulációja elérhetőségének kérdése, még megválaszolatlan. Magától értetődik, hogy a természetben működő pszichológiai folyamatok tipikusan számítógépre vihetők, és ezért a megismerés számítógépes modellje felhasználható az emberi viselkedés emulálására (Fodor 1983).

A felvetődő kérdések: Egy komplex tudásbázissal összekapcsolt, viszonylag egyszerű irányítási stratégia elérheti-e ugyanazt a teljesítményt, mint amit egy kifinomult irányítási stratégia és egy egyszerűbb tudásbázis? Hogyan lehet egy kezdeti reprezentációt és irányítási stratégiát szisztematikusan finomítani új ismeretek, tanulás és természetesen hibák felismerése alapján?

A megfigyelt adatok értelmezése A reprezentáció egyik legfontosabb feladata a megfigyelések értelmezése, vagy a megfigyelt adatok egyesítése egy vagy több reprezentációval. Egy alternatív, mintavételezésen alapuló nézőpont alapján keressük a választ arra, melyik az a reprezentáció, amellyel a legjobban értelmezhetők a megfigyelt adatok.

A reprezentáció jellemzői Koncepció mint a teljes rendszer logikai felosztása alrendszerekre, Lét mint individuális komponens, vagy mint objektumhoz rendelt összetevő, Tulajdonságok, attribútumok és értékek mint például egy objektum színe, egy alrendszer funkciója, egy érzékelő jele, stb.

Kényszerek és összefüggések az objektumok között, mint relációk és oksági kapcsolatok. Alkalmazhatóság, mely szerint a reprezentáció pontosan jellemző a rendszerre vagy a környezetre. Teljesség, amely szerint a reprezentáció széles körben és átfogóan jellemzi a rendszert. Rugalmasság és bővíthetőség, mely szerint a model vagy a reprezentáció általában alkalmazható a egy szituációban.

Konzisztencia, mely szerint a reprezentáció nem támogatja a konfliktus feloldását, és nem használja a tudásbázist sem. Rugalmasság és manipulálhatóság, mely szerint a reprezentáció kizárja a tudásnak a cél elérése érdekében végzett manipulálását. Integrálhatóság a megfigyelhető környezet adataival. Gyakorlatiasság - ez a legnehezebben teljesíthető követelmény.

Tanulás A tanulás célja: az önképzés,
új vagy megváltozott körülmények adaptációja, viselkedés változtatás, a koncepció alakítása és finomítása, beleértve a koncepció modelljének általánosítását vagy specializálását.

Tanulás Tanulás mint modell finomítás
A tárolt tudás reprezentáció változásán alapuló tanulás kategóriái (Rummelhart/Norman, 1978): fejlődés: alapvetően ugyanaz, mint az asszimiláció, a séma hangolása: struktúra kis mértékű változtatása megengedett, szerkezet változtatás: a sémának új koncepció felállításához alkalmas nagy mértékű változtatása.

Tanulás Az automatizált tanulás paradigmái
1. Neurális modellezés: a tanulás a hálózatban lévő csatlakozások adaptációja. 2. Dötéselméleti technika: nyilvánvaló, hogy A1, A2,…, An változókkal aktualizálható a P(EA1, A2,…, An) predikátum. 3. Szimbólikus koncepció elsajátítás: a koncepció tárolt reprezentációjának átalakítása,megváltoztatása. 4. Konstruktív indukció (Michalski et al., 1986): megfigyelések és minták analógiájára alapozott tanulás.

Koncepció (hipotézis) generátor
Tanulás A bizonyításból eredő tanulási koncepció paradigmája Koncepció ellenőrzés/cáfolás algoritmusa Koncepció (hipotézis) generátor Mesterséges intelligencia tudásreprezentáció Bizonyíték (megfigyelések/adatok)

Tanulás Analógián alapuló tanulás paradigmája (Carbonell/Langley,1987)
Új probléma Előzőleg megoldott probléma Megoldás új problémára Megoldás régi problémára Részleges tervezés Folyamat transzformálás

Tanulási algoritmusok
Az egyediről az általánosra való áttérés során az indukció magába foglalja az információk összevonását vagy átszervezését, vagy szabályok fejlesztését. Az általánosítás alapján történő tanulási paradigma a következő műveleteket tartalmazza: kényszerek bizonyos kifejezésekből történő kiküszöbölését, változók állandókkal történő helyettesítését.

A tanulási algoritmus a mesterséges intelligencia rendszer kereteként integrálható a mesterséges intelligenciába, vagy annak integráns részeként fejleszthető. A tanulási paradigma elemi modellje: Tanulási algoritmus Tudásbázis Teljesítmény index Külső környezet Mesterséges intelligencia

A teljesítmény index a következők alapján számítható: az adatbázisban található információ (esetek és szabályok) mennyisége alapján, az adatbázisban található információ (esetek és szabályok) részletessége alapján, az adatbázisban található információ (esetek és szabályok) általánossága alapján, az adatbázisban található információ (esetek és szabályok) koncepcionális szervezettsége alapján.

Tanulás az általános-egyedi/egyedi-általános megközelítés módszerével Az algoritmus célja: egyedi-általános esetben: általános koncepcionális leírások halmazát eredményezi, általános-egyedi esetben: az egyedire legjellemzőbb koncepcionális leírások halmazát eredményezi.

Induktív döntés és igaz/hamis állapot Ha egy részletre vonatkozó állítás IGAZ, akkor ez a részletet tartalmazó egészre is következtetehtő. Ha azonban az állítás HAMIS, akkor az egész is az.

Általánosító operátorok Az általánosítás folyamata olyan, mint általánosító operátor alkalmazása a közbenső lépésekben. Legyen S1 kifejezésre G az általánosító operátor, amely a sokkal általánosabb S2 állítást eredményezi az E kumultatív tudás és tapasztalat felhasználásával. Eszerint: S2 = G(S1, E) S2  S1 Megállapítható, hogy S1 egyedi esete az általánosabb S2-nek.

Nem-konstruktív általánosító operátorok Számos nem-konstruktív operátor létezik, amelyekkel sokkal szélesebb körű általánosítás érhető el, ilyenek: feltételt elvető operátor, konstansokat változókkal helyettesítő operátor, diszjunktív operátor, intervallum lezáró operátor, hierarchia-generáló operátor, speciális kivétel operátor

Konstruktív indukciós általánosítás A tanulás ezen típusa sokkal nehezebben vizsgálható, és megvalósítása is nehezebb. A konstruktív általánosító operátor egy vagy több új leírást eredményez, így megváltoztatja a probléma reprezentációs terét.

Tanulás felépített modellek és strukturális csatolások felhasználásával A tanulás mint modellépítés során egy folyamat kényszer vagy modell alapján létrejött példáit vagy megvalósulásait mint tapasztalatot használjuk fel. A nagyobb koncepcionális modellek kisebb építőkockákból építhatők fel. A koncepció kialakításához felhasznált szabályok és mechanizmusok alkotják a sémát.

Tudásfelhasználás Bármely tudás felhasználásához valamilyen más tudás szükséges. A problémák megoldásához tudás szükséges, amely az operátorok halmazából és egy alkalmas sorrend megállapítására képes stratégiából áll.

Tudásfelhasználás A procedurális tudás tipikus példája a számítógépes program, ahol az egész problémamegoldó eljárás programként jelenik meg, mint a LISP és a PROLOG nyelvben. A deklaratív tudás jellegzetes esete a predikátum logikával kifejezett tudás, amikor az előre deklarált minták közül kereséssel választjuk ki a probléma megoldásához legjobb választ, mert a megoldások száma több is lehet.

Tudásfelhasználás A démonok (demon) folyamatosan figyelik a problémamegoldás menetét, állapotát, és amikor egy előre definiált helyzet fordul elő, belépnek a végrehajtásba, elvégzik feladatukat és inaktiválják magukat. A démon-koncepció igen elterjedt, a valósidejű operációs rendszerű számítógépek watch-dog rendszere ehhez hasonlóan működik, melynek feladata a hiba folyamatos figyelése és jelzése, minden más esetben “rejtve marad”.

Tudásfelhasználás A produkciós rendszerek kizárólag démonok halmazával írják le a feldolgozás folyamatát. A produkciós rendszer modelljének elemei: a produkciós szabályok halmaza, munkamemória, a szabályok alkalmazási sorrendjét meghatározó vezérlőeszközök.

Tudásfelhasználás A produkciós szabályokat használó rendszer jellemzői a következők: a tudás hozzáadása vagy módosítása egyszerű, könnyű megállapítani, milyen tudást tartalmaz a rendszer, a bemenő adatoktól függően a feldolgozás rugalmassá tehető,

Tudásfelhasználás a következtetés kidolgozása nyomon követhető, szükség esetén a szabályok megváltoztathatók, a szabályok halmazából a rendszer viselkedése nem jósolható meg, egy eljárás sorrendet nem lehet közvetlenül ábrázolni.

Tudásfelhasználás A felismerés - cselekvés ciklusa:
a munkamemória állapotának és aszabályok előfeltételeinek összehasonlítása, az illesztést megvalósító szabályok alkalmazása.

Tudásfelhasználás Konfliktusfeloldásnak nevezzük azt az eljárást, amelynek során kiválasztjuk az egyetlen alkalmazásra kerülő szabályt. A lehetséges kiválasztási módszerek a következők: a szabályokhoz prioritást kell rendelni, minél több klózt tartalmaz egy szabály, annál magasabb prioritást krll hozzárendelni, a gyakran használt szabálynak magasabb prioritást kell adni,

Tudásfelhasználás a leggyakrabban használt változóval rendelkező szabálynak magasabb prioritást kell adni, a szabályok halmazához legutoljára hozzáadott szabálynak magas prioritást kell adni, a végrehajtáskor minden szabályhoz prioritást kell rendelni, és a legmagasabb prioritású szabályt kell kiválasztani.

Neurális hálózatok Az idegsejtek - neuronok - funkciói:
jelátvétel a szomszédos neuronoktól, idegimpulzusok létrehozása, impulzusok vezetése, impulzusok átadása más neuronoknak.

 Neurális hálózatok A neuron általános modellje: Sejttest Összegzés
Dendritek Sejttest Összegzés Küszöbérték Axon

Neurális hálózatok A neurális modellek általános jellemzői:
a bemeneti jelek súlyozott összegét határozzák meg, küszöblogikás feldolgozás, a bemeneti jelek alapján megváltoztathatják viselkedésüket.

Neurális hálózatok McCulloch és Pitts neuron modellje
Jelölések: E=h(e1,... en) a teljes bemenet, A=ƒ(E) a neuron állapota, S=g(A) a neuron kimenete. E A=(E) S=g(A) in i1 S

Neurális hálózatok A neuron működését leíró függvény:
h(e1,... en)= Wi ei h(e1,... en)= Wi ei - a, ahol Wi az i-dik bemenet súlyozása, - a a neuronok közötti negatív jelátviteli tényező.

Neurális hálózatok Matematikai modellek:
A Boole-féle neurális automata bemenetei Boole-változók, kimenete a bemenetek Boole.függvénye. A küszöbérték automaták kimenete bináris, függetlenül attól, hogy a bemeneti jelek binárisak, folytonos függvények, aktivációs függvény, egységugrás függvény (Heaviside-függvény), vagy előjelfüggvény. S=ƒ( Wi ei - a)

Neurális hálózatok A lineáris automata bemenetei és kimenetei folytonos függvények, a bemenet lineáris, a kimenet pedig egységugrás függvény. S= Wi ei A telítődő automata bemeneti és kimeneti értékei csak adott küszöbértékek között lehetnek, a bemenet lineáris, a kimenet pedig SATUR minősítő függvény.

Neurális hálózatok A folyamatos automatának valós értékű be- és kimenetei vannak, a bemeneti függvény lineáris, az aktivációs függvény a SIGMOID függvény, amelynél az átmenet exponenciális, nincs benne törés. A valósznűségi automata bemenetei és kimenetei binárisak, az aktivációs függvény stochasztikus.

Neurális hálózatok A SATUR(x) függvény: A SIGMOID(x) függvény: u v x

Neurális hálózatok A Hebb szabály - az állapotfüggő visszacsatolás
Ha két összekapcsolt neuron egyidejűleg aktiválódik, a kapcsolatuk megerősítést nyer. Minden más esetben a kapcsolat változatlan marad. A kapcsolat erősödik A kapcsolat nem változik

Neurális hálózatok A kapcsolat megerősítése a tanulás, ezért ennek a kapcsolatnak a súlyozása növekszik. Ha nincs megerősítés, akkor a két neuron közötti kapcsolat súlyozása kicsi. Az i-dik és a j-dik neuron közötti kapcsolat súlyozása egy t időpontban Wi j (t). Az i-dik neuron aktivációs állapota Ai a j-dik neuron aktivációs állapota Aj, ahol Ai és Aj logikai állapotok.

Wi j (t +t)= Wi j (t) +  Ai Aj
Neurális hálózatok A Hebb szabály szerint a neurális hálózat elemeinek állapota az alábbi összefüggés szerint határozható meg a (t+t) időpontban: Wi j (t +t)= Wi j (t) +  Ai Aj ahol a >0 tényező a tanulás súlyozása.

Neurális hálózati modellek
A perceptron Rosenblatt perceptronjának elemei: a retina, amely a stimulusokat fogadó afferens neuron cellákat tartalmazza, az asszociatív cellák rétege, amelynek egyes cellái a retina cellákhoz és más asszociatív cellákhoz és a döntési cellákhoz kapcsolódnak, a döntési cellák rétege, amelyben a kimeneti jel képződik, és amelyben a cellák az asszociatív réteg celláival azonosan működnek.

Egyszerűsített szerkezetű perceptronban nem lehet kapcsolat az asszociatív rétegen belül és a döntési rétegen belül a réteg cellái között. Az asszociatív és a döntési réteg cellái közötti kapcsolatokhoz súlyok vannak hozzárendelve. A Hebb szabály szerint a súlyok változtatásával „tanulhat” - helyesebben tanítható be - a háló.

A perceptron működési szabálya: Wi  Wi+k(d - s)ei ahol k>0, d a kívánt kimenet, s pedig a tényleges kimenet. Ha d=s, akkor a súlyok nem változnak. Ha (d - s)=1, akkor Wi  Wi+k ei .

Egyrétegű asszociatív hálózatok A lineáris küszöbértékes, két bemeneti cellához kapcsolódó döntési cella felépítése: E1 W1 W0 Q  W2 E2 Döntési cella

Jelölések: E az osztályozandó példák halmaza, Eh a h-dik példa, Ehj az Eh példa j-dik elemének értéke, Wj a döntési cella j-dik bemenetének súlyozása, W0 a döntési cella küszöbértéke.

Legyen Qh a döntési cella kimeneti állapota a h-dik példa esetére. 1, ha  Wj Ej  W0 Qh= 0 minden más esetben

A perceptron tanulási algoritmusa Az algoritmus lépései: az Eh feladatot kell a hálózat bemenetére kapcsolni, meg kell határozni a h=Th - Qh értéket, módosítani kell valamennyi Wj súlyozást a Wj=k h Ehj egyenletnek megfelelően.

Ez az algoritmus akkor konvergens, ha a probléma megoldásai lineárisan szétválaszthatók. Ellenkező esetben az algoritmus működése bizonytalanná válhat, nem biztos, hogy a megoldás megközelíti a helyes értéket. Több megoldás esetén nehezen vagy egyáltalán nem dönthető el, melyik a helyes.

A Widrow-Hoff tanuló algoritmus szétválasztották az osztálybasorolást és a tanulási szabályok műveleteit, az osztálybasorolásnál a perceptronnal azonos küszöbérték elemet alkalmaztak, a tanuláskor a hibajel képzése a h=Th -  Wj Ehj egyenlet szerint történik, nem pedig a perceptronnál alkalmazott h=Th - Qh összefüggéssel.

A „visszafelé terjesztés” elve A cél a kívánt és a tényleges kimenet közötti különbség négyzetének minimalizálása. A hibajel visszafelé terjed, értéke mindig az előző rétegek hibajeleinek súlyozott összege. A bemeneti rétegektől a kimenetek felé haladva kell figyelmbe venni az aktuális súlyozásokat, ez a relaxációs fázis, valamennyi cella hibájának négyzetösszegével mint teljes hibával visszafelé haladva kell módosítani a súlyozást.

A Kohonen modell a tanulási fázis csak a bemenethez legközelebbi referencia súlyozást módosítja, a módosítás helyes és hibás osztályozás esetén is megtörténik, a korrekciós eljárás numerikusan kompatíbilis az azonosítási kritériumokkal.

A neuron dinamikus állapotegyenlete ahol E a teljes bemenet, p(S) nem-lineáris veszteség, amely a neuron működési sebességére jellemző. dS = E – p(S) dt

dS A neuron állapota stabilizálódott, ha , azaz a neuron felvette a „megtanult állapotot”. Az egyenlet megoldása adja a neuron működésének leírását: S = p-1(E) = p Wj Ej , ahol p-1 függvény a SIGMOID. = 0 dt  j=1 n

A tanulási mechanizmust leíró Kohonen-féle összefüggés az előbiek alapján: ahol (S)>0 jelenti a felejtést, és általában k0. A tanulás ebben az esetben is a Hebb szabály szerint történik. dWj = k Sej – (S) Wj dt

A Kohonen-hálózat egyidejűleg veszi figyelembe a külső adatokat és a belső kapcsolódásokat. Bemenetek E Kimenetek S M N

Az ábra jelölései: S=(SI,…,Si,…,Sn) a hálózat n kimeneti neuronjának kimeneti vektora, E=(EI,…,Ei,…,Em) a hálózat m bemeneti neuronjának kimeneti vektora, M a bemeneti neuronok bemeneteinek súlyozó vektora, N a neuronok közti kapcsolódások súlyozó vektora.

A Kohonen modell működését és tanulását leíró állapotegyenletek: dM dt dS dN = F(E, S, M, N) = G(E, S, M) = H(S, N) általános működést jellemző leírás külső kapcsolatok leírása belső kapcsolatok leírása

Időkésleltetéses neurális hálózatok A hálózat csomópontjai között nemcsak egyetlen súlyozó tényezővel jellemezhető kapcsolat van, hanem a korábbi állapotot kifejező súlyozó tényezők is hatással vannak a hálózat állapotaira. A visszafelé terjesztésnél az azonos késleltetésű szomszédos csomópontok súlyozó tényezői egyszerre változnak.

Változó topológiájú hálózatok A változó topológiájú hálózatok a betanítás során nyerik el végső összekapcsolódásaikat és súlyozó értékeiket, a hierarchia azonban nem feltétlenül változik: alapállapot: a pillanatnyi kiindulás, jutalmazás: új kapcsolat létesítése, létező kapcsolat jóváhagyása, megerősítése vagy gyengítése, büntetés: nem létesítünk új kapcsolatokat, tanítás: új kapcsolat létesítése, létező kapcsolat jóváhagyása, megerősítése vagy gyengítése.

Neuro-fuzzy rendszer A fuzzy és a neurális rendszerek alapvető különbsége a tudásreprezentáció megvalósításában van. A neurális rendszer jellemzői: a betanítás számításigényes, egymáshoz rendelhető be/kimeneti állapotokat nem táblázatosan kezeli, alkalmazások a nem struktúrált feldolgozás területén.

A fuzzy rendszer jellemzői: minősítő Hebb-szabály alkalmazása, kis számítási igény, alkalmazások a struktúrált feldolgozás területén.

Neuro-fuzzy hálózat definiálása: be/kimenetek meghatározása, minősítő részhalmazok meghatározása, hovatartozási függvények meghatározása, minták betanítása.

Mesterséges intelligenciák

Hasonló előadás

Az előadások a következő témára: "Mesterséges intelligenciák"— Előadás másolata:

Hasonló előadás

Projectumról

Visszajelzés

Bejelentkezés

A társadalmi hálózaton keresztül belépni:

Mesterséges intelligenciák

Hasonló előadás

Az előadások a következő témára: "Mesterséges intelligenciák"— Előadás másolata:

Hasonló előadás

Projectumról

Visszajelzés