GÉPI TANULÁS (MACHINE LEARNING)

Slides:



Advertisements
Hasonló előadás
Készítette: Kosztyán Zsolt Tibor
Advertisements

Tamás Kincső, OSZK, Analitikus Feldolgozó Osztály, osztályvezető A részdokumentumok szolgáltatása az ELDORADO-ban ELDORADO konferencia a partnerkönyvtárakkal.
Készítette: Kosztyán Zsolt Tibor
Programozási tételek, és „négyzetes” rendezések
ADATBÁZISOK.
A normalizálás az adatbázis-tervezés egyik módszere
K-Chat Dr. Szepesvári Csaba Kutatási Alelnök mindmaker.
2005. Operációkutatás Ferenczi Zoltán. Széchenyi István Egyetem Operációkutatás eredete •második világháború alatt alakult ki •különböző szakmájú emberekből.
Pac-Man játék tanulása Megerősítéses Tanulással Mesterséges Intelligencia algoritmusok tesztelése játékokon Gyenes Viktor Eötvös Loránd Tudományegyetem.
Képességszintek.
EE/R adatmodell (Extended E/R) 1 Az objektum orientált szemlélet elterjedésével egyre nőtt az igény az olyan SDM (Semantic Data Model) modellek iránt,
MI 2003/9 - 1 Alakfelismerés alapproblémája: adott objektumok egy halmaza, továbbá osztályok (kategóriák) egy halmaza. Feladatunk: az objektumokat - valamilyen.
MI 2003/ A következőkben más megközelítés: nem közvetlenül az eloszlásokból indulunk ki, hanem a diszkriminancia függvényeket keressük. Legegyszerűbb:
SAS Enterprise Miner 2. gyakorlat
Streaming Algorithms for k-core Decomposition. K-mag dekompozíció Maximális részgráf, amiben minden csúcshoz legalább k részgráfbeli csúcs csatlakozik.
Programozási alapismeretek 8. előadás. ELTE 2/  További programozási tételek További programozási tételek 
Bevezetés a gépi tanulásba február 16.. Mesterséges Intelligencia „A számítógépes tudományok egy ága, amely az intelligens viselkedés automatizálásával.
Szintaktikai elemzés március 1.. Gépi tanulás Osztályozási feladat: Adott egyedek egy halmaza és azok osztályba tartozási függvénye (tanító halmaz),
MI 2003/ Alakfelismerés - még egy megközelítés: még kevesebbet tudunk. Csak a mintánk adott, de címkék nélkül. Csoportosítás (klaszterezés, clustering).
Halmazok, relációk, függvények
Induktív és eset alapú rendszerek
Mesterséges neuronhálózatok
Dr. Szalka Éva, Ph.D.1 Statisztika II. VII.. Dr. Szalka Éva, Ph.D.2 Mintavétel Mintavétel célja: következtetést levonni a –sokaságra vonatkozóan Mintavétel.
Rendszer és modell szeptember-december Előadó: Bornemisza Imre egyetemi adjunktus.
AVL fák.
KÖZMŰ INFORMATIKA NUMERIKUS MÓDSZEREK I.
Online hasonlóságelemzések: Online hasonlóságelemzések: Tapasztalatok (kukorica) hozamfüggvények levezetése kapcsán Pitlik László, SZIE Gödöllő (Forrás:
Regresszióanalízis 10. gyakorlat.
Operációkutatás eredete
ISMERETALAPÚ RENDSZEREK SZAKÉRTŐ RENDSZEREK
MYCIN szakértői rendszer. MYCIN modell szakértői rendszer vér fertőzéseinek, gyógykezeléseknek meghatározását támogató orvosi diagnosztikai rendszer célvezérelt,
Ismeretalapú rendszerek alaptechnikái I. Szabályalapú rendszerek.
Ismeretalapú rendszerek alaptechnikái
Ismeretalapú rendszerek alaptechnikái I. Szabályalapú rendszerek.
MYCIN Szakértői rendszer.
Adatbázisrendszerek jövője
Scenáriók készítése Dr. Kollár József Magyar Coachszövetség Közhasznú Alapítvány.
Textúra elemzés szupport vektor géppel
Természetes és formális nyelvek Jellemzők, szintaxis definiálása, Montague, extenzió - intenzió, kategóriákon alapuló gramatika, alkalmazások.
Gépi tanulás Tanuló ágens, döntési fák, általános logikai leirások tanulása.
Petri-hálón alapuló modellek analízise és alkalmazásai a reakciókinetikában Papp Dávid június 22. Konzulensek: Varró-Gyapay Szilvia, Dr. Tóth János.
Részecskenyom analízis és osztályozás Pálfalvi József MSc, Intelligens Rendszerek, Önálló labor 1.
Bizonytalanság A teljesen megbízható következtetést lehetővé tevő tudás hiánya Egy esemény bizonytalansága  objektív  szubjektív Módszerek  numerikus.
Tényekre alapozott oktatáspolitika és gyakorlat ONK 2011, Szimpózium a tények, bizonyítékok természetéről, szerepéről az oktatásban Evidence Based Education.
MI 2003/ Mi lenne a b legjobb választása? Statisztikai eljárásoknál az un. Fisher féle lineáris diszkriminancia függvény adja a legjobb szétválasztási.
Adatbányászati módszerek a weblogfájlok elemzésében
Business Mathematics A legrövidebb út.
DIDAKTIKA ÉS OKTATÁSSZERVEZÉS II.
Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika és Információs Rendszerek Tanszék Korlátkielégítési problémák Autonóm és hibatűrő információs.
Adatbáziskezelés. Adat és információ Információ –Új ismeret Adat –Az információ formai oldala –Jelsorozat.
Operációkutatás eredete második világháború alatt alakult ki különböző szakmájú emberekből álló team: matematikus, fizikus, közgazdász, mérnök, vegyész,
Programozási alapismeretek 8. előadás. ELTE Szlávi-Zsakó: Programozási alapismeretek 8.2/  További programozási.
WP-Dyna: tervezés és megerősítéses tanulás jól tervezhető környezetekben Szita István és Takács Bálint ELTE TTK témavezető: dr. Lőrincz András Információs.
Részecskenyom analízis és osztályozás Pálfalvi József MSc, Intelligens Rendszerek, Önálló labor 1. Egyetemi konzulens: dr. Dobrowiecki Tadeusz (BME MIT)
1 Megerősítéses tanulás 7. előadás Szita István, Lőrincz András.
MI 2003/8 - 1 Alakfelismerés alapproblémája: adott objektumok egy halmaza, továbbá osztályok (kategóriák) egy halmaza. Feladatunk: az objektumokat - valamilyen.
Kutatási beszámoló 2002/2003 I. félév Iváncsy Renáta.
Struktúra predikció Struktúra lehet Felügyelt tanulási probléma
Automatikus fizikai tervezési javaslatok XML adatbázisokhoz Balogh Bernadett Kresz Marcell Cseh Tamás.
Példa fogalom tanulására
PÁRHUZAMOS ARCHITEKTÚRÁK – 13 INFORMÁCIÓFELDOLGOZÓ HÁLÓZATOK TUDÁS ALAPÚ MODELLEZÉSE Németh Gábor.
Mesterséges Neurális Hálózatok 3. előadás
Megerősítéses tanulás 2. előadás
Operációkutatás I. 1. előadás
Mesterséges intelligencia
Mesterséges intelligencia
A gépi tanulás célja Cél: Olyan programok létrehozása, amelyek a működésük során szerzett tapasztalatok segítségével képesek javítani a saját hatékonyságukon.
Bevezetés Tematika Számonkérés Irodalom
A mesterséges neuronhálók alapjai
Algoritmusok és Adatszerkezetek I.
Előadás másolata:

GÉPI TANULÁS (MACHINE LEARNING)

GÉPI TANULÁS Motiváció tudásalapú rendszerek fejlesztése és tökéletesítése általános tanulási modellek felállítása emberi tanulási folyamat modellezése Tanulás tudás gyűjtési és/vagy manipulálási folyamat eredménye: jobb működés egy feladat végrehajtásából származó tapasztalat alapján

GÉPI TANULÁS - MÓDSZEREK induktív tanulás tanuló példákból való általánosítás (példák  következtetések levonása) felügyelt (supervised) tanulás példák (xi, yi) párok formájában, yi értékek  tanár ismeretlen f függvény megkeresése, f(xi) = yi – hipotézis: becslés f-re Ockham borotvája (Ockham's razor): „A legvalószínűbb hipotézis a legegyszerűbb olyan hipotézis, amely megfelel a megfigyeléseknek” fogalmi tanulás (concept learning) – néhány yi érték esetén

GÉPI TANULÁS - MÓDSZEREK induktív tanulás nem felügyelt (unsupervised) tanulás csak xi értékek  szabályosságok/összefüggések megkeresése csoportosítási algoritmusok ismeretfeltárási algoritmusok (knowledge discovery) megerősítéses tanulás (reinforcement learning) visszacsatolás az eredményből (megerősítés) nem tudjuk, melyik cselekvés volt helyes/rossz deduktív/analitikus tanulás magyarázaton alapuló tanulás igazságmegőrző transzformációk meglevő ismeretek átszervezése (hatékonyabb forma) nem-szimbólikus módszerek neurális hálók

FOGALMI TANULÁS Fogalom megtanulása pozitív és negatív példák alapján "kapu" fogalmi leírása jó leírás: minden + példát tartalmaz és nem tartalmaz – példát új pozitív példa: leírás szélesítése új negatív példa: leírás szűkítése cél: „legjobb” hipotézis

TANULÁS: A HIPOTÉZISTÉRBEN VALÓ KERESÉS Fogalmi tanulás  hipotézistérben való keresés cél: a hipotézistérben a tanulási példákra legjobban illeszkedő hipotézis megkeresése hipotézistér nagy, végtelen is lehet  hatékony keresési módszer rendezési reláció hipotézisek között: ha h1 kevesebb korlátozást tartalmaz, mint h2  h1 általánosabb hipotézis, mint h2  h2 specifikusabb hipotézis, mint h1 legáltalánosabb hipotézis legspecifikusabb hipotézis

PILLANATNYILAG LEGJOBB HIPOTÉZIS KERESÉSE egy hipotézis figyelembe vétele új példa  hipotézis átalakítása (ellentmondásmentesség fenntartása) Hipotézis és példák ellentmondása: negatív hiba/hamis negatív: a példa a valóságban +, de a hipotézis szerint – pozitív hiba/hamis pozitív: a példa a valóságban –, de a hipotézis szerint +

PILLANATNYILAG LEGJOBB HIPOTÉZIS KERESÉSE specifikus  általános pozitív példák egyenként negatív példák mindegyikével ellenőrzés (memória !) befejezés?? any time algoritmus legspecifikusabb hipotézis megtartása

PILLANATNYILAG LEGJOBB HIPOTÉZIS KERESÉSE általános  specifikus negatív példák egyenként pozitív példák mindegyikével ellenőrzés (memória !) befejezés?? any time algoritmus legáltalánosabb hipotézis megtartása

MITCHELL VERZIÓTÉR MÓDSZERE eddigi példákkal konzisztens hipotézisek – megmaradt hipotézisek halmaza határhalmazokkal reprezentálható S elemei konzisztensek a példákkal és nincs ennél szűkebb konzisztens hipotézis G elemei konzisztensek a példákkal és nincs ennél általánosabb konzisztens hipotézis nem szükséges memória pozitív példák Si-re hamis negatív  Si általánosítása Gi-re hamis negatív  Gi törlése negatív példák Gi-re hamis pozitív  Gi szűkítése Si-re hamis pozitív  Si törlése any time algoritmus inkrementális – soha nem kell visszalépni zajjal terhelt fogalomleírás??

INDUKTÍV TANULÁS: DÖNTÉSI FA TANULÁSA Döntési fa (decision tree): osztályozás egyes attribútumok értékeinek tesztelése alapján belső csomópont: egy attribútum értékre vonatkozó teszt fa élei: attribútum értékek fa levelei: igen/nem címkék gyökér  levél út: attribútumtesztekre vonatkozó konjunkció teljes döntési fa: ezen konjunkciók diszjunkciója Gyártás helye Kor Motor Szín cm3 Jól eladható 1. Németo. 3-6 diesel fehér 1300-1600 igen 2. Japán 6-10 piros 1600 felett 3. kék nem

INDUKTÍV TANULÁS: DÖNTÉSI FA TANULÁSA triviális megoldás: döntési fa, amelynél minden példához önálló bejárási út jó döntési fa: példákkal konzisztens, „tömör” leírás – lehető legkevesebb teszttel döntésre jutunk utak a döntési fán: implikációk (szabályok) (gyártás helye = Németo.)  (jól eladható = igen) (gyártás helye = Japán)  (cm3 = 1600 felett)  (jól eladható = igen) (gyártás helye = Japán)  (cm3 = 1300-1600)  (jól eladható = nem)

INDUKTÍV TANULÁS: DÖNTÉSI FA TANULÁSA ID3 ALGORITMUS (DÖNTÉSI FA TANULÓ ALGORITMUS) a "legjobb" attribútum kiválasztása e csomópontból kiindulva a fa bővítése az attribútum minden lehetséges értéke szerint az értékek szerint a példák csoportosítása a levelekhez minden levélre egyenként: ha csupa azonos osztályozású példát tartalmaz, az osztályozás hozzárendelése és leállás egyébként 1-4 lépések ismétlése a levélre

INDUKTÍV TANULÁS: DÖNTÉSI FA TANULÁSA Melyik a "legjobb" attribútum? Melyik osztályoz legjobban? Információtartalom változása a kérdéssel:

INDUKTÍV TANULÁS: DÖNTÉSI FA TANULÁSA információs előny (information gain): adott A attribútum szerinti osztályozás mennyivel csökkenti S entrópiáját (mennyi információt nyerünk, ha A attribútumot teszteljük?) válasszuk azt az attribútumot, amelyre G(A,S) maximális – maximálisan megkülönböztető attribútum

INDUKTÍV TANULÁS: DÖNTÉSI FA TANULÁSA Gyártás helye Kor Motor Szín cm3 Jól eladható 1. Németo. 3-6 diesel fehér 1300-1600 igen 2. Japán 6-10 piros 1600 felett 3. kék nem

INDUKTÍV TANULÁS: DÖNTÉSI FA TANULÁSA az ID3 algoritmus tulajdonságai: nem alkalmaz visszalépést (lokális optimum alapján dönt) tanulási példák egyedi hibáira kevésbé érzékeny túlilleszkedés (overfitting) előfordulhat  vágás – irreleváns attribútumok megkeresése kérdések költsége . . . félreosztályozás költsége . . . befejezés . . . jó döntési fa . . .

CSOPORTOSÍTÁSI ALGORITMUSOK induktív, nem felügyelt tanulás (nem felügyelt osztályozás – nincsenek előre definiált osztályok) példák alapján objektumok osztályokba sorolása

ISMERETFELTÁRÓ/FELFEDEZŐ RENDSZEREK induktív, nem felügyelt tanulás példák alapján szabályosságok/ összefüggések megkeresése BACON – kvantitatív törvények „felfedezése” numerikus adattömegből összefüggések keresése fogalmak között  új fogalmak alkotása alapfogalmak: idő, távolság, súly szabályosságok keresése x nő és y nő  x/y állandó-e  új fogalom x nő és y csökken  x*y állandó-e  új fogalom eredmények: bolygók távolsága, keringési ideje közötti összefüggés „felfedezése” Ohm, Kirchhoff törvények „felfedezése”

ISMERETFELTÁRÓ/FELFEDEZŐ RENDSZEREK AM (Automated Mathematics) – matematikai fogalmak „felfedezése” alapfogalmak: halmaz, egyenlőség, kisebb, nagyobb, unió, metszet  formulák szabályok új fogalmak létrehozására: ha túl könnyű a formulát kielégítő számot találni  specializáció ha túl nehéz a formulát kielégítő számot találni  általánosítás két nehezen kielégíthető formula  összekapcsolás „vagy”-gyal két könnyen kielégíthető formula  összekapcsolás „és”-sel szabályok a generált fogalmak kiértékelésére: érdekes a fogalom, ha nem könnyen, de lehet rá példákat találni érdekes a fogalom, ha nehezen eldönthető kérdéseket tud feltenni a fogalommal kapcsolatban a program eredmények: egész számok, alapműveletek, prímszámok „felfedezése” számelmélet alaptétele, Goldbach-sejtés „felfedezése”

MEGERŐSÍTÉSES TANULÁS induktív tanulás tanulási példák nélkül pl. sakk tanulása tanító nélkül – visszacsatolás az eredményből – jutalom (reward)/ megerősítés (reinforcement) megerősítéses tanulás feladata: jutalmak alapján egy hasznosságfüggvény (állapot-akció asszociáció) megtanulása – elérhető hasznosság várható értékének maximalizásával hasznosságértékek tanulása pl. dinamikus programozással genetikus algoritmus – egyedek terében keresést végez, hogy megtalálja a maximális fitness függvénnyel rendelkező egyedet

DEDUKTÍV/ANALITIKUS TANULÁS Tanulás dedukció révén: igazságmegőrző lépések új, de a már ismert axiómákból eredő axiómák hozzáadása a tudásbázishoz Probléma: hasznos szabályokat kell előállítani Nő a hatékonyság ? elágazási tényező! felejteni is kellene Tanulható ismeret lehet: alkalmazási területre vonatkozó funkcionális leírás  struktúrális leírás háttértudás vezérlésre (keresés irányítására) vonatkozó if (and (aktuális-csomópont ?cs) (lehetséges-cél ?cs (rajta ?x ?y)) (lehetséges-cél ?cs (rajta ?w ?x))) then (előbb (rajta ?x ?y) aztán (rajta ?w ?x))

DEDUKTÍV/ANALITIKUS TANULÁS Tanuló példák szerepe: irányítják a keresést az új fogalomleírás felé magyarázat: a tanuló példa miért elégíti ki a fogalom egyféle definícióját majd magyarázat általánosítása igazságmegőrző lépésekkel elég lehet akár egyetlen példa is csésze(X) :- nyitott-edény(X), stabil(X), felemelhető(X). stabil(X) :- … felemelhető(X) :- …

az MI összes tanuló módszerét, keresési eljárásokat használhatja ADATBÁNYÁSZAT rejtett adatok, ismeretlen minták és összefüggések keresési folyamata nagy adatbázisokban információ-feldolgozó eljárás (válasz azon kérdésekre is, amelyeket fel sem tudunk tenni – pl. „találd meg az összefüggő vásárlási mintákat”) az MI összes tanuló módszerét, keresési eljárásokat használhatja http://www.cs.bme.hu/%7Ebodon/magyar/adatbanyaszat/tanulmany/adatbanyaszat.pdf