Hidasi Balázs Gravity R&D BME-TMIT 2012. február 20. Budapest.

Slides:



Advertisements
Hasonló előadás
ÉRDEKES PONTOK KINYERÉSE DIGITÁLIS KÉPEKEN. BEVEZETÉS  ALAPPROBLÉMA  Jellemzőpontok detektálása mindkét képen  Kinyert pontok megfeleltetése  Megfeleltetések.
Advertisements

Fejmozgás alapú gesztusok felismerése
MI 2003/9 - 1 Alakfelismerés alapproblémája: adott objektumok egy halmaza, továbbá osztályok (kategóriák) egy halmaza. Feladatunk: az objektumokat - valamilyen.
MI 2003/ A következőkben más megközelítés: nem közvetlenül az eloszlásokból indulunk ki, hanem a diszkriminancia függvényeket keressük. Legegyszerűbb:
Számítógépes algebrai problémák a geodéziában
Módszerek sebességi állandók becslésére Kovács Benedek, Budapesti Műszaki és Gazdaségtudományi Egyetem.
Digitális képanalízis
Matematikai Statisztika VIK Doktori Iskola
Rekurzió (Horváth Gyula és Szlávi Péter előadásai felhasználásával)
Címkézett hálózatok modellezése
Bayes hálók október 20. Farkas Richárd
Mozgó Objektumok Detektálása és Követése Robotkamera Segítségével
Bevezetés a gépi tanulásba február 16.. Mesterséges Intelligencia „A számítógépes tudományok egy ága, amely az intelligens viselkedés automatizálásával.
Naïve Bayes, HMM.
Gépi tanulási módszerek
Osztályozás -- KNN Példa alapú tanulás: 1 legközelebbi szomszéd, illetve K-legközelebbi szomszéd alapú osztályozó eljárások.
Rangsorolás tanulása ápr. 24..
MI 2003/ Alakfelismerés - még egy megközelítés: még kevesebbet tudunk. Csak a mintánk adott, de címkék nélkül. Csoportosítás (klaszterezés, clustering).
Hálózati Biológia A sejt funkcionális működésének megértése.
Klaszterező algoritmusok smart city alkalmazásokhoz Gonda László Témavezető: Dr. Ispány Márton.
Szoftver bonyolultsági mértékek alkalmazási területei Király Roland 2011.
Mesterséges neuronhálózatok
Dr. Szalka Éva, Ph.D.1 Statisztika II. VII.. Dr. Szalka Éva, Ph.D.2 Mintavétel Mintavétel célja: következtetést levonni a –sokaságra vonatkozóan Mintavétel.
SZÁMÍTÓGÉP ARCHITEKTÚRÁK
Előadó: Prof. Dr. Besenyei Lajos
Szabó Attila, Cross-entrópia alkalmazása a megerősítéses tanulásban.
Régióközi tudáshálózatok minőségének hatása a kutatási teljesítményre Sebestyén Tamás és Varga Attila.
INNOCSEKK 156/2006 Hasonlóságelemzés-alapú vizsgálat a COCO módszer használatával Készítette: Péter Gábor
Miskolci Egyetem Informatikai Intézet Általános Informatikai Tanszé k Pance Miklós Adatstruktúrák, algoritmusok előadásvázlat Miskolc, 2004 Technikai közreműködő:
Az Alakfelismerés és gépi tanulás ELEMEI
Fejmozgás alapú gesztusok felismerése Bertók Kornél, Fazekas Attila Debreceni Egyetem, Informatikai Kar Debreceni Képfeldolgozó Csoport KÉPAF 2013, Bakonybél.
Dijkstra-algoritmus ismertetése
Hiba-előjel alapú spektrális megfigyelő Orosz György Konzulensek: Sujbert László, Péceli Gábor Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika.
Textúra elemzés szupport vektor géppel
Készítette: Gergó Márton Konzulens: Engedy István 2009/2010 tavasz.
Minőségtechnikák I. (Megbízhatóság)
Idősor elemzés Idősor : időben ekvidisztáns elemekből álló sorozat
Problémás függvények : lokális optimalizáció nem használható Globális optimalizáció.
Környezeti monitoring Feladat: Vízminőségi adatsor elemzése, terhelés (anyagáram) számítása Beadás: szorgalmi időszak vége (dec. 11.), KD: dec. 21.
Optimalizáció modell kalibrációja Adott az M modell, és p a paraméter vektora. Hogyan állítsuk be p -t hogy a modell kimenete az x bemenő adatokon a legjobban.
Felszíni víz monitoring
Többváltozós adatelemzés
Többváltozós adatelemzés
Alapsokaság (populáció)
Budapesti Műszaki Főiskola Neumann János Informatikai Kar Informatikai Automatizált Rendszerek Konzulens: Vámossy Zoltán Projekt tagok: Marton Attila Tandari.
Költség-minimalizálás az ellenőrző kártyák alkalmazásánál Feladatmegoldás, kiegészítés.
MI 2003/ Mi lenne a b legjobb választása? Statisztikai eljárásoknál az un. Fisher féle lineáris diszkriminancia függvény adja a legjobb szétválasztási.
Algoritmizálás, adatmodellezés tanítása 8. előadás.
Kommunikációs Rendszerek
Business Mathematics A legrövidebb út.
Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika és Információs Rendszerek Tanszék Korlátkielégítési problémák Autonóm és hibatűrő információs.
F IGYELMI ALGORITMUSOKKAL VEZÉRELT HELYSZÍNANALÍZIS Persa György.
Menetrend optimalizálása genetikus algoritmussal
WP-Dyna: tervezés és megerősítéses tanulás jól tervezhető környezetekben Szita István és Takács Bálint ELTE TTK témavezető: dr. Lőrincz András Információs.
Bevezetés a méréskiértékelésbe (BMETE80ME19)
MI 2003/8 - 1 Alakfelismerés alapproblémája: adott objektumok egy halmaza, továbbá osztályok (kategóriák) egy halmaza. Feladatunk: az objektumokat - valamilyen.
Kutatási beszámoló 2002/2003 I. félév Iváncsy Renáta.
Struktúra predikció Struktúra lehet Felügyelt tanulási probléma
Automatikus fizikai tervezési javaslatok XML adatbázisokhoz Balogh Bernadett Kresz Marcell Cseh Tamás.
Bevezetés a méréskiértékelésbe (BMETE80ME19) 2014/
PÁRHUZAMOS ARCHITEKTÚRÁK – 13 INFORMÁCIÓFELDOLGOZÓ HÁLÓZATOK TUDÁS ALAPÚ MODELLEZÉSE Németh Gábor.
Gépi tanulási módszerek
Mediánok és rendezett minták
Mesterséges intelligencia
Nem módosítható keresések
A évi kompetenciamérés FIT-jelentéseinek új elemei
Bevezetés Tematika Számonkérés Irodalom
Emlékeztető Az előző órán az adatok eloszlását Gauss-eloszlással közelítettük Célfüggvénynek a Maximum Likelihood kritériumot használtuk A paramétereket.
Bunkóczi László, Dr.Pitlik László, Pető István, Szűcs Imre
A mesterséges neuronhálók alapjai
Előadás másolata:

Hidasi Balázs Gravity R&D BME-TMIT február 20. Budapest

Tartalom  Bevezetés  Idősorok  Idősor-osztályozás  Az alap ShiftTree algoritmus  Felépítés  Címkézés  Tanulás  Futási idő  Modellek értelmezése  Előnyök, hátrányok  Kiegészítések  Nyesés  Többszörös modellezés  Heurisztikák a tanulásban  Stream-ShiftTree  Futási idő csökkentés  Konfidenciák  Online tanulás  Modellek kombinálása  Néhány eredmény  Merre tovább?

Idősorok  Félig strukturált adatok  Idő szerinti rendezettség  Egy vagy több változó  Idősor-szerű adatok  Több időtengely  Jelen tárgyalásban:  Egy idő tengely  Egy vagy több változó  Változók egyenletes mintavétele

Motiváció  Olcsó szenzorok elterjedése  Jelentős mennyiségű idősor jellegű adat  Előtérbe kerülő alkalmazási területek  Nyomkövetés  Hangfelismerés  Gesztusfelismerés  Diagnosztika  Stb.

Idősorokhoz kapcsolódó feladatok  Előrejelzés  Klaszterezés  Szakaszok felismerése  Osztályozás  Stb.

Idősorok osztályozása  Klasszikus osztályozás, idősor bementtel  Ismert címkéjű példányokkal tanítás  Ismeretlen címkéjű pontok felcímkézése Modell Tanítás Modell Osztályozás

Idősor-osztályozó módszerek  Klasszikus módszerek  Változó(k) értékei függetlenek  Nem használja ki a struktúrát  Nem tudja kezelni az eltérő hosszakat  Példány alapú módszerek (1-NN (k-NN))  Valamilyen mérték használatával  Nincs tanulás  Nagyon lassú az osztályozás  Indexelés  Alacsony általánosító képesség  Nem kell sok tanítóminta  Rejtett Markov modellek (HMM)  Kell ismeret a problémáról (nem domain független)  Állapotátmenet mátrix, alap struktúra definiálása  Tanuláshoz sok minta kell

Célok  Modell alapú megoldás  Nagyobb általánosító képesség  Címkézés gyors  Viszont: több tanítóminta kell  Értelmezhető modell  Leírás az osztályokról  Bizalom az algoritmussal szemben  Kellő pontosság  Domain függetlenség  Szakértői tudás beépíthetősége

Általános koncepció  Nem idősor specifikus  Idősor  Más félig strukturált adat  Gráfok  Kurzor (szem)  Dinamikus attribútumok  Két kérdés  „Hova nézzünk?”  „Mit nézzünk?”  Operátor családok  EyeShifter Operator(s) (ESO)  ConditionBuilder Operator(s) (CBO)  Modell: egyszerű operátorok / szabályok sorozata  Elágazások lehetségesek F(x)

Koncepció alkalmazása idősorokra  Dinamikus attribútumok idősorokhoz  EyeShifter Operator (ESO): „Hova nézzünk?”  A szemet az időtengely mentén mozgatja  Az idősor egy meghatározott pontjához  Pl.: „Következő lokális minimum”, „100 egységgel előre”, etc.  Megj.: a hely függ(het) a teljes operátor sorozattól  ConditionBuilder Operator (CBO): „Mit nézzünk?”  Kiszámolja az attribútum értéket  Pl.: „Változó értéke”, „Ugrás hossza”, etc.  Bináris döntési fa, mint alap modell  Jól együttműködik a dinamikus attribútumok rendszerével  A gyökértől a levelekig tartó operátor sorozatok Súlyozott átlag F(x)

Egy csomópont felépítése ESO j V E változón CBO k V C változón CV < TV ? CV Θ Θ IH Child L Child R

Néhány példa operátor  ESO  Következő lokális maximum  Globális minimum  Vissza 25 egységgel  Legközelebbi szélsőértékre  CBO  Pontbeli érték  Pont körüli súlyozott átlag  Ugrás hossza  Értékek átlaga az átugrott tartományban

Címkézés szint ESOMax CBOSimple Felt: 2, szint ESONext(25) CBOSimple Felt: 0, szint 1. szint Levél Érték: 1,32432 Érték: -0, Érték: 1,89136 Érték: 2,15333 Érték: 2,97557

Modell tanulás  0. Operátor halmazok definiálása (ESO, CBO).  0. Üres gyökér csomópont felvétele, az összes tanítóminta hozzárendelése a gyökérhez. Minden mintánál a szem beállítása az idősor elejére. Gyökér berakása a kifejtési sorba.  1. A következő üres csomópont vétele a kifejtési sorból.  1.A. Ha teljesül a leállási feltétel, az aktuális csomópont legyen levél. GOTO 1.  1.B. Egyébként a csomópontba kerülő tanítóminták két részre bontása a legjobban szeparáló dinamikus attribútum szerint. (Csomópont tanulás.)  2. A kiválasztott ESO szerint a szem beállítása a tanítómintákon.  3. Két gyermek csomópont létrehozása, a mintahalmazok hozzárendelése, csomópontok hozzá vétele a kifejtési sorhoz. GOTO 1.

Csomópont tanulás  Kiindulási állapot  Szem az idősor elején  Előre definiált ESO halmaz  Lehetséges szem pozíciók

Csomópont tanulás  Előre definiált CBO halmaz  Elérhető dinamikus attribútumok  A lehetséges szem pozíciók „körül”  Minden ESO-CBO kombináció  Választunk egy…  Attribútumot  Küszöbértéket Ami minimalizálja a gyermek csomópontokban az osztályok eloszlásának entrópiáinak az összegét F(x)

Csomópont tanulás  Legjobb vágás kiválasztása  Szem mozgatása  Elérhető pozíciók megváltoznak! Minták kétfelé osztása Gyermek csomópontok létrehozása Homogén csomópont esetén leállás

Csomópont tanulás 20 Döntő 2,486220, , Feltételállító Szemtologató Definiált operátorok ES ESONextMax Ugrás a következő lokális maximumhoz ESONext100 Ugrás 100 hellyel előre ESOMax Ugrás a maximumhoz CBCBSimple Pontbeli érték visszaadása ESONextMax ESONext100 ESOMax CBOSimple ShiftTree Eddigi legjobb jóságérték: ESO: CBO: Feltétel: Eddigi legjobb vágás a csomópontban Jelen beállításnál a legjobb jóság érték: Jelen beállításnál a legjobb vágási feltétel: Eddigi legjobb rendezés: Inf 0, , , , , Inf 1, , , , , , Inf 00,805777Inf0, ,985078Inf ESONextMax CBOSimple -0, ESONext100 CBOSimple 0, ESONextMax -0, ESOMax CBOSimple 1,02775 ESONextMax - -0, F(x) M

Futási idő - elmélet  Címkézés:  Operátorfüggően lineáris az idősor hosszában  Lineáris a modell szintjeinek számában  Tanítás:  Csomópontonként  A rendezés miatt N*logN a csomópont mintáinak számában  Operátorfüggően lineáris az idősor hosszában  Lehetséges dinamikus attribútumok számában lineáris függés  Összességében  Függ a kialakult struktúrától  Függ a tanítópontok aktuális eloszlásától

Futási idő - gyakorlat  Címkézés: nagyon gyors  Tanítás: viszonylag gyors  A hossztól való függés nem mutatható ki  Nagyban függ a probléma nehézségétől  Függ a definiált operátoroktól  Lineárisan skálázódik

Modell értelmezés  Operátor függő!  Az adatok megértésében is segít  Pl.: CBF adatsor  3 osztály: Cylinder, Bell, Funnel  Cylinder a globális maximumban különbözik a másik kettőtől  Z-normalizált adatsor  Bell és Funnel közti különbség: vissza 25 egységet + zajszűrés (súlyozott átlag)  Melyik oldalon van a csúcs

Előnyök  Modell alapúság előnyei  Értelmezhető  Domain független  Szakértői tudás bevihető az operátorokon keresztül

Hátrányok  Alap operátorkészlet (és paramétereik) definiálása nem triviális  Túl sok operátor esetén belassulhat a tanulás  Modell alapúság hátrányai

Többváltozós idősorok kezelése  Az alap algoritmus működik többváltozóson  Változók értékeiből származtathatunk  CBE (Condition Builder Extension)  A CBO-k által számolt származtatott értékeket kombinálja  Pl.: Átlagolás  VVO (Virtual Variable operátor)  Az egyes változókból származtat virtuális változókat  Pl.: 2. és 3. változó különbsége

Nyesés  Utó- vagy előnyesés  Bizonyos ágak levágása  Kipróbált módszerek:  Szignifikancia alapú  Komplexitás-hibaarány  Egyszerű nyesés  A validációs halmazra legjobban illeszkedő részfa  Szintszám limit  Csomópontszám limit  Mintaszám limit  Bármilyen nyesés csak ront a hatékonyságon

Többszörös modellezés (MM) 1. szint ESONext(25) CBOSimple Feltétel1 2. szint Levél  Több optimális attribútum esetén  Az összeset kiválasztjuk, az összes szerint vágunk  Többszörös fát építünk  De csak ott sokszorozunk, ahol kell, nem az egész fát  Címkézés  Többségi szavazás  Vagy legjobb illeszkedés kiválasztása validációs halmazzal  Lassú, memóriaigényes  Korlátozás kell a maximális elágazás- és/vagy modellszámra  Javulás az eredményekben, de rossz a trade-off Az 1. optimális (25-öt előre) Ez is optimális (25-öt vissza) 1. szint ESOPrev(25) CBOSimple Feltétel2 2. szint Levél

Heurisztikák a tanításban  Vágási határtól legyenek a az attribútum értékek minél távolabb  Operátorok eltérő működési tartománya  Normalizálás  Átlagolás a negatív példák miatt nem jó  SM+  A határhoz legközelebbi pontok távolsága  SM++  Az összes pont távolsága a határtól  SM3+  SM+ és SM++ aránya  Az MM-nél jobb eredmények  SM+ a leghatékonyabb  Nem jelentős a számítási igény növekedés  Kombinálható az MM-mel  Mely vágásokat dobjuk el  MM használata itt már nem jelent javulást A B H = A / B a7a7 B H = SUM(ai) / B a8 a9 a10 a6 a1 a2 a3 a4 a5

ShiftForest: Modellek kombinálása  Több modell kombinálása a pontosság növelése végett  Értelmezhetőség általában elveszik  Kivéve, ha értelmes a modellek metszete  Boosting  Iteratív módszer:  Miden tanítómintához súly rendelése  Tanítás  Tanítóhalmazon (súlyozott) hiba mérése  Modellsúly kiszámítása  Hibásan osztályozott minták súlyának növelése  Problémák:  Kell nyesés, különben a tanítási hiba nulla  Kisebb adatsorokon nem feltétlenül működik (tökéletesen illeszkedő fa)  „XV” módszer  Véletlenszerű felosztása a tanítóhalmaznak  Első részen tanítás  Másodikon pontosság mérés  A modell súly a becsült pontosság érték

Futási idő csökkentése  Tanítás során attribútum választás  Célfüggvény minimalizálása  Célfüggvény tulajdonságai  Adott rendezés mellett minimumok csak az egybefüggő intervallumok szélén lehetnek  Minimum előre meghatározható  Nem léphetünk ki minimumnál, de…  Ha eléri, akkor csak 2-2 helyet kell vizsgálni a további rendezéseknél  Jelentősen csökken a célfüggvény értékének meghatározásának száma  Futási idő átlagosan 22,33%-kal csökkent  Pl.: FordB – 3636 tanítóminta:  214,94s  173,52s (-19,27%)  Pl.: CBF – 30 tanítóminta:  0,246s  0,145s (-41,18%)  Pl.: Beef – 30 tanítóminta  0,574s  0,517s (-9,9%)

Konfidenciák  Mennyire biztos a modellünk a kimenetben  Levél (csomópont) konfidencia  Pl. többségi osztály aránya a levélben (nyesés!)  Útvonal konfidencia  Osztályozási útvonalon a konfidenciák (súlyozott) összegzése  Egyfajta dinamikus nyesési eljárás

Online tanulás  Konfidenciák bevezetésével válik lehetővé  Teljes modellépítés helyett a modell kisméretű megváltoztatása  Konfidencia frissítés az egyes csomópontokban felhasználói visszajelzés alapján  Útvonal konfidencia, mint dinamikus nyesés  Arányok változásával változik a nyesés

Stream ShiftTree  Egy érdekes kiegészítés adatfolyamokban bizonyos jelek felismerésére  Idősorokon tanított ShiftTree modellt használ a felismerésre  Időablakos megoldás  A stream változójának értékei alapján frissül, hogy éppen hol vagyunk a fában  Visszafele ugrásokat nem támogatja  Elkeni a feldolgozáshoz szükséges számítási igényt  Főbb problémák  Alapjel elkülönítése az egyes osztályoktól

Stream ShiftTree példa  Attribútum előállítása  Ugorj a következő lokális maximumra (ESONextMax(1)),  és vedd a 2 sugarú környezet átlagát (CBOAVG(2))  Collector  5 hosszú FIFO sor  Activator  azt nézi, hogy az előző beérkezett érték lokális maximum-e  Bemenet: 234 Előző előtti érték: Előző érték: Beérkezett érték: Aktiválás Eredmény: 2,8 Attribútum érték kiszámítása

Teszteléshez használt adatok  UCR Time Series Database  20 adatsor  Különböző területekről  A nagy részük kis méretű  Time Series Classification Challenge 2007  20 adatsor  Különböző területekről  Csak vak tesztekhez  Ford Classification Challenge 2008  2 nagy méretű adatsor  Többváltozós adatok  EEG jelek  Hangfelismerés  Gesztusfelismerés

ShiftTree eredmények  Nincs optimalizálás  Alap operátorkészlet használata minden problémánál  Ford és UCR adatok  Kisebb adatsorokon nem hatékony

ShiftForest eredmények  Jelentős növekedés az alap algoritmushoz képest

Vak tesztek  Time Series Challenge adatsorán  Mintha részt vett volna a versenyben  Egy-egy futtatás a ShiftTree-vel és a ShiftForest-tel  Pontszám a helyezés alapján egy-egy problémánál  Eredmény:  13 beadott megoldással (kombinált módszerek) összevetve  ShiftTree 8., ShiftForest 6. helyen  De az első helyek száma a ShiftTree-nél és a ShiftForest-nél a legmagasabb  A kisebb adatsorokon teljesítenek rosszul

Algoritmus megbízhatósága

A ShiftTree története  Egyetemi feladat + hobbi projekt  2008 (februártól)  Május: első verzió és néhány teszt  Október: alap modell, kiterjedt tesztek  December: MM, nyesés, többváltozós  2009  Alkalmazási kísérletek (EEG adatokon)  Stream kiterjesztés kidolgozása  Egyéb kísérletek  Vak tesztek  2010  Heurisztikus tanítás  ShiftForest  Kísérleti módszerek  Új, fejlettebb implementáció  Futási idő csökkentő eljárások  2011 (áprilisig)  Konfidenciák  Online tanulás

Nyitott kérdések  Hogyan lehet tovább javítani a tanításon?  Inner boosting  Súlyozott MM  Valószínűségi modellek MM-nél  Hogyan lehet egy adatsorhoz jó operátorkészletet definiálni?

Kutatási irányok  Tanítás fejlesztése  Az alapelv kiterjesztése  Gráfok  Többdimenziós idősorok (képek, videók)  Más félig strukturált adatok  Más modell használata  Neurális háló szerű megoldás  Alkalmazás

Köszönöm a figyelmet! További ShiftTree-vel kapcsolatos kutatási anyagok az oldalamon: