Digitális képanalízis Tematikus osztályozás
Tematikus osztályozás Elnevezések: klasszifikáció (classification) térképezés (thematic mapping) klaszterezés (clustering)
Lehetséges térképezési folyamatok
Az eljárások csoportosítása Ellenőrzött (supervised) felügyelt Nem-ellenőrzött (unsupervised) nem felügyelt automatikus klaszterezés (clustering)
Ellenőrzött osztályozás Kérdés: egy kép pixelei hogyan sorolhatók tematikus osztályokba? Másként: az adott pixel mit ábrázol?
A tesztkép
A kísérletekben szereplő tematikák: erdő vízfelület rét lakott terület tűlevelű erdő lombos erdő liget cserjeerdő rét szántó parlag ritka beépítés sűrű beépítés vízfelület
Tananyag Ellenőrző adat = terepről gyűjtött információ (ground truth information) 2/3 rész: „tanításra” (paraméterezésre) 1/3 rész: tesztelésre Fajtái: pontszerű (elszórt pixelek) vonalszerű (lineáris elemek) felületszerű (poligonok) Megoszlás: egy tematikus osztály = egy tanuló terület egy tematikus osztály = több tanuló terület
Alapkérdés az intenzitástérben ? Landsat TM B3-B4
Néhány ellenőrzött osztályozó Legközelebbi középpont módszer (minimum distance) Hipertégla vagy Box-módszer (paralelepipedon) Legnagyobb valószínűség módszer (maximum likelihood) Hibrid módszerek Neurális hálózatok
Legközelebbi középpont Osztályjellemzés: átlagvektor Döntésfüggvény:
Legközelebbi középpont Előnyök: egyszerű osztályleírás gyors számítás Hátrányok: nehézségek azonos távolságok esetén átfedő osztályok kezelhetetlensége
MD-eredmény (4 osztály)
MD-eredmény (10 osztály)
Legközelebbi középpont osztályozás eredménye
Box-módszer Osztályjellemzés: Döntésfüggvény: minimum és maximum vektor Döntésfüggvény:
Box-módszer Előnyök: Hátrányok: pontosabb osztályleírás gyors számítás átfedő részek kívül eső részek
Legnagyobb valószínűség Osztályjellemzés: átlagvektor kovariancia mátrix Döntésfüggvény:
Legnagyobb valószínűség Előnyök: (gyakran) pontos osztályleírás jó paraméterezhetőség Hátrányok: bonyolult számítási eljárás lassú számítás
ML-eredmény (4 osztály)
ML-eredmény (10 osztály)
ML-eredménykép
Valószínűség-kép
Változatok ML-módszerre logaritmusos formula: Mahalanobis-távolság: …
Mahalanobis-eredmény A – Komárom B – Esztergom
Hibrid módszerek Gyors és kellően pontos módszer érdekében Változatai: Box + legközelebbi középpont Box + legnagyobb valószínűség
Neurális hálózatok Eszköze: Tananyag: Előny: Hátrányok: backpropagation hálózat Tananyag: közvetlenül a pixelek intenzitásértékeivel Előny: bonyolult, összetett intenzitáshatár-képzés részosztályok kezelhetősége Hátrányok: „black-box” tulajdonság szakértelmet igényel
Neurális eredménykép
Neuro-fuzzy eredménykép
Megoldások a pontosságért Osztályszétválaszthatósági elemzés pl. divergencia számítása Alosztályok képzése, kezelése, majd egyesítése Távolság- vagy valószínűség-kép létrehozása és elemzése Fuzzy logika alkalmazása Többszörös osztályozók használata
Alosztályos ML-eredmény
Szabályalapú osztályozás
Nem-ellenőrzött osztályozás Nincs tematikus osztály Nincs tananyag (ground truth) Cél: csoportok (klaszterek) képzése lehetőleg automatikusan Alkalmazási példa: homogén területek keresése
Nem-ellenőrzött osztályozók k-means ISODATA neurális hálózat
K-means módszer Algoritmus: mintavételezés „véletlen” klaszterjellemző felvétele minták besorolása klaszterjellemzők számítása megállás? vissza 3.-ra?
ISODATA Iterative Self-Organizing Data Analysis Technique A hasonló algoritmus, mint a k-means klaszter szétvágás és egyesítés is lehetséges
ISODATA-eredmény (ETM+)
ISODATA-eredmény
Neurális hálózatok versengő (competitive) hálózatok „winner-takes-all”-szabály önszerveződő leképezések (self-organizing maps – SOM)
SOM-eredménykép
Pontossági mérőszámok Hiba- (tévesztési) mátrix (error matrix)(confusion matrix) Cohen-kappa