Az előadás letöltése folymat van. Kérjük, várjon

Az előadás letöltése folymat van. Kérjük, várjon

Hierarchikus klaszteranalízis. Klaszteranalízisről általában Cél: Olyan csoportok (klaszterek) létrehozása, melyekben az egyedek a saját csoportjukban.

Hasonló előadás


Az előadások a következő témára: "Hierarchikus klaszteranalízis. Klaszteranalízisről általában Cél: Olyan csoportok (klaszterek) létrehozása, melyekben az egyedek a saját csoportjukban."— Előadás másolata:

1 Hierarchikus klaszteranalízis

2 Klaszteranalízisről általában Cél: Olyan csoportok (klaszterek) létrehozása, melyekben az egyedek a saját csoportjukban levő más egyedekhez hasonlítanak a legjobban Heterogén sokaság homogén csoportokba Az objektumok „helyettesítése” a rájuk legjellemzőbb „mesterséges” objektummal Különböző módszerek: Hierarchikus –Agglomeratív –Divizív Nem hierarchikus (iteratív) 2

3 Agglomeratív hierarchikus klaszterezés Elve: minden megfigyelés egy egyelemű klaszter, majd ezeket vonjuk távolságuk/hasonlóságuk alapján össze Menete: 1.Valamennyi megfigyelésünk külön 2.A választott távolságmérték alapján a két leginkább hasonló klaszter kiválasztása 3.Csökkentsük a klaszterek számát egyel, számítsuk ki újra a távolságokat 4.Az előző két lépést folytassuk addig, amíg egyetlen klasztert nem kapunk 3

4 Megválaszolandó kérdések Távolság/hasonlóság mérése –Milyen mérőszámmal mérjük? –Mi között mérjük a távolságot? Mértékegységek kezelése –Változók különböző nagyságrendje –Standardizálás Hány klasztert képezzünk? Változók jellemzői, mérési skála –Kvantitatív, bináris, darabszámok Esetleg sorrend függőség 4

5 Alkalmazott távolság/hasonlóság mérték Skála típusú változók esetén –Euklideszi távolság –Négyzetes euklideszi távolság –Korreláció –Cosine –Csebisev-távolság –Block –Minkowski (p) –Power (p,r) 5

6 Hogyan mérjük a klaszterek közti távolságot? Legközelebbi szomszéd (single linkage): legközelebbi elemek alapján Legtávolabbi szomszéd (complete linkage): legtávolabbi elemek alapján Átlagos távolság (average linkage): páronkénti távolságok átlaga Euklideszi távolságot használó módszerek: Centroid módszer (centroid method): átlagos klasztertagok közötti távolság Ward módszer: minimális klaszteren belüli szórás növekedés 6

7 Eredmény ábrázolása: dendogram Kevés eset esetén áttekinthető csak 7


Letölteni ppt "Hierarchikus klaszteranalízis. Klaszteranalízisről általában Cél: Olyan csoportok (klaszterek) létrehozása, melyekben az egyedek a saját csoportjukban."

Hasonló előadás


Google Hirdetések