K-közepű és kétlépéses klaszteranalízis (3. fejezet)

Slides:



Advertisements
Hasonló előadás
4. Két összetartozó minta összehasonlítása
Advertisements

Statisztika II. I. Dr. Szalka Éva, Ph.D..
Nem hierarchikus klaszterelemzés az SPSS-ben
A tervezés mint menedzsment funkció
Klaszterelemzés az SPSS-ben
Összetett kísérleti tervek és kiértékelésük: Háromszempontos variancia analízis modellek.
A statisztika alapjai - Bevezetés az SPSS-be -
MI 2003/9 - 1 Alakfelismerés alapproblémája: adott objektumok egy halmaza, továbbá osztályok (kategóriák) egy halmaza. Feladatunk: az objektumokat - valamilyen.
Online asztalfoglalási rendszer
Non-profit szervezetek bevételi szerkezetének elemzése.
Digitális képanalízis
Optimális részhalmaz keresése Keresési tér. 0,0,0,0 1,0,0,0 0,1,0,0 0,0,1,0 0,0,0,10,0,1,1 1,1,0,0 1,0,1,0 0,1,1,0 1,1,1,0 1,0,1,1 0,1,1,1 1,1,1,11,1,0,1.
Távolság alapú eljárások Hierarchikus eljárások
Mérés és adatgyűjtés Virtuális méréstechnika Mingesz Róbert 9. Óra Idő és sokaságátlag November 7., 9.
MI 2003/ Alakfelismerés - még egy megközelítés: még kevesebbet tudunk. Csak a mintánk adott, de címkék nélkül. Csoportosítás (klaszterezés, clustering).
Klaszterező algoritmusok smart city alkalmazásokhoz Gonda László Témavezető: Dr. Ispány Márton.
Készítette: Pető László
Dr. Szalka Éva, Ph.D.1 Statisztika II. VII.. Dr. Szalka Éva, Ph.D.2 Mintavétel Mintavétel célja: következtetést levonni a –sokaságra vonatkozóan Mintavétel.
Statisztika II. VI. Dr. Szalka Éva, Ph.D..
Előadó: Prof. Dr. Besenyei Lajos
III. előadás.
Adatbányászat: Rendellenesség keresés
Lineáris egyenletrendszerek megoldása
SPSS bevezetés.
Hierarchikus klaszteranalízis
SPSS többváltozós (lineáris) regresszió (4. fejezet)
Diszkriminancia analízis
SPSS többváltozós regresszió
Többdimenziós skálázás (7. fejezet). Alapgondolat Feltáró elemzés A skálázással az adatok közötti különbségeket vizsgáljuk, illetve vetítjük le őket kevesebb.
Diszkriminancia analízis
Főkomponens és faktor analízis
Microsoft Excel Diagramok.
Nem-paraméteres eljárások, több csoport összehasonlítása
Kovarianciaanalízis Tételezzük fel, hogy a kvalitatív tényező(k) hatásának azonosítása után megmaradó szóródás egy részének eredete ismert, és nem lehet,
Kvantitatív módszerek
Nemparaméteres próbák Statisztika II., 5. alkalom.
Nemparaméteres próbák
Az F-próba szignifikáns
Klaszter analízis A klaszteranalízis értelmes és használható csoportba sorolja az adatokat, ezek a klaszterek. A klaszteranalízis kiindulópontja az elemek.
Kvantitatív Módszerek
Idősor elemzés Idősor : időben ekvidisztáns elemekből álló sorozat
Környezeti monitoring Feladat: Vízminőségi adatsor elemzése, terhelés (anyagáram) számítása Beadás: szorgalmi időszak vége (dec. 11.), KD: dec. 21.
Optimalizáció modell kalibrációja Adott az M modell, és p a paraméter vektora. Hogyan állítsuk be p -t hogy a modell kimenete az x bemenő adatokon a legjobban.
Matematikai eszközök a környezeti modellezésben
Környezeti rendszerek modellezése
Statisztikai módszerek áttekintése módszerválasztási tanácsok Makara Gábor.
Adatbányászati módszerek a térinformatikában
Többváltozós adatelemzés
Többváltozós adatelemzés 5. előadás. Hierarchikus klaszterezés Klaszterek számát nem kell előre megadni A pontok elhelyezkedését térképezi fel Nem feltétlenül.
Többváltozós adatelemzés
Lineáris regresszió.
Folytonos eloszlások.
Adatbázis kezelés.
Paleobiológiai módszerek és modellek 4. hét
Bevezetés a méréskiértékelésbe (BMETE80ME19) Intervallumbecslések 2014/
Kördokumentumok 2..
Bevezetés a méréskiértékelésbe (BMETE80ME19) 2014/
 A matematikai statisztika a természet és társadalom tömeges jelenségeit tanulmányozza.  Azokat a jelenségeket, amelyek egyszerre nagyszámú azonos tipusú.
Kutatási beszámoló 2002/2003 I. félév Iváncsy Renáta.
Fájlszervezés Adatbázisok tervezése, megvalósítása és menedzselése.
17. Előadás Dr. Pauler Gábor, Egyetemi Docens
A beruházások kockázata Beruházási döntések folyamata ♦ Tőkeköltségvetés- a pénzáramok meghatározása ♦ Megfelelő módszer kiválasztása a pénzáramok értékeléséhez.
Mozgásvizsgálat gyakorlat
Szabályozott és képes termékek/szolgáltatások, folyamatok, rendszerek
18. Gyakorlat Dr. Pauler Gábor, Egyetemi Docens
Statisztikai Programcsomagok SAS EG gyakorlat
Adatredukciós módszerek
A leíró statisztikák alapelemei
Rangsoroláson és pontozáson alapuló komplex mutatók
Adatredukciós módszerek (klaszterezés, alakfelismerés)
Előadás másolata:

K-közepű és kétlépéses klaszteranalízis (3. fejezet) 2017.04.04. K-közepű és kétlépéses klaszteranalízis (3. fejezet)

k-közepű klaszterezés Jellemzők: nagy számú egyed csoportosítása klaszterek számának (k) meghatározása előre iteratív klaszterközéppontok csak intervallum/arány skálán mért változók egyszerű euklideszi távolság!!! standardizálás Az eljárás lépései: Kezdeti klaszterközéppontok kiválasztása: első k darab teljes megfigyelés, majd ezek módosítása Kezdeti klaszterközéppontok újraszámítása: minden esetet a legközelebbi klaszterhez rendelünk, majd újra kiszámítjuk a középpontot „Elég kis” változáskor az iteráció leáll

Kétlépéses klaszterezés Jellemzők: Folytonos és kategóriás változók kezelésére egyaránt képes A klaszterek számának automatikus kiválasztása Hatékonyság nagy adatállományok esetén is Feltevések: A változók egymástól függetlenek A folytonos változók normális, a kategóriás változók multinomiális eloszlásúak A módszer lépései: CF (Cluster Features) Tree: előzetes klaszterezés hasonló egyedekre A levelek agglomeratív klaszterezése, AIC/BIC alapján a „legjobb” választása

k-közepű klaszterezés telco_extra.sav (1000 ügyfél): SPSS példa k-közepű klaszterezés telco_extra.sav (1000 ügyfél): változók: zlnlong zlntoll zlnequi zlncard zlnwire zmultlin zvoice zpager zinterne zcallid zcallwai zforward zconfer zebill 3 induló klaszter, majd 4 exclude cases pairwise Kétlépéses klaszterezés car_sales.sav (157 gépkocsi) változók: típus, price-mpg