Többváltozós adatelemzés 5. előadás. Hierarchikus klaszterezés Klaszterek számát nem kell előre megadni A pontok elhelyezkedését térképezi fel Nem feltétlenül.

Slides:



Advertisements
Hasonló előadás
Készítette: Kosztyán Zsolt Tibor
Advertisements

Definíciók: Algoritmus: bármely véges sok lépéssel leírható tevékenység. Olyan pontos előírás, amely megmondja, hogy egy adott típushoz tartozó feladat.
Adatelemzés számítógéppel
Hatékonyságvizsgálat, dokumentálás
FRAKTÁLOK.
Csoportosítás.
Tökéletes verseny és monopólium
Klaszterelemzés az SPSS-ben
Függvények Egyenlőre csak valós-valós függvényekkel foglalkozunk.
ALAKZATOK TRANSZFORMÁCIÓJA ÚJ KÉPSÍKOK BEVEZETÉSÉVEL
SAS Enterprise Miner 2. gyakorlat
DIFFERENCIÁLSZÁMÍTÁS ALKALMAZÁSA
Függvénytranszformációk
5. előadás (2005. március 22.) Függvények definíciója, deklarációja, hívása Enumerációs adattípus 1.
Dokumentum klasszifikáció október 12.. Dokumentum klasszifikáció Feladat: Dokumentumok automatikus előre definiált osztályokba sorolása. Dokumentum:
Távolság alapú eljárások Hierarchikus eljárások
Osztályozás -- KNN Példa alapú tanulás: 1 legközelebbi szomszéd, illetve K-legközelebbi szomszéd alapú osztályozó eljárások.
MI 2003/ Alakfelismerés - még egy megközelítés: még kevesebbet tudunk. Csak a mintánk adott, de címkék nélkül. Csoportosítás (klaszterezés, clustering).
FRAKTÁLOK.
Hálózati Biológia A sejt funkcionális működésének megértése.
Intelligens ébresztő óra Számítógépes látás projekt 2011.
Mutatók, tömbök, függvények
Hasonlósági transzformáció
Közlekedésstatisztika
5. előadás.
Szűrés és konvolúció Vámossy Zoltán 2004
Év eleji információk Előadó: Hosszú Ferenc II. em Konzultáció: Szerda 9:50 – 10:35 II. em
A háromszögek nevezetes vonalai
Adatbányászat: Klaszterezés Haladó fogalmak és algoritmusok
Adatbányászat: Klaszterezés Alapfogalmak és algoritmusok
PTE PMMK Matematika Tanszék dr. Klincsik Mihály Matematika III. előadások MINB083, MILB083 Gépész és Villamosmérnök szak BSc képzés 2007/2008. őszi félév.
Régióközi tudáshálózatok minőségének hatása a kutatási teljesítményre Sebestyén Tamás és Varga Attila.
Programozás C-ben Link és joint Melléklet az előadáshoz.
Hierarchikus klaszteranalízis
SPSS többváltozós (lineáris) regresszió (4. fejezet)
K-közepű és kétlépéses klaszteranalízis (3. fejezet)
Lineáris programozás Definíció: Olyan matematikai programozási feladatot nevezünk lineáris programozási feladatnak, amelyekben az L halmazt meghatározó.
2. Koordináta-rendszerek és transzformációk
Ipari képfeldolgozás projekt II. mérföldkő
Hálózati réteg.
Klaszter analízis A klaszteranalízis értelmes és használható csoportba sorolja az adatokat, ezek a klaszterek. A klaszteranalízis kiindulópontja az elemek.
Függvények.
Adatbányászati módszerek a térinformatikában
Többváltozós adatelemzés
Többváltozós adatelemzés
Többváltozós adatelemzés
Többváltozós adatelemzés
Többváltozós adatelemzés
Többváltozós adatelemzés
Többváltozós adatelemzés
Többszintű Tenyéralapú Biometrikus Azonosító Rendszer
„Taxonok mintákban” típusú adatmátrix
Nevezetes algoritmusok: Fa megvalósítása Készítette: Várkonyi Tibor Zoltán.
Bevezetés a méréskiértékelésbe (BMETE80ME19) 2014/
2. előadás.
Útkeresések.
előadások, konzultációk
Készítette: Mátyás István agrár mérnöktanár szakos hallgató,
Kutatási beszámoló 2002/2003 I. félév Iváncsy Renáta.
Ultrametrikus terek ELTE IK/Fraktálok - Varga Viktor.
Hasonlóság modul Ismétlés.
1.Kanonikus felügyelt tanulási feladat definíciója (5p) 1.Input, output (1p) 2.Paraméterek (1p) 3.Hipotézisfüggvény (1p) 4.Hibafüggvény/költségfüggvény.
Szóródási mérőszámok, alakmutatók, helyzetmutatók
Nem módosítható keresések
Statisztikai Programcsomagok SAS EG gyakorlat
Matematika I. BGRMA1GNNC, BGRMA1GNNB előadás.
ELEMI GEOMETRIAI ISMERETEK
5. előadás.
A leíró statisztikák alapelemei
Quine-McCluskey Módszer
Előadás másolata:

Többváltozós adatelemzés 5. előadás

Hierarchikus klaszterezés Klaszterek számát nem kell előre megadni A pontok elhelyezkedését térképezi fel Nem feltétlenül képződnek klaszterek Agglomeratív és felosztó eljárások Adatok és/vagy változók klaszterezése

Hierarchikus klaszterezés -2- Algoritmus leírása (agglomeratív eljárások): Kezdetben minden pont önálló klaszter Minden lépésben a két legközelebbi klaszter összevonása történik N-1 lépésben összevonásra kerül az összes pont (változó) Az összevonásokat ún. dendrogramon ábrázoljuk

Hierarchikus klaszterezés -3- Két lényeges kérdés: Mit értünk két pont távolságán (hasonlóságán) Mit értünk két klaszter távolságán (un. agglomerációs elvek)

Távolság (hasonlósági) mértékek Távolság definíciója: d(x,y) kétváltozós függvény távolság, ha –nemnegatív: d(x,y)>=0 –d(x,y)=0, akkor és csak akkor, ha x=y –szimmetrikus d(x,y)=d(y,x) –háromszög egyenlőtlenség d(x,z)>=d(x,y)+d(y,z)

Távolság (hasonlósági) mértékek Nevezetes távolságok: –Euklídeszi: d(x,y)= sqrt[(x 1 -y 1 ) 2 +(x 2 -y 2 ) 2 +…+(x n -y n ) 2 ] –Négyzetes euklídeszi (nem távolság!): (x 1 -y 1 ) 2 +(x 2 -y 2 ) 2 +…+(x n -y n ) 2 –City block (Manhattan): |x 1 -y 1 |+|x 2 -y 2 |+…+|x n -y n | –Csebisev: max(|x 1 -y 1 |,|x 2 -y 2 |,…,|x n -y n |)

Agglomerációs elvek Mit értünk két klaszter távolságán

Agglomerációs elvek Legközelebbi szomszéd (egyszerű lánc) Legtávolabbi szomszéd (teljes lánc) Átlagos lánc (csoportok között, csoporton belül) Centroid Medián Ward

Legközelebbi szomszéd

Legtávolabbi szomszéd

Ward elv

Hány klaszter keletkezik A dendrogramot az 5 és 10 távolságszint között szoktuk elvágni Akkor jó, ha összevonódások az 5 távolságszint alatt, vagy a 10 felett vannak Az eljárás meglehetősen heurisztikus

Melyiket válasszuk ‘Ahogy tetszik gondolni’ Tértégító, térszűkítő, térkonzerváló hatás ‘Szokásjog’ Feladat egyedi jellege (pl. monoton transzformációra legyen érzéketlen)

Esetek szűrése Ha túl sok eset van nem mutat semmit a dendrogram, ilyenkor célszerű szűkíteni a megfigyelések körét Sztendredizálás szűrés előtt, vagy szűrés után?

Hierarchikus klaszterezés Egyházi intézmények

Fenntartóra aggregálva kiadások szerkezete

Fenntartóra aggregálva kiadások megoszlása

Megyére aggregálva kiadások szerkezete

Megyére aggregálva kiadások megoszlása