Többváltozós adatelemzés

Slides:



Advertisements
Hasonló előadás
Összetett kísérleti tervek és kiértékelésük:
Advertisements

Adatelemzés számítógéppel
Meteorológiai Előrejelzés Adatbányászati Támogatással Putnoki Gyula GTK ISZAM II.évf. Társszerzők: az ISZAM-os Meteor-team TDK-konferencia 2007 Gödöllő.
Számítógépes algebrai problémák a geodéziában
Sűrűségfüggvény Parzen becslés Mintapontszám, szigma.
SAS Enterprise Miner 2. gyakorlat
Junit testing.
Az összehasonlító rendezések
Bevezetés a gépi tanulásba február 16.. Mesterséges Intelligencia „A számítógépes tudományok egy ága, amely az intelligens viselkedés automatizálásával.
Modern többosztályos tanulók: Döntési fa, Véletlen erdő, Előrecsatolt többrétegű neuronháló, Support Vector Machine (SVM), Kernel „trükk”.
Lineáris és nemlineáris regressziók, logisztikus regresszió
Gépi tanulási módszerek
Osztályozás -- KNN Példa alapú tanulás: 1 legközelebbi szomszéd, illetve K-legközelebbi szomszéd alapú osztályozó eljárások.
Rangsorolás tanulása ápr. 24..
Főkomponensanalízis Többváltozós elemzések esetében gyakran jelent problémát a vizsgált változók korreláltsága. A főkomponenselemzés segítségével a változók.
2006. július 11.SAS Felsőoktatási Fórum1 Adatbányászat oktatása a SAS rendszerrel a Debreceni Egyetemen Ispány Márton DE, Informatikai Kar.
Neurális hálók néhány alkalmazása a komputergrafikában
Mesterséges neuronhálózatok
Statisztika II. VI. Dr. Szalka Éva, Ph.D..
Ozsváth Károly NYME ACSJK Testnevelési Tanszék. Faktor = „jellemző”, „háttérváltozó” A faktoranalízis (FA) alapjában a változók csoportosítására, redukciójára.
Szűrés és konvolúció Vámossy Zoltán 2004
III. előadás.
INNOCSEKK 156/2006 Hasonlóságelemzés-alapú vizsgálat a COCO módszer használatával Készítette: Péter Gábor
Regresszióanalízis 10. gyakorlat.
Varianciaanalízis 12. gyakorlat.
Dr. Gombos Tímea SE, III.sz. Belgyógyászati Klinika
SPSS bevezetés.
SPSS többváltozós (lineáris) regresszió (4. fejezet)
SPSS többváltozós regresszió
Kovarianciaanalízis Tételezzük fel, hogy a kvalitatív tényező(k) hatásának azonosítása után megmaradó szóródás egy részének eredete ismert, és nem lehet,
Dr. Szalka Éva, Ph.D.1 Statisztika II. VI.. Dr. Szalka Éva, Ph.D.2 Regresszióanalízis.
Készítette: Kosztyán Zsolt Tibor
Kvantitatív módszerek
Kvantitatív módszerek
Térkép. Mi az adat? Minden információ, amit tárolni kell. Minden információ, amit tárolni kell.  szám  szöveg  dátum  hang  kép, stb.
Egytényezős variancia-analízis
STATISZTIKA II. 7. Előadás
Gyengén nemlineáris rendszerek modellezése és mérése Készítette: Kis Gergely Konzulens: Dobrowieczki Tadeusz (MIT)
Textúra elemzés szupport vektor géppel
Többváltozós adatelemzés
Többváltozós adatelemzés
Többváltozós adatelemzés
Többváltozós adatelemzés
Többváltozós adatelemzés
Többváltozós adatelemzés
Többváltozós adatelemzés 5. előadás. Hierarchikus klaszterezés Klaszterek számát nem kell előre megadni A pontok elhelyezkedését térképezi fel Nem feltétlenül.
Többváltozós adatelemzés
A sztochasztikus kapcsolatok (Folyt). Korreláció, regresszió
Két kvantitatív változó kapcsolatának vizsgálata
A Dijkstra algoritmus.
Részecskenyom analízis és osztályozás Pálfalvi József MSc, Intelligens Rendszerek, Önálló labor 1.
A kombinációs táblák (sztochasztikus kapcsolatok) elemzése
Bevezetés a Korreláció & Regressziószámításba
Kapcsolatok ellenőrzése
Adatbányászati módszerek a weblogfájlok elemzésében
Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika és Információs Rendszerek Tanszék Megerősítő elemzés „Big Data” elemzési módszerek Salánki.
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Regresszió-számítás március 30. Dr. Varga Beatrix egyetemi.
Adatbáziskezelés. Adat és információ Információ –Új ismeret Adat –Az információ formai oldala –Jelsorozat.
Részecskenyom analízis és osztályozás Pálfalvi József MSc, Intelligens Rendszerek, Önálló labor 1. Egyetemi konzulens: dr. Dobrowiecki Tadeusz (BME MIT)
Gépi tanulási módszerek
1.Kanonikus felügyelt tanulási feladat definíciója (5p) 1.Input, output (1p) 2.Paraméterek (1p) 3.Hipotézisfüggvény (1p) 4.Hibafüggvény/költségfüggvény.
Szimuláció. Mi a szimuláció? A szimuláció a legáltalánosabb értelemben a megismerés egyik fajtája A megismerés a tudás megszerzése vagy annak folyamata.
III. előadás.
Dr. Varga Beatrix egyetemi docens
Statisztikai Programcsomagok SAS EG gyakorlat
Az Európai Unió tagországainak, a csatlakozásra váró országoknak
A leíró statisztikák alapelemei
Rangsoroláson és pontozáson alapuló komplex mutatók
A mesterséges neuronhálók alapjai
14-16 óra Rendszerek irányítása. Szabályozás és példával A szabályozás a kibernetikában az irányítás egyik fajtája: az irányítás lehet vezérlés (open.
Előadás másolata:

Többváltozós adatelemzés 12. előadás

Regresszió fák Regressziós fák elmélete nagyban hasonlít a klasszifikációs fák elméletéhez, itt azonban az eredményváltozó egy legalább intervallum szinten mért folytonos változó. A tisztasági mérték általában az átlagos négyzetes eltérés szokott lenni az algoritmusok esetében

CRT algoritmus A tisztasági mérték az átlagos négyzetes eltérés A fa növesztésére és a metszéshez is ezt használja

CRT algoritmus

CRT algoritmus

CHAID algoritmus CHAID algoritmus esetén nem függtelenséget tesztel, hanem ANOVA tesztet használ, mind a kategóriák egyesítésénél, mind pedig elágaztatáskor.

CHAID algoritmus

Egyéb algoritmusok Diszkriminancia elemzés Boosting Neurális hálók Kohonen hálók (Self Organizing Map, SOM) Neurális főkomponens elemzés Support Vector Machine (SVM)

Diszkriminancia elemzés Klasszikus statisztikai eljárás Szigorú előfeltevései vannak Eredményváltozó kategória változó Magyarázó változók legalább intervallum szinten mért változók Sajátérték feladat Lineáris modellt feltételez

Boosting Adott egy egyszerű osztályozó Hogyan lehetne feljavítani az osztályozó jóságát? Az egyszerű osztályozót egymás után alkalmazom többször. Az egyik modell végeredménye a következő bemenete. Azok a megfigyelések, amiket nem jól sorol be a modell nagyobb súlyt kapnak, amiket jól sorol be kisebbet

Boosting A végső osztályozás az összes addigi osztályozás lineáris kombinációja A boosting algoritmus segítségével egyszerű osztályozók segítségével is le lehet írni bonyolult összefüggéseket. A boosting algoritmus során az egyszerű osztályozó lehet pl. döntési fa is.

Boosting http://www.cse.ucsd.edu/~yfreund/adaboost/index.html

Neurális hálók Forrás:http://en.wikipedia.org/wiki/Image:Artificial_neural_network.svg

Neurális hálók ‘Fekete doboz’ eljárás Csak a végeredmény ismert, kevés mutatószám áll rendelkezésre Bonyolult, de determinisztikus kapcsolatok esetén jól teljesít (mérnöki tudományokban jól használható) Sztochasztikus kapcsolatok esetén a teljesítménye nem annyira vonzó Mostanában szövegfelismerési feladatokra szokták sikeresen alkalmazni

Kohonen hálók Neurális háló alapú klaszterező eljárás Nem kizárólag klaszterező eljárás Érdekesség, hogy nincs eredményváltozó K*N-es hálót hoz létre, aminek a csúcspontjai reprezentálják a klaszterközepeket

Kohonen hálók Minden megfigyelést hozzárendel a legközelebbi klaszterközéphez. Amennyiben nem pontos az illeszkedés a klaszterközepet elmozdítja a pont irányába. A Kohonen háló specialitása, hogy nem csak a legközelebbi klaszterközép értéket módosítja, hanem a szomszédságba tartozókét is.

Kohonen hálók http://www.sund.de/netze/applets/som/som1/index.htm

Neurális főkomponens elemzés Az ‘Input’ és ‘Output layer’ megegyezik, a közbülső réteg viszont kevesebb neuront tartalmaz, mint az első és utolsó Attól függően, hogy a középső réteg hány neuront tartalmaz lehet szabályozni a megőrzött információ nagyságát A neuronok esetén lehet nemlineáris transzformáció is.

Support Vector Machine (SVM) Az egyik legújabb ‘trónkövetelő’ A versenyeket általában valamilyen SVM algoritmussal szokták nyerni Az alapötlet az, hogy úgy különítsük el a csoportokat, hogy a köztük lévő ‘mezsgye’ a lehető legszélesebb legyen

Support Vector Machine (SVM) Forrás:http://en.wikipedia.org/wiki/Image:Svm_max_sep_hyperplane_with_margin.png

Support Vector Machine (SVM) http://tsubaki.csce.kyushu-u.ac.jp/~norikazu/research.ja.html