A sztochasztikus kapcsolatok (Folyt). Korreláció, regresszió ÁVF Leíró statisztika 7 A sztochasztikus kapcsolatok (Folyt). Korreláció, regresszió 2010 tavasz
A korreláció Korreláció: két mennyiségi ismérv közötti (sztochasztikus) kapcsolat Például: a tanulással töltött órák száma és a ZH pontszám Regresszió (regressziós függvény): a sztochasztikus (tehát nem fv-szerű) kapcsolathoz legközelebb álló fv-kapcsolat.
A mennyiségi ismérvek összefüggése Az ismérvek közötti ok-okozati kapcsolat, ill. a következtetési lehetőség iránya: X: magyarázó változó (független változó, tényezőváltozó); az az ismérv, amelyből sztochasztikusan következtethetünk a másik ismérv értékeire. Y: eredményváltozó (függő változó), az az ismérv, amely a másik hatására, attól függően változik.
Elvi szélső esetek 1. Determinisztikus kapcsolat: fv-kapcsolat. 2. Nincs kapcsolat: (korrelálatlanság)
Példa (A sör kereslete)
A matematikai regresszió-függvény A korrelációs kapcsolat jellegének (függvénytípusának) előzetes kijelölése (lin. fv, hatvány-fv., exponenciális fv., stb) 2. Az adott fv-típushoz a paraméterek meghatározása 3. A illeszkedés jóságának meghatározása, és ennek ismeretében a legalkalmasabb fv-forma kiválasztása *
Két mennyiségi ismérv szorossága A kovariancia (az együttingadozás mértéke): Az előjele a kapcsolat irányát mutatja Nincs elvi alsó v. felső korlátja Ha a két változó független, akkor C = 0 Ha C = 0, akkor a két változó korrelálatlan A C abszolút értéke kisebb vagy egyenlő mint a szórások szorzata: Ha x és y között lineáris függvény-kapcsolat van, akkor NT Stat 2010 ápr 20. kov kiszámolva, jön: kov. tulajdonságai és C-nek ez a maximális értéke
A Pearson-féle lineáris korrelációs együttható és értelmezése Az előjele a kapcsolat irányát mutatja Minél közelebb áll 1-hez ill. (-1)-hez, annál közelebb áll X és Y kapcsolata a lineáris fv-kapcsolathoz. Ha kicsi, akkor ez Vagy egy gyenge lineáris kapcsolat, (lineáris, de gyenge) Vagy lehet erős kapcsolat, de nem lineáris.
Lineáris regresszió-függvény A „kalap ”jelzi, hogy csak tendencia-szerű kapcsolatról van szó b1 megmutatja, hogy a független változó egységnyi növekedése mennyivel növeli a függő változó értékét b0 azt mutatja, hogy mennyi a függő változó értéke, ha a független változó értéke 0. (Nem mindig értelmezhető)
A legkisebb négyzetek módszere A függvény illesztését a legkisebb négyzetek módszerével végezzük el. Ennek lényege: Megkeressük azt a függvényt, amelynek esetében regressziós fv értékei és az y tényleges értékei közötti eltérések négyzetösszege a lehető legkisebb.
A b0 és b1 paraméter kiszámítása I. Normálegyenletek segítségével:
A b0 és b1 paraméter kiszámítása II. A normálegyenletekből kifejezve:
A determinációs együttható, D A D determinációs együttható megmutatja, hogy a független változó (x) mekkora hányadát (hány %-át) magyarázza meg a függő változó (y) alakulásának. Értéke 0 és 1 közé eshet. Lineáris esetben: D a Pearson-féle lin. korrelációs együttható négyzete.