Az előadás letöltése folymat van. Kérjük, várjon

Az előadás letöltése folymat van. Kérjük, várjon

 Két kvantitatív változó kapcsolatának vizsgálata.

Hasonló előadás


Az előadások a következő témára: " Két kvantitatív változó kapcsolatának vizsgálata."— Előadás másolata:

1  Két kvantitatív változó kapcsolatának vizsgálata

2  Egy KSH-vizsgálat adatai Születési súly (kg) Születési testhossz (cm)

3  Az előrejelzés problémája l Ha az anya 50 kg súlyú, kb. hány kiló 10 éves gyermeke?

4  Előrejelzés egy egyenes segítségével Anya testsúlya (kg) Gyerek tests. 10 év (kg)

5  Anya testsúlya (kg) Gyerek tests. 10 év (kg) Melyik a legjobb előrejelző egyenes?

6  Az előrejelzés alapfogalmai l Jósolt (függő) változó: Y l Jósló (előrejelző, független) változó: X l Lineáris előrejelzés (jóslás): Ŷ = a + bX l Az x értékhez tartozó igazi Y-érték: y l Az x értékhez tartozó előrejelzés: ŷ = a + bx l Az előrejelzés hibája egy személynél: (y - ŷ) 2 l A legjobb előrejelzésnél E[(Y - Ŷ) 2 ] minimális

7  Szokásos szóhasználat l Legjobb előrejelző egyenes: regressziós egyenes l Regressziós egyenes képlete, y = a + bx, a lineáris regressziós függvény l Regressziós egyenlet meghatározása: regressziós feladat l Regresszió hibája = hibavariancia: Res = E((Y - Ŷ) 2 ) l a és b paraméter: regressziós együtthatók

8  Példák lineáris regresszióra Változó Átlag Variancia Regressziós egyenlet X: SúlySzül 3,21 0,25 Y = 26,05 + 2,24X Y: Súly10 33,2 46,4 Res = 45,20 X: ThosszSzül 50,2 6,4 Y = 96,88 + 0,83X Y: Thossz10 138,7 41,5 Res = 37,09 X: Anyatesth 161,1 38,3 Y = 77,66 + 0,38X Y: Thossz10 138,7 41,5 Res = 36,02

9  Az Y kvantitatív változó előrejelzése X ismerete nélkül, illetve X ismeretében Y legjobb előrejelzése abban az esetben, ha nem tudunk semmit X-ről vagy más változókról:  Y Ezen előrejelzés hibája: E[(Y -  Y ) 2 ] = Var(Y) l X-et is felhasználva a legkisebb hibájú előrejelzés: Ŷ = a + bX, az X változó Y-ra von. lineáris regressziós függvénye. Ezen előrejelzés hibája, az ún. hibavariancia: E[(Y - Ŷ) 2 ] = Res

10  Milyen szoros az együttjárása Y-nak az X kvantitatív változóval? l Minél informatívabb X az Y változóra nézve, annál kisebb lesz Res a Var(Y)-hoz viszonyítva, vagyis annál kisebb lesz a Res/Var(Y) hányados. l Viszont annál nagyobb lesz a mutató, az X változónak az Y változóra vonatkozó lineáris determinációs együtthatója.

11  Alapösszefüggések a determinációs együtthatóra 0  Det(X,Y)  1 l Det(X,Y) = 0 csakkor, ha Res = Var(Y). Ekkor X nem tartalmaz lineáris jellegű információt Y-ra nézve. l Det(X,Y) = 1 csakkor, ha Res = 0. Ekkor Y hibamentesen előrejelezhető X által. X determinisztikusan meghatározza Y-t, éspedig lineáris függvény formájában.

12  A determinációs együttható l Jól mutatja, hogy Y milyen mértékben függ lineárisan X-től, hogy X milyen mértékben határozza meg, “determinálja” Y-t. l FONTOS: Det(X,Y) = Det(Y,X). l Jelzi, hogy az X és az Y változó milyen mértékben határozza meg egymást, vagy másképpen: X és Y milyen szoros lineáris típusú kapcsolatban van egymással.

13  Két véletlen változó függetlensége DEFINÍCIÓ: Y független X-től, ha Y eloszlása ugyanaz bármely X = x mellett KÉRDÉS: Függ-e a személy magassága a nemétől?

14  Függ-e a születési testhossz a születési súlytól? És fordítva? Születési súly (kg) Születési testhossz (cm)

15  Függ-e az Y változó X-től? , YY X X

16  Függ-e az Y változó X-től? X Y

17  A függetlenség kölcsönös FONTOS: Ha Y független X-től, akkor X is független Y-tól

18  Függetlenség és elméleti átlag l Bármely X és Y kvantitatív változóra: E(X+Y) = E(X) + E(Y) l Ha X és Y független egymástól, akkor E(X·Y) = E(X)·E(Y), vagyis ekkor E(X·Y) - E(X)·E(Y) = 0, de a megfordítás nem mindig igaz.

19  Két változó kovarianciája l DEFINÍCIÓ: Cov(X,Y) = E(X·Y) - E(X)·E(Y) l Ha X és Y független változók, akkor Cov(X,Y) = 0 l A megfordítás nem mindig igaz, vagyis nulla kovariancia esetén X és Y nem biztos, hogy független egymástól.

20  Két kvantitatív változó korrelációs együtthatója l Ha X vagy Y szórását megkétszerezzük, kétszeresére nő kovarianciájuk is. l Szórásokkal leosztott, ún. “standardizált” kovariancia = korrelációs együttható:

21  Összefüggés a korrelációs együttható és a determinációs együttható között l A korrelációs együttható négyzete mindig megegyezik a determinációs együtthatóval: [  (X,Y)] 2 = Det(X,Y)  (X,Y) tehát az X és Y közti összefüggés mértékét jelzi, vagyis a lineáris típusú kapcsolat szorosságának mérőszáma.

22  A korrelációs együttható jellemzői -1   (X,Y)  1 Ha X és Y független, akkor  (X,Y)  Ha  (X,Y)  vagyis ha X és Y korrelálatlan, akkor nem feltétlenül függetlenek, de biztos, hogy nincs köztük lineáris típusú összefüggés (U vagy fordított U alakú kapcsolatban persze lehetnek). l Ha X és Y együttes eloszlása normális, azaz bármely rögzített X = x mellett Y normális, akkor a függetlenség és a korrelálatlanság ekvivalens.

23  Regresszió és korreláció kapcsolata Az elméleti korrelációs együttható szokásos jelölései:  (X,Y),  XY vagy  l A lineáris regresszió képlete: Ŷ =  +  X vagy Ŷ =  YX +  YX X l Ekkor  X  YX =  Y  és z Y =  z X

24  Két következmény Ha X értékét 1 egységgel növeljük, akkor Y értéke várhatóan  YX egységgel nő. Ha viszont  X egységgel növeljük, akkor Y értéke várhatóan  Y egységgel nő.  előjele összhangban van a regressziós egyenes irányával. Ha a regressziós egyenes emelkedő, akkor X és Y között pozitív a korreláció. Ha ereszkedő, akkor  negatív.

25  

26  

27  

28  

29  

30  A mintabeli korrelációs együttható l Jelölése: r XY vagy r l Egyik képlete: l Ez az elméleti kovariancia mintabeli becslése osztva a két mintaszórás szorzatával. l r XY az elméleti korr. eh. egyik pontbecslése.

31  X-minta H 1 :  XY < 0 H0H0 H 2 :  XY > 0 Feltétel: X és Y együttes eloszlása legyen normális t  -t 0,05 t  t 0,05 |t| < t 0,05 Korrel. eh. vizsgálata H 0 :  XY = 0 (f = n  2)   t  t 0,05 -t 0,05

32  X-minta H 1 :  XY < 0 H0H0 H 2 :  XY > 0 Feltétel: X és Y együttes eloszlása legyen normális r   r 0,05 r  r 0,05 |r| < r 0,05 Korrel. eh. vizsgálata H 0 :  XY = 0 r xy kiszámítása (f = n  2) A t-táblázat helyett használható az r XY eh. kritikus értékeinek táblázata is.


Letölteni ppt " Két kvantitatív változó kapcsolatának vizsgálata."

Hasonló előadás


Google Hirdetések