Az előadás letöltése folymat van. Kérjük, várjon

Az előadás letöltése folymat van. Kérjük, várjon

Többváltozós adatelemzés 8. előadás. Modellezés Nemlineáris hatások modellezése –Négyzetes tagok szerepeltetése a regresszióban –Keresztszorzat (interakció.

Hasonló előadás


Az előadások a következő témára: "Többváltozós adatelemzés 8. előadás. Modellezés Nemlineáris hatások modellezése –Négyzetes tagok szerepeltetése a regresszióban –Keresztszorzat (interakció."— Előadás másolata:

1 Többváltozós adatelemzés 8. előadás

2 Modellezés Nemlineáris hatások modellezése –Négyzetes tagok szerepeltetése a regresszióban –Keresztszorzat (interakció szerepeltetése a modellben)

3 Négyzetes tagok Négyzetes tagok szerepeltetése a modellben Arra akarunk választ kapni, hogy a magyarázó változó és az eredményváltozó között konvex, vagy konkáv (vagy lineáris) az összefüggés

4 Négyzetes tagok Az eredményváltozó és a magyarázó változó közötti kapcsolatot konkavitását úgy vizsgáljuk, hogy szerepeltetjük a regresszióban a változó négyzetét is a magyarázó változók között A gyakorlatban annyit jelent, hogy az adatokra parabolát illesztünk

5 Négyzetes tagok Konvex jellegű kapcsolat (felfelé nyíló parabola) –Lassuló ütemű csökkenés –Gyorsuló ütemű növekedés –Trendfordulás: a csökkenés növekedésbe megy át

6 Négyzetes tagok Konkáv jellegű kapcsolat (lefelé nyíló parabola) –Gyorsuló ütemű csökkenés –Lassuló ütemű növekedés –Trendfordulás: a növekedés csökkenésbe megy át

7 Négyzetes tagok

8

9 Y= *tancsop_szum+ -15*tancsop_szum^2+…. A négyzetes tag előjeléből lehet eldönteni, hogy konvex, vagy konkáv a kapcsolat, jelen esetben konkáv Az, hogy a konkáv esetek közül melyik eset áll fenn, a szélsőérték megkeresésével dönthetjük el

10 Négyzetes tagok a*x^2+b*x+c alakú függvény szélsőértékhelye A kifejezés deriváltja: 2*a*x+b=0, amiből: x=(-b) / (2*a) Ha az szélsőérték az előforduló értékektől balra esik (kisebb), akkor gyorsuló ütemű csökkenésről beszélhetünk (konkáv kapcsolat esetén), ha jobbra (nagyobb), akkor lassuló ütemű emelkedés, ha az előforduló értékek ‘közepébe’ esik, akkor valódi trendfordulásról beszélünk

11 Négyzetes tagok Mi esetünkben a szélsőérté a tancsop_szum változó (2886,91) / (2*15,38) ) = 93,8 értékénél van

12 Négyzetes tagok

13 Mivel a szélsőérték (ami maximum, hiszen konkáv paraboláról van szó) az előforduló értékektől jobbra esik, ezért csökkenő mértékű emelkedésről van szó

14 Négyzetes tagok Az összehasonlítás abból a szempontból problematikus, hogy a többi változó becsült együtthatója is változik, amit nem veszünk figyelembe az ábrázolásnál

15 Négyzetes tagok

16

17

18 Y= *szamtech *szamtech^2+…. Konvex kapcsolat Szélsőérték helye: -[ 1789 / (2*3259) ] = -0,27 A szélsőérték az adatoktól balra helyezkedik el, tehát gyorsuló ütemű növekedésről van szó

19 Négyzetes tagok

20 Kereszszorzat 3 típusú keresztszorzatot érdemes megkülönböztetni: –Két dummy változó szorzata –Egy folytonos és egy dummy változó szorzata –Két folytonos változó szorzata

21 Keresztszorzat Két dummy változó szorzata: –Azt vizsgáljuk, hogy szétválasztható-e a két változó hatása, vagy sem –Pl. nők fizetése kisebb a férfiakénál, a kisebbséghez tartozók fizetése kisebb a nem kisebbséghez tartozókénál. Ha valaki nő és kisebbséghez tartozik, akkor a fizetése annyival kisebb, mint a két változó indokolná, vagy ‘halmozódás’ fizethető meg (vagy esetleg pont fordítva)

22 Keresztszorzat

23

24

25 Egy dummy változó és egy folytonos változó szorzata –Azt vizsgáljuk, hogy a két csoport közötti különbség a folytonos változó mentén konstans vagy sem: a két csoportra különböző a meredekség

26 Keresztszorzat

27

28

29

30

31

32

33

34 Két folytonos változó szorzata –Megint csak azt vizsgáljuk, hogy a két változó hatása szétbontható-e vagy sem. Amennyiben nem, akkor az egyik változó meredeksége függ a másik változó konkrét értékétől.

35 Keresztszorzat

36

37

38

39

40

41

42

43 Összesítés

44

45

46 Parciális korreláció X és Y változó közötti összefüggés megtisztítva Z 1, Z 2, … Z n változók hatásától Regressziós modellt illesztünk X és Y változóra Z 1, Z 2, … Z n magyarázóváltozók segítségével A két regressziós modellben kapott eltérésváltozó realizációi közötti korrelációs együttható

47 Parciális korreláció A pedagógusokra és nem pedagógusokra jutó személyi kiadás között erős korreláció mutatkozik. Ugyanakkor jó lenne az intézmény nagyságát kiszűrni, mert nyilvánvalóan nagy intézményekben mindkét változó nagy

48 Parciális korreláció

49

50 Numerikusan nem az előbb felvázolt módon érdemes számolni: r XY.Z =[r XY -r XZ *r YZ ] / [sqrt[(1-r 2 XZ )*(1-r 2 YZ )] ] Több változó hatásának kiszűrése esetén rekurzív összefüggés Korrelációs mátrix inverzéből is lehet számítani

51 Parciális korreláció Regresszió esetén kíváncsiak vagyunk valamelyik magyarázó változó és az eredményváltozó közötti kapcsolat szorosságára kiszűrve a többi magyarázó változó hatását

52 Parciális korreláció


Letölteni ppt "Többváltozós adatelemzés 8. előadás. Modellezés Nemlineáris hatások modellezése –Négyzetes tagok szerepeltetése a regresszióban –Keresztszorzat (interakció."

Hasonló előadás


Google Hirdetések