Az előadás letöltése folymat van. Kérjük, várjon

Az előadás letöltése folymat van. Kérjük, várjon

REGRESSZIÓ1 Regresszióanalízis Lineáris regresszió.

Hasonló előadás


Az előadások a következő témára: "REGRESSZIÓ1 Regresszióanalízis Lineáris regresszió."— Előadás másolata:

1 REGRESSZIÓ1 Regresszióanalízis Lineáris regresszió

2 REGRESSZIÓ2 Modell: Valamely (pl. fizikai) törvényszerûség értelmében az x független változó bizonyos értékénél a függõ változó értéke Y =  (x). Y helyett y értéket mérünk, E(y  x) = Y, vagy és Amennyiben nincsen ismert és igazolt fizikai összefüggés, nem lehetünk elõre meggyõzõdve az illesztett függvény alkalmasságáról.

3 REGRESSZIÓ3 A regresszióanalízis során feltételezzük, hogy y az x minden értékénél normális eloszlású, vagyis az  i  mérési hibák N(0,   ) normális eloszlásúak; Var(y) = konstans, illetve y-nak vagy x-nek ismert függvénye; a különbözõ i mérési pontokban elkövetett mérési hibák egymástól függetlenek; Y(x) = f(x, ...) az ismert vagy feltételezett függvénykapcsolat alakja, ahol   a függvény konstansai (paraméterei).

4 REGRESSZIÓ4 Egyváltozós lineáris regresszió ismétlés nélküli mérések esetén,   konstans A becslési kritérium:

5 REGRESSZIÓ5 A normálegyenletek: Átrendezve:Ha a b 0 és b becslések egymástól nem függetlenek

6 REGRESSZIÓ6 A normálegyenletek azmodell illesztésekor Átrendezve: Az a és b becslések egymástól függetlenek, mert

7 REGRESSZIÓ7 tehát az a és b becsült paraméterek egymástól függetlenül kaphatók meg a két normálegyenletbõl: ; és

8 REGRESSZIÓ8 A becslések tulajdonságai:

9 REGRESSZIÓ9

10 10 A konfidenciatartományok a t-eloszlás alapján számíthatók.

11 REGRESSZIÓ11 1. példa Kísérletileg vizsgálták az x független változó és az y függő változó közötti összefüggést. Az x független változó értéke pontosan beállítható, az y függő változó értéke azonban a Y valódi érték körül ingadozik. A mérési adatok a következő táblázatban láthatók, az y értéke szerint növekvő sorrendbe rendezve. A tényleges mérési sorrendet a táblázat második oszlopa tartalmazza. Feltételezve, hogy y normális eloszlású, valamint azt hogy az y és x közötti függvénykapcsolat lineáris, adjunk becslést az egyenes paramétereire!

12 REGRESSZIÓ12

13 REGRESSZIÓ13 Excel eredmények s r reziduális szórás b0b0 b R2R2

14 REGRESSZIÓ14 Determinációs együttható: “Residual” “Total” “Regression”

15 REGRESSZIÓ15 R 2 = SSR/SST

16 REGRESSZIÓ16

17 REGRESSZIÓ17 SSR SSE SST n - 2

18 REGRESSZIÓ18

19 REGRESSZIÓ19 A konfidenciatartományok a t-eloszlás alapján számíthatók.

20 REGRESSZIÓ20 95%-os konfidencia intervallum a paraméterekre

21 REGRESSZIÓ21 Konfidencia sáv az Y(x) valódi értékre

22 REGRESSZIÓ22 Jóslási intervallum (1-  a valószínűsége annak, hogy x adott értékénél egy későbbi mérés eredménye a számított intervallumba esik. intervallum:

23 REGRESSZIÓ23

24 REGRESSZIÓ24 A mérések sorrendje

25 REGRESSZIÓ25 Egyváltozós lineáris regresszió ismételt mérések esetén,   konstans

26 REGRESSZIÓ26 SST = SSE + SSR SST = SSrepl + SSres + SSR Ismétlésekbõl számított négyzetösszeg Reziduális négyzetösszeg A szabadsági fokok száma:

27 REGRESSZIÓ27 Az csoportokon belüli error szórásnégyzet a variancia torzítatlan becslése, függetlenül az Y függvény alakjától. Az reziduális szórásnégyzet csak akkor becslése -nak, ha a tapasztalati regressziós függvény "megfelelõ alakú", vagyis az elméleti regressziós függvény lineáris. Esetünkben tehát akkor, ha.

28 REGRESSZIÓ28 A hipotézis vizsgálatára az F-próbát használjuk: Ha az arány (feltéve, hogy ) nem halad meg egy F  kritikus értéket, mondhatjuk, hogy a mérési adatok nem mondanak ellent annak a nullhipotézisnek, amely szerint az elméleti és tapasztalati regressziós görbe matematikailag azonos alakú.

29 REGRESSZIÓ29 Ha elfogadjuk a nullhipotézist, egyben azt állítjuk, hogy és egyaránt torzítatlan becslései. A kettõ együtt több információt nyújt, mint bármelyik külön-külön, mivel az így egyesített szórásnégyzet nagyobb szabadsági fokú (tehát kisebb varianciájú) becslése -nak, mint akár, akár. Célszerû tehát a két becslést egyesíteni.

30 REGRESSZIÓ30 2. példa Kalibrációs eljárás során a táblázatban közölt adatokat mérték, x a koncentráció, y a mért jel. Illesszünk egyenest a mérési adatokra.

31 REGRESSZIÓ31 Az adatok a mérési sorrendjében kerülnek be az input file-ba, tehát a programok számára általában ugyanaz az x - y adatok szerkezete, mint ismétlés nélküli mérések esetén.

32 REGRESSZIÓ32

33 REGRESSZIÓ33

34 REGRESSZIÓ34 Annak ellenõrzésére, hogy az alkalmazott lineáris modell megfelelõ-e, F-próbát végzünk. Az Excel táblázat segítségével számítsuk ki a reziduális szórásnégyzetet, majd végezzük el a próbát!

35 REGRESSZIÓ35 Az F-eloszlás kritikus értéke 95 % -os egyoldali szinten (  = 0.05), ha a számláló szabadsági foka 3, a nevezõé 18: F 0.05 (3, 18) = Azt mondhatjuk, hogy a számított egyenes (a tapasztalati regressziós görbe) a mérési pontokat megfelelõen leírja.

36 REGRESSZIÓ36

37 REGRESSZIÓ37

38 REGRESSZIÓ38 Egyváltozós lineáris regresszió ismételt mérések esetén,   nem konstans A becslési kritérium: A négyzetösszeg felbontható:

39 REGRESSZIÓ39 A variancia nem konstans, hanem x-nek ismert függvénye: ahol x -tõl független konstans. A minimalizálandó függvény: ahol w i az ún. súly:

40 REGRESSZIÓ40 az a és b becsült paraméterek egymástól függetlenül kaphatók meg a két normálegyenletbõl: Ha

41 REGRESSZIÓ41 Kalibrációs egyenes: a regressziós egyenlet megoldása a független változóra Az egyenes egyenlete: Most y a független, de sztochasztikus változó (ötször mérve 5 különbözõ abszorbanciát kapunk), x a függõ változó, amelynek becslése várható értéke (és valódi értéke) X. (Az becslés valószínûségi változó, mivel y, a és b valószínûségi változók.)

42 REGRESSZIÓ42 konfidencia-intervalluma: segédváltozó Ha y n mérés átlagértéke, értelemszerûen írandó y helyébe, és

43 REGRESSZIÓ43 Az becslést úgy kapjuk, hogy Var(z) elõbbi kifejezésében a w súlyok helyett beírjuk a h 2 (x) függvény reciprokának becslését, becsléséül pedig az s 2 -statisztikát használhatjuk. ;

44 REGRESSZIÓ44 Az X-re másodfokú kifejezés átrendezése után a konfidenciaintervallum ahol

45 REGRESSZIÓ45 Az X-re másodfokú kifejezés átrendezése után a konfidenciaintervallum ahol és

46 REGRESSZIÓ46 -val és-vel kifejezve Ha,, így az elõzõ kifejezés egyszerûsödik ahol

47 REGRESSZIÓ47 Az összefüggések felhasználásával, ha : ahol

48 REGRESSZIÓ48 3. példa A 2. példában kapott regressziós egyenest kalibrációs összefüggésként használjuk. Az ismeretlen koncentrációjú oldattal végzett 5 mérés átlagértéke Adjunk becslést és 95 %-os konfidencia-intervallumot az oldat koncentrációjára (X-re ). ; ;

49 REGRESSZIÓ49 A konfidencia-intervallum: felhasználásával:

50 REGRESSZIÓ50 A regresszió feltételeinek ellenõrzése; a reziduumok vizsgálata A regresszióanalízis során feltételeztük, hogy y az x minden értékénél normális eloszlású, vagyis az  mérési hibák N(0,   ) normális eloszlásúak; Var(y) = Var(y  x) = konstans, illetve y-nak vagy x-nek ismert függvénye; a különbözõ i mérési pontokban elkövetett mérési hibák egymástól függetlenek; E(y  x) = Y(x) = f(x, ...) az ismert vagy feltételezett függvénykapcsolat alakja, ahol   a függvény konstansai (paraméterei).

51 REGRESSZIÓ51 Reziduumok a mérések sorszámának függvényében: extrém értékek 1.

52 REGRESSZIÓ52 Reziduumok a mérések sorszámának függvényében: trend 2.

53 REGRESSZIÓ53 3. Ugrás (Szintváltozás a reziduumok vizsgálatánál)

54 REGRESSZIÓ54 4. A szórás (variancia, mérési pontosság) változása

55 REGRESSZIÓ55 A függvény megfelelõen írja le változását:

56 REGRESSZIÓ56 5. Normalitás Az közelítõleg zérus várható értékû normális eloszlású kell legyen az 1  4. feltételezések szerint. A normalitást úgy is vizsgálhatjuk, hogy ún. valószínû- ségi papíron (Gauss hálón) ábrázoljuk értékét A normalitást statisztikai próbával vizsgálhatjuk (  2 -próba, Kolmogorov – Szmirnov próba).

57 REGRESSZIÓ57 A reziduumok eloszlása nem normális, az illesztett modell nem megfelelõ:

58 REGRESSZIÓ58 A reziduum értékek ábrázolása Gauss-hálón. elméleti eloszlás a reziduumok nem normális eloszlásúak

59 REGRESSZIÓ59 A reziduum értékek ábrázolása Gauss-hálón. a reziduumok normális eloszlásúak

60 REGRESSZIÓ60 Kétváltozós lineáris regresszió Az elméleti regressziós függvény: A becslési kritérium: A becsülendõ paraméterek szerint deriválva, és a deriváltakat nullával egyenlõvé téve kapjuk a normálegyenleteket:

61 REGRESSZIÓ61 A becsült paraméterek akkor függetlenek egymástól, ha ; és ; ortogonális kísérleti terv

62 REGRESSZIÓ62 Szempontok a független változók értékeinek megválasztásához Egymástól független becsült paraméterek (ortogonalitás) x2x2 x1x1

63 REGRESSZIÓ63 A paraméter minél pontosabb becslése a) b) c)

64 REGRESSZIÓ64 Többváltozós lineáris regresszió Legyen r a független változók száma. A kísérletsorozat eredményeit a következő táblázatos formában szokásos írni:

65 REGRESSZIÓ65 A modell ahol x 0i az általános írásmód érdekében bevezetett fiktív változó. Az x 0i elemek értéke 1. A tapasztalati regressziós egyenes A kétváltozós regressziónál mondottakhoz hasonlóan a b j becslések egymástól nem függetlenek.

66 REGRESSZIÓ66 Az egyes változók szignifikanciájának vizsgálata Eldöntendõ, hogy q < r változó figyelembevétele r változóhoz képest nem rontja-e a közelítést. A q ill. r számú változóra a mért pontok és a becsült sík közötti eltérések négyzetösszege, ha minden i pontban csak egy y mérés van:

67 REGRESSZIÓ67 Tegyük fel, hogy r változó biztosan elég (hibátlan a regressziós egyenlet alakja), ekkor az eltérések normális eloszlásúak, (konstansnak feltételezett) varianciával; az eltérések S r négyzetösszegének szabadsági foka n-(r+1) Ha q változó is elég (H 0 nullhipotézis), az eltérések is normális eloszlásúak, varianciával; az eltérések S q négyzetösszegének szabadsági foka n-(q+1)

68 REGRESSZIÓ68 Ha a nullhipotézis igaz, az hányados F-eloszlású n – q – 1 és n – r – 1 szabadsági fokkal. F-próba

69 REGRESSZIÓ69 S q és S r különbsége szintén normális eloszlású eltérések négyzetösszege, szabadsági foka r – q: F-próba Bármelyik módszerrel elvégezhetõ az F-próba, a második érzékenyebb (általános regressziós próba).

70 REGRESSZIÓ70 Ha az arány a kritikus F értéket meghaladja, el kell vetnünk a nullhipotézist, amely szerint r – q változó hatása nem szignifikáns. Természetesen r – q = 1 is lehet, ekkor azt vizsgáljuk, hogy adott egyetlen változó hatásának (lineáris) figyelembevétele javítja-e a közelítést. Ha a normális eloszlás feltételezése nem jogos, az itt leírt vizsgálati módszer hamis eredményeket ad! Minthogy a becslések egymástól nem függetlenek, az elõbbi vizsgálat t-próbával nem végezhetõ el.

71 REGRESSZIÓ71 Regresszió más, a független változóban nemlineáris, de a paraméterekben lineáris függvényekkel Vezessük be a következõ jelöléseket: Ezekkel A becslési probléma és az eredmények statisztikai elemzése teljesen azonos a többváltozós lineáris regressziónál leírtakkal.

72 REGRESSZIÓ72 Polinom illesztése Legyenek olyan mérési adataink, amelyeknél az y függõ változó nem lineáris, hanem polinommal leírható függvénye a z független változónak. Mivel a z független változó értéke pontosan beállítható és nem terheli mérési hiba, tetszõleges hatványa is pontosan ismert, tehát determinisztikus független változóként kezelhetõ. Bevezetve az x 1 = z, x 2 = z 2,..., x k = z k jelöléseket, a feladat a többváltozós lineáris regresszióra vezethetõ vissza. Mivel x j értékek nem függetlenek egymástól, a becsült b j együtthatók erõsen korreláltak lesznek.


Letölteni ppt "REGRESSZIÓ1 Regresszióanalízis Lineáris regresszió."

Hasonló előadás


Google Hirdetések