tananyag =előadások és gyakorlatok anyaga (írott és elmondott is) Bevezetés, tippek Ea-gyak kapcsolata Statisztika II -más tárgyak kapcsolata Hogyan tanulj? Interaktív órák, kérdezz, ha valami nem világos! tananyag =előadások és gyakorlatok anyaga (írott és elmondott is) Dia, előadás segédanyagai ~ kisiskolás foglalkoztató füzet (kiegészíted, felhasználod)
Számonkérések és tartalmuk Kis dolgozat Beugró Kollokvium nagy feladatok Pontozás konzultáció
2. félév: induktív statisztika Témakörök 1. félév: Leíró statisztika Alapfogalmak Leíró statisztika Összehasonlító statisztika Idősorok vizsgálata 2. félév: induktív statisztika Mintavétel Induktív statisztika Kapcsolatvizsgálat, Magyarázó modellek
Mintavétel Statisztikai minták
Cél Mintavételi tervek ismerete Mintavételi és nem mintavételi hiba közötti különbség megértése Leíró és induktív statisztika közötti különbség megértése Reprezentativitás megértése
Statisztikai megfigyelések Elvárás: Gyorsaság Pontosság Megbízhatóság Lehetőségek Teljes körű megfigyelések Részleges megfigyelések ->Mintavétel Reprezentatív minták Nem reprezentatív megfigyelések
A statisztikai munka fázisai Tájékoztatás, visszacsatolás Elemzés Elemi adatok ellenőrzése, feldolgozása Adatfelvétel Adatátvétel? Megfigyelés? Teljes körű? Részleges? (reprezentatív?) Tervezés Kiindulópont: igény Mi a statisztikai feladat? Mit mérünk? Ki a célcsoport? Hogyan szerzünk adatokat? Kiket? Mivel?
Hibaforrások felméréseknél Konstrukció, Kutatási kérdés Érvényesség, specifikációs hiba Mérőeszköz Mérési hiba Válaszok Feldolgozási hiba Előkészített adatok Felmérés Alapsokaság Célcsoport Lefedettségből származó hiba Mintavételi keret Mintavételi hiba Minta Nem válaszolásból fakadó hiba Válaszadók Feldolgozási hiba: könyv, 9999 kód, gépelési hiba, ellentmondó adatok, Tárki 2013 euval nem szimpatizálók aránya Lefedettség: hinyzó egyed, duplikátum, rossz sztártum, többlet, nem cél. Csop tag, csak netes felm. Mintavételi hiba:
Összegezve Mintavételi hiba Nem mintavételi hiba Csak mintavétel esetében Matematikailag kezelhető Nem mintavételi hiba nemcsak mintavétel esetében
Mintákkal kapcsolatos problémák Véletlen, nem véletlen Kiválasztási arány A minta elemszámának meghatározása Reprezentativitás Mintavételi terv, eljárás
Hogyan vehetünk véletlen mintát? Véletlen Mintavételi eljárások Mintákszáma.xls Független azonos eloszlású (FAE) Egyszerű véletlen (EV) Rétegzett (R) Csoportos (CS) Többlépcsős (TL) Kombinált eljárások Ismétlődő felvételek Panelfelvételek Hogyan lehet véletlen mintákat generálni? Kollokvium beugró példa rétegzett mintára
Leíró versus Induktív statisztika Leíró statisztika Induktív statisztika A megfigyeltek jellemzése Mintavétel esetén a mintára vonatkozik Teljeskörű megfigyelés esetén a sokaságra vonatkozik. (információtömörítési eljárás: táblázatok, diagramok, középértékek, szóródási mérőszámok, eloszlás jellemzése) Cél: sokaság jellemzése a minta alapján. Csak mintavétel esetén alkalmazható! Két dologról lesz szó: Becslés: A sokasági jellemző mintából történő közelítő meghatározása Hipotézisvizsgálat: Egy sokaságra vonatkozó előzetes állítás, feltételezés vizsgálata minta(k) alapján.
Változók milyen jellemzőit fogjuk vizsgálni? Minta Alapsokaság Elemszám n N Átlag m Szórás s* s Arány p P Illetve Változók és jellemzőik eloszlását Változók kapcsolatát
Statisztikai indukció Mintaelemek valószínűségi változók Mintajellemzők (mintaátlag, mintaszórás, arány) is valószínűségi változó Ezeknek is van várható értékük Szórásuk Eloszlásuk Kérdés: ezek hogyan vizsgálhatóak mintajellemzőből következtetés, becslés az alapsokaság jellemzőire= A val.számból tanultakat kellene alkalmazni statisztikai jellemzőkre.
Valószínűség számítási analógiák Valószínűség~relatív gyakoriság Feltételes valószínűség~”sor százalék, oszlopszázalék” Diszkrét változó várható értéke~súlyozott számtani átlag Szórás: D(X), s Eloszlásfüggvény F(X)=P(z<X) Empirikus sűrűségfüggvény ~ hisztogram
Pontbecslések Hogyan becsülhetőek meg sokasági paraméterek? Mekkora a becslés hibája?
Cél Minta alapján hogyan becsülhető meg egy sokasági Mekkora a becslés Átlag Szórás Arány Mekkora a becslés standard hibája? (átlagos hibája) Maximális hibája?
Elvárások a becslőfüggvényekkel kapcsolatosan
A sokasági átlag pontbecslése (1) Lehet-e a mintaátlag a sokasági átlag pontbecslése? Ehhez mi kell? Torzítatlanság
Szemléltető példa Tekintsük az összes lehetséges két elemű mintát! mintavételieloszlás.xls alapsokaság: 10, 11, 12, 13, 14 Átlag (m): 12 Szórásnégyzet (s2): 2 Szórás (s): 1,4142136 elemszám (N): 5 Minta elemszám (n): Tekintsük az összes lehetséges két elemű mintát! Határozzuk meg a mintaátlagok eloszlását és várható értékét! Mintavételi eloszlás: A vizsgált mintajellemző eloszlása
A sokasági átlag pontbecslése (3) Mit kaptunk eredményül? Az adott elemszámú mintaátlagok átlaga megegyezik a sokasági átlaggal, azaz A sokasági átlag torzítatlan pontbecslése a mintaátlag.
Sokasági szórás pontbecslése korrigált tapasztalati szórás A sokasági szórás torzítatlan pontbecslése a korrigált tapasztalati szórás
A sokasági arány torzítatlan pontbecslése a mintabeli arány Arány pontbecslése A sokasági arány torzítatlan pontbecslése a mintabeli arány
Példa
Pontbecslések hibái
Becslés során mekkora a hiba? Átlagos hiba (becslés standard hibája) Adott elemszámú minták esetében a mintából számított pontbecslések átlagosan mennyivel térnek el a sokasági paramétertől. Ez egy közönséges szórás. Maximális hiba (hibahatár) Adott elemszámú minták esetében a mintából számított pontbecslések maximálisan mennyivel térnek el a sokasági paramétertől, adott valósínűség mellett.
A mintaátlag standard hibájának (átlagos hiba) kiszámítása:
A mintaátlag standard hibájának (átlagos hiba) kiszámítása: FAE-minta Ev-minta
néhány tulajdonsága A minta elemszámának növekedésével értéke egyre kisebb. Pld. FAE-minta esetén 4x nagyobb mintán értéke feleakkora, minden más változatlansága mellett. Az alapsokaság szórásának növekedésével értéke egyre nagyobb.
Példa
A mintaátlag standard hibájának kiszámítása: FAE-minta Ev-minta Probléma: s (alapsokasági szórás) a valóságban többnyire nem ismert. Ekkor hogyan számíthatjuk ki a mintaátlag standard hibáját EV és FAE minták esetében?
Hogyan számíthatjuk ki a mintaátlag standard hibáját EV és FAE minták esetében ha s ismeretlen? Ha az alapsokasági szórás (s ) NEM ismert becsülni kell FAE-minta Ev-minta
SPSS alkalmazása
Sokasági aránybecslés standard hibája A sokasági arány torzítatlan pontbecslése a mintabeli arány FAE-minta EV-minta Az adott tulajdonságú egyedek mintabeli arányai átlagosan hány százalékponttal térnek el a várható értéküktől (adott tulajdonságú egyedek alapsokaságon belüli arányától)