Bevezetés, tippek Ea-gyak kapcsolata Statisztika II -más tárgyak kapcsolata Hogyan tanulj? Interaktív órák, kérdezz, ha valami nem világos! tananyag =előadások és gyakorlatok anyaga (írott és elmondott is) Dia, előadás segédanyagai ~ kisiskolás foglalkoztató füzet (kiegészíted, felhasználod)
Számonkérések és tartalmuk Kis dolgozat Beugró Kollokvium nagy feladatok Pontozás konzultáció
Témakörök 1. félév bevezető félév Alapfogalmak Leíró statisztika Összehasonlító statisztika Idősorok vizsgálata 2. félév Mintavétel induktív statisztika Kapcsolatvizsgálat, Magyarázó modellek
Valószínűség számítási analógiák Valószínűség~relatív gyakoriság Feltételes valószínűség~”sor százalék, oszlopszázalék” Diszkrét változó várható értéke~súlyozott számtani átlag Szórás: D(X), Eloszlásfüggvény F(X)=P( <X) Empirikus sűrűségfüggvény ~ hisztogram
Az eloszlásból következik…. Mindig igaz (Csebisev- egyenlőtlenség alapján) Normális eloszlás
Mintavétel Statisztikai minták
Statisztikai megfigyelések Elvárás: Gyorsaság Pontosság Megbízhatóság Lehetőségek Teljes körű megfigyelések Részleges megfigyelések Reprezentatív megfigyelések ->Mintavétel
Milyen hibákat követhetünk el? Mintavételi hiba Nem mintavételi hiba
AlapsokaságCélcsoport Lefedettségből származó hiba Mintavételi keret Mintavételi hiba Minta Nem válaszolásból fakadó hiba VálaszokTervezés Érvényesség Mérés Mérési hiba Válaszadás Feldolgozási hiba Adatfeldolgozás (előkészítés) Felmérés mintaalapján Néhány hibatípus
Mintákkal kapcsolatos problémák Véletlen, nem véletlen Kiválasztási arány A minta elemszámának meghatározása Reprezentativitás Mintavételi terv, eljárás
Véletlen Mintavételi eljárások Független azonos eloszlású (FAE) Egyszerű véletlen (EV) Rétegzett (R) Csoportos (CS) Többlépcsős (TL) Kombinált eljárások Ismétlődő felvételek Panelfelvételek Hogyan lehet véletlen mintákat generálni? Kollokvium beugró példa rétegzett mintára Mintákszáma.xls
Változók milyen jellemzőit fogjuk vizsgálni? Illetve - Változók és jellemzőik eloszlását - Változók kapcsolatát MintaAlapsokaság ElemszámnN Átlag Szóráss* AránypP
Statisztikai indukció Mintaelemek valószínűségi változók Mintajellemzők (mintaátlag, mintaszórás, arány) is valószínűségi változó Ezeknek is van ◦ várható értékük ◦ Szórásuk ◦ Eloszlásuk ◦ Kérdés: ezek hogyan vizsgálhatóak mintajellemzőből következtetés, becslés az alapsokaság jellemzőire= A val.számból tanultakat kellene alkalmazni statisztikai jellemzőkre.
Induktív statisztika Leíró statisztika: csak a megfigyelteket jellemzi (MINTA) Induktív statisztika: gyakorlatban a cél az egész célsokaság jellemzése. Ezek tulajdonságaira a minta alapján lehet következtetni. (két dologról lesz szó: becsléselmélet, hipotézisvizsgálat)
Becslések: A sokasági jellemző mintából történő közelítő meghatározása Típusok Pontbecslés Intervallumbecslés Ehhez alapozunk
Pontbecslések
Elvárások a becslőfüggvényekkel kapcsolatosan
SOKASÁGI ÁTLAG PONTBECSLÉSE
A sokasági átlag pontbecslése Lehet-e a mintaátlag a sokasági átlag pontbecslése? Ehhez mi kell? 1. Torzítatlanság
Szemléltető példa alapsokaság:10, 11, 12, 13, 14 Átlag ( ): 12 Szórásnégyzet ( 2 ): 2 Szórás ( ): 1, elemszám (N):5 Minta elemszám (n):2 mintavételieloszlás.xls Tekintsük az összes lehetséges két elemű mintát! Határozzuk meg a mintaátlagok eloszlását és várható értékét! Mintavételi eloszlás: A vizsgált mintajellemző eloszlása
Mit kaptunk eredményül? Az adott elemszámú mintaátlagok átlaga megegyezik a sokasági átlaggal, azaz
Mekkora a becslés hibája? Az adott elemszámú minták átlagai átlagosan mennyivel térnek el a várható értéküktől (az alapsokaság átlagától) Ez mi? közönséges szórás: A mintaátlagok szórása: A mintaátlag standard hibája
A mintaátlag standard hibájának kiszámítása: FAE-mintaEv-minta
néhány tulajdonsága A minta elemszámának növekedésével értéke egyre kisebb. Pld. FAE-minta esetén 4x nagyobb mintán értéke feleakkora, minden más változatlansága mellett.
SOKASÁGI SZÓRÁS PONTBECSLÉSE
Sokasági szórás pontbecslése korrigált tapasztalati szórás A sokasági szórás torzítatlan pontbecslése a korrigált tapasztalati szórás
TÉRJÜNK VISSZA A MINTAÁTLAG STANDARD HIBÁJÁRA
A mintaátlag standard hibájának kiszámítása: (alapsokasági szórás) a valóságban többnyire nem ismert. Ekkor hogyan számíthatjuk ki a mintaátlag standard hibáját EV és FAE minták esetében?FAE-mintaEv-minta
Hogyan számíthatjuk ki a mintaátlag standard hibáját EV és FAE minták esetében ha ismeretlen? FAE-mintaEv-minta Ha az alapsokasági szórás ( ) NEM ismert becsülni kell
SOKASÁGI ARÁNY PONTBECSLÉSE
Arány pontbecsléseFAE-mintaEV-minta Az adott tulajdonságú egyedek mintabeli arányai átlagosan hány százalékponttal térnek el a várható értéküktől (adott tulajdonságú egyedek alapsokaságon belüli arányától) A sokasági arány torzítatlan pontbecslése a mintabeli arány
A NORMÁLIS ELOSZLÁSRÓL
Standardizált változó Legyen x egy tetszőleges változó, ekkor z Standardizált változó: hány szórásnyival tér el a változó értéke a várható értékétől z Átlaga:0 z Szórása:1
Példa Egy felvételi vizsgán a hallgatók által elért pontszámok (x) átlaga 72, szórása 15 pont volt. A vizsgán elért pontszám megközelítőleg normális eloszlású változó. a) Határozza meg és értelmezze azon hallgatók standardizált pontszámát, akik a vizsgán 57; 72; 87 pontot értek el!
A normális eloszlás kezeléséről X~N(E(X), 2 ) Speciális eset ha E(X)=0, 2 = 1 ez standard normális eloszlás X változót standardizáljuk Ekkor z~N(0,1) F(x)= (z) [táblázatból] (-z)=1- (z) [táblázatból]
Példa Egy felvételi vizsgán a hallgatók által elért pontszámok (x) átlaga 72, szórása 15 pont volt. A vizsgán elért pontszámok megközelítőleg normális eloszlású változók. a) Határozza meg azon hallgatók standardizált pontszámát, akik a vizsgán 57; 72; 87 pontot értek el! b) Mekkora annak a valószínűsége, hogy valaki legfeljebb 87 pontot ér el a vizsgán? c) Mekkora annak a valószínűsége, hogy valaki legfeljebb 57 pontot ér el a vizsgán? d) Mekkora annak a valószínűsége, hogy valaki 57 és 87 pont között teljesít a vizsgán? Hogyan lehetne ezt a kérdést másképp megfogalmazni?
Példa (folytatás) 95 százalékos megbízhatósággal maximum hány szórásnyival térhet el az elért pontszám a várható értékétől? Ez milyen elért pontszámot jelent?
Általánosan: (-z)=1- (z) [táblázatból]