77. óra Statisztika www.seidl.hu/ambrus/mat
Eredetileg a statisztika matematikai eszközöket igénybe vevő államháztartástant jelentett, vagyis azon módszerek gyűjteményét és elméletét, amelyek segítségével az újkorban kialakuló modern államok számon tarthatták erőforrásaikat és a társadalmi problémákat (népesség, termelés, betegségek stb.). Erre utal a szó etimológiája is, minthogy a szót az latin statisticum collegium („államtanács”) és az olasz statista („államférfi”, politikus) kifejezésekből származtatják. A szó mai értelmét csak a tizenkilencedik század elején nyerte el. Statisztika: „az adatgyűjtés és adatfeldolgozás általános tudománya”
A statisztikának alapvetően két nagy területe ismeretes: Leíró statisztika Célja egy már rendelkezésre álló, valóságra vonatkozó adathalmaz összefoglalása, elemzése, egyszóval az információtömörítés. Következtető (matematikai) statisztika Célja a megfelelő – vagyis a sokaság egészének paramétereit legjobban tükröző, reprezentáló – minta kiválasztása, a sokasági paramétereknek a minta paramétereivel történő becslése, illetve a sokasági paraméterekre vonatkozó feltételezések, hipotézisek elfogadása vagy elvetése.
A statisztika helytelen használata A statisztika helytelen használatáról beszélünk, amikor a statisztika használatának megsértése miatt indokolatlan következtetésre jutunk. Esetenként ez véletlen, máskor szándékos is lehet, és az elkövető hasznot húz belőle. A téves statisztika csapdája meglehetősen ártalmas a tudás keresésében. Például az orvostudományban egy téves állítás kijavítása évtizedeket vehet igénybe, és emberéletekbe kerülhet. A helytelen alkalmazás könnyen előfordulhat. Kutatókat, még matematikusokat és statisztikusokat is megtéveszthetnek egyszerű módszerek is, még ha gondosan figyelnek is mindenre. Vannak kutatók, akik a hibát valószínűség-számítási tudásuk hiánya vagy a tesztjeik standardizálásának (egységesítésének, általánosításának) hiánya miatt követik el.
A helytelen alkalmazás típusai: A nem tetsző adatok kihagyása Befolyásoló kérdezés Pl.: háborúról való szavazás kérdése: „Támogatja az USA próbálkozását, hogy szabadságot és demokráciát hozzon különböző országokba? Túláltalánosítás A nyáron megvizsgált almák 100%-a piros. Az állítás, hogy „Minden alma piros”, a túláltalánosításra példa. Torzított mintavétel A gyakorlatban sok közvélemény-kutatás telefonon történik, ami eltorzítja a mintát több módon, például kizárja azokat, akiknek nincs telefonjuk, több eséllyel kerül bele, akinek több telefonja van, könnyebben bekerülhetnek, akik hajlamosabbak részt venni telefonos felmérésben, stb. A becsült hiba félreértelmezése vagy félreértése Például 1000 ember felmérése 100 főt tartalmazhat egy bizonyos etnikai csoportból vagy gazdasági státuszból. Az erre a csoportra vonatkozó eredmények sokkal kevésbé lesznek megbízhatóak, mint a teljes népességre vonatkozó eredmények. Ha a teljes mintára vonatkozó hibahatár 4% volt, akkor a hibahatár egy ilyen alcsoportra 13% körüli lehet.
Statisztika készítése: A statisztika tudomány eszközeivel A hibahatár megjelölésével Statisztika értelmezése: Körültekintően Hibahatárt figyelembe véve Tehát mind a készítőnek, mind az értelmezőnek szükségesek a statisztikai ismeretek.
Lásd: Galton-deszka működése
k n tizedestörtben: 0 0,1 0,36 0,24 0,18 0,1 0,02 százalékban: 0 10 36 24 18 10 2
k n tizedestörtben: 0 0,1 0,36 0,24 0,18 0,1 0,02 százalékban: 0 10 36 24 18 10 2 tizedestörtben: 0,022 0,116 0,218 0,304 0,24 0,094 0,006 százalékban: 2,2 11,6 21,8 30,4 24 9,4 0,6
Ebben az esetben mi a: Statisztikai sokaság: Egyedek: Ismérv: Adat: Adatsokaság:
Ebben az esetben mi a: Statisztikai sokaság: 50 vagy 500 golyó Egyedek: egy-egy golyó Ismérv: csatornába gurulás Adat: melyik csatornába mennyi érkezik Adatsokaság: a barna ill. a kék mező adatai
Miért ilyen a csatornákba érkezés eloszlása?
Statisztikai adatok, adatsokaság szemléltetése diagramokkal
Statisztikai adatok, adatsokaság szemléltetése diagramokkal
Statisztikai adatok, adatsokaság szemléltetése diagramokkal
Statisztikai adatok, adatsokaság szemléltetése diagramokkal
Statisztikai sokaság: Egyedek: Ismérv: Adat: Adatsokaság:
Statisztikai sokaság: mulasztások lehetséges számai Egyedek: mulasztások száma Ismérv: tanuló hiányzik Adat: hány tanuló hiányzott Adatsokaság: az alsó mező adatai n = 36 A = a hiányzások száma k = az alsó mező
A k Relatív gyakoriság: Százalékban: Százalékok összege:
Házi feladat Tk.: Fgy.: 313, 317, 318