Az előadás letöltése folymat van. Kérjük, várjon

Az előadás letöltése folymat van. Kérjük, várjon

Statisztikai alapfogalmak

Hasonló előadás


Az előadások a következő témára: "Statisztikai alapfogalmak"— Előadás másolata:

1 Statisztikai alapfogalmak

2 Fogalomlista Hisztogram Átlag Szórás
Konfidencia-intervallum (megbízhatósági tartomány) Szignifikancia Percentilis CSH-index (családiháttér-index)

3 1. Hisztogram Egy változó lehetséges értékeinek megoszlását bemutató oszlopdiagram. A grafikon vízszintes tengelyén a változó lehetséges értékei vagy azok valamilyen csoportosítása szerepel, függőleges tengelyről pedig az adott kategóriában található értékek száma vagy aránya olvasható le. Városi ált. iskolába járó gyerekek körében az adott intervallumba eső gyerekek száma (ezer fő) Matematika képességpont 50 pontnyi széles intervallumokra osztva

4 2. Átlag Leggyakrabban a számtani átlagot használjuk: Jelölés: x1, x2,…, xn az n db érték Jelentősége abban rejlik, hogy egyetlen számadattal jól jellemzi az adathalmazt, mert az adatok az átlag környezetébe esnek. Óvatosan kell használni, mert a „környezet” nagy is lehet! Kell egy másik mutató mellé (pl. szórás, konfidencia-intervallum, szignifikancia).

5 3. Szórás Azt mutatja meg, hogy az egyes értékek átlagosan mennyivel térnek el az átlagtól. Minél kisebb a szórás, az átlag annál pontosabban jellemzi az adatokat. Az átlagtól vett eltérések négyzetes átlaga: Jelölések: x1, x2,…, xn: n db érték A: számtani közép (átlag) kicsi szórás: nagy szórás:

6 4. Konfidencia-intervallum (megbízhatósági tartomány)
95%-os konfidencia-intervallum jelentése: a becsült adat 95%-os valószínűséggel a megadott intervallumba esik. A becsült adat most: a tanulók átlagos képességpontja. 249 pontnyi széles tartomány! 2 pontnyi széles tartomány

7 4. Konfidencia-intervallum (megbízhatósági tartomány)
FONTOS: Nem az egyes értékek esnek 95%-os eséllyel az intervallumba, hanem az átlaguk! Az országos átlagban a telephely tanulói is benne vannak! Azért nagy a telephelyi átlag konfidencia-intervalluma, mert kevés elemű és nagy szórású adathalmazból becsüljük a tanulók átlagos teljesítményét. Az országos szórás is nagy, viszont nagyon sok értékből számolunk, ami megbízhatóbb becslésre vezet.

8 5. Szignifikancia A statisztikai összehasonlításban gyakran használatos fogalom (szignifikáns=jelentős). Például két telephelyet össze akarunk hasonlítani a tanulók kompetenciamérés eredménye alapján. Megnézzük az átlagokat (nem elég!) Megnézzük a konfidencia intervallumokat Ez itt most nem elég a döntéshez, ezért statisztikai módszerrel (hipotézisvizsgálat –> 2 mintás t-próba) megállapítjuk, hogy van-e jelentős különbség, ekkor: ki tudunk mutatni szignifikáns különbséget a két telephely közt (akkor egyértelmű, hogy melyik a jobb) nem tudunk kimutatni lényeges különbséget (a hipotézisvizsgálat nem tudta megerősíteni, hogy különböznek, ezért lényegében egyformának tekintjük őket)

9 Konfidencia-intervallum, szignifikáns különbség
Egy példa: 1408 1657 1542 NINCS VAN 1. 2. 4. Bp. NAGY Ált. Iskola Országos átlag 1611 1612 1613 1655 1662 1658 3. Bp-i iskolák átlaga További statisztikai vizsgálat szükséges 1675 1682 1679 Bp-i NAGY iskolák átlaga Egy konkrét telephely

10 6. Percentilis A változó eloszlásának jellemzésére szolgáló mutató.
A k. percentilis az az érték, amelynél a változó által felvett értékek k%-a kisebb, (100-k)%-a pedig nagyobb (k: 0 és 100 közötti egész szám). Például az 5-ös percentilisnél az értékek 5%-a kisebb, 95%-a pedig nagyobb. A 0-s percentilis a minimum, a 100-as percentilis a maximum, az 50-es percentilis pedig a medián.

11 6. Percentilis Szövegértés képességpont 20 db érték 100%
1903 1887 1856 1815 1774 1746 1730 1682 1675 1631 1624 1617 1588 1559 1527 1503 1471 1463 1425 1407 15 db legnagyobb érték 75% 1509 25-ös percentilis: az értékek 25%-a alatta, 75%-a fölötte van 5 db legkisebb érték 25%

12 6. Percentilis Szövegértés képességpont 20 db érték 100%
1903 1887 1856 1815 1774 1746 1730 1682 1675 1631 1624 1617 1588 1559 1527 1503 1471 1463 1425 1407 10 db legnagyobb érték 50% 50-es percentilis (medián): az értékek 50%-a alatta, 50%-a fölötte van 1627 10 db legkisebb érték 50% 1509 25-ös percentilis: az értékek 25%-a alatta, 75%-a fölötte van

13 6. Percentilis Szövegértés képességpont 20 db érték 100%
1903 1887 1856 1815 1774 1746 1730 1682 1675 1631 1624 1617 1588 1559 1527 1503 1471 1463 1425 1407 5 db legnagyobb érték 25% 75-ös percentilis: az értékek 75%-a alatta, 25%-a fölötte van 1767 50-es percentilis (medián): az értékek 50%-a alatta, 50%-a fölötte van 1627 15 db legkisebb érték 75% 1509 25-ös percentilis: az értékek 25%-a alatta, 75%-a fölötte van

14 7. CSH-index (családiháttér-index)
Egyetlen számadattal szeretnénk jellemezni a tanuló családi környezetének azon tényezőit, melyek a legnagyobb befolyással vannak az iskolai teljesítményére. A családiháttér-index értéke a tanulói kérdőív néhány kérdésére adott válasz alapján kerül kiszámításra, amelyek az index os kialakításakor a legnagyobb magyarázóerővel bírtak a lineáris modellben: az otthon található könyvek száma a szülők iskolai végzettsége külön-külön van-e otthon számítógép tanulónak vannak-e saját könyvei 2013-tól a HHH státusz is része

15 7. CSH-index (családiháttér-index)
A telephelyi jelentésekben külön ábracsoport mutatja be, hogy a telephely tanulóinak átlagos CSH-indexe alapján milyen eredményre számítanánk a kompetenciamérésen, és ehhez képest a telephely hogyan szerepelt (hátránykompenzáló hatás).


Letölteni ppt "Statisztikai alapfogalmak"

Hasonló előadás


Google Hirdetések