Gazdasági informatika 2001/2002. tanév II. félév Gazdálkodási szak Nappali tagozat
Statisztikai számítások Excellel Minta vizsgálata – LEÍRÓ STATISZTIKA Megjegyzés: a statisztikai függvények zömének paramétere az adathalmaz, ezért nem részletezzük az egyes függvények paraméterezését!
Alapfogalmak Statisztika tárgya: SOKASÁG – meghatározott tulajdonságok szerint egyformák, más tulajdonságok szerint viszont különbözőek Ismérv: sokaság egységeire vonatkozó jellemzők Közös ismérvek – egységek ez alapján egyformák Megkülönböztető ismérvek – ezek alapján különböznek egymástól az egységek
Sokaság típusok Álló sokaság – valamely időpontra vonatkozik Mozgó sokaság – valamely időtartamra vonatkozik
Ismérvek típusai Területi – földrajzi jellegű Időbeli – valamilyen időpontra vagy időtartamra utalnak Minőségi – nem számszerűsíthető - kvalitatív Mennyiségi – számmal kifejezhető – kvantitatív Az ismérv lehetséges kimenetei az ismérvértékek!
Statisztikai adatok Mérhető adatok (Kvantitatív): olyan adatok, melyek mérésből származnak. Megállapítható adat: Nem számadat, kategória – „kategorizált adat” (Kvalitatív): Pl. nem(férfi, nő); igen-nem válaszlehetőségek; 2 gyereke van – ebben az esetben az a fontos, hogy a kétgyermekes kategóriába tartozik.
Adattípusok fajtái Adattípusok fajtái a rendezhetőség és a köztük értelmezhető távolságfüggvény alapján: Nominális Ordinális Intervallum típusú Numerikus
Nominális adatok A mérés legalacsonyabb szintjét jelöli, amikor minden megfigyelt egyedet olyan adattal írunk le, melyek egymással nagyság szerint nem összehasonlíthatók Példa: dolgozó neve, születési helye, neme…stb. akkor is nominális, ha számban kódolt: pl. a dolgozó törzsszáma.
Ordinális adatok Bármely két adat összehasonlítható Példa: dolgozók iskolai végzettsége. Jellemző: Nincs távolság értelmezve az adatok között. (Pl. Nem lehet megmondani, hogy mennyivel értékesebb az érettségi a 8 általánosnál. ) Egyetlen művelet: adatok rendezése – olyan rangstatisztika alkalmazható, amely csak az adatok egymáshoz képesti rendezettségét használják. (Pl. átlagnak nincs értelme, de mediánnak és módusznak igen – ezekről a későbbiekben lesz szó).
Intervallum típusú adatok Sorba rendezhetőség mellett az egymástól való távolság is megadható. Példa: hőmérsékleti adatok Értelmetlen az egymáshoz viszonyított arányról beszélni: 20 C° kétszer olyan meleg, mint a 10C°.(A hőmérséklet a Kelvin skálán nem intervallum típusú!)
Numerikus adatok Valós számokkal jellemezhető adatok. Minden olyan műveletet végrehajthatunk ezekkel, amelyeket a valós számokkal.
Viszonyszámok
Feladat - megoszlási viszonyszám számolása A MÁV tehervonatok üzemi teljesítményei vontatási nemenként 1993-ban a következők: Feladat: Elemezze az üzemi teljesítmények vontatási nemenkénti megoszlását!
Megoldás Összegzés: =SZUM() - SUM() függvénnyel Viszonyszámok kiszámítása: Képlettel- abszolút hivatkozás Teljesítmény Gőz Villamos Diesel Motorkocsi Összesen Vontatás Vonatkilóméter (ezer egység) 19,21% 36,73% 43,92% 0,13% 100,00% Elegytonnakm (millió egység) 11,02% 44,00% 44,90% 0,07% 100,00% Üzemi árutonnakm (millió egység) 10,41% 44,12% 45,41% 0,06% 100,00% =15877 / 43221 =8303 / 43221
Középértékek
Számított középértékek Matematikai összefüggés alapján számíthatók ki: Számtani (Aritmetikai) átlag Egyszerű Súlyozott Harmonikus átlag Mértani (Geometriai) átlag Négyzetes (Kvadratikus) átlag
Számtani átlag Számítsuk ki az adott osztály átlagát matematikából a megadott eredmények alapján! =ÁTLAG( ) - AVERAGE()
Mértani átlag Egy vállalat nyereségét tartalmazza az alábbi táblázat az 1982 – 92 években: =MÉRTANI.KÖZÉP – GEOMEAN() Feladat: Határozzuk meg az adott időszakra a nyereség növekedésének átlagos ütemét!
További átlagok megfelelő függvényei Harmonikus átlag – HARM.KÖZÉP() – HARMEAN()
Helyzeti középértékek A sokaságban elfoglalt helyzetüknél fogva jellemzik a sokaságot Valamilyen szabály szerint rendezni kell az adatokat Rangsor Előnye: Függetlenek a sokaság más tagjainak értékeitől – Hetrogén sokaságok esetén jellemzőbbek, mint az átlagok
Helyzeti középértékek Kvantilis értékek – A sokaság mennyiségi ismérv szerinti eloszlásának tömör leírását adják meg k egyenlő rész neve Függvény 2 MEDIÁN =medián() = kvartilis() 3 TERICLIS 4 KVARTILIS 5 KVINTILIS 10 DECILIS 100 PERCENTILIS =Percentilis()
Feladat Tegyük fel, hogy egy üzem dolgozóinak elmúlt havi teljesítményszázalékai az alábbiak: - Határozzuk meg a mediánt! MEDIÁN X db Mediánnál kisebb Y db Mediánnál nagyobb X=Y
Excel függvényei MEDIÁN() – MEDIAN() KVARTILIS() – QUARTILE() PERCENTILIS() – PERCENTILE(): k-dik percentilis SZÁZALÉKRANG() – PERCENTRANK(): egy értéknek egy adathalmazon vett százalékos rangját adja MAX MIN KICSI() – SMALL():Egy adathalmaz k-dik legkisebb elemét adja értékül! NAGY() – LARGE(): Egy adathalmaz k-dik legnagyobb elemét adja értékül! SORSZÁM()- RANK(): Egy szám sorszámát adja, meg ha az adatokat sorba rendezzük
Próbálja ki! Rendezze át az adatokat! Módusz Leggyakrabban előforduló ismérvérték =MÓDUSZ() – MODE() Figyelem! Több azonos gyakoriságú adat esetén a sorrendebn az elsőt adja móduszként! – Próbálja ki! Rendezze át az adatokat!
Képlet beírás befejezése: Feladat Készítsen kimutatást, hogy hány db 1;2;3;4 és 5 lett matematikából! ={GYAKORISÁG(tartomány; csoportosítási tömb)} TÖMBKÉPLET! Képlet beírás befejezése: [CTRL + SHIFT + ENTER]
Gyakoriság =Gyakoriság() – FREQUENCY() Adott adathalmazban melyik érték hányszor szerepel
Összefoglalás - Középértékek Az egyes adatfajtáknál milyen középértékeket alkalmazunk? Nominális Módusz Ordinális Medián Kvantitatív Átlag
Szóródás és mérése
Mérőszámok Terjedelem Interkvartilis félterjedelem Átlagos abszolút eltérés Szórás – Szórásnégyzet (Variancia) Relatív szórás (Variációs koefficiens)
Függvények az Excelben = SQ()- átlagtól való eltérések négyzetének összegét adja eredményül =SZÓRÁSP() –STDEVP()- szórás =VARP() – variancia (szórásnégyzet) =ÁTL.ELTÉRÉS – átlagos abszolút eltérés – AVEDEV()
Asszimmetria mérése
Ferdeség mérése =FERDESÉG() – SKEW() =CSÚCSOSSÁG() – KURT() A ferdeség az eloszlás középérték körüli aszimmetriájának mértékét jelzi. A pozitív ferdeség a pozitív értékek irányába nyúló aszimmetrikus eloszlást jelez, míg a negatív ferdeség a negatív értékek irányában torzított. =CSÚCSOSSÁG() – KURT() Egy adathalmaz csúcsosságát számítja ki. A függvény a normális eloszláshoz viszonyítva egy eloszlás csúcsosságát vagy laposságát adja meg. A pozitív értékek viszonylag csúcsos, a negatív értékek viszonylag lapos eloszlást jelentenek. A FERDESÉG fv kimenete #ZÉRUOSZTÓ, ha az adatok száma 3-nál kisebb, illetve ha a minta szórása 0. A CSÚCSOSSÁG fv kimenete #ZÉRUOSZTÓ, ha az adatok száma 4-nél kisebb, illetve ha a minta normális eloszlása 0-val egyenlő.
Számláló - keresőfüggvények Adatok kezelése Számláló - keresőfüggvények
Függvények DARAB () - COUNT() DARAB2() – COUNTA() a megadott tartomány számmal kitöltött celláinak a számát adja DARAB2() – COUNTA() a megadott tartomány értékkel kitöltött celláinak (nem üres) a számát adja DARABTELI () – COUNTIF () a megadott tartományban megszámolja, hogy hány darab cella felel meg a megadott kritériumnak DARABÜRES () – COUNTBLANK () A megadott tartományban megszámolja hány db cella üres
Feladat A megadott adathalmaz egy osztály matematika eredményeit tartalmazza. Határozzuk meg, hogy hány db elégtelen lett! Vizsgáljuk meg, hogy van-e olyan tanuló, akinek nincs beírva az érdemjegy – még nem zárták le? =DARABTELI(tartomány; kritérium) =DARABÜRES(tartomány)
Feladat Készítsen kimutatást, hogy hány db 1;2;3;4 és 5 lett matematikából! Hány cellában van adat – azaz hány tanuló kapott már érdemjegyet? =DARABTELI(tartomány; kritérium) =DARAB(tartomány)
Összefoglalás Függvény Angol Magyar QUARTILE KVARTILIS PERCENTILE PERCENTILIS PERCENTRANK SZÁZALÉKRANG RANK SORSZÁM MIN MAX SMALL KICSI LARGE NAGY SQ SKEW FERDESÉG KURT CSÚCSOSSÁG COUNTIF DARABTELI COUNTBLANK DARABÜRES COUNTA DARAB2 Függvény Angol Magyar AVERAGE ÁTLAG STDEVP SZÓRÁSP SUM SZUM GEOMEAN MÉRTANI.KÖZÉP HARMEAN HARM.KÖZÉP MEDIAN MEDIÁN MODE MÓDUSZ FREQUENCY GYAKORISÁG VARP AVEDEV ÁTL.ELTÉRÉS COUNT DARAB