Az előadás letöltése folymat van. Kérjük, várjon

Az előadás letöltése folymat van. Kérjük, várjon

Gazdasági informatika II. 2006/2007. tanév II. félév Gazdálkodási szak Nappali tagozat.

Hasonló előadás


Az előadások a következő témára: "Gazdasági informatika II. 2006/2007. tanév II. félév Gazdálkodási szak Nappali tagozat."— Előadás másolata:

1 Gazdasági informatika II. 2006/2007. tanév II. félév Gazdálkodási szak Nappali tagozat

2 Statisztikai számítások Excellel Minta vizsgálata – LEÍRÓ STATISZTIKA Megjegyzés: a statisztikai függvények zömének paramétere az adathalmaz, ezért nem részletezzük az egyes függvények paraméterezését!

3 EMLÉKEZTETŐ - Alapfogalmak Statisztika tárgya: SOKASÁG – meghatározott tulajdonságok szerint egyformák, más tulajdonságok szerint viszont különbözőek Ismérv: sokaság egységeire vonatkozó jellemzők Közös ismérvek – egységek ez alapján egyformák Megkülönböztető ismérvek – ezek alapján különböznek egymástól az egységek

4 Sokaság típusok Álló sokaság – valamely időpontra vonatkozik Mozgó sokaság – valamely időtartamra vonatkozik

5 Ismérvek típusai Területi – földrajzi jellegű Időbeli – valamilyen időpontra vagy időtartamra utalnak Minőségi – nem számszerűsíthető - kvalitatív Mennyiségi – számmal kifejezhető – kvantitatív Az ismérv lehetséges kimenetei az ismérvértékek!

6 Statisztikai adatok Mérhető adatok Mérhető adatok (Kvantitatív): olyan adatok, melyek mérésből származnak. Megállapítható adat Megállapítható adat: Nem számadat, kategória – „kategorizált adat” (Kvalitatív): Pl. nem(férfi, nő); igen-nem válaszlehetőségek; 2 gyereke van – ebben az esetben az a fontos, hogy a kétgyermekes kategóriába tartozik.

7 Adattípusok fajtái Adattípusok fajtái a rendezhetőség és a köztük értelmezhető távolságfüggvény alapján: Nominális Nominális Ordinális Ordinális Intervallum típusú Intervallum típusú Numerikus Numerikus

8 Nominális adatok A mérés legalacsonyabb szintjét jelöli, amikor minden megfigyelt egyedet olyan adattal írunk le, melyek egymással nagyság szerint nem összehasonlíthatók Példa: dolgozó neve, születési helye, neme…stb. akkor is nominális, ha számban kódolt: pl. a dolgozó törzsszáma.

9 Ordinális adatok Bármely két adat összehasonlítható Példa: dolgozók iskolai végzettsége. Jellemző: Nincs távolság értelmezve az adatok között. (Pl. Nem lehet megmondani, hogy mennyivel értékesebb az érettségi a 8 általánosnál. ) Egyetlen művelet: adatok rendezése – olyan rangstatisztika alkalmazható, amely csak az adatok egymáshoz képesti rendezettségét használják. (Pl. átlagnak nincs értelme, de mediánnak és módusznak igen – ezekről a későbbiekben lesz szó).

10 Intervallum típusú adatok Sorba rendezhetőség mellett az egymástól való távolság is megadható. Példa: hőmérsékleti adatok Értelmetlen az egymáshoz viszonyított arányról beszélni: 20 C° kétszer olyan meleg, mint a 10C°.(A hőmérséklet a Kelvin skálán nem intervallum típusú!)

11 Numerikus adatok Valós számokkal jellemezhető adatok. Minden olyan műveletet végrehajthatunk ezekkel, amelyeket a valós számokkal.

12 Középértékek

13 Számított középértékek Matematikai összefüggés alapján számíthatók ki: Számtani (Aritmetikai) átlag Egyszerű Súlyozott Harmonikus átlag Egyszerű Súlyozott Mértani (Geometriai) átlag Egyszerű Súlyozott Négyzetes (Kvadratikus) átlag Egyszerű Súlyozott

14 Számtani átlag Számítsuk ki az adott osztály átlagát matematikából a megadott eredmények alapján! =ÁTLAG( ) - AVERAGE()

15 Mértani átlag Egy vállalat nyereségét tartalmazza az alábbi táblázat az 1982 – 92 években: Feladat: Határozzuk meg az adott időszakra a nyereség növekedésének átlagos ütemét! =MÉRTANI.KÖZÉP – GEOMEAN()

16 További átlagok megfelelő függvényei Harmonikus átlag – HARM.KÖZÉP() – HARMEAN()

17 Helyzeti középértékek A sokaságban elfoglalt helyzetüknél fogva jellemzik a sokaságot Valamilyen szabály szerint rendezni kell az adatokat  Rangsor Előnye: Függetlenek a sokaság más tagjainak értékeitől – Heterogén sokaságok esetén jellemzőbbek, mint az átlagok

18 Helyzeti középértékek Kvantilis értékek – A sokaság mennyiségi ismérv szerinti eloszlásának tömör leírását adják meg k egyenlő részneveFüggvény 2 MEDIÁN=medián() = kvartilis() 3 TERICLIS= kvartilis() 4 KVARTILIS= kvartilis() 5 KVINTILIS 10 DECILIS 100 PERCENTILIS=Percentilis()

19 Feladat Tegyük fel, hogy egy üzem dolgozóinak elmúlt havi teljesítményszázalékai az alábbiak: - Határozzuk meg a mediánt! MEDIÁN X db Mediánnál kisebb Y db Mediánnál nagyobb X=Y

20 Excel függvényei MEDIÁN() – MEDIAN() KVARTILIS() – QUARTILE() PERCENTILIS() – PERCENTILE(): k-dik percentilis SZÁZALÉKRANG() – PERCENTRANK(): egy értéknek egy adathalmazon vett százalékos rangját adja MAX MIN KICSI() – SMALL():Egy adathalmaz k-dik legkisebb elemét adja értékül! NAGY() – LARGE(): Egy adathalmaz k-dik legnagyobb elemét adja értékül! SORSZÁM()- RANK(): Egy szám sorszámát adja, meg ha az adatokat sorba rendezzük

21 Módusz Leggyakrabban előforduló ismérvérték =MÓDUSZ() – MODE() Figyelem! Több azonos gyakoriságú adat esetén a sorrendben az elsőt adja móduszként! – Próbálja ki! Rendezze át az adatokat!

22 Feladat Készítsen kimutatást, hogy hány db 1;2;3;4 és 5 lett matematikából! ={GYAKORISÁG(tartomány; csoportosítási tömb)} TÖMBKÉPLET! Képlet beírás befejezése: [ CTRL + SHIFT + ENTER]

23 Gyakoriság =Gyakoriság() – FREQUENCY() Adott adathalmazban melyik érték hányszor szerepel

24 Összefoglalás - Középértékek Az egyes adatfajtáknál milyen középértékeket alkalmazunk? NominálisMódusz OrdinálisMedián KvantitatívÁtlag

25 Szóródás és mérése

26 Mérőszámok Terjedelem Interkvartilis félterjedelem Átlagos abszolút eltérés Szórás – Szórásnégyzet (Variancia) Relatív szórás (Variációs koefficiens)

27 Függvények az Excelben = SQ()- átlagtól való eltérések négyzetének összegét adja eredményül =SZÓRÁSP() –STDEVP()- szórás =VARP() – variancia (szórásnégyzet) =ÁTL.ELTÉRÉS – átlagos abszolút eltérés – AVEDEV()

28 Asszimmetria mérése

29 Eloszlások Egymóduszú SzimmetrikusAsszimetrikus Mérsékelten asszimetrikus Balra ferdültJobbra ferdült Erősen asszimetrikus J alakú Fordított J alakú Több móduszú U alakú M alakú

30 Ferdeség mérése =FERDESÉG() – SKEW() A ferdeség az eloszlás középérték körüli aszimmetriájának mértékét jelzi. A pozitív ferdeség a pozitív értékek irányába nyúló aszimmetrikus eloszlást jelez, míg a negatív ferdeség a negatív értékek irányában torzított. =CSÚCSOSSÁG() – KURT() Egy adathalmaz csúcsosságát számítja ki. A függvény a normális eloszláshoz viszonyítva egy eloszlás csúcsosságát vagy laposságát adja meg. A pozitív értékek viszonylag csúcsos, a negatív értékek viszonylag lapos eloszlást jelentenek.

31 Adatok kezelése Számláló - keresőfüggvények

32 Függvények DARAB () - COUNT() a megadott tartomány számmal kitöltött celláinak a számát adja DARAB2() – COUNTA() a megadott tartomány értékkel kitöltött celláinak (nem üres) a számát adja DARABTELI () – COUNTIF () a megadott tartományban megszámolja, hogy hány darab cella felel meg a megadott kritériumnak DARABÜRES () – COUNTBLANK () A megadott tartományban megszámolja hány db cella üres

33 Feladat A megadott adathalmaz egy osztály matematika eredményeit tartalmazza. Határozzuk meg, hogy hány db elégtelen lett! Vizsgáljuk meg, hogy van-e olyan tanuló, akinek nincs beírva az érdemjegy – még nem zárták le? =DARABTELI(tartomány; kritérium) =DARABÜRES(tartomány)

34 Feladat Készítsen kimutatást, hogy hány db 1;2;3;4 és 5 lett matematikából! Hány cellában van adat – azaz hány tanuló kapott már érdemjegyet? =DARABTELI(tartomány; kritérium) =DARAB(tartomány)

35 Idősorok elemzése

36 Trendszámítás - elmélet Trend: Az időben változó jelenségek alakulásában mindig megfigyelhetünk alapvető tendenciákat (növekedés, csökkenés…stb) Szezonális ingadozás: Rendszeresen visszatérő hullámzás Ciklushatás: fel-le mozgás hatása (konjunktúra - dekonjunktúra) Véletlen hatás: előre nem látható események befolyása

37 Trendszámítás formái 1. Analitikus trendszámítás 2. Mozgóátlagolású trendszámítás

38 Analitikus trendszámítás Megfigyelt jelenségek tapasztalatai alapján felírunk egy olyan függvényt, mely az időbeli változás alapirányzatát fejezi ki. Függvénytípusok: Lineáris Exponenciális Parabola Logisztikus (S-alakú)

39 Lineáris függvény felírása Egy vállalat dolgozóinak létszámváltozását tükröző lineáris függvény felírása, ábrázolása! Függvény egyenlete: Y:létszám – függő változó! X:év – független változó! Y=20,4*x+198,3 ={LIN.ILL(létszám;évek;;;)} LIN.ILL függvényről

40 LIN.ILL függvény Paraméterei: Y értékek X értékek Konstans: Igaz (b számítása normál módon történik) vagy Hamis (b értéke 0 lesz – ez az alapértelmezett érték) Nulla: IGAZ (kiegészítő elemzések készülnek) vagy HAMIS (nem készülnek kiegészítő elemzések – alapértelmezett érték)

41 LIN.ILL függvény használata Tömbképletként – Ha csak két adathalmazról van szó X és Y, akkor kettő cellát kijelölve a képlet beírása után CTRL+SHIFT+ENTER leütéssel képezzük a tömbképletet – LÁSD: példa! Ha nem alkalmazunk tömbképletet, akkor a kapott érték az egyenes meredeksége lesz – következő dia! 2 adatsor esetén alkalmazhatjuk a következőképpen is: Meredekség meghatározása: =INDEX(LIN.ILL(y;x);1); Y metszéspont meghatározása: =INDEX(LIN.ILL(y;x);2); Lásd! Következő dia!

42 Példák a LIN.ILL függvény alkalmazására

43 LIN.ILL alkalmazása, ha a nulla értéke IGAZ Kiegészítő statisztikákat számol ki az EXCEl, ha a nulla értékét IGAZ-ra állítjuk A statisztikákat tömbként adja meg a következő elrendezésben lásd! Következő dia! Ha a tömb elemeinek nagyobb tartományt jelölünk ki a statisztikák számán kívül, akkor a felesleges cellákban a #HIÁNYZIK üzenetet kapjuk!

44 LIN.ILL kiegészítő statisztikái mnmn m n-1… m 1 b sh n sh n-1 sh b r2r2 sh y FDfDf ss reg ss marad együtthatók Együtthatók standard hibái Determináns együttható – összehasonlítja a becsült értékeket a tényleges értékekkel – értéke 0 és 1 közötti. Ha 1 akkor jó a becsült érték – azaz jó a lin. Egyenes ha 0, akkor nem jó! sh y : az y becslés standard hibája F próba eredményeként kapott érték D f : Szabadságfok Ss reg : regressziós négyzetösszeg (y érték és az y értékek átlaga közötti eltérés négyzete) ss marad: maradék négyzetösszeg (y becsült érték és a tényleges érték közötti eltérés négyzete) ∑℮ 2 =∑ (y i -y i ^ ) 2 Az egyenes egyenlete: Y=m 1 x 1 +m 2 x 2 +…+b vagy y=mx+b

45 LIN.ILL kiegészítő statisztikái ∑℮2 = 43.9 Megjegyzés: ezen érték alapján lehet például eldönteni, hogy az exponenciális vagy a lineáris függvény a jobb! R 2 =1, azaz a lineáris függvény jól leírja az adatok tendenciáját! Szabadságfok: 5

46 Grafikon rajzolása – trendegyenesek Rajzoltassunk ki egy grafikont a közölt adatokból! (Beszúrás  Diagram) Jelöljük ki a grafikont Diagram  Trendvonal felvétele Típus lap: Tetszőleges függvény kiválasztása Egyebek lap: Beállíthatjuk, hogy az egyenlet látszódjon R négyzet értékét is megjeleníthetjük

47 Példa – Trendegyenes kirajzoltatása

48 Lineáris egyenes meredekségének és y tengelymetszetének meghatározása Külön függvényekkel (természetesen a LIN.ILL is ugyanezt adja eredményül) Meredekség: MEREDEKSÉG(y;x) = m Y tengelymetszet: METSZ(y;x) = b

49 Exponenciális függvény felírása Egy vállalat dolgozóinak létszámváltozását tükröző exponenciális függvény felírása, ábrázolása! ={LOG.ILL(létszám;évek;;;)} LOG.ILL függvényről

50 LOG. ILL függvény Ugyanazok az alkalmazások igazak erre a függvényre, mint a LIN.ILL-re! Paraméterezésük is azonos

51 Előrejelzés a trendegyenlet alapján Határozzuk meg a lineáris és exponenciális trend alapján, hogy mennyi lesz a létszám 2001-ben és 2002-ben! TREND(y;x;új_x;konstans) függvénnyel – lineáris NÖV(y;x;új_x;konstans) - exponenciális

52 Melyik egyenlet jellemzi jobban az adatok trendjét? Eldönthető a NÖV(y;x) és TREND(y;x) függvényekkel, ha nem adjuk meg a 3. paramétert! A trend() alapján kapott érték kevésbé tér el a 220- tól (1994-es érték), mint a növ() alapján kapott érték, ezért azt mondhatjuk, hogy ezt az adatsort a lineáris egyenlet jellemzi jobban! Ugyanaezt a LIN.ill és a LOG.ILL kiegészítő statisztikáival is megállapíthatjuk!

53 3. ANALYSIS TOOLPAK VBA

54 Eszközök menü - Bővítménykezelő

55 Eszközök - Adatelemzés

56 Leíró statisztikák

57 Példa: Adott egy osztály matematikából kapott eredménye. Számítsuk ki a jellemző középértékeket (átlag, medián, módusz) valamint a szórást!

58 Megoldás Eszközök menü  Adatelemzés  Leíró statisztika Leíró statisztika párbeszédpanel

59 Leíró statisztika párbeszédpanel beállításai Bemeneti tartomány Csoportosítási alap Feliratok az első sorban/oszlopban Várható értékek konfidenciaszintje K-adik legnagyobb K-adik legkisebb Kimeneti tartomány Összesítő statisztika

60 Végeredmény Várható érték = ÁTLAG(tartomány) Medián= MEDIÁN(tartomány) Módusz= MÓDUSZ (tartomány) Szórás = SZÓRÁS(tartomány) Variancia = VAR(tartomány) Csúcsosság= CSÚCSOSSÁG (tartomány) Ferdeség = FERDESÉG(tartomány) Tartomány = MAX() – MIN() Minimum = MIN(tartomány) Maximum = MAX(tartomány) Összeg = SZUM(tartomány) Darabszám = DARAB(tartomány) Legnagyobb(k)=NAGY(tratomány;k) Legkisebb(k) = KICSI(tartomány;k)

61 Gyakoriság

62 Feladat Az előző feladatban közölt adatokkal dolgozva állapítsuk meg a gyakoriságokat – hány hallgató kapott 1,2,3,4,5 osztályzatot matematikából? Készítsünk diagramot is!

63 Megoldás Eszközök  Adatelemzés  Hisztogram menüpont

64 Hisztogram párbeszédablak pontjai Bementi tartomány - adatok Rekesztartomány – csoportosítási szempont (nem kötelező megadni) Feliratok – ekkor a megadott tartományok első sorát feliratként kezeli! Kimeneti beállítások Eredmény megjelenítésének helye Tartomány - adatokat tartalmazó munkalapon belül Új munkalap Új munkafüzet Paraeto – Rendezett oszlopdiagram felrajzolása – csökkenő sorrendben megjelenítve, kezdve a leggyakoribb adattal Halmozott százalék – kummulált relatív gyakoriság kiszámolása Diagram kimenet – adatok oszlopdiagramban ábrázolása

65 Paraeto

66 Mozgóátlag Alkalmazása: azon idősoroknál, melyek az adatokat rövidebb időszakokra bontva tartalmazzák

67 Példa Adatokat egy oszlopban vagy egy sorban kell elhelyezni!

68 Megoldás


Letölteni ppt "Gazdasági informatika II. 2006/2007. tanév II. félév Gazdálkodási szak Nappali tagozat."

Hasonló előadás


Google Hirdetések