Az előadás letöltése folymat van. Kérjük, várjon

Az előadás letöltése folymat van. Kérjük, várjon

Gazdasági informatika II.

Hasonló előadás


Az előadások a következő témára: "Gazdasági informatika II."— Előadás másolata:

1 Gazdasági informatika II.
2006/2007. tanév II. félév Gazdálkodási szak Nappali tagozat

2 Statisztikai számítások Excellel
Minta vizsgálata – LEÍRÓ STATISZTIKA Megjegyzés: a statisztikai függvények zömének paramétere az adathalmaz, ezért nem részletezzük az egyes függvények paraméterezését!

3 EMLÉKEZTETŐ - Alapfogalmak
Statisztika tárgya: SOKASÁG – meghatározott tulajdonságok szerint egyformák, más tulajdonságok szerint viszont különbözőek Ismérv: sokaság egységeire vonatkozó jellemzők Közös ismérvek – egységek ez alapján egyformák Megkülönböztető ismérvek – ezek alapján különböznek egymástól az egységek

4 Sokaság típusok Álló sokaság – valamely időpontra vonatkozik
Mozgó sokaság – valamely időtartamra vonatkozik

5 Ismérvek típusai Területi – földrajzi jellegű
Időbeli – valamilyen időpontra vagy időtartamra utalnak Minőségi – nem számszerűsíthető - kvalitatív Mennyiségi – számmal kifejezhető – kvantitatív Az ismérv lehetséges kimenetei az ismérvértékek!

6 Statisztikai adatok Mérhető adatok (Kvantitatív): olyan adatok, melyek mérésből származnak. Megállapítható adat: Nem számadat, kategória – „kategorizált adat” (Kvalitatív): Pl. nem(férfi, nő); igen-nem válaszlehetőségek; 2 gyereke van – ebben az esetben az a fontos, hogy a kétgyermekes kategóriába tartozik.

7 Adattípusok fajtái Adattípusok fajtái a rendezhetőség és a köztük értelmezhető távolságfüggvény alapján: Nominális Ordinális Intervallum típusú Numerikus

8 Nominális adatok A mérés legalacsonyabb szintjét jelöli, amikor minden megfigyelt egyedet olyan adattal írunk le, melyek egymással nagyság szerint nem összehasonlíthatók Példa: dolgozó neve, születési helye, neme…stb. akkor is nominális, ha számban kódolt: pl. a dolgozó törzsszáma.

9 Ordinális adatok Bármely két adat összehasonlítható
Példa: dolgozók iskolai végzettsége. Jellemző: Nincs távolság értelmezve az adatok között. (Pl. Nem lehet megmondani, hogy mennyivel értékesebb az érettségi a 8 általánosnál. ) Egyetlen művelet: adatok rendezése – olyan rangstatisztika alkalmazható, amely csak az adatok egymáshoz képesti rendezettségét használják. (Pl. átlagnak nincs értelme, de mediánnak és módusznak igen – ezekről a későbbiekben lesz szó).

10 Intervallum típusú adatok
Sorba rendezhetőség mellett az egymástól való távolság is megadható. Példa: hőmérsékleti adatok Értelmetlen az egymáshoz viszonyított arányról beszélni: 20 C° kétszer olyan meleg, mint a 10C°.(A hőmérséklet a Kelvin skálán nem intervallum típusú!)

11 Numerikus adatok Valós számokkal jellemezhető adatok.
Minden olyan műveletet végrehajthatunk ezekkel, amelyeket a valós számokkal.

12 Középértékek

13 Számított középértékek
Matematikai összefüggés alapján számíthatók ki: Számtani (Aritmetikai) átlag Egyszerű Súlyozott Harmonikus átlag Mértani (Geometriai) átlag Négyzetes (Kvadratikus) átlag

14 Számtani átlag Számítsuk ki az adott osztály átlagát matematikából a megadott eredmények alapján! =ÁTLAG( ) - AVERAGE()

15 Mértani átlag Egy vállalat nyereségét tartalmazza az alábbi táblázat az 1982 – 92 években: =MÉRTANI.KÖZÉP – GEOMEAN() Feladat: Határozzuk meg az adott időszakra a nyereség növekedésének átlagos ütemét!

16 További átlagok megfelelő függvényei
Harmonikus átlag – HARM.KÖZÉP() – HARMEAN()

17 Helyzeti középértékek
A sokaságban elfoglalt helyzetüknél fogva jellemzik a sokaságot Valamilyen szabály szerint rendezni kell az adatokat  Rangsor Előnye: Függetlenek a sokaság más tagjainak értékeitől – Heterogén sokaságok esetén jellemzőbbek, mint az átlagok

18 Helyzeti középértékek
Kvantilis értékek – A sokaság mennyiségi ismérv szerinti eloszlásának tömör leírását adják meg k egyenlő rész neve Függvény 2 MEDIÁN =medián() = kvartilis() 3 TERICLIS 4 KVARTILIS 5 KVINTILIS 10 DECILIS 100 PERCENTILIS =Percentilis()

19 Feladat Tegyük fel, hogy egy üzem dolgozóinak elmúlt havi teljesítményszázalékai az alábbiak: - Határozzuk meg a mediánt! MEDIÁN X db Mediánnál kisebb Y db Mediánnál nagyobb X=Y

20 Excel függvényei MEDIÁN() – MEDIAN() KVARTILIS() – QUARTILE()
PERCENTILIS() – PERCENTILE(): k-dik percentilis SZÁZALÉKRANG() – PERCENTRANK(): egy értéknek egy adathalmazon vett százalékos rangját adja MAX MIN KICSI() – SMALL():Egy adathalmaz k-dik legkisebb elemét adja értékül! NAGY() – LARGE(): Egy adathalmaz k-dik legnagyobb elemét adja értékül! SORSZÁM()- RANK(): Egy szám sorszámát adja, meg ha az adatokat sorba rendezzük

21 Próbálja ki! Rendezze át az adatokat!
Módusz Leggyakrabban előforduló ismérvérték =MÓDUSZ() – MODE() Figyelem! Több azonos gyakoriságú adat esetén a sorrendben az elsőt adja móduszként! – Próbálja ki! Rendezze át az adatokat!

22 Képlet beírás befejezése:
Feladat Készítsen kimutatást, hogy hány db 1;2;3;4 és 5 lett matematikából! ={GYAKORISÁG(tartomány; csoportosítási tömb)} TÖMBKÉPLET! Képlet beírás befejezése: [CTRL + SHIFT + ENTER]

23 Gyakoriság =Gyakoriság() – FREQUENCY()
Adott adathalmazban melyik érték hányszor szerepel

24 Összefoglalás - Középértékek
Az egyes adatfajtáknál milyen középértékeket alkalmazunk? Nominális Módusz Ordinális Medián Kvantitatív Átlag

25 Szóródás és mérése

26 Mérőszámok Terjedelem Interkvartilis félterjedelem
Átlagos abszolút eltérés Szórás – Szórásnégyzet (Variancia) Relatív szórás (Variációs koefficiens)

27 Függvények az Excelben
= SQ()- átlagtól való eltérések négyzetének összegét adja eredményül =SZÓRÁSP() –STDEVP()- szórás =VARP() – variancia (szórásnégyzet) =ÁTL.ELTÉRÉS – átlagos abszolút eltérés – AVEDEV()

28 Asszimmetria mérése

29

30 Ferdeség mérése =FERDESÉG() – SKEW() =CSÚCSOSSÁG() – KURT()
A ferdeség az eloszlás középérték körüli aszimmetriájának mértékét jelzi. A pozitív ferdeség a pozitív értékek irányába nyúló aszimmetrikus eloszlást jelez, míg a negatív ferdeség a negatív értékek irányában torzított. =CSÚCSOSSÁG() – KURT() Egy adathalmaz csúcsosságát számítja ki. A függvény a normális eloszláshoz viszonyítva egy eloszlás csúcsosságát vagy laposságát adja meg. A pozitív értékek viszonylag csúcsos, a negatív értékek viszonylag lapos eloszlást jelentenek. A FERDESÉG fv kimenete #ZÉRUOSZTÓ, ha az adatok száma 3-nál kisebb, illetve ha a minta szórása 0. A CSÚCSOSSÁG fv kimenete #ZÉRUOSZTÓ, ha az adatok száma 4-nél kisebb, illetve ha a minta normális eloszlása 0-val egyenlő.

31 Számláló - keresőfüggvények
Adatok kezelése Számláló - keresőfüggvények

32 Függvények DARAB () - COUNT() DARAB2() – COUNTA()
a megadott tartomány számmal kitöltött celláinak a számát adja DARAB2() – COUNTA() a megadott tartomány értékkel kitöltött celláinak (nem üres) a számát adja DARABTELI () – COUNTIF () a megadott tartományban megszámolja, hogy hány darab cella felel meg a megadott kritériumnak DARABÜRES () – COUNTBLANK () A megadott tartományban megszámolja hány db cella üres

33 Feladat A megadott adathalmaz egy osztály matematika eredményeit tartalmazza. Határozzuk meg, hogy hány db elégtelen lett! Vizsgáljuk meg, hogy van-e olyan tanuló, akinek nincs beírva az érdemjegy – még nem zárták le? =DARABTELI(tartomány; kritérium) =DARABÜRES(tartomány)

34 Feladat Készítsen kimutatást, hogy hány db 1;2;3;4 és 5 lett matematikából! Hány cellában van adat – azaz hány tanuló kapott már érdemjegyet? =DARABTELI(tartomány; kritérium) =DARAB(tartomány)

35 Idősorok elemzése

36 Trendszámítás - elmélet
Trend: Az időben változó jelenségek alakulásában mindig megfigyelhetünk alapvető tendenciákat (növekedés, csökkenés…stb) Szezonális ingadozás: Rendszeresen visszatérő hullámzás Ciklushatás: fel-le mozgás hatása (konjunktúra - dekonjunktúra) Véletlen hatás: előre nem látható események befolyása

37 Trendszámítás formái Analitikus trendszámítás
Mozgóátlagolású trendszámítás

38 Analitikus trendszámítás
Megfigyelt jelenségek tapasztalatai alapján felírunk egy olyan függvényt, mely az időbeli változás alapirányzatát fejezi ki. Függvénytípusok: Lineáris Exponenciális Parabola Logisztikus (S-alakú)

39 Lineáris függvény felírása
Egy vállalat dolgozóinak létszámváltozását tükröző lineáris függvény felírása, ábrázolása! Függvény egyenlete: Y:létszám – függő változó! X:év – független változó! Y=20,4*x+198,3 LIN.ILL függvényről ={LIN.ILL(létszám;évek;;;)}

40 LIN.ILL függvény Paraméterei: Y értékek X értékek
Konstans: Igaz (b számítása normál módon történik) vagy Hamis (b értéke 0 lesz – ez az alapértelmezett érték) Nulla: IGAZ (kiegészítő elemzések készülnek) vagy HAMIS (nem készülnek kiegészítő elemzések – alapértelmezett érték)

41 LIN.ILL függvény használata
Tömbképletként – Ha csak két adathalmazról van szó X és Y, akkor kettő cellát kijelölve a képlet beírása után CTRL+SHIFT+ENTER leütéssel képezzük a tömbképletet – LÁSD: példa! Ha nem alkalmazunk tömbképletet, akkor a kapott érték az egyenes meredeksége lesz – következő dia! 2 adatsor esetén alkalmazhatjuk a következőképpen is: Meredekség meghatározása: =INDEX(LIN.ILL(y;x);1); Y metszéspont meghatározása: =INDEX(LIN.ILL(y;x);2); Lásd! Következő dia!

42 Példák a LIN.ILL függvény alkalmazására

43 LIN.ILL alkalmazása, ha a nulla értéke IGAZ
Kiegészítő statisztikákat számol ki az EXCEl, ha a nulla értékét IGAZ-ra állítjuk A statisztikákat tömbként adja meg a következő elrendezésben lásd! Következő dia! Ha a tömb elemeinek nagyobb tartományt jelölünk ki a statisztikák számán kívül, akkor a felesleges cellákban a #HIÁNYZIK üzenetet kapjuk!

44 LIN.ILL kiegészítő statisztikái
együtthatók Együtthatók standard hibái Determináns együttható – összehasonlítja a becsült értékeket a tényleges értékekkel – értéke 0 és 1 közötti. Ha 1 akkor jó a becsült érték – azaz jó a lin. Egyenes ha 0, akkor nem jó! shy: az y becslés standard hibája F próba eredményeként kapott érték Df: Szabadságfok Ssreg: regressziós négyzetösszeg (y érték és az y értékek átlaga közötti eltérés négyzete) ssmarad:maradék négyzetösszeg (y becsült érték és a tényleges érték közötti eltérés négyzete) ∑℮2 =∑ (yi-yi^)2 mn mn-1…m1 b shn shn-1 shb r2 shy F Df ssreg ssmarad Az egyenes egyenlete: Y=m1x1+m2x2+…+b vagy y=mx+b

45 LIN.ILL kiegészítő statisztikái
∑℮2 = 43.9 Megjegyzés: ezen érték alapján lehet például eldönteni, hogy az exponenciális vagy a lineáris függvény a jobb! R2=1, azaz a lineáris függvény jól leírja az adatok tendenciáját! Szabadságfok: 5

46 Grafikon rajzolása – trendegyenesek
Rajzoltassunk ki egy grafikont a közölt adatokból! (BeszúrásDiagram) Jelöljük ki a grafikont DiagramTrendvonal felvétele Típus lap: Tetszőleges függvény kiválasztása Egyebek lap: Beállíthatjuk, hogy az egyenlet látszódjon R négyzet értékét is megjeleníthetjük

47 Példa – Trendegyenes kirajzoltatása

48 Lineáris egyenes meredekségének és y tengelymetszetének meghatározása
Külön függvényekkel (természetesen a LIN.ILL is ugyanezt adja eredményül) Meredekség: MEREDEKSÉG(y;x) = m Y tengelymetszet: METSZ(y;x) = b

49 Exponenciális függvény felírása
Egy vállalat dolgozóinak létszámváltozását tükröző exponenciális függvény felírása, ábrázolása! LOG.ILL függvényről ={LOG.ILL(létszám;évek;;;)}

50 LOG. ILL függvény Ugyanazok az alkalmazások igazak erre a függvényre, mint a LIN.ILL-re! Paraméterezésük is azonos

51 Előrejelzés a trendegyenlet alapján
Határozzuk meg a lineáris és exponenciális trend alapján, hogy mennyi lesz a létszám 2001-ben és 2002-ben! TREND(y;x;új_x;konstans) függvénnyel – lineáris NÖV(y;x;új_x;konstans) - exponenciális

52 Melyik egyenlet jellemzi jobban az adatok trendjét?
A trend() alapján kapott érték kevésbé tér el a 220-tól (1994-es érték), mint a növ() alapján kapott érték, ezért azt mondhatjuk, hogy ezt az adatsort a lineáris egyenlet jellemzi jobban! Ugyanaezt a LIN.ill és a LOG.ILL kiegészítő statisztikáival is megállapíthatjuk! Eldönthető a NÖV(y;x) és TREND(y;x) függvényekkel, ha nem adjuk meg a 3. paramétert!

53 3. ANALYSIS TOOLPAK VBA

54 Eszközök menü - Bővítménykezelő

55 Eszközök - Adatelemzés

56 Leíró statisztikák

57 Példa: Adott egy osztály matematikából kapott eredménye.
Számítsuk ki a jellemző középértékeket (átlag, medián, módusz) valamint a szórást!

58 Megoldás Eszközök menü AdatelemzésLeíró statisztika
Leíró statisztika párbeszédpanel

59 Leíró statisztika párbeszédpanel beállításai
Bemeneti tartomány Csoportosítási alap Feliratok az első sorban/oszlopban Várható értékek konfidenciaszintje K-adik legnagyobb K-adik legkisebb Kimeneti tartomány Összesítő statisztika

60 Végeredmény Várható érték = ÁTLAG(tartomány) Medián= MEDIÁN(tartomány)
Módusz= MÓDUSZ (tartomány) Szórás = SZÓRÁS(tartomány) Variancia = VAR(tartomány) Csúcsosság= CSÚCSOSSÁG (tartomány) Ferdeség = FERDESÉG(tartomány) Tartomány = MAX() – MIN() Minimum = MIN(tartomány) Maximum = MAX(tartomány) Összeg = SZUM(tartomány) Darabszám = DARAB(tartomány) Legnagyobb(k)=NAGY(tratomány;k) Legkisebb(k) = KICSI(tartomány;k)

61 Gyakoriság

62 Feladat Az előző feladatban közölt adatokkal dolgozva állapítsuk meg a gyakoriságokat – hány hallgató kapott 1,2,3,4,5 osztályzatot matematikából? Készítsünk diagramot is!

63 Megoldás EszközökAdatelemzés Hisztogram menüpont
Ha a példában látható módon adjuk meg a rekesztartományt, akkor ügyeljünk arra, hogy a Feliratok négyzet legyen bejlölve, ezzel jelezve, hogy az első cella nem számadatot, hanem feliratot tartalmaz – ennek eredményeként a megjelenített táblázat fejlécében nem a Rekesz alapértelmezett szöveg jelenik meg, hanem az, amit mi az első sorban megadtunk!

64 Hisztogram párbeszédablak pontjai
Bementi tartomány - adatok Rekesztartomány – csoportosítási szempont (nem kötelező megadni) Feliratok – ekkor a megadott tartományok első sorát feliratként kezeli! Kimeneti beállítások Eredmény megjelenítésének helye Tartomány - adatokat tartalmazó munkalapon belül Új munkalap Új munkafüzet Paraeto – Rendezett oszlopdiagram felrajzolása – csökkenő sorrendben megjelenítve, kezdve a leggyakoribb adattal Halmozott százalék – kummulált relatív gyakoriság kiszámolása Diagram kimenet – adatok oszlopdiagramban ábrázolása

65 Paraeto

66 Mozgóátlag Alkalmazása: azon idősoroknál, melyek az adatokat rövidebb időszakokra bontva tartalmazzák

67 Példa Adatokat egy oszlopban vagy egy sorban kell elhelyezni!

68 Megoldás


Letölteni ppt "Gazdasági informatika II."

Hasonló előadás


Google Hirdetések