Gazdaságelemzési és Statisztikai Tanszék STATISZTIKA I. 2. Előadás Dr. Balogh Péter egyetemi adjunktus Gazdaságelemzési és Statisztikai Tanszék
ALAPFOGALMAK Statisztikai sokaság: a vizsgálat tárgyát képező egyedek összessége. A sokaság egységei: a sokaság egyedei Az egységek jellegük szerint lehetnek: valóságos egységek: (pl.: állatok, tárgyak, emberek, intézmények) érzékelhető jelenségek mennyiségük egy adott időpontra vonatkoztatható. események: (pl. fénymásolópapír felhasználás) adott időtartam alatt bekövetkezett cselekmények vagy teljesítmény. A sokaság egységeinek mértékegységét mindig meg kell adni.
Adatok pontossága Hibaforrások: Abszolút hibakorlát: A ± a felvételi hibák (definíciós, válaszadási,nem válaszolási, végrehajtási, feldolgozási) mintavételi hibák (minden egység megfigyeléséről való lemondás „ára”) Abszolút hibakorlát: A ± a mért adat abszolút hibakorlát Szignifikáns számjegyek (pontosnak tekinthető számjegyek) Relatív hibakorlát:
Statisztikai alapfogalmak Egyed: a sokaságot alkotó elemek Ismérv: a sokaság egyedeit jellemző tulajdonság Homogenitás: a sokaság egyedei hasonlóak, illetve megegyezők; a sokaság egyöntetű Heterogenitás: a sokaság egyedei eltérőek, a sokaság változékony
A sokaság típusai álló sokaság - mozgó sokaság véges sokaság - végtelen sokaság valóságos sokaság - elméleti sokaság teljes sokaság - minta sokaság fősokaság - részsokaság
Álló vagy állapot sokaság: valóságos egységek alkotják, a sokaság egységeinek egy adott időpontban fennálló állapotát rögzítik (alkalmazottak létszáma). Mozgó sokaság: események alkotják, melyek egy adott időtartam alatt következnek be, (cég árbevételének értéke). Véges sokaság: gyakorlatilag számba vehető. Végtelen sokaság: gyakorlatilag nem vehető számba (búzaszemek).
Valóságos sokaság: ténylegesen meglévő egységekből tevődik össze. Elméleti sokaság: valamely esemény egységei lehetséges értékeinek összessége (a lehetséges minták száma). Teljes sokaság: a körülhatárolt sokaság minden egységét tartalmazza (az összes választópolgár). Minta sokaság: a teljes statisztikai sokaság egységeinek bizonyos szempontok szerint kiválasztott része.
Fősokaság: a sokaság egységei valamely alapvető tulajdonság tekintetében azonosak (adott üzem dolgozói). Rész sokaság: a fősokaságon belül elkülönített tulajdonság változatok (szellemi ill. fizikai dolgozók). A sokaság pontosan legyen körülhatárolva tárgyi, térbeli, időbeli ismérvekkel.
Ismérvek minden olyan szempont vagy kritérium, ami szerint a sokaságot vizsgáljuk Közös ismérv a sokaság valamennyi egyedét jellemzik és ez(ek) alapján tartoznak az egyedek a sokasághoz Megkülönböztető ismérv amelyek alapján az egyedek elkülöníthetők a sokaságon belül (a sokaság egy-egy részhalmazát jellemzik)
Az ismérvek (A sokaság egységeit jellemző tulajdonságok) 1.Tárgyi ismérvek: Minőségi ismérvek: a vizsgált jelenség számszerűen kifejezhetetlen tulajdonságai (nemek szerinti megoszlás) Mennyiségi ismérvek: számszerűsíthető tulajdonságok Folytonos: fizetés Diszkrét: dolgozó létszám
Az ismérvek (folytatás) 2.Térbeli ismérvek: változatai területi egységek (megye, régió, állam, körzet) 3. Időbeli ismérvek: változatai lehetnek időpontok, v. időtartamok. A sokaság egységeit időbeli alakulásának alapján különíti el. 4. Alternatív ismérvek: csak két változattal rendelkező ismérvek (férfi, nő)
MÉRÉSI SKÁLÁK Névleges (nominális): kódszám (pl: férfi: 1, nő: 0) Sorrendi (ordinális): iskolai végzettség Különbségi (intervallum): hőmérséklet Arány: termelés, fogyasztás
Ismérvek és mérési skálák kapcsolódása
A statisztika adat Empirikus, tapasztalati szám, amely mérés, megfigyelés vagy számlálás alapján keletkezik és elszakíthatatlan a társadalmi, gazdasági tartalmától. Lehetnek abszolút számok leszármaztatott számok
Mutatószám A rendszeresen ismétlődő jelenségeket jellemző statisztikai – általában leszármaztatott – adat. A statisztikai mutatószámok a valóság valamely mozzanatának modelljeként is felfoghatók. A – vizsgálat céljától függően – csak a valóság valamely lényegesnek tartott vonását jellemzik.
STATISZTIKAI ALAPMŰVELETEK 1. A sokaság nagyságának megállapítása véges: diszkrét - számlálás folytonos - mérés végtelen: - 2. Összehasonlítás: több sokaság jellemzői (különbség, hányados) 3. Osztályozás (csoportosítás): egy ismérv szerint több ismérv szerint
EGYSZERŰ ELEMZÉSEK Statisztikai sor Statisztikai tábla Viszonyszámok Grafikus ábrázolás
Statisztikai sorok Meghatározott szempontok szerint kiválasztott két vagy több logikailag összetartozó statisztikai adat, statisztikai sort képez. általában csoportosítás útján jönnek létre, képezhetők abszolút és származtatott számokból, valódi sorok: mennyiségi, minőségi, területi, idősor nem valódi: leíró sor
A csoportosító sor általános sémája Ci ismérv-változat vagy kategória fi gyakoriság N a sokaság nagysága
Minőségi sorok: a sokaság olyan tárgyi ismérv szerinti megoszlását mutatják, amelyek változatai csak fogalmilag vannak meghatározva (az alkalmazottak végzettség szerinti megoszlása). Mennyiségi sorok: a sokaság olyan tárgyi ismérv szerinti megoszlását mutatják, amelyek változatait számszerűen fejezzük ki.
Nagyszámú ismérvérték esetén az összes lehetséges ismérv értékeket nem tüntetjük fel, hanem csoportközökre bontjuk. Egyenlő Egyenlőtlen
Alkalmazottak száma (fő) Két típusa van: 2.1.Gyakorisági sor: azt mutatja meg, hogy a mennyiségi ismérvek egyes értékközeibe tartozó egységek száma, gyakorisága mennyi (a vállalat alkalmazotti létszámának fizetés szerinti megoszlása). Kereset (ezer Ft/fő) Alkalmazottak száma (fő) 51 – 60 61 – 70 71 – 80 81 – 90 91 – 100 101 – 110 11 26 18 41 37 52 Összesen: 185
Összes kifizetett bér (millió Ft) 2.2.Értékösszeg sor: megmutatja, hogy a mennyiségi ismérv értékeinek egyes csoportjába tartozó egységek által képviselt értékek összege mekkora (a dolgozók bérszínvonal szerinti bértömegének alakulása). Kereset (ezer Ft/fő) Összes kifizetett bér (millió Ft) 51 – 60 61 – 70 71 – 80 81 – 90 91 – 100 101 – 110 0,605 1,690 1,350 3,485 3,515 5,460 Összesen: 16,105
A gyakorisági sor és az értékösszeg sor egymásból kiszámítható A gyakorisági sor és az értékösszeg sor egymásból kiszámítható! 11 x 55 = 605 26 x 65 = 1.690
Területi sorok: valamely statisztikai sokaság területi megoszlását tünteti fel (gépjárműállomány megyék szerinti megoszlása). Idősorok: a sokaság alakulását az idő függvényében, időbeli változásában, mozgásában ábrázolják.
Idősorok: Állapot idősor: az egyes időpontok adatait tüntetik fel. Állósokaság időbeli alakulását mutatják (Magyarország népességének alakulása az 1990-2004 években Magyarországon (január 01. állapot). Tartam idősor: időtartamok alatt beállott változásokat tüntetnek fel. Mozgósokaság időbeli alakulását mutatják (egy vállalkozás árbevételének alakulása 2000-2005-ben).
Leíró sorok: ugyanazon gazdasági, társadalmi vagy politikai egység különböző jellegű, többoldalú, különböző tulajdonságok szerinti felsorolásszerű jellemzését adják (Hajdú-Bihar megye fontosabb adatai 2004-ben).
A statisztikai sorok jellegzetességei Minőségi sor Gyakorisági sor Értékösszeg sor Területi sor Tartam idősor Állapot idősor Leíró sor A statisztikai sorok a leíró sort kivéve egyneműek. általában csoportosítás útján jönnek létre létrejöhetnek csoportosítás útján vagy anélkül soha nem csoportosítás útján jön létre és nem adhatók össze
Statisztikai táblák Egymás mellé vagy alá írt statisztikai sorok statisztikai táblát képeznek Részei: magyarázó mező táblamező Tábla típusai: Dimenzió szerint: 1 vagy 2 Rendeltetés szerint: gyűjtő, feldolgozási, közlési Csoportosítás szerepe a tábla elkészítésében: Egyszerű statisztikai tábla: - ha csoportosítást nem tartalmaz Csoportosító tábla: - egy ismérv szerinti csoportosítást tartalmaz Kombinációs tábla: - két vagy több ismérv szerint csoportosítást tartalmaznak
A helyes táblaszerkesztés követelményei: könnyen áttekinthető legyen, címe világos és kifejező legyen, a sorok és oszlopok megnevezése pontosan fejezze ki azok tartalmát, az adatok mértékegységét fel kell tüntetni a táblamező minden rovatát ki kell tölteni,
Jelölések: észlelést nem tudunk végezni (-), az adat nem áll rendelkezésünkre (…), adatunk nagyon kicsi (0,0), ha az adat előzetes becslés eredménye (+), adatunk a tábla többi adatának minőségétől, vagy a tömb egyöntetű értelmezésétől eltér (* és lábjegyzet), ha az adat nem saját megfigyelésünkből ered, a forrást a tábla alján megjelöljük.