Dr. Balogh Péter Gazdaságelemzési és Statisztika Tanszék DE-AMTC-GVK

Slides:



Advertisements
Hasonló előadás
Összetett kísérleti tervek és kiértékelésük:
Advertisements

Események formális leírása, műveletek
I. előadás.
Statisztika II. I. Dr. Szalka Éva, Ph.D..
ÁVF Leíró statisztika Statisztikai alapismeretek 1.
Kvantitatív Módszerek
Erőállóképesség mérése Találjanak teszteket az irodalomban
Idegenforgalmi statisztika
Statisztika I. VI. Dr. Szalka Éva, Ph.D..
Az előadásokon oldandók meg. (Szimulációs modell is tartozik hozzájuk)
Leíró statisztika 1.Bevezetés
Humánkineziológia szak
A statisztika alapjai - Bevezetés az SPSS-be -
3. Két független minta összehasonlítása
Műveletek logaritmussal
Gazdaságelemzési és Statisztikai Tanszék
A tételek eljuttatása az iskolákba
MI 2003/ Alakfelismerés - még egy megközelítés: még kevesebbet tudunk. Csak a mintánk adott, de címkék nélkül. Csoportosítás (klaszterezés, clustering).
Mérési pontosság (hőmérő)
Gazdaságelemzési és Statisztikai Tanszék
Gazdaságelemzési és Statisztikai Tanszék
Gazdaságelemzési és Statisztikai Tanszék
Dr. Szalka Éva, Ph.D.1 Statisztika II. VII.. Dr. Szalka Éva, Ph.D.2 Mintavétel Mintavétel célja: következtetést levonni a –sokaságra vonatkozóan Mintavétel.
Előadó: Prof. Dr. Besenyei Lajos
Mintavételes eljárások
ADATBÁZISOK
Az élővilág kutatásának matematikai, statisztikai eszköztára
Regresszióanalízis 10. gyakorlat.
Lineáris egyenletrendszerek (Az evolúciótól a megoldáshalmaz szerkezetéig) dr. Szalkai István Pannon Egyetem, Veszprém /' /
Vámossy Zoltán 2004 (H. Niemann: Pattern Analysis and Understanding, Springer, 1990) DIP + CV Bevezető II.
Matematikai alapok és valószínűségszámítás
szakmérnök hallgatók számára
2. A KVANTUMMECHANIKA AXIÓMÁI 1. Erwin Schrödinger: Quantisierung als Eigenwertproblem (1926) 2.
Térkép. Mi az adat? Minden információ, amit tárolni kell. Minden információ, amit tárolni kell.  szám  szöveg  dátum  hang  kép, stb.
Dr. Balogh Péter Gazdaságelemzési és Statisztika Tanszék DE-AMTC-GVK
Dr. Balogh Péter Gazdaságelemzési és Statisztika Tanszék DE-AMTC-GVK
Dr. Balogh Péter Gazdaságelemzési és Statisztika Tanszék DE-AMTC-GVK
Dr. Balogh Péter Gazdaságelemzési és Statisztika Tanszék DE-AMTC-GVK
Dr. Balogh Péter Gazdaságelemzési és Statisztika Tanszék DE-AMTC-GVK
Dr. Balogh Péter Gazdaságelemzési és Statisztika Tanszék DE-AMTC-GVK
Dr. Balogh Péter Gazdaságelemzési és Statisztika Tanszék DE-AMTC-GVK
Dr. Balogh Péter Gazdaságelemzési és Statisztika Tanszék DE-AMTC-GVK
Statisztika.
Gazdaságstatisztika Bevezetés szeptember 11.
RÉSZEKRE BONTOTT SOKASÁG VIZSGÁLATA
Többváltozós adatelemzés
Alapsokaság (populáció)
Alapfogalmak.
Két kvantitatív változó kapcsolatának vizsgálata
IV. Terjeszkedés.
A klinikai transzfúziós tevékenység Ápolás szakmai ellenőrzése
DEMOGRÁFIA Alapfogalmak, mutatók
Paleobiológiai módszerek és modellek 4. hét
I. előadás.
1. Melyik jármű haladhat tovább elsőként az ábrán látható forgalmi helyzetben? a) A "V" jelű villamos. b) Az "M" jelű munkagép. c) Az "R" jelű rendőrségi.
A kombinációs táblák (sztochasztikus kapcsolatok) elemzése
Kvantitatív módszerek
Statisztika 12.A és 13.N. A statisztika fogalma A statisztika tömegesen előforduló jelenségek egyedeire vonatkozó információk, adatok gyűjtése, feldolgozása,
Valószínűségszámítás II.
3. hét Asszociáció.
Statisztikai táblák.
 A matematikai statisztika a természet és társadalom tömeges jelenségeit tanulmányozza.  Azokat a jelenségeket, amelyek egyszerre nagyszámú azonos tipusú.
2. előadás Gyakorisági sorok
Oszlopdiagram dr. Jeney László egyetemi adjunktus
2. előadás Viszonyszámok
Dr. Varga Beatrix egyetemi docens
2. előadás Gyakorisági sorok, Grafikus ábrázolás
Rangsoroláson és pontozáson alapuló komplex mutatók
2. előadás Viszonyszámok típusai
Mérési skálák, adatsorok típusai
Előadás másolata:

Dr. Balogh Péter Gazdaságelemzési és Statisztika Tanszék DE-AMTC-GVK 2. Dr. Balogh Péter Gazdaságelemzési és Statisztika Tanszék DE-AMTC-GVK

A statisztikai vizsgálatok feltételei A valóságban megfigyelhető jelenségek számokkal kifejezhetők legyenek. A megfigyelési egységek jól körülhatárolhatók legyenek. A mérési eljárások pontosan definiáltak és a vizsgálati célnak megfelelőek legyenek.

Statisztikai alapfogalmak A sokaság (populáció) a statisztikában mindazon egyedek összességét (halmazát) jelenti, amelyekre statisztikai megfigyelés irányul. A sokaság egyedeinek mind közös, mind különböző tulajdonságokkal rendelkezniük kell, mert ez teszi lehetővé statisztikai célokra való csoportosításukat.

Statisztikai alapfogalmak II. Egyed: a sokaságot alkotó elemek Ismérv: a sokaság egyedeit jellemző tulajdonság Homogenitás: a sokaság egyedei hasonlóak, illetve megegyezőek; a sokaság egyöntetű Heterogenitás: a sokaság egyedei eltérőek, a sokaság változékony

A sokaságot alkotó egységek Valóságos egységek a számbavétel során valóságosan léteznek – mérhetők, megszámolhatók Nem valóságos egységek ezek olyan események, amelyek egy időtartam alatt bekövetkezett változást tükröznek

A statisztikai sokaság típusai Álló sokaság mindig valamilyen állapotot fejez ki valóságos egységek alkotják egy adott időpontra vonatkozik Mozgó sokaság egy folyamatot, történést mutat be nem valóságos egységek alkotják Egy időtartamra vonatkozik

A statisztikai sokaság további típusai Véges sokaság gyakorlatilag számba vehető Végtelen sokaság gyakorlatilag nem vehető számba (búzaszemek) Teljes sokaság a körülhatárolt sokaság minden egységét tartalmazza (az összes választópolgár) Minta sokaság a teljes statisztikai sokaság egységeinek bizonyos szempontok szerint kiválasztott része

A statisztikai sokaság további típusai Fősokaság a sokaság egységei valamely alapvető tulajdonság tekintetében azonosak (adott üzem dolgozói) Részsokaság a fősokaságon belül elkülönített tulajdonság változatok (szellemi ill. fizikai dolgozók)

Ismérvek a sokaság valamennyi egyedét jellemzik Közös ismérv minden olyan szempont vagy kritérium, ami szerint a sokaságot vizsgáljuk Közös ismérv a sokaság valamennyi egyedét jellemzik és ez(ek) alapján tartoznak az egyedek a sokasághoz Megkülönböztető ismérv amelyek alapján az egyedek elkülöníthetők a sokaságon belül (a sokaság egy-egy részhalmazát jellemzik)

Ismérvek (2) Alternatív ismérv Tárgyi ismérvek Térbeli ismérv csak két ismérvváltozata létezik Tárgyi ismérvek Mennyiségi ismérv Folytonos (mérhető) ismérv Diszkrét (számlálható) ismérv Minőségi ismérv Térbeli ismérv Időbeli ismérv

Ezek nem fejezhetők ki mennyiségekként, inkább kategóriák: Az adatok A mintabeli egyedekről a vizsgálat során adatokat gyűjtünk. Két fő adattípust különböztetünk meg: Kvalitatív adatok: Ezek nem fejezhetők ki mennyiségekként, inkább kategóriák: gépjármű típusa, vallási felekezet, vállalkozás formája, szem színe, pártállás

Ezek valamilyen mérés eredményei (mennyiségek). Kvantitatív adatok: Ezek valamilyen mérés eredményei (mennyiségek). árbevétel, alapterület, hengerűrtartalom, létszám, fizetés…..

A kvantitatív adatok kétfélék lehetnek: 1.) Folytonosak (a mérési skála egy intervallum) hőmérséklet lehullt csapadékmennyiség egy adott napon

(a mérhető értékek a számegyenes izolált pontjai) A kvantitatív adatok kétfélék lehetnek: 2.) Diszkrétek (a mérhető értékek a számegyenes izolált pontjai) a foglalkoztatottak létszáma, a vállalat gépjárműveinek száma

Az adatok másik csoportosítási lehetősége: 1. Forrásadat 2. Származtatott adat 3. Hiányzó adat 4. Becsült adat

Forrás adat Az adatgyűjtésből, felmérésből, mérésből származó adat. Ezeket az adatokat a rendelkezésre álló adatokból függvénykapcsolatok segítségével nem lehet előállítani. Például: név, születési dátum, stb…

Származtatott adat Az azonos esethez tartozó több más változó komponensekből számoljuk ki valamilyen algoritmussal. Például: a kezdő és a jelenlegi fizetésből a fizetésnövekedés számolható ki.

Hiányzó adat Akkor keletkezhet, ha nem áll rendelkezésünkre forrásadat, vagy származtatott adat (például a nullával való osztás, vagy negatív számból való négyzetgyökvonás miatt nem képezhető). Az adathiányt jelöljük a következő speciális karakterrel: „ , ”. Például a kartonról nem jól olvasható egy dolgozó születési dátuma, vagy a dolgozó egyszerűen megtagadta az adat közlését, például nemzetiség esetén.

Becsült adat Akkor keletkezik, ha a változó többi adatából valamilyen statisztikai eljárással a hiányzó adatot kipótoljuk. Lehet ez a többi adat átlaga, vagy a többi adat eloszlásának megfelelő véletlenszerű generálás eredménye. Például ha egy dolgozónál hiányzik a „kezdő fizetés” adata, akkor az azonos korú, azonos iskolai végzettségű és hasonló beosztású dolgozók kezdő fizetésének átlagaiból becsülhetjük.

Adatszerzési módok

Mérési skálák Nominális (kategoriális) mérési szint a legegyszerűbb és a legkevésbé informatív mérési skála. Ebben az esetben az adat csupán az eset azonosítására, vagy valamilyen kategóriához tartozás azonosítására szolgál (pl. növényevő ill. húsevő állatok). A változók értékei kategóriákba vannak sorolva, közöttük nem feltétlenül van bármilyen viszony. Például: név, törzsszám, nemzetiség, nem, családi állapot...

Mérési skálák Ordinális (sorrendi) mérési szint esetén a skálaértékek egyezősége vagy különbözősége mellett az értékek sorrendiségét is figyelembe vehetjük. Ordinális az adat, ha az adatok között erős sorrend azaz rendezettség létesíthető. Azaz, ha bármely két adat közül meg tudjuk mondani, hogy ők egyenlők, vagy valamelyik nagyobb. Például az iskolai végzettség, vagy skálák: nagyon nem tetszik, nem tetszik,….

Mérési skálák Intervallum (különbségi) az adat, ha rendezett, és értékkészlet egy intervallum, de nincsen origó, vagyis az adatok viszonylagosak. Például a fizetésnövekedés adat %-ban kifejezve ilyen, hiszen egy 10%-os fizetésemelés egy alacsony fizetésű dolgozónál kisebb lehet, mint egy 1%-os fizetésemelés egy kiemelt fizetéssel rendelkező dolgozónál. További példa: IQ, hőmérséklet…

Mérési skálák Arányskála (abszolút skála): a legtöbb információt adja. Arány az adat, ha valós számérték és ismert az origó, a viszonyítási alap. Például a kezdő- és jelenlegi fizetés, testsúly.

4. Reggel és este mért vérnyomás Nominális Példa: 2. Név Nominális Nem Ordinális 3. Legmagasabb iskolai végzettség Arány 4. Reggel és este mért vérnyomás 5. Kezdő és jelenlegi fizetés Intervallum Nominális 6. Tájegység 7. Saját terület (ha) A r á n y 8. Földkategória Arány Ordinális 9. Erőgépek száma

Ismérvek és mérési skálák kapcsolódása

A statisztikai adat Empirikus, tapasztalati szám, amely mérés, megfigyelés vagy számlálás alapján keletkezik és elszakíthatatlan a társadalmi, gazdasági tartalmától. Lehetnek abszolút számok leszármaztatott számok

Mutatószám A rendszeresen ismétlődő jelenségeket jellemző statisztikai - általában leszármaztatott – adat. A statisztikai mutatószámok a valóság valamely mozzanatának modelljeként is felfoghatók. A – vizsgálat céljától függően – csak a valóság valamely lényegesnek tartott vonását jellemzik.

Statisztikai sorok A statisztikai adatok valamilyen szempont szerinti felsorolása, rendezett halmaza. Keletkezhetnek azonos típusú adatokból idősor területi sor minőségi sor mennyiségi sor különböző típusú adatokból leíró sor

Statisztikai sorok alaptípusai Csoportosító a fősokaság és a részsokaságok nagyságát adják meg (összesen sorok) Összehasonlító a sor tagjainak egymás közötti összehasonlítása az elsődleges cél (általában nem összegezhetők) Leíró adatai különböző fajta, legtöbbször különböző mértékegységben megadott adatok, amelyek mindegyike egy meghatározott jelenségre, társadalmi vagy gazdasági egységre vonatkozik (Hajdú-Bihar megye fontosabb adatai 2004-ben).

A csoportosító sor általános sémája Ci ismérv-változat vagy kategória fi gyakoriság N a sokaság nagysága

A statisztikai sorok jellegzetességei Minőségi sor Gyakorisági sor Értékösszeg sor Területi sor Tartam idősor Állapot idősor Leíró sor A statisztikai sorok a leíró sort kivéve egyneműek. általában csoportosítás útján jönnek létre létrejöhetnek csoportosítás útján vagy anélkül soha nem csoportosítás útján jön létre és nem adhatók össze

Statisztikai sorok (2) Minőségi sor: a sokaság olyan tárgyi ismérv szerinti megoszlását mutatja, amelyek változatai csak fogalmilag vannak meghatározva (pl.:az alkalmazottak végzettség szerinti megoszlása). Mennyiségi sorok: a sokaság olyan tárgyi ismérv szerinti megoszlását mutatják, amelyek változatait számszerűen fejezzük ki. nagy mennyiségű adat esetén gyakorisági sorok értékösszeg sorok

Alkalmazottak száma (fő) 2.1.Gyakorisági sor: azt mutatja meg, hogy a mennyiségi ismérvek egyes értékközeibe tartozó egységek száma, gyakorisága mennyi (a vállalat alkalmazotti létszámának fizetés szerinti megoszlása). Kereset (ezer Ft/fő) Alkalmazottak száma (fő) 51 – 60 61 – 70 71 – 80 81 – 90 91 – 100 101 – 110 11 26 18 41 37 52 Összesen: 185

Összes kifizetett bér (millió Ft) 2.2.Értékösszeg sor: megmutatja, hogy a mennyiségi ismérv értékeinek egyes csoportjába tartozó egységek által képviselt értékek összege mekkora (a dolgozók bérszínvonal szerinti bértömegének alakulása). Kereset (ezer Ft/fő) Összes kifizetett bér (millió Ft) 51 – 60 61 – 70 71 – 80 81 – 90 91 – 100 101 – 110 0,605 1,690 1,350 3,485 3,515 5,460 Összesen: 16,105

A gyakorisági sor és az értékösszeg sor egymásból kiszámítható A gyakorisági sor és az értékösszeg sor egymásból kiszámítható! 11 x 55 = 605 26 x 65 = 1.690

Statisztikai sorok (3) Területi sorok: valamely statisztikai sokaság területi megoszlását tünteti fel (gépjárműállomány megyék szerinti megoszlása). Idősorok: a sokaság alakulását az idő függvényében, időbeli változásában, mozgásában ábrázolják. állapot idősor tartam idősor

Statisztikai táblák a statisztikai sorok összefüggő rendszere a statisztikai adatok feldolgozásának, elemzésének és közlésének, valamint szemléltetésének eszközei Részei: magyarázó mező táblamező Típusai: Dimenzió szerint: 1 vagy 2 Rendeltetés szerint: gyűjtő, feldolgozási, közlési Csoportosítás szerepe a tábla elkészítésében: Egyszerű statisztikai tábla: - ha csoportosítást nem tartalmaz Csoportosító tábla: - egy ismérv szerinti csoportosítást tartalmaz Kombinációs tábla: - két vagy több ismérv szerint csoportosítást tartalmaznak

A helyes táblaszerkesztés követelményei könnyen áttekinthető legyen, címe világos és kifejező legyen, a sorok és oszlopok megnevezése pontosan fejezze ki azok tartalmát, az adatok mértékegységét fel kell tüntetni a táblamező minden rovatát ki kell tölteni,

A statisztikai tábla jelölései észlelést nem tudunk végezni (-), az adat nem áll rendelkezésünkre (…), adatunk nagyon kicsi (0,0), ha az adat előzetes becslés eredménye (+), adatunk a tábla többi adatának minőségétől, vagy a tömb egyöntetű értelmezésétől eltér (* és lábjegyzet), ha az adat nem saját megfigyelésünkből ered, a forrást a tábla alján megjelöljük.