Statisztikai paradoxonok

Slides:



Advertisements
Hasonló előadás
I. előadás.
Advertisements

Másodfokú egyenlőtlenségek
FIATALOK AKTIVITÁSA KÖZÖSSÉGFORMÁLÓ TEVÉKENYSÉGEKBEN
Statisztika II. I. Dr. Szalka Éva, Ph.D..
A normalizálás az adatbázis-tervezés egyik módszere
Matematika a filozófiában
Tárki Európai társadalmi jelentés fejezet Állam és piac Janky Béla.
11 Az interakció azokat a folyamatokat foglalja magában, amelyekben minden résztvevő kész arra, hogy megváltozzon és ennek a beállítottságnak az alapján.
Gazdaságelemzési és Statisztikai Tanszék
Matematika II. 2. előadás Geodézia szakmérnöki szak 2012/2013. tanév Műszaki térinformatika ágazat őszi félév.
Statisztika feladatok Informatikai Tudományok Doktori Iskola.
Két változó közötti összefüggés
Statisztika Érettségi feladatok
1 A magyar gazdaság helyzete, perspektívái 2008 tavaszán Dr. Papanek Gábor Előadás Egerben május 7.-én.
Dr. Szalka Éva, Ph.D.1 Statisztika II. VII.. Dr. Szalka Éva, Ph.D.2 Mintavétel Mintavétel célja: következtetést levonni a –sokaságra vonatkozóan Mintavétel.
Helyzetfelmérés Helyzetfelmérés elemzése, értékelése
A társadalomtudományi kutatás módszerei
A lineáris függvény NULLAHELYE
Kelet- és közép-európai tudománytörténeti vázlat Horváth Gyula _______________________________ Magyar Regionális Tudományi Társaság 11. vándorgyűlése Győr,
A PEDAGÓGIAI KUTATÁS Dr. Molnár Béla Ph.D.. 1. PEDAGÓGIAI KUTATÁS CÉLJA, TÁRGYA Célja, hogy az új ismeretek feltárásával, pontosabbá tételével, elmélyítésével.
III. Sz. Belgyógyászati Klinika
Hipotézisvizsgálat (1. rész) Kontingencia táblák
KÉT FÜGGETLEN, ILL. KÉT ÖSSZETARTOZÓ CSOPORT ÖSZEHASONLÍTÁSA
Hozzászólás Hermann Zoltán: Az iskolatípus hatása a tanulói teljesítményekre Lovász Anna Szirák november 9.
Alapfogalmak Alapsokaság, valamilyen véletlen tömegjelenség.
Matematikai alapok és valószínűségszámítás
Egytényezős variancia-analízis
A hazai és a nemzetközi hadtudományi kutatások műhelyei, főbb képviselői, a legfontosabb hadtudományi kutatási témák GŐCZE ISTVÁN ZMNE, Gőcze.
2. Argumentációs szabályok (É 50−55) argumentációs szabályok meghatározzák, hogy mi mellett és mivel kell érvelni 1. a feleknek érveléssel indokolniuk.
A tudás értéke Nyelvtudás, közgazdasági és természettudományos tájékozottság Európában Lannert Judit.
Statisztika.
LB értékelési módszerek, technikák MAB Budapest, 2007 január 17. Topár József.
Gazdaságstatisztika Bevezetés szeptember 11.
Alapsokaság (populáció)
Alapfogalmak.
Adatleírás.

Diszkrét változók vizsgálata
A statisztika problémaköre és alapfogalmai
© Farkas György : Méréstechnika
11. tétel Adatbázis táblái közti kapcsolatok optimalizálása
HALLGATÓI ELÉGEDETTSÉGI VIZSGÁLATOK A WJLF-EN A es tanév eredményei.
Paradigmák mentén tudomány = kvantifikálhatóság? Minden mérhető?
Tízből négy férfit zavarna, ha női főnöke lenne
Az ősi tudomány Geodézia Készítette: Jakab Csaba Lóránd.
Amit a magyar adatok mutatnak.  BAKTAY ERVIN „ez az ismeretrendszer csak akkor válhat ismét komoly értékké, ha a tudomány nyilvánosságának napfényében.
I. előadás.
Dunaújváros2014. szeptember 15. Projekt eredményeinek disszeminációja – 9. fejlesztési elem ÁROP- 1.A „Szervezetfejlesztés a konvergencia régióban.
Egyenes vonalú mozgások
A statisztika eredete és története
 A matematikai statisztika a természet és társadalom tömeges jelenségeit tanulmányozza.  Azokat a jelenségeket, amelyek egyszerre nagyszámú azonos tipusú.
Korreláció-számítás.
Kapcsolat vizsgálat II: kontingencia táblák jelentősége és használata az epidemiológiában, diagnosztikában: RR, OR. Dr. Prohászka Zoltán Az MTA doktora.
Bevezetés, tippek Ea-gyak kapcsolata Statisztika II -más tárgyak kapcsolata Hogyan tanulj? Interaktív órák, kérdezz, ha valami nem világos! tananyag =előadások.
Csík Orsolya, Horváth László TÁMOP X. Pedagógiai Értékelési Konferencia Szeged április Kompetencia- és tanulási eredmények alapú képzési.
A Föld lakosságszámát meghatározó tényezők I. A természetes szaporodás
Eredetileg a statisztika matematikai eszközöket igénybe vevő államháztartástant jelentett, vagyis azon módszerek gyűjteményét és elméletét, amelyek segítségével.
Kiváltott agyi jelek informatikai feldolgozása 2016
IV. Demográfia Halandóság
Statisztika Érettségi feladatok
Statisztikai paradoxonok
Lineáris egyenletrendszerek
I. Előadás bgk. uni-obuda
Dr. Felvinczi Katalin Nemzeti Drogmegelőzési Intézet
A matematikai statisztika alapfogalmai
EGYENES ARÁNYOSSÁGGAL
Statisztika Érettségi feladatok
A lineáris függvény NULLAHELYE
2-3-fák A 2-3-fa egy gyökeres fa az alábbi tulajdonságokkal:
2. Regresszióanalízis Korreláció analízis: milyen irányú, milyen erős összefüggés van két változó között. Regresszióanalízis: kvantitatív kapcsolat meghatározása.
Előadás másolata:

Statisztikai paradoxonok Matematikai statisztika

Adatbányászat vs Statisztika Valamely vizsgált populációra vonatkozólag nagymennyiségű, kontrollálatlan adathalmazból számítógépes adatkezelő technikákkal, algoritmusokkal a populációra vonatkozó hasznos információ, összefüggés kinyerése. Az adatok begyűjtése spontán, többnyire véletlen folyamatok eredményeképpen, nem tervezett módon történik. Megjelenése az informatikai világ kiteljesedése következtében történt meg. Modern tudományág. Az elméleti megalapozás napjainkban folyik.

Adatbányászat vs Statisztika A vizsgált populációra vonatkozólag előre megtervezett módon, matematikai elvek figyelembe vételével beszerzett adatokkal, a minta feldolgozásával állítja elő a sokaságra vonatkozó hasznos következtetéseket. A statisztikai mintának reprezentatívnak kell lennie, különben a következtetések pontatlanok, megtévesztők lesznek! A valószínűségszámítással párhuzamosan fejlődött ki, erős matematikai elméleti háttérrel rendelkezik.

A statisztika eredete A statisztika eredetileg államszámtan volt. (Maga a „statisztika” szó is az „állam” jelentésű latin „status”-ból alakult ki.) A statisztika az ókortól kezdve arról tájékoztatta az államok vezetőit, mekkora adókat vethetnek ki alattvalóikra és hány katonára számíthatnak egy eljövendő háborúban. A statisztika csak a polgári forradalmak után vált igazi tudománnyá. Úttörői JOHN GRAUNT (1620—1674) és WILLIAM PETTY (1623—1687). A kapitalizmusban már nemcsak az államok vezetőit, hanem a tőkés vállalkozókat is érdekelni kezdték a statisztikai felmérések, és egyre komolyabb matematikai eszközöket használtak föl adataik feldolgozására, egyre növekvő haszonnal, például a biztosításban. A jó biztosítás alapja a pontos felmérés és a helyes matematikai következtetés. A XVII. század óta a matematikai statisztika fokozatosan a matematika önálló ágává fejlődött, amelynek fő célja: minél megbízhatóbb hasznosítható információt nyerni a felmérési, megfigyelési és mérési adatokból: a statisztikai mintából. Székely J. Gábor „Paradoxonok a véletlen matematikájában”

Statisztika bonmotok „Csak abban a statisztikában hiszek, amit én magam hamisítok” „A statisztika olyan, mint a bikini: sok minden megmutat, de a lényeget eltakarja. ” W. Churchill „Az éhezőket nem lehet statisztikával táplálni” Lloyd George „Kis hazugság, nagy hazugság, statisztika!” Benjamin Disraeli "A statisztika nem ad választ minden tudásra." „Az élet voltaképp nem más, mint a halál statisztikai hibája.” „Nagy barátja vagyok a statisztikának; nem mintha azt hinném, hogy az csakugyan annyit bizonyít, mint sokan felteszik, hanem azért, mert mióta minden állításnak statisztikai adatokkal való támogatása divattá vált, a hamis tételek felállítása valamivel több nehézséggel jár, s a tudományos paradoxonok alkotói badarságaikat legalább jobb rendszerben adják elő.” Eötvös József

Politikusok TV vitája Egy kívülálló nehezen tudja átlátni az igazságot…

Fátvágás átvágás… Egy erdőgazdaság elhatározza, hogy az erdőből fenyőfákat vágnak ki. A környezetvédelmi tiltakozások hatására a gazdaság vezetője igyekszik megnyugtatni az érdekelteket: az erdő 99%-a fenyőfákból áll, a favágás után pedig az erdő 98%-a még mindig fenyő lesz. Az erdő hány százalékát akarják kivágni?

Fátvágás átvágás… fenyőfa+egyébfa=n n×0.99+n×0.01=n Hogy alakul a képlet, ha a fák felét kivágják? n/2×0.98+n/2×0.02=n×0.5 Tehát, ha az erdő felét kivágják, megmaradhat a beígért fenyőfa arány…

Politikusi magyarázat Egy politikai rendezvényre 140 ember jött el. Az alábbi táblázat a résztvevők életkorát mutatja be nagyság szerint rendezve: 15 16 17 18 19 20 21 22 23 24 25 26 27 28 30 32 33 35 37 38 39 40 41 42 43 44 45 46 47 48 49 50 52 53 54 56 57 58 59 60 61 64 65 67 68 69 Próbáljuk megmutatni - alkalmas grafikonválasztással, a tényeket szigorúan megőrizve - hogy: a) "A fiatalok nem érdeklődnek a politika iránt." b) "Mindenekelőtt a fiatalokat érdekli a politika." c) "A középkorúakat érdekli legkevésbé a politika."

A pofonegyszerű megoldások a) "A fiatalok nem érdeklődnek a politika iránt." Négy korcsoportra osztjuk a résztvevőket: I: 15 - 19 év közöttiek: számuk 20 fő; II: 20 - 29 év közöttiek: számuk 29 fő; III: 30 - 44 év közöttiek: számuk 41 fő; IV: 45 - 69 év közöttiek: számuk 50 fő. Ábrázoljuk pl. oszlopdiagrammal az egyes korcsoporthoz tartozó résztvevők számát! A kapott grafikon jellege: Jól látható, hogy a fiatalokat reprezentáló oszlop a legkisebb…

A pofonegyszerű megoldások b) "Mindenekelőtt a fiatalokat érdekli a politika." Vegyük figyelembe az egyes korcsoportok időbeli szélességét, legyen pl. ezzel arányos az oszlopdiagramok szélessége! Ekkor az (életkor intervallum)/(szavazók száma) értéket ábrázolhatjuk korcsoportonként. A fiatalokat reprezentáló oszlop a legmagasabb…

A pofonegyszerű megoldások c) "A középkorúakat érdekli legkevésbé a politika." Legyen a három korcsoport pl. az alábbi, ekkor az a) grafikon módosul. I: 15 - 24 év közöttiek: számuk 40 fő; II: 25 - 39 év közöttiek: számuk 20 fő; III: 40 - 69 év közöttiek: számuk 80 fő. Most a középkorúakat reprezentáló oszlop a legalacsonyabb…

Mi az igazság? Vizsgáljuk meg az alábbi táblázatot, mely a résztvevők számát mutatja a település kormegoszlása tükrében. Ebből a táblázatból úgy tűnik, hogy minden korosztály egyformán érdeklődik a politika iránt.

Hatásos vagy nem hatásos? Egy új gyógyszerrel kísérleteznek. Az eredményeket az alábbi táblázat tartalmazza: A kezelés a férfiak körében sikeres volt: a kezelt férfiak 46,7%-a gyógyult meg, míg a nem kezeltek között ez az arány 38,1%. A kezelés a nők körében is sikeres volt: a két arányszám 68,2% és 58,8%. Ami viszont megdöbbentő: ha az adatokat összesítjük, kiderül, hogy a kezelt emberek 49,4%, míg a nem kezeltek 53,9%-a gyógyult meg. Vagyis: ez a gyógyszer hatásos a férfiak és a nők számára is, de káros az emberek számára.

Hatásos vagy nem hatásos? Megjegyzések: 1. Ha mi lennénk a gyártó gyógyszergyár igazgatója, hogyan döntenénk: piacra dobjuk az új gyógyszert vagy sem? 2. A példánk azt mutatja, hogy óvatosan kell bánni az „adatok egységesítésével”. (Elvileg csak az azonos szórású sokaságokat lehetne összevonni, de a gyakorlatban ilyenek nem nagyon vannak.) 3. De vegyük észre, hogy az eljárás fordítva is problematikus! Ha egy politikusnak jó statisztikusa van, bizony előfordulhat, hogy egy negatív eredményű adathalmazt szét tud bontani pozitív eredményű részekre, főnöke nagy-nagy megelégedésére.

Simpson-paradoxon Kaliforniai Egyetem Posztgraduális felvételi adatai (1973) Felmerül a nemi diszkrimináció vádja, hiszen kisebb arányban vettek fel nőt, mint férfit. Igaz lehet ez?

Simpson-paradoxon A részletekben van az ördög elrejtve: A karok többségében a nők felvételi aránya magasabb, mint a férfiaké…

Magyarázat Tényleg nagyobb arányban vették fel a férfiakat! Ez a tény. A probléma ott volt, amikor ok-okozati összefüggést feltételeztünk a felvételi arány és a nemi diszkrimináció között. Nem a diszkriminálás miatt szerepeltek jobban a férfiak, hanem mert a felvételi nehézsége karonként eltérő és a nők nagyobb arányban jelentkeztek a nehezebb szakokra mint a férfiak. Általánosabb nézőpontból összefüggést találtunk a "nem " és "sikeresség" változók között, ami a "kar" változó figyelembevételével eltűnt.