Statisztika Adatvizualizáció.

Slides:



Advertisements
Hasonló előadás
Szimmetriák szerepe a szilárdtestfizikában
Advertisements

Kauzális modellek Randall Munroe.
A TUDOMÁNYOS KUTATÁS MÓDSZERTANA
2.1Jelátalakítás - kódolás
Az úttervezési előírások változásai
Fizika II..
Számítógépes Hálózatok
Profitmaximalizálás  = TR – TC
A járműfenntartás valószínűségi alapjai
Szenzorok Bevezetés és alapfogalmak
Végeselemes modellezés matematikai alapjai
A magas baleseti kockázatú útszakaszok rangsorolása
Szerkezetek Dinamikája
MÉZHAMISÍTÁS.
Hőtan BMegeenatmh 5. Többfázisú rendszerek
BMEGEENATMH Hőátadás.
AUTOMATIKAI ÉPÍTŐELEMEK Széchenyi István Egyetem
Skandináv dizájn Hisnyay – Heinzelmann Luca FG58PY.
VÁLLALATI Pénzügyek 2 – MM
Hőtan BMEGEENATMH 4. Gázkörfolyamatok.
Szerkezetek Dinamikája
Összeállította: Polák József
A TUDOMÁNYOS KUTATÁS MÓDSZERTANA
Csáfordi, Zsolt – Kiss, Károly Miklós – Lengyel, Balázs
Tisztelt Hallgatók! Az alábbi példamegoldások segítségével felkészülhetnek a 15 pontos zárthelyi dolgozatra, ahol azt kell majd bizonyítaniuk, hogy a vállalati.
J. Caesar hatalomra jutása atl. 16d
Anyagforgalom a vizekben
Kováts András MTA TK KI Menedék Egyesület
Az eljárás megindítása; eljárási döntések az eljárás megindítása után
Melanóma Hakkel Tamás PPKE-ITK
Az új közbeszerzési szabályozás – jó és rossz gyakorlatok
Képzőművészet Zene Tánc
Penicillin származékok szabadgyökös reakciói
Boros Sándor, Batta Gyula
Bevezetés az alvás-és álomkutatásba
Kalandozások az álomkutatás területén
TANKERÜLETI (JÁRÁSI) SZAKÉRTŐI BIZOTTSÁG
Nemzetközi tapasztalatok kihűléssel kapcsolatban
Gajdácsi József Főigazgató-helyettes
Követelmények Szorgalmi időszakban:
Brachmann Krisztina Országos Epidemiológiai Központ
A nyelvtechnológia eszközei és nyersanyagai 2016/ félév
Járványügyi teendők meningococcus betegség esetén
Kezdetek októberében a könyvtár TÁMOP (3.2.4/08/01) pályázatának keretében vette kezdetét a Mentori szolgálat.
Poszt transzlációs módosulások
Vitaminok.
A sebész fő ellensége: a vérzés
Pharmanex ® Bone Formula
Data Mining Machine Learning a gyakorlatban - eszközök és technikák
VÁLLALATI PÉNZÜGYEK I. Dr. Tóth Tamás.
Pontos, precíz és hatékony elméleti módszerek az anion-pi kölcsönhatási energiák számítására modell szerkezetekben előadó: Mezei Pál Dániel Ph. D. hallgató.
Bevezetés a pszichológiába
MOSZKVA ZENE: KALINKA –HELMUT LOTTI AUTOMATA.
Bőrimpedancia A bőr fajlagos ellenállásának és kapacitásának meghatározása Impedancia (Z): Ohmos ellenállást, frekvenciafüggő elemeket (kondenzátort, tekercset)
Poimenika SRTA –
Végeselemes modellezés matematikai alapjai
Összefoglalás.
Az energiarendszerek jellemzői, hatékonysága
Varga Júlia MTA KRTK KTI Szirák,
Konzerváló fogászat Dr. Szabó Balázs
Outlier detektálás nagyméretű adathalmazokon
További MapReduce szemelvények: gráfproblémák
Ráhagyások, Mérés, adatgyűjtés
Járműcsarnokok technológiai méretezése
Grafikai művészet Victor Vasarely Maurits Cornelis Escher.
VÁLLALATI PÉNZÜGYEK I. Dr. Tóth Tamás.
RÉSZEKRE BONTOTT SOKASÁG VIZSGÁLATA
Az anyagok fejlesztésével a méretek csökkennek [Feynman, 1959].
Bevezetés a színek elméletébe és a fényképezéssel kapcsolatos fogalmak
Minőségmenedzsment alapjai
Előadás másolata:

Statisztika Adatvizualizáció

A statisztika téves használata elemzések során Alkalmazási feltételek nem vizsgálata Reprezentativitás hiánya Big Data Félrevezető diagramok Együttmozgás vs. Ok-okozati kapcsolat Hibás értelmezések, következtetések Tesztek, eljárások, mérési szint Fb kitöltés, tv naplója Big d: tesztek, nem tudjuk mit keresünk Diagram: formai köv be nem tatrtása, marketing fogás, egyszerűsítés

Statisztikai adatok közlése és ábrázolása Cél: Információtömörítés, adatok, mutatószámok tömör megjelenítése Alapja: Ismérvek Eszköz: Statisztikai táblák (statisztikai adatok valamilyen felsorolása) Táblázatok (speciális eset: statisztikai sor) Grafikus ábrák

Fontosság Tor Norretranders modellje:

Történeti kitekintés

Adatvizualizáció (1) Vizualizáció: olyan eljárás, amelyek képek, diagramok, animációk készítésével üzeneteket közvetít. Adatvizualizáció: adatok képi, grafikus megjelenítése. Segít az adatok felfedezésében, döntéshozatalban. Információ vizualizáció: absztrakt adatok (interaktív) vizuális reprezentációja a megismerés elősegítésére. Speciális területe: vizuálanalitika

Adatvizualizáció (2) Érzékelés „optimalizálása” (pld. Színek, ikonok) Új adatforrások Új eszközök, hatékony megjelenítés?

Táblázatok készítése ismérvek alapján Lajstrom vagy a statisztikai sokaságot alkotó egyedek csoportosítását végezzük el. Követelmények Az osztályozás teljes legyen. Az osztályozás átfedés mentes legyen. Homogenitás

Magyarország fontosabb adatai Népességszám (ezer fő) 2016. január 1. 9 798 Fogyasztóiár-index (infláció) előző év azonos időszaka=100,0%) 2016. év 100,4 Munkanélküliségi ráta 2016, % 5,1 GDP (előző év =100,0%) 2016 102,0 Példa lajstromra Magyarország fontosabb adatai Forrás:http://www.ksh.hu; letöltve: 2017.09.04.

Osztályozás Példák Áruszállítás a forgalom jellege szerint 2000-ben Forrás: Magyar Statisztikai Zsebkönyv 2001. 282. o. Megnevezés Szállított áruk tömege, ezer tonna Vasút 48 994 Közút 142 390 Vízi 2 433 Légi 22 Csővezetékes 22 351 Összesen 216 190

Statisztikai táblák készítésének formai követelményei Cím Oszlopok, sorok feliratai, mértékegységek Összesen Forrás Megjegyzések Kérdés Kategóriák sorrendje?

Fizetési kategória, ezer Ft Egy termelő vállalat munkavállalói létszáma 2008. júniusában fizetési kategóriák szerint Fizetési kategória, ezer Ft Létszám, fő – 50 20 50,1 – 80 85 80,1 – 120 24 120,1 – 200 8 200,1 – 3 Összesen 140 Forrás: fiktív adatok

Pontdiagram Vonaldiagram Síkdiagramok: Térbeli diagramok Piktogramok Statisztikai ábrák Pontdiagram Vonaldiagram Síkdiagramok: oszlop diagram, hisztogram osztott oszlop diagram kör diagram Térbeli diagramok Piktogramok Kartogramok „Újabb diagramok”

Problémák - Elvárások Az ábrának áttekinthetőnek Sok adatot kell kis területen megjeleníteni Az adatot életre kell kelteni Szakszerű, de érthető legyen az ábrázolás Megfelelő ábratípus Nincs felesleges információ Megfelelő dizájn Adattörténet Felhasználó mit ért meg? Big data: mi információ, mi nem? Az ábrának áttekinthetőnek célorientáltnak és homogénnek egyszerűnek, könnyen értelmezhetőnek, rekonstruálhatónak optikailag semlegesnek kell lennie.

trendek Mobil, új platformok Interaktivitás Real time Story teller Integráció 3D Kognitív ismeretek Geoadatok

Statisztikai ábrák formai követelményei Cím Mértékegység Felirat Arányosság Egységek Forrás

OECD Better Life index http://www.oecdbetterlifeindex.org/#/11111111111  This Index allows you to compare well-being across countries, based on 11 topics the OECD has identified as essential, in the areas of material living conditions and quality of life. 22 indicators There’s been a lot of debate lately on measuring the well-being of societies –Weights are assigned by the users, who build and customise their own IndexReturn to top Each topic of well-being is measured by one to four indicators. Within each topic, indicators are averaged with equal weights. For instance education is measured through educational attainment and reading skills. The education score will thus be given by: The Index gathers many indicators, expressed on very different units (dollars, years, etc). To compare and aggregate values expressed in different unities, the values have to be normalised.

Korreláció és ok-okozat Gólya hozza a kisbabákat Szignifikáns kapcsolat a gólyapárok száma és a születések száma között. r=0.62 (p=0.008)

Oszlopdiagramok Proportional Perceive

Vonaldiagram

Source: http://www.datapine.com/blog/misleading-statistics-and-data/

Kördiagramok Source: https://en.wikipedia.org/wiki/Misleading_graph In the misleading pie chart, Item C appears to be at least as large as Item A, whereas in actuality, it is less than half as large. Source: https://en.wikipedia.org/wiki/Misleading_graph

Radar

Kartogram Magyarország hő térképe (2010.09.02. 14:00) °C Forrás: OMSZ

Forrás: Eurostat

Piktogramok Source: https://en.wikipedia.org/wiki/Misleading_graph When using pictograms in bar graphs, they should not be scaled uniformly, as this creates a perceptually misleading comparison.[12] The area of the pictogram is interpreted instead of only its height or width.[13] This causes the scaling to make the difference appear to be squared.[13] In the improperly scaled pictogram bar graph, the image for B is actually 9 times as large as A. Source: https://en.wikipedia.org/wiki/Misleading_graph

Korfa

Szófelhő fontsize= 𝒎𝒂𝒙𝒔𝒊𝒛𝒆∙ ( 𝒇 𝒊 − 𝒇 𝒎𝒊𝒏 ) ( 𝒇 𝒎𝒂𝒙 −𝒇 𝒊𝒎𝒊𝒏 ) A greedy algorithm is an algorithmic paradigm that follows the problem solving heuristic of making the locally optimal choice at each stage with the hope of finding a global optimum. Illusion preception Source : https://www.visioncritical.com/wp-content/uploads/2012/08/2-the-pros-and-cons-of-word-clouds-as-visualizations.png Source: Steele & Noah: Beautiful Visualization, O Reilly, 2010 Source : https://s-media-cache-ak0.pinimg.com/236x/a7/51/c2/a751c24af03099e6e0c43a28fb23ccaa.jpg

Gapminder World http://www.gapminder.org

Hőtérkép source: http://weeko.fr/2012/11/29/correlation-heatmap/

Tableplots Unwin research group (2006) Source: Tannekes et al. Visulizing and Inspecting Large datasets with tableplots, Journal of Data science 11(2013) 43-58

Hálózatok