Statisztika Adatvizualizáció
A statisztika téves használata elemzések során Alkalmazási feltételek nem vizsgálata Reprezentativitás hiánya Big Data Félrevezető diagramok Együttmozgás vs. Ok-okozati kapcsolat Hibás értelmezések, következtetések Tesztek, eljárások, mérési szint Fb kitöltés, tv naplója Big d: tesztek, nem tudjuk mit keresünk Diagram: formai köv be nem tatrtása, marketing fogás, egyszerűsítés
Statisztikai adatok közlése és ábrázolása Cél: Információtömörítés, adatok, mutatószámok tömör megjelenítése Alapja: Ismérvek Eszköz: Statisztikai táblák (statisztikai adatok valamilyen felsorolása) Táblázatok (speciális eset: statisztikai sor) Grafikus ábrák
Fontosság Tor Norretranders modellje:
Történeti kitekintés
Adatvizualizáció (1) Vizualizáció: olyan eljárás, amelyek képek, diagramok, animációk készítésével üzeneteket közvetít. Adatvizualizáció: adatok képi, grafikus megjelenítése. Segít az adatok felfedezésében, döntéshozatalban. Információ vizualizáció: absztrakt adatok (interaktív) vizuális reprezentációja a megismerés elősegítésére. Speciális területe: vizuálanalitika
Adatvizualizáció (2) Érzékelés „optimalizálása” (pld. Színek, ikonok) Új adatforrások Új eszközök, hatékony megjelenítés?
Táblázatok készítése ismérvek alapján Lajstrom vagy a statisztikai sokaságot alkotó egyedek csoportosítását végezzük el. Követelmények Az osztályozás teljes legyen. Az osztályozás átfedés mentes legyen. Homogenitás
Magyarország fontosabb adatai Népességszám (ezer fő) 2016. január 1. 9 798 Fogyasztóiár-index (infláció) előző év azonos időszaka=100,0%) 2016. év 100,4 Munkanélküliségi ráta 2016, % 5,1 GDP (előző év =100,0%) 2016 102,0 Példa lajstromra Magyarország fontosabb adatai Forrás:http://www.ksh.hu; letöltve: 2017.09.04.
Osztályozás Példák Áruszállítás a forgalom jellege szerint 2000-ben Forrás: Magyar Statisztikai Zsebkönyv 2001. 282. o. Megnevezés Szállított áruk tömege, ezer tonna Vasút 48 994 Közút 142 390 Vízi 2 433 Légi 22 Csővezetékes 22 351 Összesen 216 190
Statisztikai táblák készítésének formai követelményei Cím Oszlopok, sorok feliratai, mértékegységek Összesen Forrás Megjegyzések Kérdés Kategóriák sorrendje?
Fizetési kategória, ezer Ft Egy termelő vállalat munkavállalói létszáma 2008. júniusában fizetési kategóriák szerint Fizetési kategória, ezer Ft Létszám, fő – 50 20 50,1 – 80 85 80,1 – 120 24 120,1 – 200 8 200,1 – 3 Összesen 140 Forrás: fiktív adatok
Pontdiagram Vonaldiagram Síkdiagramok: Térbeli diagramok Piktogramok Statisztikai ábrák Pontdiagram Vonaldiagram Síkdiagramok: oszlop diagram, hisztogram osztott oszlop diagram kör diagram Térbeli diagramok Piktogramok Kartogramok „Újabb diagramok”
Problémák - Elvárások Az ábrának áttekinthetőnek Sok adatot kell kis területen megjeleníteni Az adatot életre kell kelteni Szakszerű, de érthető legyen az ábrázolás Megfelelő ábratípus Nincs felesleges információ Megfelelő dizájn Adattörténet Felhasználó mit ért meg? Big data: mi információ, mi nem? Az ábrának áttekinthetőnek célorientáltnak és homogénnek egyszerűnek, könnyen értelmezhetőnek, rekonstruálhatónak optikailag semlegesnek kell lennie.
trendek Mobil, új platformok Interaktivitás Real time Story teller Integráció 3D Kognitív ismeretek Geoadatok
Statisztikai ábrák formai követelményei Cím Mértékegység Felirat Arányosság Egységek Forrás
OECD Better Life index http://www.oecdbetterlifeindex.org/#/11111111111 This Index allows you to compare well-being across countries, based on 11 topics the OECD has identified as essential, in the areas of material living conditions and quality of life. 22 indicators There’s been a lot of debate lately on measuring the well-being of societies –Weights are assigned by the users, who build and customise their own IndexReturn to top Each topic of well-being is measured by one to four indicators. Within each topic, indicators are averaged with equal weights. For instance education is measured through educational attainment and reading skills. The education score will thus be given by: The Index gathers many indicators, expressed on very different units (dollars, years, etc). To compare and aggregate values expressed in different unities, the values have to be normalised.
Korreláció és ok-okozat Gólya hozza a kisbabákat Szignifikáns kapcsolat a gólyapárok száma és a születések száma között. r=0.62 (p=0.008)
Oszlopdiagramok Proportional Perceive
Vonaldiagram
Source: http://www.datapine.com/blog/misleading-statistics-and-data/
Kördiagramok Source: https://en.wikipedia.org/wiki/Misleading_graph In the misleading pie chart, Item C appears to be at least as large as Item A, whereas in actuality, it is less than half as large. Source: https://en.wikipedia.org/wiki/Misleading_graph
Radar
Kartogram Magyarország hő térképe (2010.09.02. 14:00) °C Forrás: OMSZ
Forrás: Eurostat
Piktogramok Source: https://en.wikipedia.org/wiki/Misleading_graph When using pictograms in bar graphs, they should not be scaled uniformly, as this creates a perceptually misleading comparison.[12] The area of the pictogram is interpreted instead of only its height or width.[13] This causes the scaling to make the difference appear to be squared.[13] In the improperly scaled pictogram bar graph, the image for B is actually 9 times as large as A. Source: https://en.wikipedia.org/wiki/Misleading_graph
Korfa
Szófelhő fontsize= 𝒎𝒂𝒙𝒔𝒊𝒛𝒆∙ ( 𝒇 𝒊 − 𝒇 𝒎𝒊𝒏 ) ( 𝒇 𝒎𝒂𝒙 −𝒇 𝒊𝒎𝒊𝒏 ) A greedy algorithm is an algorithmic paradigm that follows the problem solving heuristic of making the locally optimal choice at each stage with the hope of finding a global optimum. Illusion preception Source : https://www.visioncritical.com/wp-content/uploads/2012/08/2-the-pros-and-cons-of-word-clouds-as-visualizations.png Source: Steele & Noah: Beautiful Visualization, O Reilly, 2010 Source : https://s-media-cache-ak0.pinimg.com/236x/a7/51/c2/a751c24af03099e6e0c43a28fb23ccaa.jpg
Gapminder World http://www.gapminder.org
Hőtérkép source: http://weeko.fr/2012/11/29/correlation-heatmap/
Tableplots Unwin research group (2006) Source: Tannekes et al. Visulizing and Inspecting Large datasets with tableplots, Journal of Data science 11(2013) 43-58
Hálózatok