Az előadás letöltése folymat van. Kérjük, várjon

Az előadás letöltése folymat van. Kérjük, várjon

Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika és Információs Rendszerek Tanszék R „Big Data” elemzési módszerek Kocsis Imre

Hasonló előadás


Az előadások a következő témára: "Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika és Információs Rendszerek Tanszék R „Big Data” elemzési módszerek Kocsis Imre"— Előadás másolata:

1 Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika és Információs Rendszerek Tanszék R „Big Data” elemzési módszerek Kocsis Imre ikocsis@mit.bme.hu 2014.10.01.

2 Adatelemzés (a számítógépig)

3 Mi nem statisztikai eszköz/csomag?  Táblázatkezelő o Lásd pl. [4]  Adatbáziskezelő o SQL  Saját C/FORTRAN/Perl/Java… o EDA…? o Stat. Függvények?  Úgy értve, hogy klasszikusan o Mindhárom területen változik  + adatelemzés != statisztika

4 Mi az, ami igen SAS SPSS R R Matlab + wikipedia [5]

5 Néhány általános jellemző  Saját szkriptnyelv o Interaktív futtatással is  Validált stat. eljárások széles köre o As in: „clinical trial data for FDA submissions”  „Workspace” modell o Jellemzően in-memory (vs. „out-of-memory” elemzés)  Erős vizualizációs képességek  Kapcsolódó funkciók o jelentések, adatbázis-kapcsolat, GUI-szkriptelés, webalkalmazások, munkafolyamatok, etc.  Gyökerek: 70-es évektől  … o SAS Institute: 1976, az egyetemmel szemben o Szoftvertechnológiailag erősen látszik; az új generáció már más o http://julialang.org/blog/2012/02/why-we-created-julia/ http://julialang.org/blog/2012/02/why-we-created-julia/

6 R  Az S nyelv „GNU verziója” o Környezet és nyelv egyben  Statisztikai számítások és grafika  Nem csak ingyenes; nyílt is  Hatékonyság: „kihívás” C/C++/FORTRAN-ba  Egyre inkább „lingua franca”, ha adatot kell elemezni o + Python

7 Miért R? (r4stats.com)

8

9 Forrás: [1]

10 Miért R? (r4stats.com)  Mert HF Forrás: [1]

11

12 + GitHub, BioC, R-Forge, saját, …

13 R konzol … …

14 RStudio Parancsállományok Interaktív konzol „workspace”

15  Interaktív bevezetés az R nyelvbe és környezetbe példákon keresztül  Rintro.R  Induláshoz javasolt: o FTSRG tech cheat sheet [6] o Magyarul: [2] és [3]  N.B.: nem kell hozzá informatikusnak lenni o Előny és hátrány is Ismerkedés az R-rel

16 typeof Forrás: [2]

17

18

19 Hivatkozások  [1] http://r4stats.com/articles/popularity/http://r4stats.com/articles/popularity/  [2] http://cran.r- project.org/doc/contrib/Solymosi-Rjegyzet.pdfhttp://cran.r- project.org/doc/contrib/Solymosi-Rjegyzet.pdf  [3] http://www.inf.unideb.hu/~jeszy/R/http://www.inf.unideb.hu/~jeszy/R/  [4] http://people.umass.edu/evagold/excel.htmlhttp://people.umass.edu/evagold/excel.html  [5] http://en.wikipedia.org/wiki/List_of_statistical_pa ckages http://en.wikipedia.org/wiki/List_of_statistical_pa ckages  [6] https://github.com/FTSRG/technology-cheat- sheets/wiki/R-programming-languagehttps://github.com/FTSRG/technology-cheat- sheets/wiki/R-programming-language


Letölteni ppt "Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika és Információs Rendszerek Tanszék R „Big Data” elemzési módszerek Kocsis Imre"

Hasonló előadás


Google Hirdetések