„Big Data” elemzési módszerek

Slides:



Advertisements
Hasonló előadás
© Kozsik Tamás Adatbáziskezelés •Relációs adatbáziskezelők •Noha a Java objektum-elvű, egyelőre nem az objektum-elvű adatbáziskezelőket támogatja.
Advertisements

Informatikai tudásleképezés paradigmái és problémái Szekeres András Márk.
Jövő Internet technológiák és alkalmazások kutatása Magyarországon A Magyar Tudomány Hónapja Jövő Internet technológiák és alkalmazások kutatása Magyarországon.
Új online technológiák: lehetőségek és kihívások Kerese István Fejlesztési platform üzletág igazgató Microsoft Magyarország
Adatbázisok SQL. TARTALOM Szijártó M.2 Témakörök  Az SQL tulajdonságai  A műveletek fajtái  Objektum-műveletek  Lekérdezések Tulajdonságok és műveletek.
SZENT ISTVÁN EGYETEM GAZDASÁG- ÉS TÁRSADALOMTUDOMÁNYI KAR KUTATÓK ÉJSZAKÁJA SZEPTEMBER 24. AUTO-SZŰRŐ FEJLESZTÉSE OLAP JELENTÉSEK UTÓLAGOS, OFFLINE.
SZENT ISTVÁN EGYETEM GAZDASÁG- ÉS TÁRSADALOMTUDOMÁNYI KAR TUDOMÁNYOS DIÁKKÖRI KONFERENCIA NOVEMBER 25. AUTO-SZŰRŐ FEJLESZTÉSE OLAP JELENTÉSEK UTÓLAGOS,
SPSS újdonságok, oktatás, support
SQL Server 2005 Reporting Services a gyakorlatban
Tájékoztató az R programról pszichológusoknak. A programról Az R egy nyílt forrású statisztikai és grafikai környezet, egyben programozási nyelv, amelynek.
Bevezetés a gépi tanulásba február 16.. Mesterséges Intelligencia „A számítógépes tudományok egy ága, amely az intelligens viselkedés automatizálásával.
Példa az Early-algoritmus alkalmazására
„High – tech networking” – szakmai konferencia informatikusoknak, szeptember 24., Debrecen, Kölcsey Központ,
Készítette: Sárközi Anikó
Nagyvállalati projektmenedzsment GTM szeminárium sorozat A Microsoft nagyvállalati projektmenedzsment megoldása Előadó:Kőnig Tibor
By Tóth Ádám Lajos EHA-kód:TOAUABI.ELTE
SPSS bevezetés.
4. Gyires Béla Informatikai Nap Debreceni Egyetem Informatikai Kar Új eredmények a Chomsky-féle (formális) nyelvtípusokkal kapcsolatban Dr. Nagy Benedek.
Objektumorientált adatbázisok és szabványok Ispány Márton.
Web Application for Resource Planning
Copyright © 2012, SAS Institute Inc. All rights reserved. STATISZTIKA ÉS VIZUALIZÁCIÓ - ÚJ LEHETŐSÉGEK A STATISZTIKAI ADATOK MEGJELENÍTÉSÉRE ÉS FELTÁRÁSÁRA.
Statisztika a szociológiában
DDL – Adatdefiníciós nyelv
Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika és Információs Rendszerek Tanszék Bin-summarise-smooth: ‚bigvis’ „Big Data” elemzési módszerek.
Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika és Információs Rendszerek Tanszék R „Big Data” elemzési módszerek Kocsis Imre
JavaScript a gyakorlatban. 1.Gyakorlat Mi a JavaScript?  A JavaScript nem Java! JavaScript futtatása JavaScript beillesztése XHTML-be Változók kezelése.
A barátságos MySQL Papp Szabolcs INFO ÉRA november 18.
SQL DDL DATA DEFINITION LANGUAGE. Táblák létrehozása CREATE TABLE táblanév ( oszlopnév1 típus(méret) /DEFAULT érték/ /NOT NULL/, oszlopnév2 típus(méret)
Bevezetés a PRADO keretrendszerbe Kardos Gergely.
Visual Basic 2008 Express Edition
A szoftver, szoftvertípusok
Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika és Információs Rendszerek Tanszék Szondázás alapú diagnosztika 1. Autonóm és hibatűrő információs.
Magic nyelven fejlesztett rendszerek szoftverminőség-biztosításához, a tesztelési folyamatok támogatásához kapcsolódó fejlesztések Magic alkalmazások tesztelésének.
Supervizor By Potter’s team SWENG. History SWENG - Szarka Gábor - G2BI DátumVerzióLeírásSzerző Első verzióSzarka Gábor.
A Microsoft Üzleti Intelligencia megoldása és platformja
Ugrás az első oldalra 1 Skaliczki Judit A teljes körű minőségirányítási rendszer bevezetésének lépései Debrecen, 2004.
A tanulási környezet változásának hatásai a tananyagfejlesztés módszereire Dr. Ludik Péter.
Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika és Információs Rendszerek Tanszék Megerősítő elemzés „Big Data” elemzési módszerek Salánki.
A GIMP képszerkesztö program bemutatása
PPKE ITK 2008/09 tanév 8. félév (tavaszi) Távközlő rendszerek forgalmi elemzése Tájékoztatás
Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika és Információs Rendszerek Tanszék R „Big Data” elemzési módszerek Kocsis Imre
Palotás Ádám és Fodor Gergely Oracle Data Integrator Bemutató és gyakorlat
.NET FRAMEWORK Röviden Krizsán Zoltán 1.0. Tulajdonságok I Rövidebb fejlesztés 20 támogatott nyelv (nyílt specifikáció) 20 támogatott nyelv (nyílt specifikáció)
Gráfadatbázisok Rácz Gábor.
Assoc. Prof. Ján Gunčaga, PhD. Faculty of Education Catholic University in Ružomberok Nyílt forráskódú szoftverek és IKT az oktatásban.
Analogical and Neural Computing Laboratory, Hungarian Academy of Sciences, Budapest 1 MATLAB u Hatékony, interaktív, tudományos és műszaki számítások,
Bevezetés Adatbázisok használata. Mi is az adatbázis? Az adatbázisok ma már az élet számos területén alapvető fontossággal bírnak (Google, Amazon, Flickr,
Windows 10 áttekintés és bevezetés Windows 10 áttekintés rendszergazdáknak Mi változott a Windows 7 óta?
Szoftver Program – a számítógép számára érthető utasítássor Operációs rendszer – Programcsomag. Kapcsolatot teremt a felhasználó és a számítógép között.
Szoftver Program Operációs rendszer – Programcsomag, kapcsolatot teremt a felhasználó és a számítógép között. Pl: Windows és DOS, Linux (ingyenes), Unix.
Kontinuum modellek 2.  Közönséges differenciálegyenletek numerikus megoldásának alapjai  közönséges differenciálegyenletek  Euler módszer  Runge-Kutta.
Kiss Balázs Geográfus MSc/I. évf..  Hazánkban leginkább használt levelezőrendszerek  Üzleti levelezőrendszerek  Thunderbird  Gmail  Apple Mail 
BYTE Projekt FP 7 Gergely László MBA NIIF Intézet Big Data 2016 Európában és a világban – nem csak a szakma, esettanulmányok is.
Az állatorvos szerepe az élelmiszerlánc- biztonság megteremtésében Informatika (számítástudomány, elemzések) Dr. Tirián Attila
A GIMP program telepítése. A GIMP program ● GIMP – GNU Image Manipulation Program, Spencer Kimball és Peter Mattis, ● Linux, Windows, Mac OS X,
Kimutatás-pivot tábla, Excel 2010
A könyvtári integrált rendszerek statisztikai moduljának használata
A szakma és az egészségpolitika kapcsolata a nemzetközi gyakorlatban
Integrált ügyfél-kommunikáció a weben
Dinamikus adatszerkezetek
Integrált könyvtár rendszer (IKR)
Adatelemzés a szociális médiában
Web-Grafika Linuxon?!? Gödöny Péter.
Leíró nyelvtan - adatbázisból
Bevezetés a kvantitatív kutatásba
DRUPAL Előadja: Nagy Nikoletta :05.
dr. Geges József Ovidius Co. Ltd.
Bemutatkozás A kutatás bemutatása
MySQL története, részei, felhasználhatóság, PHPMyAdmin
Szűcs Imre - Dr. Pitlik László (OTKA T049013)
Előadás másolata:

„Big Data” elemzési módszerek Kocsis Imre ikocsis@mit.bme.hu 2015.09.30.

Adatelemzés (a számítógépig)

Mi nem statisztikai eszköz/csomag? Táblázatkezelő Lásd pl. [4] Adatbáziskezelő SQL Saját C/FORTRAN/Perl/Java… EDA…? Stat. függvények? Úgy értve, hogy klasszikusan Mindhárom területen változik + adatelemzés != statisztika

Mi az, ami igen SAS SPSS R Matlab + wikipedia [5]

Néhány általános jellemző Saját szkriptnyelv Interaktív futtatással is Validált stat. eljárások széles köre As in: „clinical trial data for FDA submissions” „Workspace” modell Jellemzően in-memory (vs. „out-of-memory” elemzés) Erős vizualizációs képességek Kapcsolódó funkciók jelentések, adatbázis-kapcsolat, GUI-szkriptelés, webalkalmazások, munkafolyamatok, etc. Gyökerek: 70-es évektől … SAS Institute: 1976, az egyetemmel szemben Szoftvertechnológiailag erősen látszik; az új generáció már más http://julialang.org/blog/2012/02/why-we-created-julia/

R Az S nyelv „GNU verziója” Statisztikai számítások és grafika Környezet és nyelv egyben Statisztikai számítások és grafika Nem csak ingyenes; nyílt is Hatékonyság: „kihívás” C/C++/FORTRAN-ba Egyre inkább „lingua franca”, ha adatot kell elemezni + Python

Miért R? (r4stats.com)

Miért R? (r4stats.com)

Miért R? (r4stats.com) Forrás: [1]

Miért R? (r4stats.com) Mert HF Forrás: [1]

+ GitHub, BioC, R-Forge, saját, …

R konzol …

RStudio Parancsállományok Interaktív konzol „workspace”

Ismerkedés az R-rel Interaktív bevezetés az R nyelvbe és környezetbe példákon keresztül Rintro.R Induláshoz javasolt: FTSRG tech cheat sheet [6] Magyarul: [2] és [3] N.B.: nem kell hozzá informatikusnak lenni Előny és hátrány is

typeof Forrás: [2]

Hivatkozások [1] http://r4stats.com/articles/popularity/ [2] http://cran.r-project.org/doc/contrib/Solymosi-Rjegyzet.pdf [3] http://www.inf.unideb.hu/~jeszy/R/ [4] http://people.umass.edu/evagold/excel.html [5] http://en.wikipedia.org/wiki/List_of_statistical_packages [6] https://github.com/FTSRG/technology-cheat-sheets/wiki/R-programming-language