Mekkora a Digitális Univerzum? Lehetőségek és kihívások

Slides:



Advertisements
Hasonló előadás
„A világ legnagyobb technológiai diákversenye.”
Advertisements

Egy innováció nyomában
Az információs társadalom helyzete Magyarországon
Számalk-MIS Tanácsadó Kft. Tel:
Adatbázis gyakorlat 1. Szerző: Varga Zsuzsanna ELTE-IK (2004) Budapest
SZOFTVER MINT SZOLGÁLTATÁS: ÜZLETI HATÉKONYSÁG A FELHŐBEN Nagy Levente Üzletágvezető Microsoft Office.
Környezetvédelmi ipar és hulladékgazdálkodás Magyarországon
Energia – történelem - társadalom
Az „Y generáció” egyeteme
Informatikai tudásleképezés paradigmái és problémái Szekeres András Márk.
Háztartások energiafogyasztása elemzésnek módszertani problémái
?. Forrás: gemius/Ipsos Audience – szeptember.
Jövő hálózati megoldások – Future Internet
Fenntartható energiagazdálkodással az éghajlatváltozással szemben: retorika vagy realitás? Budapesti Műszaki és Gazdaságtudományi Egyetem Környezetgazdaságtan.
A magyarországi kockázatitőke- finanszírozás másfél évtizede ( ) Készítette: Papp Zsuzsa Tivadari Evelin.
Tisztelt Hölgyeim és Uraim! Budapest, Előadó: Dr. Mihalik József
Szigorlati mintafeladat megoldása (folytatás)
Technológiai fejlesztés a hatékony ellátás szolgálatában
1 „ Gazdasági kihívások 2009-ben ” Dr. Hegedűs Miklós Ügyvezető GKI Energiakutató és Tanácsadó Kft. Dunagáz szakmai napok, Dobogókő Április 15.
Microsoft Üzleti Megoldások Konferencia Az informatika szerepe a vállalati kultúra és versenyképesség javításában Dr. Kornai Gábor AAM Tanácsadó.
Fáy András EADS, Védelmi és biztonsági divízió április
Könyvtári digitális tartalmak az oktatási multimédiák számára
MNB Statisztika A külső finanszírozási igény/képesség változása
Környezetértékelési módszerek
Üzleti intelligencia Kecskemét 2007 ősz. BI Business Intelligence Üzleti Intelligencia Bevételnövelő és költségcsökkentő lehetőségek feltárása, döntéstámogatás.
A Microsoft Windows Vista gazdasági hatásai Lehetőségek az ökoszisztéma számára Microsoft Innovációs Nap november 27. Komáromi Zoltán Ügyvezető igazgató.
Kiss Attila: Korszerű adatbázisok Adatbázis kutatási eredmények a TÁMOP támogatásával Június 7. Visegrád.
Korszerű adatbázisok 1. előadás Bevezetés 1. előadás.
Az EU kohéziós politikájának 20 éve ( ) Dr. Nagy Henrietta egyetemi adjunktus SZIE GTK RGVI.
TÉTELEK Info_tech_2012. Simon Béláné. 1. TÉTEL 1.a. A digitális számítógép és a logikai áramkör kapcsolata (6.4.1.) 1.b. Az ÉS logikai áramkörnek adja.
Önkiszolgáló üzleti intelligencia az SQL Server 2012-ben
Ittzés Zsigmond Budapest Airport IT Infrastruktúra manager
A könyvtárak szerepe az információs társadalomban
OAIS. Megőrzés feladatai Viability –Meg kell őrizni a bitfüzér változatlanságát és olvashatóságát a tároló eszközön Rendbebility –Meg kell őrizni a bitfüzér.
© 2007 GKIeNET Kft. A környezettudatosság és informatika Lőrincz Vilmos.
A szelektív gyűjtés helyzete, eredményei Kommunikációs kihívások
Honnan származik a pozitív nettó jelenérték? Richard A. Brealey Stewart C. Myers MODERN VÁLLALATI PÉNZÜGYEK Panem, fejezet McGraw Hill/Irwin Copyright.
SZÁMÍTÓGÉP ARCHITEKTÚRÁK - 4
A munkaerő-piaci helyzet a Nyugat-Dunántúli Régióban IPA Szakértői Akadémia Harkány
Budapest, június 28. Ontológia kezelő modul tervezése szöveges információt kezelő informatikai rendszer számára Förhécz András BME Méréstechnika.
Az egészségügyi informatika jövője Dr. Surján György GYEMSZI Informatikai és rendszerelemzési főigazgatóság EGVE Egészségügyi Napok 2012 Balatonfüred.
1 Tudásalapú információ-kereső rendszerek elemzése és kifejlesztése Célkitűzés: Információk téma-specifikus, különböző típusú forrásokból (internet, intranet.
Pankász Balázs PTE FEEK Munkapszichológia és Ergonómia Tanszék
A Dublin-i Future Internet Assembly üzenetei Sallai Gyula, Vilmos András Jövő Internet Kutatáskoordinációs Központ Budapest, június 4.
TÁMOP 5.5.1/A-10/ “Jó pályán! Jó gyakorlatok továbbfejlesztése és alkalmazása a munkaerő-piaci integrációért és esélyegyenlőségért” Foglalkoztatási.
Az internet.
Körmendi György SPSS Hungary 2007 november 6. Magyar nyelvű szöveganalitika.
Ágazati GDP előrejelző modell Foglalkoztatási és makro előrejelzés Vincze János Szirák, november 10.
Jogi informatika, 2. előadás Az információs társadalom lényegi ismérvei és egyes modelljei szeptember 21. Témakörök: 1.Az IT-ről általában 2.Az IT.
TUDTAD?Ha Kínában egymillió közül sem találni nálad jobbat……akkor csak egy vagy az 1300-ból!Hamarosan Kínában beszélnek majd legtöbben angolul.India lakosságának.
A Microsoft Üzleti Intelligencia megoldása és platformja
4 Tender Hungary Kft. (Sziklai Zoltán)
1 „ Beszéljünk végre világosan az energetikáról” Dr. Hegedűs Miklós Ügyvezető GKI Energiakutató és Tanácsadó Kft. Energetika Október 2.
A szolgáltatás technikájával – technológiájával kapcsolatos elemzések „EISZ Jövője” Konferencia június 22.
1© Dennis Meadows, 2005 Rendszerszemlélet a felsőoktatásban Élő egyetem - konferencia Budapest, 2005 Április 21. Dennis Meadows
1 AZ IKTA-2000 projektjeinek szakmai bemutatója IKTA-144/2000 projekt november 28.
PPKE ITK 2009/10 tanév 8. félév (tavaszi) Távközlő rendszerek forgalmi elemzése Tájékoztatás GY. – 02.
A felnőttképzés, szakképzés fejlesztése és a gazdaság igényei november 21. DAT 2006 Konferencia S2 – Gazdaság vezérelt informatikai szakképzés Szociális.
Iskolai számítógépes hálózat bővítése Készítette Tóth László Ferenc.
Gombos GergőKorszerű Adatbázis 2012/13 tavasz 2 Kik használják?
Bevezetés Adatbázisok használata. Mi is az adatbázis? Az adatbázisok ma már az élet számos területén alapvető fontossággal bírnak (Google, Amazon, Flickr,
DIGITALIZÁCIÓ A NAGYVÁLLALATBAN
“Tudásmegosztás és szervezeti problémamegoldás a mesterséges intelligencia korában” Levente Szabados Technológiai Igazgató.
Integrált ügyfél-kommunikáció a weben
"404 Not Found – Ki őrzi meg az internetet?"
Business Intelligence (Üzleti Intelligencia)
This is the first level bullet for notes 12 point Arial Regular
Vállalatirányítási rendszerek alapjai
A világ sarkából is elérhető könyvtár, a könyvtár sarkából is elérhető világ Winkler Bea.
Kinek törték már fel az autóját?
Előadás másolata:

Mekkora a Digitális Univerzum? Lehetőségek és kihívások Benczúr András ELTE IK A projekt az Európai Unió támogatásával, az Európai Szociális Alap társfinanszírozásával valósul meg (a támogatás száma TÁMOP 4.2.1/B-09/1/KMR-2010-0003). 1 1

Méretek Mennyi információ van a Digitális Univerzumban? Mi az információ? Hogy mérjük? Hogy férünk hozzá? - Kiszámításon keresztül. Kiszámítás: jelentéssel bíró információ átalakítás. Nem lehet vele információt nyerni. Digitális Univerzum: nem tud nyerni információt, csak veszteni. Benne gyűlik az információ. 2011.: 1.8 Zettabyte adatmennyiség keletkezik, töltődik fel. Ez mind csupán jel. A jelentést nekünk kell hozzárendelni. (Valós szemantika és műveleti szemantika.) 2 2

Mennyi információ? How Much Information 1970. Dunai Vasmű, 4MB rendelésállomány 1980.Állami Népesség-nyilvántartás Rendszere: 40*100MB, cserélhető lemezeken „optimális” tömörítéssel: 400 MB-re tömöríthető, egyszerű visszaállítással, legfeljebb 1 MB programkód kellene. (Kolmogorov-entrópia, első kérdés) 3 3

Méretek Az USA Kongresszusi Könyvtár: 30 millió könyv. Teljes digitalizálása: 10-100 Mbyte/kötet:összesen 0,3-3 Petabyte. Most a világháló adatbázisába ömlik minden. Épül a Digitális Univerzum. Becsült mérete Zettabyte tartományban van. Másfél évenként kétszereződik , gyorsul. Exabyte: az 1999-ben keletkezett információ (adattömeg) fele. IDC 2009-es tanulmány szerint közel fél Zettabyte információ keletkezett 2008-ban, 2010-ben ezerszer annyi várható, mint 1999-ben. 4 4

Méretek IDC: Extracting Value from Chaos, IDC IVIEW 2011. június; (évente készítik) Alapvető megállapítások: A létrehozott, többszörözött információ mennyisége 5 év alatt 9-szeresére nőtt. (Másfél évenként kétszereződik) A „fájlok” száma még gyorsabban nő, beágyazott rendszerek adattöltései miatt. (5*1017 fájl – 64bites cím?) Csak harmada rendelkezik megfelelő védettséggel. Tároló kapacitás lassabban nő. 1 GB tárolt adat akár Petabyte átmeneti adatot generálhat. (TV jelek) 5 5

Méretek Egységnyi kapacitásra jutó árak 5 év alatt hatodára csökkenetek. Cégek, vállalatok beruházásai a Digitális Univerzumba 50%-kal nőttek. Egy információs társadalomban az információ pénz. A nagy kihívás, nagy „trükk” abban áll, hogyan tudunk értéket teremteni a megfelelő információ kinyerésével egy olyan DU-ból, ami ugyanolyan turbulens és megjósolhatatlan, mint maga a fizikai univerzum. (Adatok 90%-a strukturálatlan, a meta adatok kétszer olyan gyorsan növekednek mint a DU.) 6 6

Előrejelzések A következő 10 évben a növekedés: Szerverek száma (virtuális és fizikai): 10-szeres (2010-ben több virtuális szerver mint fizikai értékesítése) A vállalati adatközpontokban kezelt információmennyiség: 50-szeres Fájlok száma ezeken a szervereken: 75-szörös Informatikai szakemberek száma világszerte: 1,5-szeres Felső becslés: 100 millió programozó, 8 óra naponta, másodpercenként egy leütés (egy byte) : új program évente : 1015 byte 7 7

Kapacitások 60 féle analóg és digitális technológia elemzése, 20 év M. Hilbert, P.López: The World’s Technological Capacity to Store, Communicate, and Compute Information (SCIENCE, 2011. április) 60 féle analóg és digitális technológia elemzése, 20 év 2007-ben az emberiség képes Tárolni: 2,7*1020 optimálisan tömörített byte-ot Továbbítani (kommunikálni): 2 *1021 byte-ot Műveletet végezni másodpercenként: 6,4*1018 az általános célú számítógépeken, . 8 8

Növekedés Számítási kapacitás: 58% évente, Kétirányú telekommunikáció: 28% évente Globálisan tárolt információ: 23% évente Egyirányú (műsorszórás) kapacitása: 6% évente A telekommunikációt 1990 óta a digitális technológia uralja, 2007-ben 99,9%-ban. A technológiai „memória” 2007-ben 94%-ban digitális volt. (Papír alapú: 1986-ban 0,33%, 2007-ben 0,007% részesedés, 19,4 PB méret) 9 9

Érdekességek Újratöltési idő: adott év teljes permanens adatállománya a maximális sebességgel: 1986: 2,2 nap, 1993: 8 nap, 2000: 17 nap, 2007: 56 nap How Much Information – University of San Diego tanulmányok 2009. USA háztartási információ fogyasztás 2008-ban 3,6 Zettabyte 2010. Vállalati szervereken – 2008-ban 9,57 Zettabyte áramlott át. Alkalmazottanként napi 12 GB. (3,18 milliárd dolgozó, 151 millió cég világszerte.) 2/3-ad rész kis, 25e$ alatti szervereken. 10 10

Kihívások Vállalati, üzleti világban a formalizált, tervezett operatív adatbázisokra épülő tranzakciós rendszerek, majd adattárházak, OLAP rendszerek mellett megjelent a szabályozatlan, strukturálatlan adatok világa. Felmérések szerint 80% strukturálatlan. USA: Big Data világa, erre vonatkozik. 200 elemző tudós véleménye a hiányosságokról: a nagy adatokat kezelő szoftverek belső bonyolultsága érvényes statisztikai módszerek alkalmazásának problémái általános hiány az adatok jelentésére való rálátásban 11 11

Kihívások Virtuális szerverek, osztott technológiák Cloud computing és adatbázisok P. Valduriez: Principles of Distributed Data Management in 2010? Özsu, T. Valduriez, P.: Principles of Distributed Database Systems, 3rd. ed, 2011. Osztott adatbázisok jellemezői: Szétosztás, heterogenitás, források autonómiája Mindhárom dimenzió növekedett Alapelvek kiállták az idő próbáját: fregmentálás (particionálás), adat integrálás, tranzakció kezelés, többszörözés, relációs lekérdezés-feldolgozás Sok új technika és algoritmus ezek kiterjesztése. 12 12

Kihívások Tudományos adatbázisok Cloud adatbázisok tipikus feladataik: nem OLTP! OLAP új , nagy, strukturálatlan adatokon Not Only SQL (NOSQL) adatbázisok (Bigtable, MapReduce) Kell-e új alapvetés? Az „ADAT” fogalma, adat-információ-tudás átmenetei Humán megértés, szakértelem, gyakorlat növekvő problémái – több automatikus következtető eszköz – Logika, Datalog visszatérése Kibontakozóban, kutatások 13 13

Az info-kommunikációs technológiák fejődése Search engines – concentration (Google, Yahoo, Ms Explorer, Mozilla, …) Distributed and parallel technologies: HPC, Clusters, Grid, Cloud, … Social Networking: Twitter, Blogging, Youtube, Facebook, … Semantic technologies (Semantic Web, RDF, OWL,…) Data Mining, Data Warehousing, OLAP, Big Data 14 14 14

Motivation Next generation science , data intensive science (Jim Grey, Alex Szalay et al. 2005). „Scientists generate new data much faster as they can analyze them. All looks like optical illusion.” 15 15

Szemantikus rés A szemantikus rés két személy között. A szemantikus rés egy személy és egy számítógép között. A növekvő adattömeg hatása a szemantikus résre: az algoritmikus információelmélet törvényei 16 16 16

Az adatmennyiség növekedésének hatása Az adatmennyiség növekedésével a lehetséges (értelmezhető) válaszok száma exponenciális arányban növekedhet. Ezért a kérdések száma is exponenciálisan nő. Akkor a kérdések hossza lineárisan nő. Jelenleg az adatmennyiség exponenciálisan növekszik. 17 17 17

A szemantikus rés növekedésének veszélye A világháló és egy emberi tudat tartalmának információmennyisége közötti különbség exponenciálisan nő. A kérdések és válaszok mérete meg fogja haladni az emberi feldolgozás lehetőségét. Hasonlóan ez következhet be emberi közösségek együttes tudására, végül a teljes emberiségre. Eljutunk idáig? Lefékeződik-e az adattömeg felhalmozódása? Tudunk-e értelmesen szűrni? 18 18 18

A szemantikus rés növekedésének veszélye A számítógép számára az adatok, jelek szemantikája miden esetben műveleti, feldolgozási szemantika. Ez akkor is igaz, ha formális szemantikus hálók struktúráját társítjuk adatainkhoz. A tényadatok azonosítása igen tömör lehet számítógép számára. Emberi tudatra ez nem használható. Saját memóriánkban nem tudunk kis kódok alapján keresni. Kérdéseket sem tudunk kis kódokkal azonosítani. 19 19 19

Peter Braun (OTP Bank elnöki tanácsadó): Motiváció Peter Braun (OTP Bank elnöki tanácsadó): itbusiness 2010.jan 12.: “Felnő egy új generáció: az informatikai csatornákat tudatuk ébredésétől használják, barátaikat ezen keresztül keresik, munkájukat és szórakozásukat ezek az eszközök biztosítják. A probléma az, hogy míg a természettel való küzdelem során a megszerzett tudás évtizedekig használható volt, az informatika világa olyan gyorsan változik - és változtatjuk -, hogy az ismeretvagyon hónapok alatt elavul. A folyamatos újratanulás, az új betűszavak, megoldások és szoftverek megismerése elveszi az energiát azoknak a kérdéseknek a megoldásától, amelyek a feladat eredeti céljai voltak.” 20 20

„The Knowledge Transfer Paradox” Peter Meusburger (professor et doctor honoris causa of ELTE, 2010. ” This is an age of knowledge and distributed intelligence” in which knowledge is available to anyone located anywhere and any time”. However a closer look at those disciplines dealing with knowledge proves the opposite. (P.Meusburger: The Nexus of knowledge and Space, in “Clashes of Knowledge”, eds. P. Meusburger at all) 21 21