Mi az eScience? Dr. Papp Gábor egyetemi tanár, igazgató eScience Regionális Egyetemi Tudásközpont Jim Gray (MS Research) előadás alapján.

Slides:



Advertisements
Hasonló előadás
Kreitl Péter Gemini-IT Magyarország Kft.
Advertisements

Adatbázis gyakorlat 1. Szerző: Varga Zsuzsanna ELTE-IK (2004) Budapest
Orbán Éva SZIE Állatorvos-tudományi Könyvtár Hagyományos és új terápiás eljárások az információhiány kezelésére Tanulságos esetek az Állatorvos-tudományi.
Pénz, de honnan?. Office 365 Eszközök 1 milliárd Okostelefon 2016-ra, ebből 350 milliót használnak majd munkára Emberek 82 % A világ online népességének.
Hardver alapok I. 10. osztály.
Jövő hálózati megoldások – Future Internet
Készítette: Bátori Béla 12.k
TÉRKÉP HELYETT CSAK KÉP? AVAGY A PAPÍRALAPÚ KARTOGRÁFIAI DOKUMENTUMOK SORSA A DIGITÁLIS VILÁGBAN DR. PLIHÁL KATALIN ORSZÁGOS SZÉCHÉNYI KÖNYVTÁR.
Tisztelt Hölgyeim és Uraim! Budapest, Előadó: Dr. Mihalik József
SZENT ISTVÁN EGYETEM GAZDASÁG- ÉS TÁRSADALOMTUDOMÁNYI KAR TUDOMÁNYOS DIÁKKÖRI KONFERENCIA NOVEMBER 25. AUTO-SZŰRŐ FEJLESZTÉSE OLAP JELENTÉSEK UTÓLAGOS,
I. Informatikai alapismeretek Dabas, november 18.
Erdélyi Múzeum-Egyesület Magyar Tudományos Akadémia Budapest, november 11. Dr. Bitay Enikő, Az EME Műszaki Tudományok Szakosztályának elnöke.
Európai Nukleáris Kutatási Szervezet Európai Részecskefizikai Laboratórium Bemutatkozik a CERN 05 Novembre 2003.
Dr. Élő Gábor július 9. MKE HKSZ 15. Országos Konferenciája
E - Learning Információtechnológiai támogatás a nyitott- és távoktatásban.
Az Univerzum térképe - ELTE 2001
Csabai IstvánELTE Komplex Rendszerek Fizikája Tanszék.
Virtuális Obszervatórium Korszerű adatbázisok 2014.
[ Internet marketing Logfile elemzés Készítették: Fejős András
SZÁMÍTÓGÉP ARCHITEKTÚRÁK
Dok.leírás, formai feltárás Zsák Judit
Doktorandusi Pálya a Pázmány Egyetem Interdiszciplináris Műszaki Tudományok Doktori Iskolájában 2009 április.
Napjaink háttértárolói
Régióközi tudáshálózatok minőségének hatása a kutatási teljesítményre Sebestyén Tamás és Varga Attila.
SZENT ISTVÁN EGYETEM GAZDASÁG- ÉS TÁRSADALOMTUDOMÁNYI KAR TUDOMÁNYOS DIÁKKÖRI KONFERENCIA NOVEMBER 25. AUTO-SZŰRŐ FEJLESZTÉSE OLAP JELENTÉSEK UTÓLAGOS,
Alapfogalmak I. Adat: fogalmak, tények, jelenségek olyan formalizált ábrázolása, amely emberi vagy gépi értelmezésre, feldolgozásra, közlésre alkalmas.
A digitális dokumentumok hosszútávú megőrzésének problémái Moldován István OSZK MEK Osztály „Networkshop” Szeged, március 30.
A Magyar Elektronikus Könyvtár új szolgáltatásai és működése Moldován István OSZK MEK osztály Somogyi Károly Városi és Megyei Könyvtár.
A könyvtárak szerepe az információs társadalomban
OAIS. Megőrzés feladatai Viability –Meg kell őrizni a bitfüzér változatlanságát és olvashatóságát a tároló eszközön Rendbebility –Meg kell őrizni a bitfüzér.
Könyvtár egy kicsit másképp - a Magyar Elektronikus Könyvtárról és legújabb fejlesztéseiről Szombathely, Góczán Andrea OSZK, MEK osztály.
Anyagadatbank c. tárgy gyakorlat Féléves tematika Adatbázis alapfogalmak, rendszerek Adatmodellek, adatbázis tervezés Adatbázis műveletek.
INFORMATIKA Terület- és Településfejlesztési szak
Adatbázisrendszerek jövője
Az informatika szerepe a XXI.század múzeumaiban
Önálló labor munka Csillag Kristóf 2005/2006. őszi félév Téma: „Argument Mapping (és hasonló) technológiákon alapuló döntéstámogató rendszerek vizsgálata”
1 Tudásalapú információ-kereső rendszerek elemzése és kifejlesztése Célkitűzés: Információk téma-specifikus, különböző típusú forrásokból (internet, intranet.
Önálló labor munka Csillag Kristóf 2004/2005. tavaszi félév Téma: „Argument Mapping (és hasonló) technológiákon alapuló döntéstámogató rendszerek vizsgálata”
A WEB ARCHÍVUMOK KÉRDÉSKÖRE KÖNYVTÁRI ÉS TÁJÉKOZTATÁSI SZEMPONTBÓL.
o Minden elektronikus formában érhető el o A munkafolyamatok egy része automatizálható, így a szolgáltatások gyorsabbak és hatékonyabbak lehetnek o A.
Térképészet és térinformatika
Alkalmazói programok Integrált felhasználói rendszerek Számítómunkahelyen szükséges felhasználói programokat egy csomagban, modulokban tartalmazza; az.
Gondolkodjunk el ! Zene A változások már léteznek!
GeoGebra A matematikai szabadszoftver tanuláshoz és tanításhoz
Kísérletezés virtuális méréstechnika segítségével 2010 március
A Microsoft Üzleti Intelligencia megoldása és platformja
Versenyelőny az informatika segítségével! Előadó: Dimitrova Dessislava Ügyvezető, Alphasonic Kft Október 8.
Topológiák Hálózati eszközök
Iskola-egészségügyi Konferencia augusztus Informatikai lehetőségek az iskola/ifjúság-egészségügyi munkában Wenhard Andrea egészségügyi szakközgaszdász.
Rétegmodellek 1 Rendelje az alábbi hálózati fogalmakat a TCP/IP modell négy rétegéhez és a hibrid modell öt rétegéhez! Röviden indokolja döntését. ,
A szolgáltatás technikájával – technológiájával kapcsolatos elemzések „EISZ Jövője” Konferencia június 22.
Adatbáziskezelés. Adat és információ Információ –Új ismeret Adat –Az információ formai oldala –Jelsorozat.
Prof. Dr. Neményi Miklós tudományos és külügyi rektorhelyettes A doktori és publikációs adatbázis kialakításának elvei és megvalósítása Nyugat-magyarországi.
Tudományos kommunikáció az interneten május 8. Simon Tamás [origo] Tudomány rovat.
UNIVERSITY OF SZEGED D epartment of Software Engineering UNIVERSITAS SCIENTIARUM SZEGEDIENSIS Okostelefon felhő Prof. Dr. Gyimóthy Tibor Szegedi Tudományegyetem.
N E M Z E T I A U D I O V I Z U Á L I S A R C H Í V U M
Térinformatika Domján Ádám.
Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika és Információs Rendszerek Tanszék R „Big Data” elemzési módszerek Kocsis Imre
ifin811/ea1 C Programozás: Hardver alapok áttekintése
Informatikus - fizika 1 ÚJ SZAK AZ ELTE TTK-N az oktatás modernizálása keretében 2000-ben lett kidolgozva, 2002 júniusában engedélyezve, 2003 szeptemberében.
Modellek a számítógép megismeréshez Takács Béla
Digitalizálás a könyvtárban …mit, mivel, hogyan, mikor, miért, mennyire…
Google Scholar Wolfram Alpha Scirus Készítette: Varga Ádám.
National Center for Biomedical Information PubMed, MESH, PMC adatbázis TÁMOP rendezvény Vasas Lívia lvasas.lib.sote.hu Budapest,
A Nation Library of Medicine és adatbázisai Vasas Lívia PhD 1 /21.
Számítógépek és eszközök
Lente Tamás Méliusz Juhász Péter Könyvtár
Internet és kommunikáció
Számítógépek és eszközök
Vasas Lívia lvasas.lib.sote.hu Budapest, október
Előadás másolata:

Mi az eScience? Dr. Papp Gábor egyetemi tanár, igazgató eScience Regionális Egyetemi Tudásközpont Jim Gray (MS Research) előadás alapján

Mi is az az eScience? Az információtechnológia és a tudomány szintézise. A tudományos módszerek fejlődnek (eszközök). A tudomány „szabványosítjuk”, próbáljuk tárgyilagossá tenni. Hogyan lehetne a tudományos információt a számítógépen ábrázolni? A tudomány adatözön előtt/közben van! Hogyan kezeljük és értékeljük ki az információt? A tudományos kommunikáció változóban van. Az adatok, gondolatok, értékelése publikációja (ezek karbantartása, gondozása, hozzáférhetővé tétele)

Tudományos módszerek Ezer évvel ezelőtt: Utóbbi száz év: A tudomány kísérleti A természeti jelenségeket írja le Utóbbi száz év: Az elmélet önállósodása Modelleket használunk, általánosítunk Utóbbi évtizedek: A számítógépes módszerek önállósodása Bonyolult (komplex) rendszerek szimulációja Manapság: Adatfeltárás (eScience) Az elmélet, kísérlet és szimuláció egyesítése A mérőeszközök gyűjtik az adatot A szoftver feldolgozza Az információt/tudást eltároljuk a számítógépen A tudósok kiértékelik az adatbázis fejlett adatelemző és statisztikus módszerekkel

Valódi és Számítógépes adat Hogyan szabványosítsuk és ábrázoljuk a tudásunkat a különböző tudományterületeken? Hogyan integráljuk a különböző tudományterületeket? Kísérletek, Mérések Szimulációk tények Válaszok kérdések Irodalom Egyéb Arhívumok ? Adatbefogadás Petabyte kezelés Közös platform Hogyan szervezzük? Hogyan szervezzük át? Hogyan osszuk meg másokkal? Lekérdező és megjelenítő eszközök Modellek építése és ellenőrzése Adatok és irodalom egységesítése Kísérletek dokumentálása Gondozás és megőrzés (Nyitott formátum!)

Adatmennyiségek Yotta Az eddigi fejlődés alapján 20 év múlva: Zetta Exa Peta Tera Giga Mega Kilo Az eddigi fejlődés alapján 20 év múlva: Képesek vagyunk mindent a kibertérben tárolni: a „személyes petabyte”. A számítógépek kibővülnek beszédfelismerő és szintetizáló, látó és alakfelismerő (arcfelismerő) interfészekkel. Következmény: Az információs adatlavina csak tovább növekszik. A felhasználói felület változik: kevesebb gépelés, több írás, beszéd, jelbeszéd, több látás és hallás. Az információ rendszerezése, összegzése, sorrendbe tétele a jövő technológiai kihívása. Itt vagyunk

Minden könyv MultiMedia Mennyi információ van? Yotta Zetta Exa Peta Tera Giga Mega Kilo Hamarosan mindent rögzíthetünk és indexelhetünk A legtöbb byte-ot ember nem is fogja látni … Az adatösszegzés, trend megállapítása, anomáliák észlelése a kulcs technológiai fogalmak. ld. Mike Lesk: How much information is there: http://www.lesk.com/mlesk/ksg97/ksg.html Lyman & Varian: How much information http://www.sims.berkeley.edu/research/projects/how-much-info/ Minden tárolva! Minden könyv MultiMedia Minden könyv (szavak) Mozi Fénykép Egy könyv

Mennyi információ van? Yotta Zetta Exa Peta Tera Giga Mega Kilo Az emberi agy tárolókapacitását 200 Mbyte-ra teszik A neuronok száma 1012-1014 Ha az agy forrásai 1%-át fordítja tárolásra: 10-103 neuron/bit Elég pazarlónak tűnik! Föld: 6 milliárd ember → 1 petabyte tárolókapacitás Az ember kb. 1 byte/sec információ befogadására és feldolgozására képes, ez élete során 2 Gb információt jelent. Információsűrűség növelése: (mozgó)képek!

Személyes petabyte? 25knap/élet – életciklus alatti tárolt információ Érdekel bárkit a weboldal 2020-ban? Valószínűleg új csatornák és közegek jelennek meg.

A világ változik 1956 IBM 305 RAMAC 10 MB lemez ~1M$ (y2004 $)

Számítási kapacitás Tovább gyorsulunk? 1890-1945 1945-1985 1985-2004 Mechanikus relék 7-éves duplázási idő 1945-1985 Rádiócső, tranzisztor 2.3 év/duplázás 1985-2004 Mikroprocesszor 1.0 év/duplázás

Mi fejlődik? 100x javulás egy évtized alatt: Ugyanaz a funkció 100x olcsóbb 100x több funkció ugyanazért az árért Mainframe SMP Konstelláció Klaszter Állandó ár Mini SMP Konstelláció Munkaállomás Olcsóbb ár – új kategóriák Grafika/tárolás PDA Kamera/browser

Növekedés=új alkalmazás Az 1980-as évek 10M$-os számítógépe ma 1k$-ba kerülne. Ha ugyanazt csinálnák, akkor ez egy 0$/év iparág lenne … Az új kapacitásokat az új fejlesztések használják ki.

A jósolható jövő 20 év múlva: 10,000x nagyobb teljesítmény ugyanazért az árért. Személyi szuperkomputerek Személyes petabyte tárolókapacitás 10 peta-op számítógép kb. $1000-ért. Vagy ugyanaz a funkció 10,000-szer kevesebbért: „Okos por” –a filléres PC?

A 10,000-szeres teljesítmény hatásai: A jósolható jövő A 10,000-szeres teljesítmény hatásai: Humán-számítógép adapter Elfogadható számítógépes látás, Elfogadható számítógépes beszédértés, Elfogadható számítógépes beszéd. Képes óriási mennyiségű információt tárolni, Képes hatékonyan keresni a „raktárakban” és összegezni az információt.

Kísérleti kiadások ¼…½-e: Szoftver A problémák Kísérleti kiadások ¼…½-e: Szoftver Forráskód sorok: több millió Minden kísérletre újra megírják ugyanazokat (vagy igen hasonló) programokat A Számítógépes Tudomány változtathat ezen Általános eszközök fejlesztése Munkafolyamat ütemezők Adatbázisok és könyvtárak Analízáló csomagok Vizualizálók … Szoftver Eszközök ütemezésére Eszközök vezérlésére Adatgyűjtés Adatredukció Adatbázisok Analízis Modellezés Vizualizáció

A problémák: projektek Meteorológiai adatok (állomások, szondák, műholdak) Turbulenciavizsgálat: 100 Tb szimuláció, ebből kell információt kibányászni! Gyorsítók CERN LHC: 10 Pb/év (Detektorok:1 Tb/s ~ 30 EB/év) BaBar: 1 Tb/nap (1/3 mérés, 2/3 szimuláció) Asztrofizika (földi- és űrtávcsövek) VLBA (NRAO: rádióteleszkópok) 1GB/s Távérzékelők (akár ipari kamerák) 108 videókamera @ 105 MBps ~ 10TB/s ~ 100 EB/év Genom szekvenálás NCBI (biotechnológia): ½ TB, de évről-évre duplázódik Számítógépes filmek Pixar: 100 TB/mozi

A problémák: projektek Térinformatika (meteorológiai és hagyomá- nyos térképek, 3D objektumok összefésülése) 15 Pb 2007-ben Orvosi képek és információk + Egészség Monitorozás Potenciálisan 1 GB/páciens/év ~ 1 EB/y Repülőgépmotorok: 1 GB szenzoradat/repülés, 105 motoróra/nap ~ 30 Pb/év

1 Terrabyte feltöltése 1 év alatt Feltöltési sebesség 1 Terrabyte feltöltése 1 év alatt Cikk Cikk/TB Cikk/nap 300 KB JPEG 3 M 9,800 1 MB Doc 1 M 2,900 1 óra 256 kb/s MP3 audio 9 K 26 1 óra 1.5 Mbp/s MPEG videó 290 0.8 A petabyte-os tár valamilyen videó típus lehet.

At table L-R: Dapeng, Gordon, Tom, Jim, Don, Vicky, Patrick, Jim Mi az információ? Dátum: 2000. júl. 7. 30-szor volt megnyitva, 10 embernek lett elküldve. Címe: “BARC dim sum intern farewell Lunch” Dapeng was an intern at BARC for the summer of 2000 We took him to lunch at our favorite Dim Sum place to say farewell At table L-R: Dapeng, Gordon, Tom, Jim, Don, Vicky, Patrick, Jim

Információ értelmezése A média értéke a magyarázatoktól függ Automatikus részletek: pl. GPS kamerák (hely, idő). A kézi magyarázat lassú, költséges. Minél egyszerűbbé kell tenni: pl. fénykép hangalámondással. „Csoportmagyarázat”: csoportmunkában „több szem többet lát”. Egyszerű történetek. Dapeng was an intern at BARC for the summer of 2000 We took him to lunch at our favorite Dim Sum place to say farewell At table L-R: Dapeng, Gordon, Tom, Jim, Don, Vicky, Patrick, Jim

Hogyan találunk meg bármit? Szükség van: lekérdezés, indexelés, adatkocka elforgatás, skálázás, mentés, replikálás, online frissítés, halmazköz-pontú elérés Ha nem DBMS-el kezdünk, előbb-utóbb kifejlesztünk egyet! Egyszerű logikai struktúra: Az adatmassza és az utalás a lényeg További tulajdonságok hozzáadhatók újabb táblákkal, és eljárásokkal a táblákon Több, mint állományrendszer Egyesíti az adatot és a metaadatot SQL ++ DBMS

FTP - GREP Hol keressünk? A letöltés (FTP vagy GREP) nem jó ötlet 1 MB-t le lehet GREPelni 1 másodperc alatt 1 GB-t le lehet GREPelni 1 perc alatt 1 TB-t le lehet GREPelni 2 nap alatt 1 PB-t le lehet GREPelni 3 év alatt. Ja, és 1PB ~3,000 lemez! Amire még biztosan szükség lesz: indexek a keresés szűkítéséhez párhuzamos adatkeresés és kiértékelés Ebben segítenek az adatbázisok A jövő technológiája: Adatfeltárás Az elemző módszereket visszük az adatokhoz!

Sebesség? Sok felhasználó szeretné a TELJES adatbázist keresni alkalmi bonyolult keresésekkel Kívánság ~ 1 perces válaszidő Nyers erő (párhuzamos keresés): 1 lemez = 50MBps => ~1M lemez/PB ~ 300M$/PB Indexek (keresés szűkítése) 1,000x kevesebb erőforrás: 1M$/PB „Számítás-előtti” válasz Senki nem tudja, hogyan kell ezt megvalósítani minden kérdésre.

A jövő adatelemzése Keressük: a tűt a szénakazalban (de milyen a tű?) A statisztikai módszerek rosszul skálázódnak Korrelációs függvény: N2, valószínűségi módszerek: N3 Ahogy az adat és a számítógép nő N log N típusú növekedést lehet elviselni Van kiút? Ne a tökéletes, hanem az optimális megoldást keressük (az adatok kuszák, a válaszok közelítőek) Ne tételezzünk fel végtelen számítási kapacitást és memóriát! Kombinálni kell a statisztikát és a számítógépes tudományt!

Analízis és adatbázisok A legtöbb statisztikai analízis Azonosság alapján csoportosít – adatszűrés A lényeges halmazok megkonstruálása A teljesség becslése Rossz adatok kiszűrése Számlál és hisztogrammokat gyárt Monte-Carlo módszerrel adatokat generál Valószínűségi elemzést végez Feltevéseket ellenőríz Hagyományosan ezeket az eljárások állományban levő adatokra alkalmazzák Sokkal hatékonyabb lenne az adatbázisban alkalmazni őket

Mi az eScience? Adatok Szoftver dolgozza fel azokat Mérőműszerekből Szimulációkból Szoftver dolgozza fel azokat Állományokban vagy adatbázisokban tároljuk A tudósok elemzik Virtuális laboratórium Az e-Tudósokat összekötő hálózatok Kutatási alapok támogatják Az erőforrások hatékonyabb használata Ma még kezdetleges

Az eScience adatbányászat RENGETEG adat van A legtöbb ember a töredékét sem képes feldolgozni. Számítógépekre van szükség az elemzéshez. Kézi vagy automatikus feltárás Kézi: az ember javasolt egy feltevést, a számítógép ellenőrzi azt Automatikus: a számítógép javasol feltevést az ember ellenőrzi a jelentőségét Tetszőleges paramétertérben: Adatklaszterek Adatklaszterek közötti pontok Elszigetelt adatklaszterek Elszigetelt adatcsoportok Lyukak az adatklaszterekben Elszigetelt pontok

Irodalmi adatbázis Ki fizeti a tárhelyet? De… a gondozás nem olcsó: Olcsó: 1 mili$ elérésenként De… a gondozás nem olcsó: Szerző/Cím/Tárgy/Hivatkozás/….. Dublin Core (metadata initiative) nagyon jó, de… NLM (National Library of Medicine) 6,000 soros nyílt forráskódú adatösszefüggés leíró szabványt (XSD) használ a dokumentumokhoz http://dtd.nlm.nih.gov/publishing A dokumentum struktúrát a szerzőtől kell beszerezni Fejezetek, ábrák, egyenletek, hivatkozások,… A kezelés/karbantartás automatizálása NCBI (National Center for Biotechnology Information ) -PubMedCentral elvégzi ezt: 1M cikk/év feldolgozása Automatizálásra van szükség!

Irodalmi adatbázis: PubMed “Információ a kezünk ügyében” USA, Kína, Anglia, Olaszország, Dél-Afrika, Japán UK PMCI http://ukpmc.ac.uk/ Mindegyik nódus elfogad dokumentumokat Az arhívumokat másolják Egyesítés web szolgáltatásokon keresztül Munka: Word/Excel/… integrálása a PubmedCentral-al, pl. WordML, XSD, A munka 99.99%-át az NCBI végzi.

A végső válasz: 42. De… Publikálás problémái Milyen egységekben? Mennyire pontos? 42.5 ± .01 Hogyan jött ki? Meg fogják ezt érteni 100 év múlva? Mi a kék? Mi a bolygó, csillag, galaxis, …? Mi a gén, fehérje, ösvény, …? Meg tudják ismételni a gondolatmenetet (Nagy Fermat sejtés)? Mik az objektumok? Mik a jellemzők? Mik a módszerek?

TerraServer http://terraService.Net/ Térképadatbázisok TerraServer http://terraService.Net/ USA geológiai feltárás fényképek (DOQ) & Topológiai (DRG) képek online elérése. 1998 júniusa óta Interneten van. Microsoft üzemelteti Kereszthivatkozások Házeladások, Demográfiai adatok, Enciklopédia Web szolgáltatás 20 TB adatállomány 10 M webtalálat/nap

Térképadatbázisok: képek Digitális rasztergrafika 1 TB tömörített TIFF, 65,000 állomány Beszkennelt topografikus térképek 100% U.S.A. lefedettség 1:24,000, 1:100,000 és 1:250,000 skálájú térképek Változó korú térképek Digitális OrthoQuad-ok 18 TB, 260,000 állomány, tömörítetlen geográfiailag korrigált felszínképek Digitalizált légifelvételek USA 88% lefedettség 1 méteres felbontás 10 évnél fiatalabb

Asztrofizikai adatbázisok Virtuális Obszervatórium http://www.astro.caltech.edu/nvoconf/ http://www.voforum.org/ Feltételezés: a legtöbb adat online elérhető (elvileg) Az Internet a legjobb teleszkóp!: Az égbolt minden pontjáról van adata Minden spektrális tartományban: optikai, röngten, rádió.. Olyan mélységben, ahogy a legjobb eszközünk előállítja. Elérhető, amikor ráérünk (nem kell éjszaka dolgozni, nem probléma a felhő, telehold, …). Okos távcső: Az objektumokat és adatokat mindjárt az irodalmi hivatkozásokhoz is köti.

Miért asztrofizikai adatok? Nincs piaci értéke Nincs adatvédelmi probléma Szabadon megoszthatók az eredmények másokkal Jó lehetőség a kísérletezésre az algoritmusokkal Valódi adatok, jól dokumentálva Magas dimenziószámú adatok (konfidenciaintervallumokkal) Térbeli adatok Időbeli adatok Sok különféle eszköz sok különféle helyről és sok különféle időpontból A cél az egységesítés A kérdés érdekes: Hogyan alakult ki a Világegyetem? Rengeteg adat van (petabyteok) IRAS 25m 2MASS 2m DSS Optical IRAS 100m WENSS 92cm NVSS 20cm GB 6cm ROSAT ~keV

Idő, tér, hullámhossz Crab star 1053 AD X-ray, optical, infrared, and radio views of the nearby Crab Nebula, which is now in a state of chaotic expansion after a supernova explosion first sighted in 1054 A.D. by Chinese Astronomers.

SkyServer.SDSS.org A modern arhívum Oktatáshoz is használják Nyers pixel adatok állományrendszerben Katalógus adatok adatbázisokban Online keresés bárkinek bármire Oktatáshoz is használják 150 órányi anyag online csillagászat Észrevétlenül tanít adatelemzésre Érdekességek Térbeli adatkeresés („közelség”) Kliens elérés Java appleten keresztül Web-szolgáltatásokon alapul 20 obszervatórium együttműködése GRID technológia Dr. Budavári Tamás, Dr. Csabai István (Virtuális Obszervatórium)

Gyógyszerfejlesztés Gyógyszerfejlesztés: potenciális célpontok megtalálása (Dr. Miklós István) különbözzön az emberben és a baktérium/vírusban „szignifikáns” legyen: blokkolása elpusztítja a kórokozót a célponthoz kötődő kismolekula megtalálása (Dr. Málnási-Csizmadia András) jól kötődjön a célhoz máshova ne kötődjön ne okozzon mellékhatásokat Egy gyógyszer kifejlesztése ~ 100 M$, a szignifikancia, mellékhatás már az utolsó fázisban derül csak ki. Ezek megjóslása csökkenti a költségeket gyorsítja a fejlesztést

Hálózatok Szoftverhálózatok (Dr. Kovács Attila): jelenleg a világban kb. 800,000,000,000 sor forráskód található Az éves fejlesztések 40% új fejlesztés, 45% bővítés, 15% karbantartás (2020: 30-55-15). Mikor érdemes egy szoftvert továbbfejleszteni, és mikor inkább egy újat írni? Mennyibe fog kerülni a fejlesztés? Mit kell tesztelni az új verzióban? Általános hálózatok (Dr. Lukács András): minden hálózat: cég felépítése (döntéshozás) működési kockázat feltárása telekommunikációs adatok célzott marketing terroristák megtalálása utasok összeválogatása

Köszönöm a figyelmet! Az eScience RET célja Az adatbányászattal kapcsolatos technológia fejlesztése (IT, módszertan) az adatbányászati technológia alkalmazása a valódi életben kipróbálni a kifejlesztett módszereket Köszönöm a figyelmet! Kapcsolat: http://escience.elte.hu