Jövőkutatási Konferencia Vág András – Kuti Sándor: Online statisztikai adatbázis elemzési és előrejelzési hasznosítása Jövőkutatási Konferencia 2002. október 3-4. Copyright World in Figures 2001 www.worldinfigures.org
Kutatási infrastruktúra Tartalom Bevezető Kutatási infrastruktúra „World in Figures” Az statisztikai adatbögésző és az online elemző Kooperáció www.worldinfigures.org www.worldinfigures.org
Bevezetés - Az online kutatás időszerűsége Helyzet és motivációk - A statisztikai információk szétszórtan, darabokban vannak tárolva. - Az elemzést gyakran az adatok elérhetősége és nem a kutatói igények határozzák meg. - Az elemző eszközökhöz csak szűk körben férnek hozzá. - Az adattulajdonosok „ráülnek” az információkra. Új lehetőségek - Az adatbázisok integrációjának sw/hw feltételei adottak - Az Interneten keresztül az információk közzétehetők és elemezhetők www.worldinfigures.org www.worldinfigures.org
Kutatási infrastruktúra 1. Magyarországi adatok A statisztikai adatrekordok és mennyiségük becslése - Rekord: jellemző neve, számértéke, terület, időszak - Évenként közzétett statisztikai adatrekord mennyisége Magyarországon: - Statisztikai Évkönyv: 0,2-0,5 x 106 rekord - Szakstatisztikai kiadványok: 10-15 x 106 rekord - Egyéb makro-adatgyűjtemények: 5-10 x 106 rekord - Évente tehát: 17-26 millió közvetlenül felhasználható adatrekord jelenik meg Magyarországon, főként nyomtatásban. Megjegyzések: (1) Becsült adatok, (2) részletes területi bontások nélkül, (3) esetenkénti adat-átfedésekkel www.worldinfigures.org www.worldinfigures.org
Kutatási infrastruktúra 2. Globális adatok online Statisztikai adatrekordok az Interneten Terület-tartalom Ingyen Fizető Összesen Átl. rekord-szám Összes rekord Globális / regionális - általános 10-15 2-5 12-17 1 x 106 12-17 x 106 Globális / regionális - szakterületi 20-30 20-50 40-80 0,5 x 106 20-40 x 106 Országos – általános összesen 150-200 170-250 1 x 104 1,7-2,5 x 106 Országos –szak-területi összesen 50-100 100-200 1 x 103 0,1-0,2 x 106 220-345 92-205 322-545 34-60 x 106 www.worldinfigures.org www.worldinfigures.org
Kutatási infrastruktúra 3. Statisztikai elemzők Off-line matematikai-statisztikai programcsomagok - A legnagyobbak az elemzői szoftverek csúcsán vannak. - Használatukhoz komoly szaktudás kell, nem mindegyik felhasználóbarát. - Drágák, ezért csak szűkebb körben használják. - Egyik-másik meglepő hiányosságokat mutat algoritmusokban vagy az output lehetőségekben. Online elemzők - Jórészt csak alapfunkciókkal rendelkeznek. - Adatbevitel nehézkes. www.worldinfigures.org www.worldinfigures.org
WiF 1. A World in Figuresről Minőségi újítás az adatszolgáltatásban - Tízmilliós nagyságrendben elérhető adatok – egy adatbázisból - Az élet minden területéről vannak adatok (legalábbis amiről van adatgyűjtés) - Tradicionális statisztikai és felmérési adatok egyformán elérhetők. Elemzési lehetőségek - Az összevont adatbázis lehetővé teszi, hogy többezer változót egyszerre, pl. kölcsönhatásukban, online lehet elemezni. - Lehetőség speciális –sok változóra fejlesztett- elemzési technikák használata - Alapvető statisztikai módszerek és grafikák - Online segédeszközök (jelentéskészítő, data upload, stb.) www.worldinfigures.org www.worldinfigures.org
WiF 2. A szoftverek és az adatbázis rendszer áttekintése Adatgyűjtő és adatintegráló rendszer (off-line oldal) Internetes adatbázis használók és statisztikai elemzők (on-line) Felhasználók Adatbázisok a fő adatgyűjtő számítógépen (Master) Adatbázis másolatok a szerveren Szerver Feltöltés Adatbázis menedzser (Master) Adatfeldolgozók (Slaves) Internet
WiF 3. Az adatgyűjtő és adatintegráló program A „Slave” - Feladata táblázatok beolvasása és adatbázisba konvertálása - Többféle file (XLS, MDB, DOC stb.) felismerése és kezelése - Automatikus „adatkonfliktus” kezelés - Automatikus szöveg-egységesítés - Beviteli teljesítmény 20-50 ezer rekord naponta A „Master” - Feladata: a Slave-től kapott adatbázisok szinkronizálása és feltöltése a szerverre - Adatbázisok menedzselése - Leválogatások készítése www.worldinfigures.org www.worldinfigures.org
WiF 4. Az adatokról és adatbázisokról Adatok tartalma: gazdasági, társadalmi, természeti-környezeti, politikai, vélemény, viselkedési változók Időintervallumok: év, negyedév, hónap Adat típusok: gyakoriságok, volumenek, értékek, indexek, százalékok, generált változók Az adatbázisokról: Globális adatbázis: éves ország adatok, rekordok száma 1.7 millió, változók száma 1100 (2002 3.negyedév) Ország adatbázisok: éves ország és országon belüli (városi, megyei) adatok, rekordok száma átlagosan 11 ezer, változók száma 600 (2002 3.negyedév) Speciális adatbázisok: egyedi igény szerint www.worldinfigures.org www.worldinfigures.org
WiF 5. A statisztikai adatböngésző és online elemző - Változókiválasztás A változók vagy a kategória rendszeren keresztül vagy a szövegkeresővel találhatók meg. Ez az ábra a kategória rendszer változó-kiválasztó paneljét mutatja. www.worldinfigures.org www.worldinfigures.org
WiF 6. A statisztikai adatböngésző és online elemző - Eredmények táblázatokban, változónként A felhasználó választhat, hogy az eredményt melyik attribútum (változó, terület, év) szerinti válogatásban nézze meg. www.worldinfigures.org www.worldinfigures.org
WiF 7. A statisztikai adatböngésző és online elemző - Eredmények táblázatokban, országonként Az adatcellák tartalma itt ugyanaz, mint az előző ábrán. Ennél a megjelenítésnél azonban országonként lehet lapozni és a változók –szemben az iménti oszlopos ábrázolással- a táblázat soraiban jelennek meg. Vissza www.worldinfigures.org www.worldinfigures.org
WiF 8. A statisztikai adatböngésző és online elemző - Eredmények vonaldiagramban www.worldinfigures.org www.worldinfigures.org
WiF 9. A statisztikai adatböngésző és online elemző – Többszörös korreláció www.worldinfigures.org www.worldinfigures.org
Kiegészítő és beállítási funkciók WiF 10. A statisztikai adatböngésző és online elemző - Az elemző moduljai Elemző funkciók Könnyen kezelhető 3D táblázatok és grafikák Trend-extrapoláció Korrelációszámítás Regresszióelemzés Egy egyszerű káosz-modell Kiegészítő és beállítási funkciók Hiányzó adatok pótlása Letölthető táblázatok és grafikák Megjelenítés pontosságának beállítása Leválogatott adatok CD-ROM-on, kezelő programmal www.worldinfigures.org www.worldinfigures.org
WiF 11. A World in Figures projekt felépítése - Heuréka Research Kft - Partnerkapcsolatok - Software fejlesztés - Adatgyűjtés, adatbevitel, minőségellenőrzés - Matematikai és statisztikai szakértés - Kutatás - Marketing - Fundraising www.worldinfigures.org www.worldinfigures.org
Együttműködő partnerek Kooperáció Együttműködő partnerek - Adat-tulajdonosokkal, elemzőkkel és adatgyűjtőkkel - Szakmai szervezetekkel (sw fejlesztők, szakértők, stb.) - Felhasználók (oktatási intézmények, üzleti szektor, kormányzat, NGO-k, stb.) Partnerségi ajánlataink - Hálózati partner - Speciális partner - Projekt partner www.worldinfigures.org www.worldinfigures.org
Kapcsolat Vág András Heuréka Research Kft. tel:36-309-985-884 avag@worldinfigures.org 2094 Nagykovácsi Park u. 1/a www.worldinfigures.org www.worldinfigures.org