Pitlik, SZIE , IIR Gazdaságpolitikai előrejelzések adatbányászat segítségével IIRIIR szakkonferencia a felsővezetés számára: Adatbányászat & tudásfeltárás Újszerű eszközök és technikák az üzleti döntéstámogatáshoz január Budapest
Pitlik, SZIE , IIR Bemutatkozás: Adatbányászat & K+F
Pitlik, SZIE , IIR Tematika ( avagy egy EU5 projekt tapasztalatai ) –A politikai tanácsadás alapjai –Makrogazdasági adatok gyűjtése, minősége –Globális trendek, tendenciák előrejelzése (pl. időjárás, tőzsde) –Piaci folyamatokra vonatkozó adatok elemzése (pl. világpiaci árak) –Az elemzések módszertana, az eredmények értelmezése, kockázatai –Makrogazdasági jövőképek kapcsolata a vállalati döntéshozatallal
Pitlik, SZIE , IIR A politikai tanácsadás alapjai Adatvagyon felmérés (objektivitás) –Heterogén források, konszolidálatlan fogalmak –Inkonzisztenciák feltárása, kiküszöbölése Módszertani rugalmasság (megrendelői igények elfogadása, generálása) –Ötlettől a döntésig minden feladatként merülhet fel… –Célelvű white-box modellek építése (gépi tanulás, indukció) Csapdahelyzetek Nem elegendő a szimuláció, előrejelzés kell! Mégis igaz, hogy: az előrejelzések objektív beválását (furcsa mód) nem feltétlenül kell vizsgálni… hiszen a döntéshozó sokszor maga sem tudja, milyen helyesen látja előre a várható folyamatokat… Minden jövőkép csak valószínű, s a döntéshozó nehezen képes a „valószínű igazsággal” dolgozni.
Pitlik, SZIE , IIR Makrogazdasági adatok gyűjtése, minősége I. Nincs sem hazai, sem nemzetközi (OLAP-alapú) egységes szemléletű, (agrár)-közgazdasági adatbázis (DWH). A politikai tanácsadás szinte már akkor is sikeres, ha (mélyen) konzisztens adatokat képes felmutatni (ágazat, megye, idő) Az inkonzisztenciák kezelése rendezetlen (KSH-OMMI, OECD). Egyidejűleg több konzisztens állapot is valószínű (SPEL) Példák Magyarország területe… OECD támogatások, update 19 megye <> 1 ország MIMIR-MIVIR-IIER (MSZR) Szarvasmarhalétszám KSH vs. OMMI Turisztikai számla (2003)
Pitlik, SZIE , IIR Makrogazdasági adatok gyűjtése, minősége II. Klasszikus (konzisztencia-független) lépések Feldolgozandó adatok mennyiségének (tanulási & teszt- objektumok, ill. változók számának) meghatározása Adatminőség (extrém adatok és hiányzó adatok kezelése) Primer és szekunder adatok aránya Időkorlátok, IT-kapacitás … Problémák Antagonizmusok (minden mindennel összefügg) Szubjektivitás (SUECR, céltalanság tétele, teljes mértékben paraméterezhető gépi tanulás)
Pitlik, SZIE , IIR Feladatok I.: Globális trendek, tendenciák előrejelzése Általános, nemzetközi gyakorlat az exogén változók előrejelzésére az agrár-szektormodellezés során: –egyedi idősorok bizonyos típusú trendjeinek előállítása –szubjektív választás a lehetséges trendek között Újszerű, hasonlóság-alapú megközelítések: –Objektumok képzése (pl. ország-év) –Heterogén magyarázó tényezők (X i ) kiválasztása –Egymásra épülő modellhelyességi mutatók (BSC?) –Túltanulás elkerülése Példa 8 év múlva várható hozamváltozás mértéke? (demo)demo AUTO-TREND
Pitlik, SZIE , IIR Feladatok II.: Piaci folyamatokra vonatkozó adatok elemzése Hagyományos (kézi-vezérlésű, nem tanulás-alapú) modellek: –Kereslet-kínálati restrikciók –Demográfiai szempontok –Egyéb gazdaságpolitikai tényezők Újszerű (context free) hasonlóság-alapú megközelítés: –Objektumok képzése –Heterogén magyarázó tényezők (X i ) kiválasztása –Egymásra épülő modellhelyességi mutatók (BSC?) –Túltanulás elkerülése Példa Világpiaci árak levezetése (OECD, FAPRI, IAP vs. WAM) PIR (hivatalos sertés-állományprognózis vs. TDK-dolgozatok)PIR
Pitlik, SZIE , IIR Az elemzések módszertana WAM (white box) –Tetszőleges probléma –Tetszőleges (tanulási) adatbázis –Tetszőleges megoldási tér –TETSZŐLEGES CÉLFÜGGVÉNY –Sajnos: nem célirányos keresés Verseny –A piaci DM termékekkel egyenrangú, –önképzést támogató megoldás
Pitlik, SZIE , IIR Az eredmények értelmezése Céltalanság tétele BSC (komplex elvárás-rendszer egyedi becslés-értékelés helyett) Mikor kell lecserélni egy már bevált modellt? Hazudós függvények „Péntektől hétfőig”
Pitlik, SZIE , IIR Makrogazdasági jövőképek kapcsolata a vállalati döntéshozatallal Külső információs rendszer építése Egyedi elemzések vs. információs szövetkezés –Adathozzáférés (szövetkezés) –Elemzések (személyre szabott) –IT (web services?) Önszerveződés vs. állami szerepvállalás
Pitlik, SZIE , IIR JavaslatokJavaslatok Mielőtt mások által készített adatbányászati eszközökkel (black box) kezdünk elemezni, érdemes saját (white box) közelítéseket készíteni, ill. ilyen tanfolyamot elvégezni (pl. árak, kereslet,…) Ha nem tudjuk, milyen pontosan látjuk előre a jövőt intuitív úton, ill. hagyományos módszerekkel, ritkán leszünk elégedettek az új módszerekkel… Egy előrejelzés akkor helyes, ha a gépi tanulás keretrendszere, de különösen a célfüggvény testre szabott (tudni kell, mit is keresünk)… Ha nem lehet péntektől hétfőig eredményre jutni, ne is próbálkozzunk tovább…
Pitlik, SZIE , IIR Ajánlott irodalom (MIAÚ-CD / HU ISSN ) OTKA I. & II. & III.I.II.III. IA 2002 GMT 2002 GMT 2002 WAM Inkonzisztenciák (PPT, demo)PPTdemo Tanácsadás informatikai felelőssége Agrár-szektormodellek Agrár-szektormodellek IDARA MAGISZ nyilatkozattervezet MIMIR----IIER
Pitlik, SZIE , IIR Köszönöm a figyelmet!