Információ és tudás: A Big Data szerepe a közgazdaságtanban Vincze János BCE és MTA KRTK KTI MAFIHE Téli Iskola
We are drowning in information but starved for knowledge. John Naisbitt (Megatrends, 1982)
Vázlat 1. Közgazdaságtan és adatok 2. Arbitrázs lehetőségek és Big Data 3. Big Data és oksági összefüggések 4. Közgazdaságtan és ökonofizika 5. Összefoglalás
1.1 Közgazdaságtan és adatok Hol van sok adat és hogyan keletkeznek? Statisztikai hivatalok Privát, elektronikus adatok Adminisztratív Strukturálatlanság fontos probléma
1.2 Közgazdászok és adatok Mottó egy ökonometria kézikönyvből a 80-as években: Nagyapám soha nem evett fasírtot; az étteremben azért nem, mert nem tudta mi van benne, otthon azért nem, mert tudta. Elméletek és adatok a közgazdaságtanban Big Data: a fasírtkészítés felelőssége (többnyire) adott hozzávalókból
1.3 Potenciálistól az aktuálisan használt adatokig Potenciális (big) Keresők, statisztikai hivatalok, vállalati tranzakciók, adminisztratív adatbázisok, népszámlálások. Aktuálisan használt (általában nem big) már strukturált adatok, n>>p
1. 4 Közgazdaságtan és Big Data Hal Varian: Big Data - New Tricks for Econometrics (2014) There have been very fruitful collaborations between computer scientists and statisticians in the last decade or so, and I expect collaborations between computer scientists and econometricians will also be productive in the future.
2.1 Üzleti alkalmazások Hitel default előrejelzés Vásárlói szokások Ügyfélvesztés előrejelzés Általában célzott marketing Pénzügyi előrejelzések
Epagogix
2.2 Példa: Epagogix Big Data módszerek a filmgyártásban (Ian Ayres: Super crunchers) Forgatókönyv, szereposztás elemzés, és a bevétel előrejelzése Eredmény: a filmkészítés profitabilitása nőhet Kinek kell és kinek nem kell?
2.3 Előrejelzés és arbitrázs Klasszikus arbitrázs: határidős devizapiac Kockázatos arbitrázs: előrejelzésen alapuló devizaspekuláció Arbitrázs általánosabban: mint a piaci tökéletlenség kihasználásának lehetősége
2.4 Tanulságok az Epagogix példából A tudás jellege: átmeneti (arbitrázs) hiányos: mit tudunk a visszacsatolásról? gyakran nincs lehetőség ellenőrzésre
3.1 Közgazdászok és adatelemzés Az ökonometria a Neyman-Pearson matematikai statisztika leszármazottja Becslés és hipotézis vizsgálat, oksági összefüggések – hatások keresése Data mining: illetlenség, de olyan, amit senki sem tud mellőzni
3.2 Big Data és okság/ hatás vizsgálat Mi van, ha nem lehet kísérletezni ? Természetes kísérletek: minimálbér Big Data és természetes kísérletek: hólapátok ára Instrumentális becslés: tanulási idő és bérek Big Data és instrumentumok: Google Correlate Igazán jó előrejelzésből is lehet hatásvizsgálat.
3.3 Hol kellene szemléletet változtatni? Adatstrukturálás adatbányászattal és p>>n Időleges előrejelzések nagyobb megbecsülése. Mit lehet előrejelezni? Mikor értelmes az „okságot” kutatni? Identifikáció vagy overfitting a probléma
3.4 De … Penicillin és arbitrázs 1. vizsgálat: A penicillin kimutathatóan hatásos 2. vizsgálat: a pneumococcus visszavág A statisztikai hatásvizsgálat kevés, mélyebb tudás kell! Az állapottér mélysége is fontos!
4.1 Lélekvándorlás: fizika, közgazdaságtan és szociológia Egy indiai közgazdász magyarázata Hálózatok: Miért fontosabb a szociológusoknak? Miért szeretik a fizikusok? Miért óvatosak a közgazdászok?
4.2 Közgazdasági modellek és a valóság Hagyományos szemlélet: mintamomentumokat akarunk magyarázni Érvelés: Nem-ergodikus esetben nincs haszna egyetlen minta momentumainak. Mivel csak egy mintánk van, ezért ergodikus modelleket kell csinálnunk.
4.3 Ágens-alapú modellek Heterogenitás: a szimulációk nagy adathalmazt generálnak Hasonlóan az evolúciós modellekhez a szimulált idősorok nem feltétlenül ergodikusak Hogyan lehet validálni egy ilyen modellt egy minta alapján?
4.4 Felfedezés és analógiák keresése Az ABM-ekből származó adathalmazok összevetése egymással és más nagy (valós) folyamatokból származó Nézzük meg, hogy vannak-e közös jellemzők!
5. Összefoglaló Big Data: új szemléletre ösztönöz a közgazdaságtanban A haszna „arbitrázs” problémáknál nyilvánvaló, hatásvizsgálatoknál is alkalmazható, de sok kihasználatlan lehetőség is van A tudást biztosan nem tudja tökéletesen helyettesíteni, de segíthet felhalmozni