Adatbányászati modellek aggregálása

Slides:



Advertisements
Hasonló előadás
Tamás Kincső, OSZK, Analitikus Feldolgozó Osztály, osztályvezető A részdokumentumok szolgáltatása az ELDORADO-ban ELDORADO konferencia a partnerkönyvtárakkal.
Advertisements

Dr Raffay Ágnes Dr Lőrincz Katalin Hajmásy Gyöngyi
„Esélyteremtés és értékalakulás” Konferencia Megyeháza Kaposvár, 2009
Hogyan készítsünk el egy COCO-t???
Meteorológiai Előrejelzés Adatbányászati Támogatással Putnoki Gyula GTK ISZAM II.évf. Társszerzők: az ISZAM-os Meteor-team TDK-konferencia 2007 Gödöllő.
A tanári munka sikerességének vizsgálata a pedagógiai attitűdök, a tanár-diák viszony és az iskolai élmények összefüggésrendszerében Indoklás.
Gazdasági Informatika Tanszék
Erőállóképesség mérése Találjanak teszteket az irodalomban
Szűcs Imre CRM elemző GE Consumer Finance Budapest Bank Rt.
1. oldal A vezetői döntéseket támogató mutatószám rendszer Pilot projektzáró jelentés szeptember 9.
Humánkineziológia szak
Online gazdasági informatika szótár fejlesztése OGIL Dr. Pitlik László, Pásztor Márta, Popovics Attila, Bunkóczi László, Pető István Szent István Egyetem,
3. Két független minta összehasonlítása
Mini felderítő repülőgép készítése SolidWorks-szel
Döntés-előkészítő változatelemzések egy jogosultság kezelő alkalmazás Identity Management rendszerré alakítása kapcsán Készítette: Papp Zsuzsanna Belső.
IRE 8 /38/ 1 Óbudai Egyetem, NIK Dr. Kutor László2011. TÁMOP – I ntelligens R endszerek E lmélete 8.
Koordináta transzformációk
Koordináta transzformációk
Készítette: Zaletnyik Piroska
Digitális képanalízis
Táblázat kezelő programok
MI 2003/ Alakfelismerés - még egy megközelítés: még kevesebbet tudunk. Csak a mintánk adott, de címkék nélkül. Csoportosítás (klaszterezés, clustering).
A diákat jészítette: Matthew Will
Mesterséges neuronhálózatok
Dr. Szalka Éva, Ph.D.1 Statisztika II. VII.. Dr. Szalka Éva, Ph.D.2 Mintavétel Mintavétel célja: következtetést levonni a –sokaságra vonatkozóan Mintavétel.
2005. Stratégiai menedzsment és informatikai támogatás (A Vezetői információs rendszerek tantárgyhoz) Gaul Géza.
1950-es évek 1960-as évek 1970-es évek 1980-as évek 1990-es évek
6. Előadás Merevítő rendszerek típusok, szerepük a tervezésben
HELYI PARTNERSÉGEK, MINT A VIDÉKI KORMÁNYZÁS INNOVATÍV ESZKÖZEI 1 A Magyar Regionális Tudományi Társaság IX. vándorgyűlése Révkomárom, november 25.
Régióközi tudáshálózatok minőségének hatása a kutatási teljesítményre Sebestyén Tamás és Varga Attila.
A területi árszínvonal különbségei, különös tekintettel a városi és falusi árszínvonalak számíthatóságára Dusek Tamás Széchenyi István Egyetem, Győr Gödöllő,
Hasonlóságelemzés COCO használatával a MY-X elemzőben
Hogyan készítsünk el egy COCO-t??? Ha választani lehet, inkább ezt a hegyet másznám meg!!!
INNOCSEKK 156/2006 Hasonlóságelemzés-alapú vizsgálat a COCO módszer használatával Készítette: Péter Gábor
Pitlik László, Pető István; SZIE GMI GINT1 A számvitelszervezés újszerű informatikai aspektusai SZIE GTK, Pénzügy-számvitel Szakirány Gödöllő, 2004.
Online hasonlóságelemzések: Online hasonlóságelemzések: Tapasztalatok árfolyamok előrejelzésekor ad hoc kérdések és inputok alapján Pitlik László, SZIE.
Gyanúgenerálás HR-kockázatok minimalizálása érdekében hasonlóságelemzéssel Pitlik László SZIE Gödöllő, Gazdaság- és Társadalomtudományi Kar, TATA Kiválósági.
A szakdolgozat készítés minőségirányítási aspektusai
Online hasonlóságelemzések: Online hasonlóságelemzések: Tapasztalatok (kukorica) hozamfüggvények levezetése kapcsán Pitlik László, SZIE Gödöllő (Forrás:
Pitlik László, SZIE Gödöllő (Forrás: My-X.hu Hírlevél) augusztus
SZENT ISTVÁN EGYETEM GAZDASÁG- ÉS TÁRSADALOMTUDOMÁNYI KAR TUDOMÁNYOS DIÁKKÖRI KONFERENCIA NOVEMBER 24. Készítette: Batár Ádám.
INNOCSEKK 156/2006 Hasonlóságelemzéssel támogatott értékbecslés ingatlanfejlesztők számára E-VALUATION - SUPPORTED WITH SIMILARITY ANALYSIS - FOR REAL.
Hozam-előrejelzés a gabonatermesztésben
Bázisérték, monitoring avagy szemléletváltás a vidékfejlesztési döntések előkészítésében Pitlik László, Horváth Henrietta, SZIE Gödöllő 9. MY-X szeminárium:
My-X Hírlevél: március A tartalomból: SCORE vs. FRAMINGHAM: Egyedi „biometriai” elemzések rendszerszintű kockázata Médiatorta a meteorológiai előrejelzések.
Online kommunikáció nappalos és levelezős tananyagok BA KMT II. Pitlik László, SZIE, GTK Gödöllő 2008 ősz INNOCSEKK 156/2006, ill. INNOCSEKK 438/2006.
Lineáris egyenletrendszerek (Az evolúciótól a megoldáshalmaz szerkezetéig) dr. Szalkai István Pannon Egyetem, Veszprém /' /
dr. Szalkai István Pannon Egyetem, Veszprém
Lineáris egyenletrendszerek (Az evolúciótól a megoldáshalmaz szerkezetéig) dr. Szalkai István Pannon Egyetem, Veszprém 2007.
Gazdaság- és Társadalomtudományi Kar Regionális Gazdaságtani és Vidékfejlesztési Intézet A LEADER PROGRAM MINT HELYI PARTNERSÉG KÉRDÉSEI MAGYARORSZÁGON.
szakmérnök hallgatók számára
Egytényezős variancia-analízis
Az opciók értékelése Richard A. Brealey Stewart C. Myers MODERN VÁLLALATI PÉNZÜGYEK Panem, 2005 A diákat készítette: Matthew Will 21. fejezet McGraw Hill/Irwin.
9.1. ábra. A 135Xe abszorpciós hatáskeresztmetszetének energiafüggése.
Idősor elemzés Idősor : időben ekvidisztáns elemekből álló sorozat
Orvosbiológiai képkereső rendszer teljesítményének képek osztályozásán alapuló javítása Június 23, 2008 Budapest Altrichter Márta Konzulens: dr. Horváth.
Mesterséges intelligencia az információbiztonság szolgálatában GOP /A ITBSZM Mesterséges intelligencia az információbiztonság szolgálatában.
Bevezetés a méréskiértékelésbe (BMETE80ME19) 2014/
Tőzsdei idősorok előrejelzése Excel-alapú hibridmodellel Varga Zoltán SZIE GSZDI PhD hallgató 2014 november
1.  Szerzői:  Panagiotis Bouros (University of Hong Kong),  Shen Ge (University of Hong Kong),  Nikos Mamoulis (University of Hong Kong)  Esemény:
Kutatási beszámoló 2002/2003 I. félév Iváncsy Renáta.
Bevezetés a méréskiértékelésbe (BMETE80ME19) 2014/
AZ ON-LINE ELEMZÉSI SZOLGÁLTATÁSOK FEJLESZTÉSE A MEZŐGAZDASÁGI VÁLLALKOZÁSOK SZÁMÁRA Pisartsov Andrei Nik.
C_08.00 és C_10.00 táblák Magyar Nemzeti Bank Pintér Csilla
Startup felvásárlások multikulturális hátterének elemzése, avagy mesterséges intelligencia alapú ellenőrzőszámítás diszkriminancia-elemzéshez Barta Gergő,
Mindenki lehet innovátor!
Szani Ferenc, Pitlik László, Balogh Anikó
Bunkóczi László, Dr.Pitlik László, Pető István, Szűcs Imre
A mesterséges neuronhálók alapjai
Szűcs Imre - Dr. Pitlik László (OTKA T049013)
Előadás másolata:

Adatbányászati modellek aggregálása Dr. Pitlik László – Szűcs Imre – Pető István – Andrei Pisartsov – Orosz Erika SZIE GTK GMI - SZIE GTK GSZDI V. Alkalmazott Informatika Konferencia Kaposvár, Kaposvári Egyetem 2006. Május 26.

Tartalom Bevezetés Felhasznált adatok Probléma felvetése: Inkonzisztencia Módszerek Modell aggregálás Eredmények Konklúzió V. Akalmazott Informatika Konferencia

Bevezetés I Adatbányászati modellek Kockázatelemzés Credit Scoring Basel II CRM (Ügyfélkapcsolat menedzsment) Termékvásárlási / válaszadási modellek Lemorzsolódás Szegmentáció Vásárlói kosár elemzés Ügyfélérték számítás V. Akalmazott Informatika Konferencia

Bevezetés II Modellek felhasználása Inkonzisztencia Preferencia Számszerű érték Inkonzisztencia Különböző modellek eltérő eredményt adnak ugyanarra a kérdésre Makro modellek vs Belső modellek V. Akalmazott Informatika Konferencia

Tartalom Bevezetés Felhasznált adatok Probléma felvetése: Inkonzisztencia Módszerek Modell aggregálás Eredmények Konklúzió V. Akalmazott Informatika Konferencia

Felhasznált adatok I V. Akalmazott Informatika Konferencia

Felhasznált adatok II V. Akalmazott Informatika Konferencia

Tartalom Bevezetés Felhasznált adatok Probléma felvetése: Inkonzisztencia Módszerek Modell aggregálás Eredmények Konklúzió V. Akalmazott Informatika Konferencia

Inkonzisztencia I Adott esemény bekövetkeztére vonatkozó eltérő eredményű becslések  Inkonzisztens jövőkép! Közös ügyfélkör 8500 objektum 46,38% „jó” ügyfél V. Akalmazott Informatika Konferencia

Inkonzisztencia II Következmények Döntéshozatal támogatása? Várható veszteség számítása (Basel II) EL = PD * EAD * LGD Kampány hatékonyság tervezés Lemorzsolódás következtében elmaradt nyereség Ügyfélérték V. Akalmazott Informatika Konferencia

Tartalom Bevezetés Felhasznált adatok Probléma felvetése: Inkonzisztencia Módszerek Modell aggregálás Eredmények Konklúzió V. Akalmazott Informatika Konferencia

Módszerek I Közös modell fejlesztése Modell fejlesztése minden lehetséges termékkombinációra Modell aggregálás Szakértői módszer Mesterséges neurális hálózat Component-based Object Comparison for Objectivity (COCO) V. Akalmazott Informatika Konferencia

Módszerek II Közös modell Modellek termék kombinációnként Hiányzó értékek Inaktív ~ Termékkel nem rendelkező Modellek termék kombinációnként Túl sok modell Automatizált modellfejlesztés? Modellek menedzselése? V. Akalmazott Informatika Konferencia

Módszerek III Modell aggregálás Közepesen sok modell Aggregálási módszer? V. Akalmazott Informatika Konferencia

Tartalom Bevezetés Felhasznált adatok Probléma felvetése: Inkonzisztencia Módszerek Modell aggregálás Eredmények Konklúzió V. Akalmazott Informatika Konferencia

Modell aggregálás – Szakértői módszer Hibával fordított arányban súlyozott átlag p = (ASE_1 * p2 + ASE_2 * p1) / (ASE_1 + ASE_2) Klaszterezés p1-p2 K-középpontú 18 szegmens Szegmensenként számítjuk a súlyozást V. Akalmazott Informatika Konferencia

Modell aggregálás – MNH I Az alkalmazott neurális hálózat: Multilayer Perceptron Aktivációs függvény: tangens hiperbolikus Kombinációs függvény: lineáris Rétegek száma: 1-2 Tanulási – tesztelési minta megoszlása: 70% - 30% Leállítási kritérium: Early stopping Memory Based Reasoning: Alapmodellek hibájának becslésére Hasonlóság = Euklidészi távolság 50 legközelebbi szomszéd V. Akalmazott Informatika Konferencia

Modell aggregálás – MNH II Becsült hibák használatának vizsgálata (2 rejtett réteg, 5-4 neuronnal) Rétegek és neuronok számának vizsgálata Megfelelő struktúra mellett a becsült hibák használata felesleges! V. Akalmazott Informatika Konferencia

Modell aggregálás – COCO I Dr. Pitlik László – SZIE GTK GMI Ügyfelek csoportosítása: p1, p2  szegmensek Alapadat mátrix (szegmens szint) Input: átlag_p1, átlag_p2 Cél: átlag termékvásárlás Szegmensenkénti becslés Modell kiterjesztése ügyfelekre http://miau.gau.hu/miau/93/5ai-coco.xls V. Akalmazott Informatika Konferencia

Modell aggregálás – COCO II COCO és MNH összehasonlítása Adatbázis: COCO alapadat mátrix 75 objektum (tréning ügyfél szegmensek) Modell eredményének kiterjesztése a teszt szegmensekbe tartozó ügyfelekre   COCO MNH 5 - 4 5 - 4 - 3 8 - 8 - 8 ASE 0,1841 0,1873 0,1844 0,1840 V. Akalmazott Informatika Konferencia

Tartalom Bevezetés Felhasznált adatok Probléma felvetése: Inkonzisztencia Módszerek Modell aggregálás Eredmények Konklúzió V. Akalmazott Informatika Konferencia

Eredmények I Inkonzisztencia feloldása az egyetlen mutatószám által Aggregált modellek pontosabbak, mint az alapmodellek a közös ügyfélkörön Nem érjük el az alapmodellek fejlesztési állományon produkált pontosságát  Fontosak a precíz alapmodellek V. Akalmazott Informatika Konferencia

Fejlesztési idők aránya Termékfelvétel várható értéke Eredmények II Modellek Rekordok száma Tanuló halmaz (%) Teszt halmaz (%) Fejlesztési idők aránya Termékfelvétel várható értéke Besorolási hiba (p=0.5) ASE (teszt) Alapmodell_1 120000 70 30 2 0,4269 26,73 0,1941 Alapmodell_2 21500 0,3741 25,25 0,1951 MNH 8500 3 0,4637 24,91 0,176 COCO 138 (8478) 54 46 1 0,4712 25,39 0,1841 Szakértői módszer 100 0,4007 27,55 0,1909 V. Akalmazott Informatika Konferencia

Konklúzió Inkonzisztencia feloldása Döntéshozatal Aggregált modellek pontosabbak, mint az alapmodellek a közös ügyfélkörön Várható veszteség Kampány eredményesség Ügyfélérték Fel kell ismerni és tudatosan kezelni kell az előrejelzésekben rejlő inkonzisztenciát! V. Akalmazott Informatika Konferencia

Köszönöm a figyelmet! Szűcs Imre icsusz@gmail.com V. Akalmazott Informatika Konferencia