Az előadás letöltése folymat van. Kérjük, várjon

Az előadás letöltése folymat van. Kérjük, várjon

Adatbányászati modellek aggregálása Dr. Pitlik László – Szűcs Imre – Pető István – Andrei Pisartsov – Orosz Erika SZIE GTK GMI - SZIE GTK GSZDI V. Alkalmazott.

Hasonló előadás


Az előadások a következő témára: "Adatbányászati modellek aggregálása Dr. Pitlik László – Szűcs Imre – Pető István – Andrei Pisartsov – Orosz Erika SZIE GTK GMI - SZIE GTK GSZDI V. Alkalmazott."— Előadás másolata:

1 Adatbányászati modellek aggregálása Dr. Pitlik László – Szűcs Imre – Pető István – Andrei Pisartsov – Orosz Erika SZIE GTK GMI - SZIE GTK GSZDI V. Alkalmazott Informatika Konferencia Kaposvár, Kaposvári Egyetem Május 26.

2 V. Akalmazott Informatika Konferencia 2 Tartalom Bevezetés Felhasznált adatok Probléma felvetése: Inkonzisztencia Módszerek Modell aggregálás Eredmények Konklúzió

3 V. Akalmazott Informatika Konferencia 3 Bevezetés I Adatbányászati modellek Kockázatelemzés Credit Scoring Basel II CRM (Ügyfélkapcsolat menedzsment) Termékvásárlási / válaszadási modellek Lemorzsolódás Szegmentáció Vásárlói kosár elemzés Ügyfélérték számítás

4 V. Akalmazott Informatika Konferencia 4 Bevezetés II Modellek felhasználása Preferencia Számszerű érték Inkonzisztencia Különböző modellek eltérő eredményt adnak ugyanarra a kérdésre Makro modellek vs Belső modellek

5 V. Akalmazott Informatika Konferencia 5 Tartalom Bevezetés Felhasznált adatok Probléma felvetése: Inkonzisztencia Módszerek Modell aggregálás Eredmények Konklúzió

6 V. Akalmazott Informatika Konferencia 6 Felhasznált adatok I

7 V. Akalmazott Informatika Konferencia 7 Felhasznált adatok II

8 V. Akalmazott Informatika Konferencia 8 Tartalom Bevezetés Felhasznált adatok Probléma felvetése: Inkonzisztencia Módszerek Modell aggregálás Eredmények Konklúzió

9 V. Akalmazott Informatika Konferencia 9 Inkonzisztencia I Adott esemény bekövetkeztére vonatkozó eltérő eredményű becslések  Inkonzisztens jövőkép! Közös ügyfélkör 8500 objektum 46,38% „jó” ügyfél

10 V. Akalmazott Informatika Konferencia 10 Inkonzisztencia II Következmények Döntéshozatal támogatása? Várható veszteség számítása (Basel II) EL = PD * EAD * LGD Kampány hatékonyság tervezés Lemorzsolódás következtében elmaradt nyereség Ügyfélérték

11 V. Akalmazott Informatika Konferencia 11 Tartalom Bevezetés Felhasznált adatok Probléma felvetése: Inkonzisztencia Módszerek Modell aggregálás Eredmények Konklúzió

12 V. Akalmazott Informatika Konferencia 12 Módszerek I Közös modell fejlesztése Modell fejlesztése minden lehetséges termékkombinációra Modell aggregálás Szakértői módszer Mesterséges neurális hálózat Component-based Object Comparison for Objectivity (COCO)

13 V. Akalmazott Informatika Konferencia 13 Módszerek II Közös modell Hiányzó értékek Inaktív ~ Termékkel nem rendelkező Modellek termék kombinációnként Túl sok modell Automatizált modellfejlesztés? Modellek menedzselése?

14 V. Akalmazott Informatika Konferencia 14 Módszerek III Modell aggregálás Közepesen sok modell Aggregálási módszer?

15 V. Akalmazott Informatika Konferencia 15 Tartalom Bevezetés Felhasznált adatok Probléma felvetése: Inkonzisztencia Módszerek Modell aggregálás Eredmények Konklúzió

16 V. Akalmazott Informatika Konferencia 16 Modell aggregálás – Szakértői módszer Hibával fordított arányban súlyozott átlag p = (ASE_1 * p2 + ASE_2 * p1) / (ASE_1 + ASE_2) Klaszterezés p1-p2 K-középpontú 18 szegmens Szegmensenként számítjuk a súlyozást

17 V. Akalmazott Informatika Konferencia 17 Modell aggregálás – MNH I Az alkalmazott neurális hálózat: Multilayer Perceptron Aktivációs függvény: tangens hiperbolikus Kombinációs függvény: lineáris Rétegek száma: 1-2 Tanulási – tesztelési minta megoszlása: 70% - 30% Leállítási kritérium: Early stopping Memory Based Reasoning: Alapmodellek hibájának becslésére Hasonlóság = Euklidészi távolság 50 legközelebbi szomszéd

18 V. Akalmazott Informatika Konferencia 18 Modell aggregálás – MNH II Becsült hibák használatának vizsgálata (2 rejtett réteg, 5-4 neuronnal) Rétegek és neuronok számának vizsgálata Megfelelő struktúra mellett a becsült hibák használata felesleges!

19 V. Akalmazott Informatika Konferencia 19 Modell aggregálás – COCO I Dr. Pitlik László – SZIE GTK GMI Ügyfelek csoportosítása: p1, p2  szegmensek Alapadat mátrix (szegmens szint) Input: átlag_p1, átlag_p2 Cél: átlag termékvásárlás Szegmensenkénti becslés Modell kiterjesztése ügyfelekre

20 V. Akalmazott Informatika Konferencia 20 Modell aggregálás – COCO II COCO és MNH összehasonlítása Adatbázis: COCO alapadat mátrix 75 objektum (tréning ügyfél szegmensek) Modell eredményének kiterjesztése a teszt szegmensekbe tartozó ügyfelekre COCOMNH ASE0,18410,18730,18440,1840

21 V. Akalmazott Informatika Konferencia 21 Tartalom Bevezetés Felhasznált adatok Probléma felvetése: Inkonzisztencia Módszerek Modell aggregálás Eredmények Konklúzió

22 V. Akalmazott Informatika Konferencia 22 Eredmények I Inkonzisztencia feloldása az egyetlen mutatószám által Aggregált modellek pontosabbak, mint az alapmodellek a közös ügyfélkörön Nem érjük el az alapmodellek fejlesztési állományon produkált pontosságát  Fontosak a precíz alapmodellek

23 V. Akalmazott Informatika Konferencia 23 Eredmények II Modellek Rekordok száma Tanuló halmaz (%) Teszt halmaz (%) Fejlesztési idők aránya Termékfelvétel várható értéke Besorolási hiba (p=0.5) ASE (teszt) Alapmodell_ ,426926,730,1941 Alapmodell_ ,374125,250,1951 MNH ,463724,910,176 COCO138 (8478)544610,471225,390,1841 Szakértői módszer ,400727,550,1909

24 V. Akalmazott Informatika Konferencia 24 Konklúzió Inkonzisztencia feloldása Döntéshozatal Aggregált modellek pontosabbak, mint az alapmodellek a közös ügyfélkörön Várható veszteség Kampány eredményesség Ügyfélérték Fel kell ismerni és tudatosan kezelni kell az előrejelzésekben rejlő inkonzisztenciát!

25 V. Akalmazott Informatika Konferencia 25 Köszönöm a figyelmet! Szűcs Imre


Letölteni ppt "Adatbányászati modellek aggregálása Dr. Pitlik László – Szűcs Imre – Pető István – Andrei Pisartsov – Orosz Erika SZIE GTK GMI - SZIE GTK GSZDI V. Alkalmazott."

Hasonló előadás


Google Hirdetések