Előadást letölteni
Az előadás letöltése folymat van. Kérjük, várjon
1
SVM alkalmazása churn előrejelzésre
Előadók: Kovács Gyula – Data Research Kft.
2
Churn előrejelzés – feladat ismertetése Történeti áttekintés 1997-2007
Tartalom Churn előrejelzés – feladat ismertetése Történeti áttekintés Ami a churn modellekről tudni kell Churn modellek 2007-ben Hogyan javítható a churn előrejelzés Adatok Megtarthatóság vizsgálata Új algoritmus alkalmazása Teszt eredmények ismertetése – KTM és a többi
3
Churn előrejelzés - PREDIKCIÓ
Feladat: egy olyan modell előállítása, mely az ügyfelekről rendelkezésre álló adatok alapján megmondja annak a valószínűségét, hogy az adott ügyfél szerződése megszűnik a közeljövőben Megválaszolandó kérdések: milyen elvándorlást jelzünk előre („forced” vagy „unforced”) milyen időintervallumra jelzünk előre mit is jelzünk előre pontosan – elvándorlás és megtarthatóság kapcsolata milyen rendszerességgel kell kiszámolni a churn valószínűségeket - milyen adatokat építhetünk be a modellbe hogyan értékeljük ki a modelleket az elvándorlási valószínűség alapján legyen ügyfél szegmentáció és az milyen alapelvek alapján
4
Churn előrejelzés – 1997-2007 1997-1999 „Tanulás” 2000-2002 „Úttörők”
Speciális mintán érdekes összefüggések feltárása, DM algoritmusokkal való ismerkedés – churn modellek fiókban „Tanulás” Első churn modellek illetve rendszerek kifejlesztése. Viszonylag kevés adat és egyéb okok miatt a modellek nem tudtak stabil teljesítményt adni. „Úttörők” Korábbi projektek tapasztalatainak felhasználásával illetve az új adatok beépítésével egyre stabilabb modellek kerültek előállításra (szerződés+viselkedés adat). CRM rendszerekkel való integráció elkezdődik „Stabil rendszerek” Szinte minden bank és telekommunikációs vállalatnak van saját churn rendszere – többségük CRM rendszerrel integrálva. Új CRM adatok a modellekbe. 2006- „CRM”
5
Churn előrejelzés napjainkban
ELTERJEDTSÉG: legtöbb telekommunikációs cégnek és banknak van saját churn előrejelző rendszere MINŐSÉG: a modellek minősége között jelentős eltérések tapasztalható. Vannak 6-7 éve fejlesztett viszonylag elavult modellek, frissen fejlesztett egyszerű modellek és vannak igen stabil, professzionális churn rendszerek. A modellek többsége statikus – azaz egy projekt eredményeként előállt modell nem változik időben. TECHNOLÓGIA: A technológia szint nem változott – továbbra is modellek többsége logisztikus regresszióval kerül kiszámolásra. Az sem ritka, hogy a churn modellek „kézzel”, adatbányászati elemzések nélkül készülnek. ADATOK: az adattárházban tárolt adatok elérhetők a modellek számára, így a modellek minőségét befolyásolja az adattárház feltöltöttsége is. Általában szerződéssel kapcsolatos adatok és ügyfél viselkedésével kapcsolatos adatok rendelkezésre állnak, de ügyfélszolgálattal való interkaciók nem SCOPE: Churn valósszínűségek havonta frissülnek, az előrejelzések mindig a következő hónapokra vonatkoznak. ALKALMAZÁS: (a) proaktív csoport ez alapján válogat le, (b) kampány targetálásnál ezen információ felhasználása, (c) CRM folyamtokba integrálása. Legtöbb esetben a churn modellek alklamazása nincs átgondolva – „üresen dolgozik”.
6
GYAKORLATBAN Churn modellek teljesítményének mérései
Átlagos churn ráta: 1,5% Churn ráta az első 1%-ban: 17,3% (LIFT: 11,5) Churn ráta az első 10%-ban: 9,5% (LIFT: 6,3) Az ügyfelek sorbarendezése churn valószínűség szerint – majd kiszámolható ez alapján elkészíthető a churn modell teljesítmény görbéje. A görbe megmutatja, hogy a sorbarendezés után az első 1, 2, 3 %-ba az összes elvándorló hány százaléka esik.
7
Vezetékes cégek és bankok
Modellek teljesítménye (első 1% LIFT értéke) CHURN MODELL Nincs hűség szerződés Van hűség szerződés LIFT: 4-6 LIFT: 8-15 Vezetékes cégek és bankok Mobil cégek
8
Churn modellek fejlődési irányai
9
Előrejelzés pontossága hogyan javítható:
Hogyan lehet javítani az ügyfél megtartást? Ügyfél elvándorlás komplex kezelése: egy téves szemléletmód változtatása, azaz az elvándorlás előrejelzése önmagában nem csökkenti az elvándorlás -> elvándorlási folyamat komplex kezelése részprobléma Előrejelzés pontossága hogyan javítható: Új adatok integrálása a modellbe (CRM adatok, Voice Mining, stb.) Szűrés a megkeresés közben – GUIDE MODELLEZÉS ÚJ ALGORITMUSSAL
10
7 18 Elvándorlás vs. megtarthatóság 45 7 = 52 25
A churn modellek általában kiszámolják, hogy mekkora annak a valószínűsége, hogy az adott ügyfél elmegy 22-es csapdája Probléma: a churn modell a múltbeli adatok alapján kalkulál – nem tudja kalkulálni a jövőben történő eseményeket: pl. proaktív megkeresést. 1000-ből mennyire vándorol el 1000-ből mennyi vándorol el megkeresés után 45 7 1000 megkeresésből hányat tartunk meg 7 18 = A szegmens 52 B szegmens 25
11
Churn előrejelzés javítása – új adatok (CRM)
Az elmúlt években komoly CRM fejlesztések történtek a telekommunikációs és banki szektorban – ennek eredményeként rendelkezésre állnak ügyfél-ügyfélszolgálati interakciók is. Az interakciók után közvetlenül az ügyfelek 10-15%-nál azonnal érdemes átírni a churn valószínűséget (pl. magas elvándorlási valószínűség ügyfél egy új szolgáltatásra regisztrál vagy alacsony churn valószínűségű panaszkodik) interakció A tapasztalatok azt mutatják, hogy ezek az események önmagukban jelentősen felülírják az ügyfél elvándorlási valószínűségét -> azonnali frissítés indokolt
12
Churn előrejelzés javítása – új adatok (Voice Mining)
Voice Mining rendszerek az összes hanganyagot feldolgozzák, az ebből kinyert információk ugyancsak felhasználható a churn valószínűség számításánál. LEHETSÉGES ALKALMAZÁS: 1. FRAUD RENDSZER - (magas churn valószínűségre állítás), amennyiben az ügyfél ingerülten fejezte be a telefonálást 2. CHURN MODELL – az ügyfélről rendelkezésre áll egy „history” rekord az elmúlt időszak interakcióiról (pozitív és negatív élmények külön tárolva) – ezen információk beépíthetők a churn modellbe. interakció Hanganyag Az adott ügyfélnek hány interakciója volt, ebből hány pozitív illetve negatív érzelmi skálájú
13
Churn előrejelzés javítása – GUIDE
A churn valószínűség tovább finomítható az interakció közben – útmutató az ügyfélszolgálatosoknak! LEVÁLOGATÁS CHURN MODELL ALAPJÁN MEGOLDÁS – megtartási ajánlat előtt tegyünk fel 2-3 olyan kérdést, ami alapján tovább szűrhető a minta. Alapsokasági churn ráta: 2% A churn modell segítségével leváloghatható ügyfél úgy, hogy körükben a churn ráta %. Mennyire elégedet az X szolgáltatással 450 1.550 Nagyon elégedett: 2% Ön szerint mennyire drága a szolgáltatója? 650 900 1.600 olyan ügyfél is bekerült a leválogatásba, aki nem akar elmenni!!! Nem drága/olcsó: 6% 548 ügyfél kap „fölöslegesen” ajánlatot
14
JELEN JÖVŐ Churn előrejelzés javítása – új algoritmus
A churn modellek többsége logisztikus regresszióval készül. Előnyei: Általában a legjobb teljesítményt adja Nem fekete doboz – az eredmény modellek jól értelmezhetők (mik a kulcs változók előrejelzés szempontjából) Nem kell külön adatbányászati szoftver Nemzetközi benchmarkok azt mutatják, a korábban szinte kizárólag logisztikus regressziót fokozatosan felváltják az SVM algoritmusok. Ennek oka: hogy egyre jobb SVM algoritmusok kerülnek kifejlesztésre, a futási idő fokozatosan javul, a modellek nem annyira robosztusak és a „fekete doboz” stáusz is egyre kevésbé jellemző rá.
15
Teszt környezet leírása I.
3 teszt adatbázis Mobil (prepaid) Üzletág Vonalas ISP Rekordszám 87.334 34.775 Változók száma 44 89 146 Churn ráta 1,8% 4,2% 1,2% Nem Nem Igen Hűségszerződés
16
Teszt eredmény – prepaid mobil
Rekord: Változó Churn% KTM 14%-al több churn-ölőt talált TOP1%-on, mint a második (NH) helyezett a (+21-el több churnölő) 44 1,8% +14% TOP1% TOP10% LIFT teszt teszt
17
Teszt eredmény – vonalas
Rekord: Változó Churn% KTM 30%-al több churn-ölőt talált TOP1%-on, mint a második (LR) helyezett a (+27-el több churnölő) 87.000 89 4,2% TOP1% TOP10% +30% LIFT teszt teszt
18
Teszt eredmény – ISP TOP1% TOP10% LIFT Rekord: Változó Churn% teszt
KTM 23%-al több churn-ölőt talált TOP1%-on, mint a második (NH) helyezett a (+24-el több churnölő) 34.000 146 1,2% +23% +43% TOP1% TOP10% LIFT teszt teszt
19
Konkúzió KTM algoritmus átlagosan 14-30%-al ad jobb teljsítményt a TOP1%-on, mint a többbi algoritmus. Volt olyan tanító adatbázis, ahol a logisztikus regressziós modellnél 43%-al több churn-ölőt talált a TOP1%-on. A teszt adatbázisokon hasonló fölény tapasztalható, mint a tanító adatbázison, itt 11-20%-al ad jobb modellt. Ez azt jelenti, hogy a KTM „hajlamosabb” egy kicsit a túltanulásra – de ez általában az SVM algoritmusoknak is sajátja. Minél több a változók illetve rekordok száma, annál nagyobb a különbség a KTM és a többi modell teljesítménye között.
Hasonló előadás
© 2024 SlidePlayer.hu Inc.
All rights reserved.