SVM alkalmazása churn előrejelzésre

Slides:



Advertisements
Hasonló előadás
Az internetezők véleménye a magyarországi vállalatok ügyfélkezeléséről. Az Infoteka Kft. – a Sugar CRM partnerje - magyarországi képviseletének megbízásából.
Advertisements

Tamás Kincső, OSZK, Analitikus Feldolgozó Osztály, osztályvezető A részdokumentumok szolgáltatása az ELDORADO-ban ELDORADO konferencia a partnerkönyvtárakkal.
PPKE ITK 2009/10 tanév 8. félév (tavaszi) Távközlő rendszerek forgalmi elemzése Tájékoztatás
A diákat készítette: Matthew Will
Mennyire projekt érett a mai magyar társadalom? 1022 Budapest, Bimbó út 3. Telefon/fax:
Válaszok válság idején: hogyan hat a válság a gyógyszeripari piackutatásra? Szerencsés Dóra Egészségügyi kutatások vezetője Millward Brown Healthcare.
Frissdiplomások a munkaerőpiacon - a jövedelmet befolyásoló tényezők
Több szerződés, lojális ügyfél Erdős Mihály elnök-vezérigazgató.
Verfasser · weitere Angaben
Data Explorer Kft. Tóth Nándor Ügyvezető.
Szűcs Imre CRM elemző GE Consumer Finance Budapest Bank Rt.
Elektronikus számlabemutatás és fizetés
2 A biztosítási piac 2013 első félévében 5,15%-ot nőtt (436 milliárdos díjbevétel)..
Tanuló (projekt)szervezet a Magyar Nemzeti Bankban
Adatbányászat az Internet korszakában
10 állítás a gyerekek internethasználatáról
MNB Statisztika A külső finanszírozási igény/képesség változása
Non-profit szervezetek bevételi szerkezetének elemzése.
Rekurzió (Horváth Gyula és Szlávi Péter előadásai felhasználásával)
Táblázat kezelő programok
A tételek eljuttatása az iskolákba
Bevezetés a gépi tanulásba február 16.. Mesterséges Intelligencia „A számítógépes tudományok egy ága, amely az intelligens viselkedés automatizálásával.
A diákat jészítette: Matthew Will
A diákat készítette: Matthew Will
A diákat készítette: Matthew Will
Makroökonómia Feladatmegoldás.
1 Apertus Közalapítvány Nemzeti Fejlesztési Program
Statisztika Érettségi feladatok
1 A magyar gazdaság helyzete, perspektívái 2008 tavaszán Dr. Papanek Gábor Előadás Egerben május 7.-én.
Az EU-pályázati rendszer gyakorlata Magyarországon
Ozsváth Károly TF Kommunikációs-Informatikai és Oktatástechnológiai Tanszék.
Új ügyfél nélkül mit érek én? Január 30.. Tartalom 1.Bemutatkozás 2.Értékesítés. Hatékonyan. 3.Jelzőlámpa az üzleti élet forgatagában 4.Több, mint.
Online hasonlóságelemzések: Online hasonlóságelemzések: Tapasztalatok (kukorica) hozamfüggvények levezetése kapcsán Pitlik László, SZIE Gödöllő (Forrás:
Webbányászat (web mining) Mártonffy A: Kutakodom, tehát vagyok cikke nyomán.
SPSS bevezetés.
K&H trambulin tapasztalatok
MAKROGAZDASÁGI KILÁTÁSOK INFLÁCIÓS JELENTÉS december Virág Barnabás December 22.
Az áttérési költségek hatása a versenyre a távközlési piacokon Lőrincz László július 28.
Debreceni Egyetem Agrár és Műszaki Tudományok Centruma Logisztikai Koordinációs Központ Logisztikai szakemberigény, képzési igény, elvárások és tények.
Statisztika a szociológiában
1 “Oly távol vagy tőlem és mégis közel...” Az Európai Unióval kapcsolatos attitűdök a hazai választók körében Göncz Borbála – Hegedűs István „Részvétel.
Szolgáltatásfejlesztés Az értékesítési és marketing osztály feladata Új szolgáltatások kifejlesztése a hagyományos és a versenypiaci tevékenységhez.
Honnan származik a pozitív nettó jelenérték? Richard A. Brealey Stewart C. Myers MODERN VÁLLALATI PÉNZÜGYEK Panem, fejezet McGraw Hill/Irwin Copyright.
Az opciók értékelése Richard A. Brealey Stewart C. Myers MODERN VÁLLALATI PÉNZÜGYEK Panem, 2005 A diákat készítette: Matthew Will 21. fejezet McGraw Hill/Irwin.
Kvantitatív Módszerek
Önálló labor munka Csillag Kristóf 2005/2006. őszi félév Téma: „Argument Mapping (és hasonló) technológiákon alapuló döntéstámogató rendszerek vizsgálata”
RÉSZEKRE BONTOTT SOKASÁG VIZSGÁLATA
TETT KUTATÁS NOGUCHI & PETERS CENTRAL-EUROPE COMMUNICATIONS INC.
Térképészet és térinformatika
Többváltozós adatelemzés
Többváltozós adatelemzés
TÁMOP 5.5.1/A-10/ “Jó pályán! Jó gyakorlatok továbbfejlesztése és alkalmazása a munkaerő-piaci integrációért és esélyegyenlőségért” Foglalkoztatási.
IV. Terjeszkedés.
IV. Terjeszkedés 2..
© 2005 The Gallup Organization T HE G ALLUP O RGANIZATION Országos Kreditmonitoring vizsgálat az oktatók körében - ábrasor
Játszani tudni kell - A gamification szabályai az interneten
Körmendi György SPSS Hungary 2007 november 6. Magyar nyelvű szöveganalitika.
Dr. Makra Zsolt projektvezető
Microsoft Üzleti Megoldások Konferencia IT HelpDesk – CRM házon belül Microsoft Operations Manager 2005 és Microsoft CRM Ügyfélszolgálat Fülöp Miklós.
Adatbányászat Excel 2007-tel
Telekommunikációs vállalat 100 százalékkal növelte a válaszarányokat az SPSS Clementine® segítségével.
Egy keretrendszer bevezetése Affentáller László MarkCon Informatikai Kft.
Korreláció-számítás.
Kutatási beszámoló 2002/2003 I. félév Iváncsy Renáta.
Ügyfélpreferenciák a bankszámlakivonatok esetében Dr. Tomcsányi Péter Prime Rate ügyvezető.
Budapest, Elmúlt-e a CRM láz? FARKAS TIBOR
ECONOMSOL a Kis- és Középvállalkozások kontrolling szolgáltatója
Tanulási görbék.
Bunkóczi László, Dr.Pitlik László, Pető István, Szűcs Imre
Szűcs Imre - Dr. Pitlik László (OTKA T049013)
Előadás másolata:

SVM alkalmazása churn előrejelzésre Előadók: Kovács Gyula – Data Research Kft.

Churn előrejelzés – feladat ismertetése Történeti áttekintés 1997-2007 Tartalom Churn előrejelzés – feladat ismertetése Történeti áttekintés 1997-2007 Ami a churn modellekről tudni kell Churn modellek 2007-ben Hogyan javítható a churn előrejelzés Adatok Megtarthatóság vizsgálata Új algoritmus alkalmazása Teszt eredmények ismertetése – KTM és a többi

Churn előrejelzés - PREDIKCIÓ Feladat: egy olyan modell előállítása, mely az ügyfelekről rendelkezésre álló adatok alapján megmondja annak a valószínűségét, hogy az adott ügyfél szerződése megszűnik a közeljövőben Megválaszolandó kérdések: milyen elvándorlást jelzünk előre („forced” vagy „unforced”) milyen időintervallumra jelzünk előre mit is jelzünk előre pontosan – elvándorlás és megtarthatóság kapcsolata milyen rendszerességgel kell kiszámolni a churn valószínűségeket - milyen adatokat építhetünk be a modellbe hogyan értékeljük ki a modelleket az elvándorlási valószínűség alapján legyen ügyfél szegmentáció és az milyen alapelvek alapján

Churn előrejelzés – 1997-2007 1997-1999 „Tanulás” 2000-2002 „Úttörők” Speciális mintán érdekes összefüggések feltárása, DM algoritmusokkal való ismerkedés – churn modellek fiókban 1997-1999 „Tanulás” Első churn modellek illetve rendszerek kifejlesztése. Viszonylag kevés adat és egyéb okok miatt a modellek nem tudtak stabil teljesítményt adni. 2000-2002 „Úttörők” Korábbi projektek tapasztalatainak felhasználásával illetve az új adatok beépítésével egyre stabilabb modellek kerültek előállításra (szerződés+viselkedés adat). CRM rendszerekkel való integráció elkezdődik 2003-2005 „Stabil rendszerek” Szinte minden bank és telekommunikációs vállalatnak van saját churn rendszere – többségük CRM rendszerrel integrálva. Új CRM adatok a modellekbe. 2006- „CRM”

Churn előrejelzés napjainkban ELTERJEDTSÉG: legtöbb telekommunikációs cégnek és banknak van saját churn előrejelző rendszere MINŐSÉG: a modellek minősége között jelentős eltérések tapasztalható. Vannak 6-7 éve fejlesztett viszonylag elavult modellek, frissen fejlesztett egyszerű modellek és vannak igen stabil, professzionális churn rendszerek. A modellek többsége statikus – azaz egy projekt eredményeként előállt modell nem változik időben. TECHNOLÓGIA: A technológia szint nem változott – továbbra is modellek többsége logisztikus regresszióval kerül kiszámolásra. Az sem ritka, hogy a churn modellek „kézzel”, adatbányászati elemzések nélkül készülnek. ADATOK: az adattárházban tárolt adatok elérhetők a modellek számára, így a modellek minőségét befolyásolja az adattárház feltöltöttsége is. Általában szerződéssel kapcsolatos adatok és ügyfél viselkedésével kapcsolatos adatok rendelkezésre állnak, de ügyfélszolgálattal való interkaciók nem SCOPE: Churn valósszínűségek havonta frissülnek, az előrejelzések mindig a következő hónapokra vonatkoznak. ALKALMAZÁS: (a) proaktív csoport ez alapján válogat le, (b) kampány targetálásnál ezen információ felhasználása, (c) CRM folyamtokba integrálása. Legtöbb esetben a churn modellek alklamazása nincs átgondolva – „üresen dolgozik”.

GYAKORLATBAN Churn modellek teljesítményének mérései Átlagos churn ráta: 1,5% Churn ráta az első 1%-ban: 17,3% (LIFT: 11,5) Churn ráta az első 10%-ban: 9,5% (LIFT: 6,3) Az ügyfelek sorbarendezése churn valószínűség szerint – majd kiszámolható ez alapján elkészíthető a churn modell teljesítmény görbéje. A görbe megmutatja, hogy a sorbarendezés után az első 1, 2, 3 %-ba az összes elvándorló hány százaléka esik.

Vezetékes cégek és bankok Modellek teljesítménye (első 1% LIFT értéke) CHURN MODELL Nincs hűség szerződés Van hűség szerződés LIFT: 4-6 LIFT: 8-15 Vezetékes cégek és bankok Mobil cégek

Churn modellek fejlődési irányai

Előrejelzés pontossága hogyan javítható: Hogyan lehet javítani az ügyfél megtartást? Ügyfél elvándorlás komplex kezelése: egy téves szemléletmód változtatása, azaz az elvándorlás előrejelzése önmagában nem csökkenti az elvándorlás -> elvándorlási folyamat komplex kezelése részprobléma Előrejelzés pontossága hogyan javítható: Új adatok integrálása a modellbe (CRM adatok, Voice Mining, stb.) Szűrés a megkeresés közben – GUIDE MODELLEZÉS ÚJ ALGORITMUSSAL

7 18 Elvándorlás vs. megtarthatóság 45 7 = 52 25 A churn modellek általában kiszámolják, hogy mekkora annak a valószínűsége, hogy az adott ügyfél elmegy 22-es csapdája Probléma: a churn modell a múltbeli adatok alapján kalkulál – nem tudja kalkulálni a jövőben történő eseményeket: pl. proaktív megkeresést. 1000-ből mennyire vándorol el 1000-ből mennyi vándorol el megkeresés után 45 7 1000 megkeresésből hányat tartunk meg 7 18 = A szegmens 52 B szegmens 25

Churn előrejelzés javítása – új adatok (CRM) Az elmúlt években komoly CRM fejlesztések történtek a telekommunikációs és banki szektorban – ennek eredményeként rendelkezésre állnak ügyfél-ügyfélszolgálati interakciók is. Az interakciók után közvetlenül az ügyfelek 10-15%-nál azonnal érdemes átírni a churn valószínűséget (pl. magas elvándorlási valószínűség ügyfél egy új szolgáltatásra regisztrál vagy alacsony churn valószínűségű panaszkodik) interakció A tapasztalatok azt mutatják, hogy ezek az események önmagukban jelentősen felülírják az ügyfél elvándorlási valószínűségét -> azonnali frissítés indokolt

Churn előrejelzés javítása – új adatok (Voice Mining) Voice Mining rendszerek az összes hanganyagot feldolgozzák, az ebből kinyert információk ugyancsak felhasználható a churn valószínűség számításánál. LEHETSÉGES ALKALMAZÁS: 1. FRAUD RENDSZER - (magas churn valószínűségre állítás), amennyiben az ügyfél ingerülten fejezte be a telefonálást 2. CHURN MODELL – az ügyfélről rendelkezésre áll egy „history” rekord az elmúlt időszak interakcióiról (pozitív és negatív élmények külön tárolva) – ezen információk beépíthetők a churn modellbe. interakció Hanganyag Az adott ügyfélnek hány interakciója volt, ebből hány pozitív illetve negatív érzelmi skálájú

Churn előrejelzés javítása – GUIDE A churn valószínűség tovább finomítható az interakció közben – útmutató az ügyfélszolgálatosoknak! LEVÁLOGATÁS CHURN MODELL ALAPJÁN MEGOLDÁS – megtartási ajánlat előtt tegyünk fel 2-3 olyan kérdést, ami alapján tovább szűrhető a minta. Alapsokasági churn ráta: 2% A churn modell segítségével leváloghatható 2.000 ügyfél úgy, hogy körükben a churn ráta 20%. Mennyire elégedet az X szolgáltatással 450 1.550 Nagyon elégedett: 2% Ön szerint mennyire drága a szolgáltatója? 650 900 1.600 olyan ügyfél is bekerült a leválogatásba, aki nem akar elmenni!!! Nem drága/olcsó: 6% 548 ügyfél kap „fölöslegesen” ajánlatot

JELEN JÖVŐ Churn előrejelzés javítása – új algoritmus A churn modellek többsége logisztikus regresszióval készül. Előnyei: Általában a legjobb teljesítményt adja Nem fekete doboz – az eredmény modellek jól értelmezhetők (mik a kulcs változók előrejelzés szempontjából) Nem kell külön adatbányászati szoftver Nemzetközi benchmarkok azt mutatják, a korábban szinte kizárólag logisztikus regressziót fokozatosan felváltják az SVM algoritmusok. Ennek oka: hogy egyre jobb SVM algoritmusok kerülnek kifejlesztésre, a futási idő fokozatosan javul, a modellek nem annyira robosztusak és a „fekete doboz” stáusz is egyre kevésbé jellemző rá.

Teszt környezet leírása I. 3 teszt adatbázis Mobil (prepaid) Üzletág Vonalas ISP Rekordszám 310.134 87.334 34.775 Változók száma 44 89 146 Churn ráta 1,8% 4,2% 1,2% Nem Nem Igen Hűségszerződés

Teszt eredmény – prepaid mobil Rekord: Változó Churn% KTM 14%-al több churn-ölőt talált TOP1%-on, mint a második (NH) helyezett a (+21-el több churnölő) 310.000 44 1,8% +14% TOP1% TOP10% LIFT teszt teszt

Teszt eredmény – vonalas Rekord: Változó Churn% KTM 30%-al több churn-ölőt talált TOP1%-on, mint a második (LR) helyezett a (+27-el több churnölő) 87.000 89 4,2% TOP1% TOP10% +30% LIFT teszt teszt

Teszt eredmény – ISP TOP1% TOP10% LIFT Rekord: Változó Churn% teszt KTM 23%-al több churn-ölőt talált TOP1%-on, mint a második (NH) helyezett a (+24-el több churnölő) 34.000 146 1,2% +23% +43% TOP1% TOP10% LIFT teszt teszt

Konkúzió KTM algoritmus átlagosan 14-30%-al ad jobb teljsítményt a TOP1%-on, mint a többbi algoritmus. Volt olyan tanító adatbázis, ahol a logisztikus regressziós modellnél 43%-al több churn-ölőt talált a TOP1%-on. A teszt adatbázisokon hasonló fölény tapasztalható, mint a tanító adatbázison, itt 11-20%-al ad jobb modellt. Ez azt jelenti, hogy a KTM „hajlamosabb” egy kicsit a túltanulásra – de ez általában az SVM algoritmusoknak is sajátja. Minél több a változók illetve rekordok száma, annál nagyobb a különbség a KTM és a többi modell teljesítménye között.