Az előadás letöltése folymat van. Kérjük, várjon

Az előadás letöltése folymat van. Kérjük, várjon

WizWhy A sikeres emberek legfőbb ismérve évezredeken át: új(szerű) törvényszerűségeket, hatásokat és összefüggéseket - másokat megelőzve - pontosabban.

Hasonló előadás


Az előadások a következő témára: "WizWhy A sikeres emberek legfőbb ismérve évezredeken át: új(szerű) törvényszerűségeket, hatásokat és összefüggéseket - másokat megelőzve - pontosabban."— Előadás másolata:

1 WizWhy A sikeres emberek legfőbb ismérve évezredeken át: új(szerű) törvényszerűségeket, hatásokat és összefüggéseket - másokat megelőzve - pontosabban fedeztek fel és hoztak biztos döntést. "újszerű": A WizWhy feltárja egy adatállomány összes(!) szabályát, így ezek 99.9%-a teljesen újszerű és lehetőséget ad sikeresebbnek lenni. "másokat megelőzve ": A WizWhy automatikus szabályfeltárása garantálja a leggyorsabb megoldást, hiszen a több millió variáció kipróbálása nem igényel éveket, csupán perceket. "pontosabban": szavakkal definiált megérzések helyett a WizWhy akár 8 tizedes pontossággal képes meghatározni azokat a határokat, ahol a siker sikertelenségbe menne át "biztos döntés": a WizWhy nemcsak létrehozza az új szabályokat, de azokat automatikusan mérlegelve a legjobb döntés meghozatalában is segít 1

2 Az ADATOK.E alakulását mely tényezők és milyen mértékben befolyásolják? 2

3 A lokális optimum megismerhető, a globális optimum nehezen felismerhető. A kettő közötti különbség kockázatot jelent 3

4 Problémafelvető következtetések Látható, hogy a leíró statisztikák sokszor félrevezetőek (ADATOK.B mutatta a legszorosabb összefüggést, mégis a legjobb modellből csak az maradt ki) A minden változót szerepeltető módszerek (pl. regresszió) sem garantálnak optimális megoldást, mert néhány változót legtöbbször érdemes kihagyni Még a stepwise regresszió sem biztosít a legtöbb esetben tökéletes megoldást (ha az F-enter értéket pl. 4-re állítjuk, úgy azt a következtetést kapjuk, hogy elfogadható modell nem hozható létre) Ha 4X8-as mátrixnál sem lehet megállapítani az összefüggést, úgy valós méretű adatbázisoknál még kevésbé A módszerek csak adott lépésnél állapítják meg az éppen optimális döntést, de nem tudnak előre gondolkodni (mint egy sakkgép). A problémák megoldása: Ha minden variációt legenerálunk, úgy a globális optimum sem marad ki 4

5 „The Wisdom of Crowds” Egész adatállományhoz egy szabályt rendel (pl. regressziók) Több szabály (pl. döntési fa), de egy rekord csak egy szabályhoz tartozik vizsgált sokaságot általánosan leíró modellekre volt szükség a múltban Minden szabályt feltár Egy rekord sok szabályhoz is tartozhat Egyedi esetekről pontosabb információt ad (hitelkeret- bírálat, churn, CLV, stb. Megszokott módszerek WizWhy 5

6 „Adatbányászat definíciója:"The nontrivial extraction of implicit, previously unknown, and potentially useful information from data” Piatetsky-Shapiro “The key in business is to know something that nobody else knows.” Aristotle Onassis Mivel az egész adatállományhoz egy szabályt rendelnek, így speciális felfedezések nem tehetők általuk Pl. neurális háló, logisztikus regresszió nem értelmezhetők mindenki számára A „minden szabály” feltárása a legjobb alapot adja a felfedezésekhez Az If-then szabályok által értelmezhető összefüggések állapíthatók meg Megszokott módszerek WizWhy 6

7 Felfedezések gyorsasága az üzleti és a tudományos sikerek kulcsa Futtatásonkénti egyetlen megoldás miatt csak napok, hónapok, évek alatt lehetne kipróbálni minden variációt Egyetlen futtatásban feltár „minden szabályt” (p.o at), így szűrőfeltételekkel egyszerűen és gyorsan felfedezhetünk újszerű megállapításokat Megszokott módszerek WizWhy 7

8 Döntési fák Pl. ha első lépésben a „nem” akár minimális mértékben is meghatározóbbnak mutatkozik a többinél, úgy már soha nem kaphatunk olyan szabályokat,, amelyek a férfire és nőre egyaránt érvényesek lesznek Úgy is felfogható, mint ha olyan döntési fa lenne, amely minden variáció mentén képes dönteni, így a korábbi döntések nem zárják ki a potenciáli s lehetőségeket. Megszokott módszerek WizWhy Feladat: havi fizetések elemzése „nem”, kor, iskolai végzettség, iparág alapján 8

9 Outlier Rendszerint negatív tartalmú fogalom Rosszul becsülhető Néha szükséges elhagyni Pozitív tartalom Ha becsülhető, úgy jobb megbízhatósággal elemezhető, mint más módszerekkel Outlier-ek speciális szabályait is fel tudja tárni (csalások, tőzsdei hirtelen emelkedések/csökkenések, stb.) Megszokott módszerek WizWhy 9

10 Tanuló és tesztelő szakaszok új dimenziója Rekordok alapján történik csak szétvágás Rekordok alapján is történhet tanulás, illetve tesztelés Az algoritmusnak köszönhetően változók szerint is külön-külön csoportok képződnek (pl.. Var1, Var2, Var3 elemzése után p.o. egy Var8, Var15, Var87 analízise is megtörténik (sok millió egyéb variáció mellett). Ha minél több kombinációból képződik szabály, illetve, ha a szabályok azonos irányba mutatnak, annál biztosabb a „teszt” szakasz. Megszokott módszerek WizWhy 10

11 Missing problémája Rekordokat kell kihagyni Változókat kell kihagyni Hiányzó értékeket helyettesíteni kell (hibaforrás!) Rekordokat nem kell kihagyni Változókat nem kell kihagyni Hiányzó értékeket sem kell helyettesíteni Pl. ha egy adott rekordnál 100 változóból 30 nincs kitöltve, úgy a 70 változó alapján is sok-sok szabály képződhet Megszokott módszerek WizWhy 11

12 Kategóriaváltozók problémája Kategóriahatárokat az elemzőnek kell definiálnia (pl. 0-10, , 21-30, 31-40, 41-50,..). Az életben semmi sem kötődik ilyen merev kategóriahatárokhoz, mégis szinte mindenben hasonlót használnak Előre definiált kategóriaváltozókat is képes elemezni AUTOMATIKUSAN állapít meg kategóriákat Kategóriák AUTOMATIKUSAN változhatnak szabályról-szabályra egy futtatáson belül is. Pl. churn esetén az életkor-kategória termékenként más-más lehet (de termék-díj relációban is módosulhat) Megszokott módszerek WizWhy 12

13 Függő változó nemlinearitásának problémája Mivel az egész állomány összes rekordjára érvényesnek kell lennie egy-egy együtthatónak, ezért lineáris változókkal nemlineáris függő változót csak problémák árán lehet elemezni Mikroszegmensek még lineáris változók esetén is jobban leírják a nemlineáris változót. Megszokott módszerek WizWhy 13

14 Túltanulás problémája Jellemző Nehezen kivédhető Nem jellemző Könnyen kivédhető A sok szabály ellensúlyozni tudja a túltanulás problémáját (maximum 6 feltétel lehet egy szabályon belül) és minden szabálynak meg kell felelni külső, szakmai elvárásnak Megszokott módszerek WizWhy 14

15 Szabályok értelmezhetősége Neurális hálók: nem értelmezhető Regressziók: nehezen értelmezhetők Döntési fák: könnyen értelmezhetők Könnyen értelmezhető Nem szükséges hozzá speciális tudás Megszokott módszerek WizWhy 15

16 Csalásfeltárás Külön szoftver szükséges hozzá A múltbéli csalásokra meg kell tanítani (rossz becslés) Megelőzés nem lehetséges a „fekete doboz” miatt Beépített opció A megadott múltbéli csalásokra is tud elemzést végezni AUTOMATKISAN új csalástípusokat és új eseteket is feltár Prevenciót támogatja az érthető szabályokkal Megszokott módszerek WizWhy 16

17 Valóság heterogenitása vs. Modell homogenitása Az „egy adatállomány - egy modell” elképzelés legtöbbször sikertelen vállalkozás Megtalálja a homogén csoportokat, miközben a heterogenitás nem probléma Megszokott módszerek WizWhy Probléma: az emberek között nincs teljesen azonos, a döntéseik is számtalanok, mégis egy modellben akarják meghatározni a viselkedésüket 17

18 Vis major a kezdő adatbányászatnak is vis major Vagy külön választják az idősorokat (ez kevés rekordszámmal, nagy kockázattal jár) Vagy egyben elemzik, de egyik periódusnál „alulról”, a másiknál „felülről” több tévedés lesz Megtalálja az optimális megoldást Az általános szabályoknál az egész idősorból választ szabályt A bekövetkezett változások miatt érintett tényezőknél automatikusan felismeri az eltérést és a periódus előtti, illetve utáni szakaszra külön szabályokat alkot Előrejelzésnél az előző kettőből végzi a végső predikciót. Megszokott módszerek WizWhy Probléma: Sok példa közül megemlítve a „2001. szeptember 11” előtt-utáni, pénzügyi válság előtt-utáni, kamatadó előtt-utáni időszakok idősorai nehezen elemezhetők egyben 18

19 Asszociációs szabályok vs. WizWhy Csak azt elemzik, hogy történt-e vásárlás adott termékből (I/N) Képes a mennyiségek figyelembevételével szabályokat alkotni (pl. ha a Tuborg Gold sör mennyisége 3-6 között van, akkor vásárolnak még Termék8-ből Az árak elemzésére is képes (saját, illetve konkurensek árai) Fizetett összegek előrejelzésére is alkalmas Dátumértékek is figyelembe vehetők (pl. délután 4-5 között jellemző egy adott viselkedés) Megszokott módszerek WizWhy Probléma: Vásárlói szokások elemzésénél vajon mindegy, hogy egy üveg sört vásárolnak, vagy bulihoz többet? 19

20 Pontosság hátránya Többnyire felismernék, hogy egy adott változó által leírható a churn. Pl. neurális háló „fekete doboza” miatt nem is lenne olyan feltűnő, hogy „bent maradt” egy „felesleges” változó Ugyanúgy feltárná az összefüggést az adott változó és a churn között, de ez nem gátolná meg abban, hogy feltárja azokat a szabályokat is, ahol csakugyan előre lehet jelezni a lemorzsolódást. Azaz elemzői hibákat is tompítani tud Megszokott módszerek WizWhy Probléma: pl. churn elemzésnél a szerződés megszüntetését jelző cella kitöltöttsége egyértelmű „előrejelzést” adna, de értelmetlen 20

21 Ok-okozat Az outputok által még a lehetőség sincs meg arra, hogy ok-okozat kapcsán felismerés szülessen Az If-then szabályok közül több konkrét ok-okozati összefüggést állapít meg (könnyen tanulmányozható formában) Megszokott módszerek WizWhy 21

22 Szabályok a szabályok között Mivel többnyire egyetlen szabály képződik, így még a lehetőség sincs meg erre. WizWhy automatikusan elemzi a létrejött szabályokat és „értelmet” keres köztük. Pl. Ha három feltétel külön-külön adott, akkor vásárolnak egy adott termékből, de ha mindhárom adott egy időben, úgy már nem történik vásárlás. Ilyen feltárások üzletileg és tudományosan igen értékes következtetéshez vezethetnek Megszokott módszerek WizWhy 22

23 Szabályok két oldala Mivel többnyire egyetlen szabály képződik, így még a lehetőség sincs meg erre. WizWhy automatikusan elemzi a létrejött szabályokat és keresi azokat a szabályokat, amelyekre igaz: ha bármelyikük igaz egy adott esetben, akkor a feltüntetett nagy valószínűséggel bekövetkezik a vizsgált esemény, de ha egyik sem igaz, akkor ugyancsak nagy valószínűséggel a másik bekövetkezés valósul meg Megszokott módszerek WizWhy 23

24 „A több kevesebb” Többnyire egyetlen szabály képződik, de a szoftverek üzemeléséhez többnyire több napos tanfolyamok szükségesek WizWhy automatikusan tárja fel az összes szabályt, gyakorlatilag első alkalommal is 5 perc alatt el lehet jutni az input adatok betöltésétől az előrejelzésig. Megszokott módszerek WizWhy 24

25 Modellek eredménye Többnyire szoftverspecifikus fájlban tárolódnak a modellek, így tanulmányozási körük erősen limitált WizWhy sokféle fájlformátumban képes elmenteni az összes modellt (akár text fájlban is), így a tanulmányozhatóság korlátlan. Megszokott módszerek WizWhy 25

26 Modellek reprodukálhatósága Többnyire szoftverspecifikus fájlban tárolódnak a modellek beállításai is, így utólagos ellenőrzésük, kontrollálásuk erősen limitált WizWhy sokféle fájlformátumban képes elmenteni a modellek beállításait is, így mindig lehet tudni, hogy adott szabályok milyen körülmények között igazak Megszokott módszerek WizWhy 26

27 Multikollinearitás Érintett változókat ki kell hagyni az elemzésből WizWhy lehetőséget ad, hogy egymással összefüggésben lévő változók ne szerepeljenek egyben, de ettől még más változókkal számtalan szabályt alkothatnak. Megszokott módszerek WizWhy 27

28 Előrejelzések száma Szinte kizárólagosan egyetlen előrejelzés készíthető WizWhy 3 lehetőséget biztosít az előrejelzés kalkulációjához (minden szabály és a preferált szabályok kétféle csoportja) Megszokott módszerek WizWhy 28

29 Real-time használat Call Center esetében Megoldhatatlan, mert a modellek futtatásához minden adatra szükség lenne és nincs dobozos megoldás arra, hogy az adatbányászok algoritmusait a call centeres könnyen futtassa WizWhy Prediktor minden call centeres gépére telepíthető olcsó megoldás, amely a központi WizWhy szabályai alapján a kapott információk begépelése után egy gombnyomásra kiadja a legjobb ajánlatot, sőt érvanyagokat is képernyőre tesz. Megszokott módszerek WizWhy 29

30 Adathibák veszélye Legtöbb módszer irreális outputot fog eredményezni Mivel Ft-os lakossági hitelösszeg nem gyakori, ezért vélhetően nincs is ilyen szabály, azaz nem fog érvényesülni az elgépelés. Megszokott módszerek WizWhy Probléma: az adatrögzítő véletlenül Ft-os havi hitelösszeg helyett Ft-ot gépel be 30

31 Miért jobb a több információ? „Antilop vagy madár?” Kevés információ kétértelműséget okozhat. Több információ az egyértelműséget támogatja 31

32 Üzleti/tudományos bűvös kocka Miért tévednek az „angol tudósok”? Kérdés: Mikor házasodnak a fiatalok? (fiktív példa) Válasz1: életkor között (megbízhatóság 60%) Válasz2: Ha egyetemet, főiskolát végeznek, akkor év között. Ha nincs felsőfokú végzettség, úgy év között (megbízhatóság 70%) Válasz2: Ha egyetemet, főiskolát végeznek és a karriert nevezik meg fő célnak, akkor év között. (megbízhatóság 80%) 32

33 Tőzsdei adatbányászati példa 33

34 34 Amerikai elemzés körülményeinek ismertetése Vizsgált részvények száma: 41 (amerikai likvid részvények) Vizsgált részvények száma: 41 (amerikai likvid részvények) Megfigyelések száma (377 nap *41) Megfigyelések száma (377 nap *41) Input adatok: kizárólag historikus árfolyamadatok (nyitó, maximum, minimum és záró) Input adatok: kizárólag historikus árfolyamadatok (nyitó, maximum, minimum és záró) Output: „Növekedés”, „Csökkenés”, illetve „Semleges” Output: „Növekedés”, „Csökkenés”, illetve „Semleges”

35 35 A cél ismertetése Esélyhányados növelése, egységnyi (pl. 100) kereskedésnél megnövelni a sikeres üzletek számát Esélyhányados növelése, egységnyi (pl. 100) kereskedésnél megnövelni a sikeres üzletek számát Valószínűségek alakulásának pontos ismerete Valószínűségek alakulásának pontos ismerete Egyéb tőzsdei előrejelzésekhez validálási módszer (igényesség) nyújtása Egyéb tőzsdei előrejelzésekhez validálási módszer (igényesség) nyújtása

36 36 „Emelkedés” sikeressége (377 nap)

37 37 „Csökkenés” sikeressége (377 nap)

38 Kérdőív adatok Melyik a kedvező célcsoport? 38

39 Melyik a kedvező célcsoport? Összesen Férfi 22,172 20,553 20,032 18,776 18,887 17,672 19,579 21,200 20,532 18,093 19,602 Nő 22,407 20,304 19,396 17,553 20,940 18,612 20,830 17,648 20,020 20,364 19,700 Összesen 22,286 20,417 19,739 18,229 19,883 18,091 20,182 19,356 20,271 19,367 19,650 39

40 WizWhy - Csalásfeltárás Szoftverhasználat lépései 40

41 Welcome to WizWhy 41

42 Fájltípus kiválasztása A Basic Data fülön kiválasztjuk a vizsgálandó adatállomány formátumát 42

43 Fájlnyitás lépései A vizsgálandó adatállományt (pl. peldaadat.csalas.txt) a Windows által támogatott megnyitási eljárással kiválasztjuk a megfelelő útvonalon 43

44 Fájlnyitás lépései Az ábrán látható sorrendben kiválasztjuk a fájl formátumát (Delimited), illetve, hogy a fájl tartalmazza a mezőneveket, majd az elválasztás módját (Tabulator). Ezt követően megjelöljük, hogy a WizWhy az egész adatbázis alapján állapítsa meg az egyes mezőkhöz tartozó típusokat, majd a Parse gombra kattintva elkezdődik a gyors minősítés, melyet az OK gomb által véglegesítünk. 44

45 Vizsgálandó változó beállítása Kiválasztjuk a vizsgálandó témát, jelen esetben a Vizsgalt_tema nevű (utolsó) változót. Azaz azt szeretnénk meghatározni, hogy mely ügyfelekre jellemző a vizsgált téma, és ezen belül melyeket tekinthetünk csalásgyanús eseteknek. Az Ignore Field oszlopban jelölhetjük be a csalásfeltárásban irreleváns változókat, amelyeket érdemes kihagyni a szabályalkotásból (pl. ügyfél ID) 45

46 Szabályfeltárás paramétereinek a beállítása I. A Rule Parameters fülön beállítjuk a vizsgálandó változó (jelen esetben „Vizsgalt_tema”) azon értékét, amelyre a vizsgálat irányul. A WizWhy automatikusan kiszámolja az „Y” alapgyakoriságát az adatállományban (20.3%). Értelemszerűen az alapgyakorisághoz képest felülreprezentált szabályokat fontos kapni, ezért a „Minimum probability of if-then rules” értéket alapgyakoriságnál magasabbra kell állítani (default érték +40%-kal magasabb) 46

47 Szabályfeltárás paramétereinek a beállítása II. A WizWhy automatikusan kiszámolja az „Y” alapgyakorisága mellett a „nem-Y” alapgyakoriságát is ( %). Az alapgyakorisághoz képest itt is felülreprezentált szabályokat fontos kapni, ezért a „Minimum probability of if-then-NOT rules” értéket alapgyakoriságnál (79.7%) magasabbra kell állítani (default érték +40%-kal magasabb) 47

48 Szabályfeltárás paramétereinek a beállítása III. A Rule Parameters fülön meghatározhatjuk, hogy egy szabály legalább hány rekordra (ügyfélre, tanácsadóra, stb.) legyen érvényes („Minimum number of cases in a rule”) és megadhatjuk, hogy egy szabályhoz maximum hány feltételtag tartozhat (maximum 6). 48

49 Szabályfeltárás paramétereinek a beállítása IV. A Rule Parameters fülön csalásfeltárásnál feltétlenül be kell jelölni a „Search for Unexpected Rules” műveletet, hogy a WizWhy feltárja a csalásgyanús eseteket leíró szabályokat. 49

50 Költségek megadása Az Error Costs fülön beállíthatjuk, hogy a WizWhy milyen költségekkel dolgozzon az előrejelzések hibáinál. „Cost of a miss” esetében azt adhatjuk meg, hogy milyen költséget jelent a Cégnek, ha egy-egy csaláseset feltáratlan marad. A „Cost of a false alarm” esetében azt a költséget kell feltüntetni, amely abban az esetben fordul elő, ha csalásgyanúsnak tűnik egy eset, de igazából mégsem csalás. Default értékkel (1-1) is működik a szabályfeltárás. 50

51 Szabály-riportálás beállítása I. A Rule Riport fülön beállíthatjuk, hogy azonnali elemzésre a képernyőn hány szabályt jelenítsen meg. Természetesen ettől függetlenül az összes szabály „megmarad”, ez csak egy elsődleges tanulmányozási lehetőség. A feltárt szabályok sorbarendezése három szempontból lehetséges: szignifikanciaszint, valószínűség és rekordszám alapján 51

52 Szabály-riportálás beállítása II. A Rule Riport fülön megadhatjuk, hogy a szabályfeltárás során hány mintapéldát jelenítsen meg azonnal az adatállományból. Így lehetőség van arra, hogy egy-egy szabály tanulmányozása során azonnal konkrét eseteket lehessen elemezni. A WizWhy az adatállományban lévő rekordsorszámot tünteti fel. Ezt a funkciót inaktívvá is tehetjük. 52

53 Szabálytagok manuális kizárása A Manual Select fülön a WizWhy lehetőséget biztosít arra, hogy manuálisan kizárjunk olyan elméleti kombinációkat, amelyek szakmailag értelmetlenek és/vagy félrevezetőek lehetnek. Például: „Ha ‘Település’ Érd és ‘Megye’ Pest megye akkor …” feltétel értelmetlen lenne, hiszen nem hordoz semmilyen plusz információt sem, csak felesleges szabályt generálna. A szelektálásban nem érintett feltételpárok fogják az elemzés alapját képezni. Példát követve a Település minden más változóval képezhet elvileg szabályt, akárcsak a Megye is. 53

54 Adatformátumok és a riportálások megadása A Data Format fülön lehetőség van szám-, dátum- és pénzformátumok beállítására és megadhatjuk, hogy a szabályokat tartalmazó riportokat milyen formátumban szeretnénk megkapni. 54

55 Előrejelzés készítése A Prediction Input fülön lehetőség van független adatbázis megadására, amelyre előrejelzést szeretnénk kapni. Az inputnál szereplő fájlformátumok, adatbázisok itt is elérhetők. Szükséges megadni legalább egy változót a Print oszlopban, amelyet a kimeneti fájlban meg szeretnénk jeleníteni. Az előrejelzéseket tartalmazó fájl a bejelölt változókat is tartalmazni fogja (azonosítás céljából). 55

56 Szabályfeltárás Az előzőkben ismertetett beállítások után indítható el a szabályfeltárás (A Basic Data és a Rule Parameters fülök kivételével a többi beállítása default értékként is szerepeltethető). 1)Amennyiben megadásra került az előrejelzés kérése külön fájlba, úgy a Predict to file gomb megnyomásával teljesen automatikusan elindul a szabályfeltárás, illetve az előrejelzés készítése is. 2)Ha a Prediction Input fülnél nem került megadásra fájl, úgy a Issue Rules gombra kattintva lehet a szabályfeltárást elindítani. 56

57 Előrejelzés A WizWhy előrejelzését tartalmazó fájlt Excelbe importálva a fenti ábrához hasonló formátumot kapunk. Ha a Concl_Prob alapján csökkenő sorrendbe állítjuk az értékeket, akkor megkapjuk a legvalószínűbb eseteket a Prediction oszlopban található előrejelzéssel kapcsolatban. 57

58 Összefoglaló riport A Summary report-ra kattintva az elemzés összefoglalója olvasható. Megjelenítésre kerül, hogy mely adatbázis milyen paraméterekkel volt elemezve és a fenti ábrán is látható részlet. A mintaadat valóságszerű, de nem valós! Összesen 166 esetben nem lehetett pontos előrejelzést adni ( eset) A Vizsgált_téma 20.3%-ban volt jelen, de a predikciónál 59.1%-os sikerrátát lehetett elérni. 58

59 If-then szabályok Az if-then szabályok külön-külön rendezve, tanulmányozható formában kerülnek megadásra. A feltételtagok (pl. Eletkor is … 34.00) alatt szerepel, hogy mire vonatkozik a megállapítás („Vizsgalt_tema is not Y), illetve, hogy a megállapítás milyen valószínűséggel igaz (Rule’s probability: 1.000, azaz 100%-ban) és hány rekordra igaz a szabály. Példákra kattintva (pl. 90) a jobb felső sarokban megjelennek az adott rekord adatai. A bal alsó sarokban lehetőség van arra, hogy adott változókhoz tartozó szabályokat keressünk. 59

60 If-then szabályok grafikusan Egy adott szabályra pozícionálva jobb egérrel kérhetünk grafikus megjelenítést is a szabályra. A példában látható, hogy a szabály által kijelölt életév hol helyezkedik el a teljes adatállomány értéktartományán belül. Képet kaphatunk arról is, hogy a szabály a vizsgált téma hány százalékát magyarázza (2.1%) 60

61 If-then szabályok szelektálása SQL-hez Egy adott szabályra pozícionálva jobb egérrel megoldható a feltételek SQL formátumban való kimásolására is. 61

62 If-then szabályok másolása SQL-be Az Issue főmenün belül az SQL Statement ponton kérhető a kijelölt szabályok SQL nyelven történő mentése a megadott fájlba vagy a vágólapra másolása 62

63 Trend riport A bal oldali Trend Report menünél választható a változónkénti automatikus analitika. A kék vonal jelzi a vizsgált esemény alapgyakoriságát (20.3%) és ehhez képest jeleníti meg egy-egy változón belüli gyakoriságot, az oszlopok szélességével jelölve a hozzájuk tartozó rekordszámot. A példán látható, hogy a csoportos beszedésnél (340 rekord) alulreprezentált a vizsgált téma (17.4%) 63

64 Csalásgyanús szabályok A jobb oldali ablakban található az a néhány alapszabály, amely alapján adott rekordnak (ügyfélnek) más kimenetelt (magatartást) "kellene" mutatni. Például: adott életkoroknál (26-28 év közöttiek) és díjintervallumnál ( ) pozitív kimenetelnek kellene lenni, de ahogyan a bal oldalon látható, együttes előfordulás esetén mégis 92.3%- ban a negatív bekövetkezés látható. A teljes felület (képernyő) bal alsó sarkában lévő nyíl segítségével további szabályok is tanulmányozhatók. 64

65 Csalásgyanús esetek Ha a bal oldali ablakban kiválaszthatjuk az Unexpected Cases lehetőséget, úgy az eltérő (sokszor csalásgyanús )eseteket egyenként vizsgálhatjuk. A WizWhy mindegyikhez kigyűjti azokat a szabályokat, amelyek az adott rekordhoz tartozó adatoknak megfelelnek. A jobb felső sarokban látható, hogy mi prediktálható a kilistázott szabályokból, szembeállítva a baloldalon lévő, piros X által megjelölt valóságos megfigyeléssel. Ugyancsak a bal oldalon megtalálható az adott rekordhoz tartozó összes adat, mellettük színnel megjelölve, hogy melyik járul hozzá a predikcióval azonos, illetve attól eltérő szabályokhoz. 65

66 Szabályok küldése ben A feltárt szabályok, csalásgyanús szabályok és esetek automatikusan elküldhetők a WizWhy-ba épített megoldás által (File-Send Report menük) 66

67 Szabályok exportálása (nyomtatása) A WizWhy-ban az If-then szabályok, a Trend riport, a csalásgyanús szabályok és a csalásgyanús esetek egyaránt exportálhatók text fájlba, rtf fájlba és Access formátumba, illetve nyomtathatók. 67

68 Nem várt (csalásgyanús) szabályok riportja Továbbküldhető, tanulmányozható formátumban exportálható a szabályrendszer (minden lapra egy-egy nem várt (csalásgyanús) szabály, annak magyarázatával. 68

69 Nem várt (csalásgyanús) esetek riportja Továbbküldhető, tanulmányozható formátumban exportálhatóak a nem várt (csalásgyanús) esetek is (minden lapra eset, az arra vonatkozó szabályok megadásával. 69

70 Szabályok exportja Excelbe (Access által) Továbbküldhető, tanulmányozható formátumban exportálhatóak a csalásgyanús esetek is (minden lapra egy-egy csalásgyanús eset, az arra vonatkozó szabályok megadásával. Az Excel szűrőfeltételei és sorba rendezési lehetőségei által a szabályok tetszés szerint elemezhetők. Így nem jelent az sem problémát, hogy esetleg több tízezer (százezer) szabály is képződhet egy-egy elemzés során. 70

71 Köszönöm a figyelmet! Domján Csaba Mobil: 06/


Letölteni ppt "WizWhy A sikeres emberek legfőbb ismérve évezredeken át: új(szerű) törvényszerűségeket, hatásokat és összefüggéseket - másokat megelőzve - pontosabban."

Hasonló előadás


Google Hirdetések