Körmendi György SPSS Hungary 2007 november 6. Magyar nyelvű szöveganalitika
© 2007 SPSS Hungary 2 Mit várunk a szöveganalitikától? A vállalatoknál tárolt információk 80%-a struktúrálatlan adatokban /IDC/ Információ kinyerése! Hol tart?
© 2007 SPSS Hungary 3 Mit NEM tárgyalunk? Keresés Speciális feladatok (pl. spamszűrés)
© 2007 SPSS Hungary 4 Text analitikai eszköztár TMFC 5.0
© 2007 SPSS Hungary 5 Web feed node
© 2007 SPSS Hungary 6 Web feed node
© 2007 SPSS Hungary 7 Web feed node
© 2007 SPSS Hungary 8 Web feed node
© 2007 SPSS Hungary 9 Statisztikai gépi fordító – Language Weaver
© 2007 SPSS Hungary 10 A textanalitika központi eleme
© 2007 SPSS Hungary 11 Különálló Text Link Analysis
© 2007 SPSS Hungary 12 Magyar nyelvű kivonatolás
© 2007 SPSS Hungary 13 Szemantikus szöveganalitika Kivonatolás Szótárak, Könyvtár Nyelvi minták azonosítása Az ipafai papnak fapipája van. A Clementine a legjobb adatbányász szoftver.
© 2007 SPSS Hungary 14 A textanalitika központi eleme
© 2007 SPSS Hungary 15 Szótár
© 2007 SPSS Hungary 16 Szótár
© 2007 SPSS Hungary 17 Text Link Analysis
© 2007 SPSS Hungary 18 Magyar példák
© 2007 SPSS Hungary 19 Magyar példák
© 2007 SPSS Hungary 20 Text link analysis
© 2007 SPSS Hungary 21 Magyar példák
© 2007 SPSS Hungary 22 Magyar példák
© 2007 SPSS Hungary 23 Magyar példák
© 2007 SPSS Hungary 24 Text link analysis
© 2007 SPSS Hungary 25 Text link analysis
© 2007 SPSS Hungary 26 Magyar példák
© 2007 SPSS Hungary 27 Magyar példák
© 2006 SPSS Inc. 28 TMC 3.0 Advanced Features (5) Link Analysis & Pattern Matcher The pattern matcher allows you to find relationships between concepts identified during the text extraction process. Examples: Bioinformatics: Gene1 Gene2 CRM: Customer1 handset Homeland security: person organization TMC 3.0 gives you access to the pattern matcher via the Text Link Analysis node CEMI node – load through CEMI dialogue Projects involving the pattern matcher should involve the Text Mining Task Force (contact Olivier Jouve)
© 2007 SPSS Hungary 29 Mire jó a szöveganalitika? Security Attitűd (vélemény) azonosítás (pl. ügyfélszolgálat, piackutatás) Pharma vényadatok digitalizált levéltárak
© 2006 SPSS Inc. 30 Churnmodell javítása CHURN Technical Support New Phone ASAP New Phone Nearest Store Location Minute Charges Manager ASAP Help Learning Handset Customer Care Change Rate Thicker Lines = Stronger Associations
© 2007 SPSS Hungary 31 CRM - telco 1 1. Hagyományos churn modell 2. Text mining eredményekkel 2 25%-os churn csökkentés 43M$ / hó
Forrásrendszer (mérési adatok) Sales DB, Marketing DB Elemzések egyedi riportok Clementine-nal SPSS Clementine Elemzési környezet Adatbányászati modellek SPSS Base Adattranszformáció, adattisztítás Alkalmazás
Kérdések? Körmendi György