Korszerű eszközök a vállalati információ- és tudásmenedzsmentben
Üzleti intelligencia (BI) Az üzleti intelligencia olyan technológiák és alkalmazások összessége (alkalmazási rendszerek), melyek adatok gyűjtésével, hozzáférhetőségével és elemzésével foglalkoznak egy vállalatban, hogy vezetői jobb üzleti döntéseket hozhassanak. (BI ‑ business intelligence)
Alkalmazási rendszerek 1. operatív folyamatokat támogató rendszerek [Adatelőállítás] a cég szervezeti hierarchiájának alsó és középső szintjén dolgozók napi tevékenységeihez kapcsolódó tevékenységek stratégiai döntéseket támogató rendszerek [Adatok rendszerezése, elemzése, hasznosítása] a vállalati stratégiai döntések a felső vezetőkre, esetenként a középvezetők felső szintjére hárulnak, ezen döntések hatása befolyásolja és meghatározza a cég jövőjét, gazdasági pozícióját, eredményeit, ezekhez a tevékenységekhez másfajta támogató rendszerek szükségesek, melyeket összefoglaló néven BI-nak nevezünk.
Alkalmazási rendszerek 2. operatív folyamatokat támogató rendszerek ERP– Enterprise Resource Planning (vállalati eerőforrás tervezés) SCM – Supply Chain Management (ellátásilánc-menedzsment) CRM – Customer Relationship Management (Ügyfélkapcsolat menedzsment ) SFA – Sales Force Automation (értékesítési menedzsment ) HRM – Human Resource Management (humánerőforrás menedzsment ) stratégiai döntéseket támogató rendszerek (BI) vállalati információs rendszerek (pl. EIS) döntéstámogató rendszerek (DSS) vezetői információs rendszerek (MIS) adatbányászat (data mining) szövegbányászat (text mining) adatmegjelenítés geográfiai információs rendszerek stb.
A BI (Business Intelligence) helye EAI - Enterprise Application Integration alkalmazások integrációja vállalaton belül
Adatbányászat „Azt mondják, hogy a webinformáció 99%-a a webhasználók 99%-a számára haszontalan.″ Han-Kamber 434. oldal
Adatbányászat 1990 után intelligens műveletsor cél: adatminták kiemelése tudásfeltárás alapja: jelentős adatmennyiség
Mi az adatbányászat? olyan folyamat, amelynek során intelligens műveleteket, műveletsort hajtunk végre az adatminták kiemelése érdekében, vagyis az érdeklődésre számot tartó tudás nagy mennyiségű adatból történő feltárása a folyamat bemeneti adatai tárolhatók adatbázisokban, adattárházakban vagy más információtárakban az adatok felfoghatatlan halmazának adatbányászat nélküli feldolgozása információban szegény, költséges, időigényes, előítéletekre épített, félrevezethető tudást eredményezhet az 1990-es években vált jelentőssé
Az adatbányászat a gazdaságban fogyasztók célzott marketing szempontú osztályozása és klaszterezése reklámhadjáratok hatékonyságvizsgálata vevőmegtartás: lojalitás-vizsgálat hiteltörlesztési hajlandóság előrejelzése és hitelbírálati irányelvek elemzése pénzügyi bűncselekmények felderítése stb.
Az adatbányászat, mint tudomány multidiszciplináris tudomány az alábbi területekre támaszkodik: adatbázis-technológia, információ-visszakeresés mesterséges intelligencia, neurális hálók számítógépes tanulás statisztika alakfelismerés tudás alapú rendszerek, tudásmegerősítés nagy teljesítményű számítások vizuális adatmegjelenítés támogatja az üzleti stratégiát, tudományos kutatásokat...
Az adatbázis-technológia fejlődése Adatgyűjtés és adatbázis létrehozása 1960-as és a megelőző évek Adatbázis-kezelő rendszerek 1970-es, korai 1980-as évek Fejlett adatbázisrendszerek 1980-as évek közepétől napjainkig Web alapú adatbázisrendszerek 1990-as évektől napjainkig Adattárházak és adatbányászat 1980-as évek végétől napjainkig Integrált információs rendszerek új generációja 2000-es évektől napjainkig Az ábra alapja: Han-Kamber 1.1 ábra (24. old)
A KDD lépései (iteratív folyamat) adattisztítás – zajos, inkonzisztens adatok eltávolítása adatintegrálás – több adatforrás összekapcsolása adatkiválasztás – adatok kiolvasása az adatbázisból az elemzéshez adat-transzformáció – az adatok olyan formájának előállítása, hogy az bányászható legyen adatbányászat – az adatminták kiemelése érdekében végzett eljárás minta kiértékelése – tudást reprezentáló, valóban érdekes minták meghatározása tudásmegjelenítés - a kinyert tudást tudáskifejező technikákkal tárja a felhasználó elé Forrás: Han-Kamber 27. oldal
Tipikus adatbányászati rendszer architektúrája Grafikus felhasználói felület Mintaértékelés Tudásbázis Adatbányászmotor Adatbázis- vagy adattárszerver Adatbázis Adattárház Forrás: Han-Kamber 1.5 ábra (29. old)
Az adatbányászati adatok típusai relációs adatbázisok adattárházak tranzakciós adatbázisok fejlett adatbázisrendszerek és adatbázis-alkalmazások objektumorientált adatbázisok objektumrelációs adatbázisok téradatbázisok időbeli és idősor-adatbázisok szöveges és multimédia-adatbázisok heterogén és örökölt adatbázisok World Wide Web - osztott információs szolgáltatások
Feladatok osztályai, funkciók adatbányászati feladatok két osztálya: leíró - az adatok általános jellemzőit tárja fel előrejelző – meglévő adatokból következtet, prognosztizál adatbányászati funkciók fogalom-/osztályleírások: karakterizáció és diszkrimináció társításelemzés osztályozás és előrejelzés klaszterelemzés szélsőséges értékek elemzése fejlődésanalízis
Mikor érdekes egy minta? Az előállított minta akkor érdekes, ha egyszerűen érthető, bizonyos megbízhatósággal érvényes új vagy kísérleti adatokon, potenciálisan hasznos, újszerű. Egy minta akkor is érdekes, ha olyan hipotézist igazol, amelyet a felhasználó bizonyítani szeretne. Az érdekes minta tudást reprezentál.
Irányzatok az adatbányászatban orvostudományi és DNS-adatok adatbányászat pénzügyekben hiteltörlesztési hajlandóság előrejelzése és hitelbírálati irányelvek elemzése fogyasztók célzott marketing szempontú osztályozása és klaszterezése pénzügyi bűncselekmények felderítése reklámhadjáratok hatékonyságvizsgálata vevőmegtartás: lojalitás-vizsgálat adatbányászat a távközlésben
Szövegbányászat strukturálatlan vagy kis mértékben strukturált szöveges állományokból történő ismeret kinyerés tudománya. Olyan különböző dokumentum forrásokból származó szöveges ismeretek és információk gépi intelligenciával történő kigyűjtése és reprezetnációja, amely a feldolgozás előtt rejtve és feltáratlanul maradt az elemző előtt. http://www.vazsonyi.hu/szovegbanyaszat/1.html
Szövegbányászat példa Egy gépjárműforgalmazó a fórumokból szeretné megtudni, hogy mi a véleményük a fogyasztóknak a hazai forgalomban kapható gépjárművekről: Miről beszélnek a legtöbbet? Melyiket dícsérik? Melyiket szeretik a családok?