Adatbányászat
Miért kell menedzselni a tudást és az adatokat? Az adatok mennyisége folyamatosan nő Az elektronikus dokumentáltság növeli az átláthatatlan adathalmazt Ki kell szűrni a hasznos információkat
Az adatbányászat célja Információ feltárás ▫Megerősítés ▫Felfedés Feladatok ▫Predikciós feladatok ▫Leíró jellegű feladatok
Indukcó alapú tanulás Tények Koncepció Eljárások Alapigazságok (principák)
Adatok előfeldolgozása Hiányos adatok Zajos adatok Inkonzisztens adatok
Adatbányászati technikák A felügyelt tanulás adatbányászati technikái: ▫Osztályozás ▫Regresszió A nem felügyelt tanulás adatbányászati technikái: ▫Csoportosítás (szegmentálás) ▫Asszociáció
Adattárházak
Adattárházak – elvárások Időfüggőség Változatlanság Tematikusság Integráltság
OLTP és OLAP rendszerek Felhasználó- és rendszerorientáltság Adattartalom Adatbázis-szerkezet Nézőpont Hozzáférési minták
Adattárházak adatforrásai Külső adatforrások Független adatpiac Relációs és más adatbázisok
Többdimenziós adatmodellek Alapfogalmak ▫Adatkockák ▫Dimenziók ▫Tények
Többdimenziós adatmodellek Csillagséma adatmodell Hópehelyséma adatmodell Galaxisséma adatmodell