Az előadás letöltése folymat van. Kérjük, várjon

Az előadás letöltése folymat van. Kérjük, várjon

Adatbányászat. Miért kell menedzselni a tudást és az adatokat? Az adatok mennyisége folyamatosan nő Az elektronikus dokumentáltság növeli az átláthatatlan.

Hasonló előadás


Az előadások a következő témára: "Adatbányászat. Miért kell menedzselni a tudást és az adatokat? Az adatok mennyisége folyamatosan nő Az elektronikus dokumentáltság növeli az átláthatatlan."— Előadás másolata:

1 Adatbányászat

2 Miért kell menedzselni a tudást és az adatokat? Az adatok mennyisége folyamatosan nő Az elektronikus dokumentáltság növeli az átláthatatlan adathalmazt Ki kell szűrni a hasznos információkat

3 Az adatbányászat célja Információ feltárás ▫Megerősítés ▫Felfedés Feladatok ▫Predikciós feladatok ▫Leíró jellegű feladatok

4 Indukcó alapú tanulás Tények Koncepció Eljárások Alapigazságok (principák)

5 Adatok előfeldolgozása Hiányos adatok Zajos adatok Inkonzisztens adatok

6 Adatbányászati technikák A felügyelt tanulás adatbányászati technikái: ▫Osztályozás ▫Regresszió A nem felügyelt tanulás adatbányászati technikái: ▫Csoportosítás (szegmentálás) ▫Asszociáció

7 Adattárházak

8 Adattárházak – elvárások Időfüggőség Változatlanság Tematikusság Integráltság

9 OLTP és OLAP rendszerek Felhasználó- és rendszerorientáltság Adattartalom Adatbázis-szerkezet Nézőpont Hozzáférési minták

10

11 Adattárházak adatforrásai Külső adatforrások Független adatpiac Relációs és más adatbázisok

12 Többdimenziós adatmodellek Alapfogalmak ▫Adatkockák ▫Dimenziók ▫Tények

13 Többdimenziós adatmodellek Csillagséma adatmodell Hópehelyséma adatmodell Galaxisséma adatmodell


Letölteni ppt "Adatbányászat. Miért kell menedzselni a tudást és az adatokat? Az adatok mennyisége folyamatosan nő Az elektronikus dokumentáltság növeli az átláthatatlan."

Hasonló előadás


Google Hirdetések