Előadást letölteni
Az előadás letöltése folymat van. Kérjük, várjon
KiadtaGusztáv Farkas Megváltozta több, mint 10 éve
1
Csoportosítás (klaszterezés) A csoportosítás feladata a vizsgált objektumok jól elkülönülő csoportba történő besorolása. A klaszterezés sok szempontból hasonlóságot mutat az adatbányászat egy másik módszerével, az osztályozással. Mi is az a klaszter?
2
A csoportosító algoritmusokkal szemben támasztott igények Skálázhatóság Dimenzionalitás Különböző adattípusok kezelése Korlátozások érvényesítése Minimális felhasználói behatás Objektumok sorrendjétől való függetlenség Zajos adatok kezelése Értelmezhetőség és felhasználhatóság
3
Módszerek Hierarchikus módszer ▫Egyesítő ▫Felező Partícionáló módszer Fuzzy módszer
4
Osztályozás A különböző mintákat előre definiált osztályokba soroljuk A kiválasztott attribútumot osztálycímkének nevezzük
5
Döntési fák Fa formájú folyamatábra Fa köztes csomópontjain egy-egy kérdés (teszt) szerepel Minden döntési fa egy szabálybázist határoz meg
7
A Merill Lynch elemzői szerint az üzleti információk 85%-a strukturálatlan adat formájában van jelen Adatbányászati módszerekkel az adatbázisokban strukturáltan tárolt adatokból nyerhetők ki célja a dokumentumokban rejtetten meglévő új információk feltárása, azonosítása. Szövegbányászat
9
Szövegbányászat néhány feladata Információkinyerés Témakövetés Fogalomtársítás
10
Adatbányász szoftverek WEKA Enterprise Miner Clementine Intelligent Miner DBMiner MineSet
11
Konkrét adatbányászati alkalmazások Tőzsdei árfolyamok ellenőrzése (Reuters) Med-AI: Betegségek modellezése Piackutatás (Reader’s Digest Canada) Gépkocsik sztereo berendezéseinek piackutatása (Washington Auto Audio, Inc.)
12
Köszönjük a figyelmet!
Hasonló előadás
© 2024 SlidePlayer.hu Inc.
All rights reserved.