Kutatási beszámoló 2002/2003 I. félév Iváncsy Renáta.

Slides:



Advertisements
Hasonló előadás
ÉRDEKES PONTOK KINYERÉSE DIGITÁLIS KÉPEKEN. BEVEZETÉS  ALAPPROBLÉMA  Jellemzőpontok detektálása mindkét képen  Kinyert pontok megfeleltetése  Megfeleltetések.
Advertisements

Fejmozgás alapú gesztusok felismerése
F IGYELMI ALGORITMUSOKKAL VEZÉRELT HELYSZÍNANALÍZIS A BIONIKUS SZEMÜVEGBEN Persa György.
Szűcs Imre CRM elemző GE Consumer Finance Budapest Bank Rt.
Képességszintek.
Adatbányászat a kontrollingban
Készítette: Zaletnyik Piroska
Energiatervezési módszerek
PhD beszámoló 2002/2003 II. félév Készítette: Iváncsy Renáta Konzulens: Dr. Vajk István.
SAS Enterprise Miner 2. gyakorlat
Szintaktikai elemzés március 1.. Gépi tanulás Osztályozási feladat: Adott egyedek egy halmaza és azok osztályba tartozási függvénye (tanító halmaz),
MI 2003/ Alakfelismerés - még egy megközelítés: még kevesebbet tudunk. Csak a mintánk adott, de címkék nélkül. Csoportosítás (klaszterezés, clustering).
Minőségmenedzsment 1. előadás
Adatbányászat. Miért kell menedzselni a tudást és az adatokat? Az adatok mennyisége folyamatosan nő Az elektronikus dokumentáltság növeli az átláthatatlan.
Korszerű eszközök a vállalati információ- és tudásmenedzsmentben
Mesterséges neuronhálózatok
Statisztika II. II. Dr. Szalka Éva, Ph.D..
A projekttervezés első lépései
Veszélyelemzés és a Kritikus Szabályozási Pontok meghatározása
Készítette: Dömötör Ádám. Az elemzés célja A kiválasztott nyolc internetszolgáltató internetes csomagjainak összehasonlítása Az összehasonlítással segíteni.
Hierarchikus klaszteranalízis
Anyagadatbank c. tárgy gyakorlat Féléves tematika Adatbázis alapfogalmak, rendszerek Adatmodellek, adatbázis tervezés Adatbázis műveletek.
Dr. Balogh Péter Gazdaságelemzési és Statisztika Tanszék DE-AMTC-GVK
Fejmozgás alapú gesztusok felismerése Bertók Kornél, Fazekas Attila Debreceni Egyetem, Informatikai Kar Debreceni Képfeldolgozó Csoport KÉPAF 2013, Bakonybél.
Statisztika a szociológiában
Adatbázisrendszerek jövője
A diákat készítette: Matthew Will
Közlekedésmodellezés Készítette: Láng Péter Konzulens: Mészáros Tamás.
Idősor előrejelzés Önálló laboratórium 2. Kollár Péter Attila ICG36F Konzulens: Dr. Pataki Béla.
Textúra elemzés szupport vektor géppel
Csoportosítás (klaszterezés) A csoportosítás feladata a vizsgált objektumok jól elkülönülő csoportba történő besorolása. A klaszterezés sok szempontból.
Gépi tanulás Tanuló ágens, döntési fák, általános logikai leirások tanulása.
Valószínűségszámítás
Hipotézis vizsgálat (2)
Dr. Fekete István Integrált kockázatfelmérés informatikai támogatása: Szigma Integrisk Budapesti Corvinus Egyetem Balatonalmádi január
Adatbányászati módszerek a térinformatikában
Többváltozós adatelemzés 5. előadás. Hierarchikus klaszterezés Klaszterek számát nem kell előre megadni A pontok elhelyezkedését térképezi fel Nem feltétlenül.
Budapesti Műszaki Főiskola Neumann János Informatikai Kar Informatikai Automatizált Rendszerek Konzulens: Vámossy Zoltán Projekt tagok: Marton Attila Tandari.
Többszintű Tenyéralapú Biometrikus Azonosító Rendszer
Költség-minimalizálás az ellenőrző kártyák alkalmazásánál Feladatmegoldás, kiegészítés.
Adatbázis kezelés.
Paleobiológiai módszerek és modellek 7. Hét TÖBBVÁLTOZÓS ADATELEMZÉS
Podoski Péter és Zabb László. Bevezető Algoritmus-vizualizáció témakörében végeztünk kutatásokat és fejlesztéseket Felmértük a manapság ismert eszközök.
Energiatervezési módszerek
MI 2003/ Mi lenne a b legjobb választása? Statisztikai eljárásoknál az un. Fisher féle lineáris diszkriminancia függvény adja a legjobb szétválasztási.
Adatbázis-kezelés. Alapfogalmak Adat: –észlelhető, felfogható ismeret –jelsorozat –valakinek, vagy valaminek a jellemz ő je –tény, közlés Információ:
Vargha András KRE és ELTE, Pszichológiai Intézet
Adatbányászati módszerek a weblogfájlok elemzésében
Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika és Információs Rendszerek Tanszék Megerősítő elemzés „Big Data” elemzési módszerek Salánki.
F IGYELMI ALGORITMUSOKKAL VEZÉRELT HELYSZÍNANALÍZIS Persa György.
Közúti és Vasúti Járművek Tanszék. A ciklusidők meghatározása az elhasználódás folyamata alapján Az elhasználódás folyamata alapján kialakított ciklusrendhez.
Bevezetés a méréskiértékelésbe (BMETE80ME19)
Spike Sorting Solutions Csercsa Richárd Magony Andor.
Automatikus fizikai tervezési javaslatok XML adatbázisokhoz Balogh Bernadett Kresz Marcell Cseh Tamás.
Génexpressziós chipek mérési eredményeinek biklaszter analízise.
PhD beszámoló 2003/2004 I. félév Készítette: Iváncsy Renáta Konzulens: Dr. Vajk István.
Bevezetés az SPSS használatába
OpenCV CV = Computer Vision
2004 május 27. GÉPÉSZET Komplex rendszerek szimulációja LabVIEW-ban Lipovszki György Budapesti Műszaki Egyetem Mechatronika, Optika és Gépészeti.
A könyvtári integrált rendszerek statisztikai moduljának használata
SZÖM II. Fejlesztési szint folyamata 5.1. előadás
Eredetileg a statisztika matematikai eszközöket igénybe vevő államháztartástant jelentett, vagyis azon módszerek gyűjteményét és elméletét, amelyek segítségével.
Készítette: Papp-Varga Zsuzsa
SZAKKÉPZÉSI ÖNÉRTÉKELÉSI MODELL ÖNÉRTÉKELÉSI SZINTEK
Az Európai Unió tagországainak, a csatlakozásra váró országoknak
Üzleti intelligencia megoldások, avagy vezetői döntéstámogatás (XXI.)
A marketinginformációs rendszer
A leíró statisztikák alapelemei
A mesterséges neuronhálók alapjai
Szűcs Imre - Dr. Pitlik László (OTKA T049013)
Előadás másolata:

Kutatási beszámoló 2002/2003 I. félév Iváncsy Renáta

Az adatbányászat

Az adatbányászat és a tudásfeltárás A tudásfeltárás az adatbázisokban tárolt adatokból implicit, korábban nem ismert és potenciálisan hasznosnak vélt információk nem triviális úton való kinyerésének folyamata Az adatbányászat a tudásfeltárás egy fázisa Feltáró algoritmusok segítségével felsorakoztatja az adatokban található mintákat.

A folyamat főbb lépései Felhasználási célok meghatározása Céladatbázis létrehozása Adattisztítás Adatintegráció Adattér csökkentés Adatbányászati algoritmus kiválasztása Az algoritmus használata A kinyert információk értelmezése A megszerzett információk ellenőrzése az elvárások alapján

Az adatbányászat általános körülményei Óriási adathalmaz Algoritmus sebessége, hatékonysága Az adatok nem férnek be a memóriába Párhuzamos algoritmusok

Az adatbányászati problémák csoportosítása Adatbányászat Feltárás Prediktív modellezés „Törvényszéki” analízis Asszociációs szabáy kutatás Klaszterezés Kimenet jóslás, előrejelzés Eltérés elemzés Sorozat- illesztés Osztályozás Epizód- kutatás

Adatbányászati technikák Statisztika Osztályozás Döntési fák Neurális hálózatok Gépi tanulás

Adatbányászati alkalmazások Hitel jóváhagyó rendszer Vásárlók vásárlói szokásainak a vizsgálata A termelés során kialakult meghibásodások okának feltárása Gyógyszerek hatékonyságáért felelős faktorok identifikálása Web bányászat Stb.

MATLAB Statistics Toolbox

Témakörök Valószínűségi eloszlások 20-féle eloszlást támogat Leíró statisztika Releváns információk kinyerése (eloszlás, szórás, függvények hiányzó adatok kezeléséhez stb.) Osztályozás (klaszterezés) Objektumok tulajdonságaik alapján csoportosítása Hipotézis teszt Egy megadott állítás helyes-e vagy sem

Többváltozós statisztika Több dimenzós minták Statisztikai ábrakészítés Különböző függvények statisztikai ábrák készítésére (pl.: eloszlás, szórás) Statisztikai folyamatszabályozás Kísérlettervezés

Osztályozás (klaszterezés) A MATLAB Statistics Toolbox-ának segítségével

Az osztályozási feladat Objektumok bizonyos tulajdonságok alapján történő csoportokba osztása Az egy csoportba tartozó objektumok közel legyenek egymáshoz A különböző csoportba tartozó objektumok távol legyenek egymástól

Az osztályozás lépései Távolságmérték meghatározása A közel álló objektumok páronkénti összekapcsolása (bináris hierarchikus fa) A fa vizsgálata -- opcionális Osztályba sorolás a hierarchikus fa alapján

Példa osztályozásra

Az osztályozandó objektumok

A páronkénti távolságok meghatározása pdist függvénnyel meghatározható a távolság számításának módja (Euklédeszi, CityBlock stb.) A kialakult bináris hierarchikus fa megjelenítése a dendrogram függvénnyel

A dendrogram

A hierarchikus párosítás

Az osztályozási szint meghatározása cluster függvénnyel Vagy az osztályok számát kell megadni, vagy egy inkonzisztencia értéket

A kialakult osztályok