Adatbányászati módszerek a térinformatikában

Slides:



Advertisements
Hasonló előadás
Lineáris regressziós MODELLEK
Advertisements

GRIN: Gráf alapú RDF index
Nem teljesen kitöltött páros összehasonlítás mátrixok aggregálása Ábele-Nagy Kristóf.
4. Előadás: A mohó algoritmus
FRAKTÁLOK.
MI 2003/9 - 1 Alakfelismerés alapproblémája: adott objektumok egy halmaza, továbbá osztályok (kategóriák) egy halmaza. Feladatunk: az objektumokat - valamilyen.
Vektormező szinguláris pontjainak indexe
GNSS elmélete és felhasználása Fázismérések lineáris kombinációi. A ciklustöbbértelműség feloldása.
Közbevetve: témakörök eddig 1-3. Közbevetve: a témakörök eddig 1. Sztohasztikus folyamatok: főként a fogalmak definiciója (sztoh. foly.; val. sűrűségek-eloszlások,
Sűrűségfüggvény Parzen becslés Mintapontszám, szigma.
Digitális képanalízis
1. A KVANTUMMECHANIKA AXIÓMÁI
SAS Enterprise Miner 2. gyakorlat
R++-tree: an efficient spatial access method for highly redundant point data Kalmár Dániel (előadás), Németh Boldizsár (feldolgozás), Hollenczer Péter.
Távolság alapú eljárások Hierarchikus eljárások
Gépi tanulási módszerek
Dimenziócsökkentés, valamint jellemzőszelekciós eljárások
MI 2003/ Alakfelismerés - még egy megközelítés: még kevesebbet tudunk. Csak a mintánk adott, de címkék nélkül. Csoportosítás (klaszterezés, clustering).
FRAKTÁLOK.
Főkomponensanalízis Többváltozós elemzések esetében gyakran jelent problémát a vizsgált változók korreláltsága. A főkomponenselemzés segítségével a változók.
Klaszterező algoritmusok smart city alkalmazásokhoz Gonda László Témavezető: Dr. Ispány Márton.
A hasonlóság alkalmazása
Ozsváth Károly NYME ACSJK Testnevelési Tanszék. Faktor = „jellemző”, „háttérváltozó” A faktoranalízis (FA) alapjában a változók csoportosítására, redukciójára.
Ozsváth Károly NYME ACSJK Testnevelési Tanszék. Fábián Gy. – Zsidegh M.: A testnevelési és sporttudományos kutatások módszertana, p. (SPSS: p.,
FRAKTÁLOK.
Adatbányászat: Klaszterezés Haladó fogalmak és algoritmusok
Adatbányászat: Rendellenesség keresés
Mérnöki Fizika II előadás
Lineáris transzformáció sajátértékei és sajátvektorai
Hierarchikus klaszteranalízis
K-közepű és kétlépéses klaszteranalízis (3. fejezet)
Többdimenziós skálázás (7. fejezet). Alapgondolat Feltáró elemzés A skálázással az adatok közötti különbségeket vizsgáljuk, illetve vetítjük le őket kevesebb.
Kvantitatív módszerek
Az Alakfelismerés és gépi tanulás ELEMEI
2. A KVANTUMMECHANIKA AXIÓMÁI
2. A KVANTUMMECHANIKA AXIÓMÁI 1. Erwin Schrödinger: Quantisierung als Eigenwertproblem (1926) 2.
Készítette: Lakos Péter.  Adott egy élsúlyozott, véges gráf  Negatív élsúlyokat nem tartalmaz  Lehet irányított vagy irányítatlan  Továbbá adott egy.
Klaszter analízis A klaszteranalízis értelmes és használható csoportba sorolja az adatokat, ezek a klaszterek. A klaszteranalízis kiindulópontja az elemek.
Csoportosítás (klaszterezés) A csoportosítás feladata a vizsgált objektumok jól elkülönülő csoportba történő besorolása. A klaszterezés sok szempontból.
1. feladat Az ábrán egy épülő ház tetőszerkezetét látjuk. A „mester” szerint ez akkor lesz a legstabilabb, ha a „ferde” CD nyeregtetőt annak F felezőpontjában,
A Boltzmann-egyenlet megoldása nem-egyensúlyi állapotban
Többváltozós adatelemzés
Többváltozós adatelemzés
Többváltozós adatelemzés 5. előadás. Hierarchikus klaszterezés Klaszterek számát nem kell előre megadni A pontok elhelyezkedését térképezi fel Nem feltétlenül.
Többváltozós adatelemzés
Többszintű Tenyéralapú Biometrikus Azonosító Rendszer
Adatbázis kezelés. Az adatbázis tágabb értelemben egy olyan adathalmaz, amelynek elemei – egy meghatározott tulajdonságuk alapján – összetartozónak tekinthetők.
Digitális képanalízis Pontoperátorok, matching. Nézzünk egy példát!
Torlódás (Jamming) Kritikus pont-e a J pont? Szilva Attila 5. éves mérnök-fizikus hallgató.
Adatbázis kezelés.
Paleobiológiai módszerek és modellek 7. Hét TÖBBVÁLTOZÓS ADATELEMZÉS
A Van der Waals-gáz molekuláris dinamikai modellezése Készítette: Kómár Péter Témavezető: Dr. Tichy Géza TDK konferencia
Az ELTE Informatikai Kar és a FÖMI Távérzékelési Központ kapcsolata : Műhold-felvétel kiértékelő rendszer komponenseinek kifejlesztése (tervezés.
Vargha András KRE és ELTE, Pszichológiai Intézet
Nagy Szilvia 7. Lineáris blokk-kódok
előadások, konzultációk
Az AEGIS térinformatikai keretrendszer kutatása és fejlesztése
Kutatási beszámoló 2002/2003 I. félév Iváncsy Renáta.
Génexpressziós chipek mérési eredményeinek biklaszter analízise.
1/19 Hogyan tájékozódnak a robotok? Koczka Levente Eötvös Collegium.
Szerkezetek Dinamikája
1.Kanonikus felügyelt tanulási feladat definíciója (5p) 1.Input, output (1p) 2.Paraméterek (1p) 3.Hipotézisfüggvény (1p) 4.Hibafüggvény/költségfüggvény.
Készítette: Horváth Zoltán
Korreláció, regresszió
Lineáris regressziós modellek

Az Európai Unió tagországainak, a csatlakozásra váró országoknak
Munkagazdaságtani feladatok
Adat-előfeldolgozás jellemzőtér-transzformációs módszerekkel
A területi koncentráció mérése és a kitüntetett helyzetek
Előadás másolata:

Adatbányászati módszerek a térinformatikában Elek István egyetemi docens ELTE Informatikai Kar

Szegmentálás  tematikus térkép Egy kiragadott adatoszlop alapján készült. Nem optimális az adatvesztés.

Szegmentálás  szemrevételezés Nem egzakt. Sok dimenziós adatbázisra egyáltalán nem alkalmazható.

Klaszterezés Cél: a nagy tömegű adathalmazokban való eligazodás. Klaszterezés: az adathalmaz pontjainak az adatrekordok hasonlósága alapján történő diszjunk csoportokba sorolása. Hasonlóság: hasonlóak azok a rekordok, amik közel vannak egymáshoz (az attributum adatok alapján) Távolság definició: euklideszi távolság fogalom

Távolság mátrix u,v két adatpont, távolságuk d(u,v) d ij az i-edik és a j-edik adatpont távolsága Mi a baj a távolság mátrixszal? Ha ‘n’ nagy, akkor gyakorlatilag nem számítható ki a hasonlóság.

Particionáló eljárások A klaszter súlypont és az új adatpontok távolságának vizsgálata. Az új pont abba a klaszterbe kerül, amelynek súlypontjához a legközelebb van. Újra kiszámítjuk a súlypontot, újra nézzük a távolságokat, … Hierarchikus eljárások Az adatelemeket fákba rendezik. Az adatok a levelekben helyezkednek el, míg a fa minden belső pontja megfelel egy klaszternek. Felhalmozó és lebontó algoritmusok: Kezdetben minden adat egy klaszter Kezdetben egy klaszter van benne az összes adattal

Dimenzió csökkentés Legyen ‘p’ számú megfigyelési egységünk ‘n’ számú adattal. Standardizálás

Dimenzió csökkentés R v = λv Határozzuk meg a korrelációs mátrix sajátértékeit és sajátvektorait, vagyis oldjuk meg a következő sajátérték egyenletet: R v = λv A λ1, λ2,.. λp sajátértékekhez tartozó sajátvektorok v1, v2, …vp Ezek után számítsuk ki a főkomponenseket:

Dimenzió csökkentés A főkomponens analízis geometriai jelentése

Dimenzió csökkentés Mire jó mindez? Az első főkomponens magába sűríti az adatrendszer varianciáinak jelentős részét Optimális adatvesztés mellett helyettesíthetjük vele az adatrendszert Az első főkomponensre készítsünk tematikus térképet, ha több adatféleséget is figyelembe kívánunk venni.

Példák Népesség eloszlás szerinti csoportok

Példák Vendégéjszakák eloszlása szerinti csoportok

Példák Első főkomponens szerinti csoportok