Térkép
Mi az adat? Minden információ, amit tárolni kell. Minden információ, amit tárolni kell. szám szöveg dátum hang kép, stb.
Mi az adatbázis Egy témakör vagy cél köré csoportosuló információ. Egy témakör vagy cél köré csoportosuló információ. Jó tervezés = hatékony adattárolás és kinyerés Jó tervezés = hatékony adattárolás és kinyerés Célorientált adatbázisok Célorientált adatbázisok
Adatbázis tervezés Milyen információt akarunk kinyerni? Milyen információt akarunk kinyerni? Milyen elkülönülő tématerületeken kell tárolni az adatokat? Milyen elkülönülő tématerületeken kell tárolni az adatokat? Hogyan kapcsolódnak ezek egymáshoz? Hogyan kapcsolódnak ezek egymáshoz? Az egyes területeken belül milyen adatokat kell tárolni? Az egyes területeken belül milyen adatokat kell tárolni?
Adatbázis felépítése Tábla (table) Tábla (table) Mező (field) Mező (field) Rekord (record) Rekord (record) Űrlap (form) adatbevitel Űrlap (form) adatbevitel Adatmegjelenítés: Adatmegjelenítés: kigyűjtés (find) sorba rendezés (sort) lekérdezés (query) Jelentések (report) nyomtatás Jelentések (report) nyomtatás
Tábla
Űrlap
Jelentések
A relációs adatbázis feltételei nem lehet két egyforma sora nem lehet két egyforma sora minden mezőnek egyedi neve van minden mezőnek egyedi neve van a sorok és oszlopok sorrendje tetszőleges a sorok és oszlopok sorrendje tetszőleges ne tartalmazzon származtatott, kiszámított adatot (redundancia) ne tartalmazzon származtatott, kiszámított adatot (redundancia) egy mező megváltoztatása nem hathat ki más mezőkre egy mező megváltoztatása nem hathat ki más mezőkre a mezők elemi információt tartalmazzanak a mezők elemi információt tartalmazzanak minden szükséges adatot tartalmaz minden szükséges adatot tartalmaz van elsődleges kulcsa van elsődleges kulcsa
Normalizálás Az adatok ésszerű csoportosítása Az adatok ésszerű csoportosítása 1NF... 3NF... 5NF 1NF... 3NF... 5NF Első normált forma, ha mezőiben (oszlop) csak egyszerű tulajdonságok szerepelnek. Első normált forma, ha mezőiben (oszlop) csak egyszerű tulajdonságok szerepelnek. 3NF alakban egy táblázat minden tulajdonsága (mező) a kulcs mezőtől függ 3NF alakban egy táblázat minden tulajdonsága (mező) a kulcs mezőtől függ
Relációs adatbázis- kezelők Oracle Oracle MS Access MS Access dBase dBase SQL SQL Excel Excel stb. stb.
Az adatok mérési szintjei Az adatok az alábbi típusba tartozhatnak: –nominális –ordinális –intervallum –skála Az alacsony mérési szintű adatok: –nominális (középértéke a módusz, a leggyakrabban előforduló adat) –ordinális (középértéke a medián, a középen elhelyezkedő adat) Magas mérési szintű adatok: –intervallum –skála típusú adatok (középértéke az átlag)
Két változó kapcsolatának elemzése Függő változó (y) AlacsonyMagas Független változó (x) Alacsony Kontingencia táblázat, Chi-négyzet Két mintás t-próba, szóráselemzés, GLM Magas Diszkriminancia- analízis Korreláció-, regresszió analízis (többváltozós esetekben: Faktoranalízis, stb
Sorba rendezés Az adatmátrix sorai csökkenő vagy növekvő sorrendbe rendezhetők. Az adatmátrix sorai csökkenő vagy növekvő sorrendbe rendezhetők. Meg kell határozni az elsődleges kulcsot, ami szerint a rendezés történjen Meg kell határozni az elsődleges kulcsot, ami szerint a rendezés történjen Egymásba ágyazott rendezés: elsődleges, másodlagos, harmadlagos stb. kulcs szerint. Egymásba ágyazott rendezés: elsődleges, másodlagos, harmadlagos stb. kulcs szerint.
Szűrés Eseteket választhatunk ki az adatbázisból. Négy lehetőség közül választhatunk: Eseteket választhatunk ki az adatbázisból. Négy lehetőség közül választhatunk: 1. Minden eset részt vegyen az analízisben. 2. Ha valamilyen feltétel teljesül (if then) 3. Véletlen minta az esetekből 4. Kijelölhetjük az esetek bizonyos tartományát, az első és utolsó eset megjelölésével 5. Használhatunk szűrő változót Mi legyen a ki nem választott esetek sorsa? Lehet megjelölni és törölni őket az adatbázisból. Mi legyen a ki nem választott esetek sorsa? Lehet megjelölni és törölni őket az adatbázisból.
Aggregálás Valamilyen ismérv, csoportképző változó vagy változók szerint különböző algoritmusok (számítások) szerint tömöríthetjük az adatokat Valamilyen ismérv, csoportképző változó vagy változók szerint különböző algoritmusok (számítások) szerint tömöríthetjük az adatokat Algoritmusok: átlag, összeg, szórás, stb. Algoritmusok: átlag, összeg, szórás, stb. Az aggregált adatok további elemzése Az aggregált adatok további elemzése
Transzponálás Az adatmátrix sorainak és oszlopainak felcserélése, ezzel az esetek és változók szerepei is felcserélődnek. A régi változók nevei a legelső új változó esetei lesznek, a többi új változó neve case_1, case_2, … stb. lesznek. Az adatmátrix sorainak és oszlopainak felcserélése, ezzel az esetek és változók szerepei is felcserélődnek. A régi változók nevei a legelső új változó esetei lesznek, a többi új változó neve case_1, case_2, … stb. lesznek. Nagy jelentősége van a többváltozós statisztikai eljárásoknál az Q és R-technika alkalmazásakor Nagy jelentősége van a többváltozós statisztikai eljárásoknál az Q és R-technika alkalmazásakor
Adatbázis bővítése Új megfigyelésekkel Új megfigyelésekkel –Feltétel: a két adatbázisban a változók nevei, típusa, stb. tökéletesen egyezzenek Új változókkal Új változókkal –Feltétel: a két adatbázisban legalább egy azonos változó szerepeljen, ami a kulcsváltozó, kapcsoló mező szerepét tölti be
Kapcsolatok (kapcsoló mező) egy az egyhez egy az egyhez egy a többhöz egy a többhöz több a többhöz (kapcsoló tábla) több a többhöz (kapcsoló tábla)
Egy az egyhez kapcsolat Az A adatbázis egyetlen rekordja kapcsolódik a B adatbázis egyetlen rekordjához Az A adatbázis egyetlen rekordja kapcsolódik a B adatbázis egyetlen rekordjához A B
Egy a többhöz kapcsolat Az A adatbázis egyetlen rekordja a B adatbázis több rekordjához is kapcsolódik (apa-fiú kapcsolat) Az A adatbázis egyetlen rekordja a B adatbázis több rekordjához is kapcsolódik (apa-fiú kapcsolat) A B
Több a többhöz kapcsolat Az A adatbázis több rekordja a B adatbázis több rekordjához is kapcsolódik (kapcsoló tábla segítségével) Az A adatbázis több rekordja a B adatbázis több rekordjához is kapcsolódik (kapcsoló tábla segítségével) Kapcsoló tábla