Az RDA a nyers adatokat relációs formátumúvá alakítja

Slides:



Advertisements
Hasonló előadás
1Szegedi Tudományegyetem Természettudományi és Informatikai KarAntal Gábor Adatbázisok gyakorlat 5. gyakorlat Adatmodellezés III/IV – Funkcionális függés,
Advertisements

Adatbázis-kezelés Készítette: Asztalos Péter január 12.
Az adatbázis kezelés alapjai
ADATBÁZISOK.
Normalizáció A normalizáció egy táblázatszétbontó eljárás, mely ebből adódóan a relációs adatmodell kialakításában van segítségünkre. Hogy miért van erre.
Informatika I. 6. Adattábla függvények, érzékenységi vizsgálatok.
E-R modell, reláció-séma
A normalizálás az adatbázis-tervezés egyik módszere
4. gyakorlat Normalizálás.
Adatbázis-kezelés.
Relációs adatbázisok készítése
Függőségek, normálformák
Adatbázis kezelés Adatbázis tervezés.
Funkcionális függés Redundancia 1NF, 2NF, 3NF
Adatbázis kezelés. Hierarchikus modell Legrégebbi modell, ma már nem használatos. Az adatokat fákban tároljuk, ahol minden pont a szegmens adatokat, és.
Számvitelszervezés Az adatmodelltől az adatbányászatig SZIE-KVA, október 15.
Adatbázis (alapfogalmak).
Fekvőbeteg adatbázis szervezés GyógyinfokPirisa Levente.
Microsoft Access I. Készítette: Rummel Szabolcs
Microsoft Access V. Készítette: Rummel Szabolcs Elérhetőség:
Információ kezelés Az információ visszakeresésének lehetőségei.
az MSAccess programmal
Adatbázis rendszerek I
Az adatfeldolgozás forrásai
SQL, Relációs adatmodell
Normálformák Adatbáziskezelés.
Tervezés, Normalizálás
Térkép. Mi az adat? Minden információ, amit tárolni kell. Minden információ, amit tárolni kell.  szám  szöveg  dátum  hang  kép, stb.
Statisztika, kutatásmódszertan I.
Adatbázisrendszerek világa
Adatbázisok Adatbázis: adatok gyűjteménye, amelyeket az adatbázis-kezelő rendszer (DBMS –Database Management System) kezel. Kezelt adatrendszer → adatbázis.
Mérnöki informatika I.év
Dr. Krauszné Dr. Princz Mária Adatbázis rendszerek I.
Microsoft Visual FoxPro 9.0
Adatszerkezetek 1. előadás
Adatbázis-kezelés JAG,
11. tétel Adatbázis táblái közti kapcsolatok optimalizálása
Adatbázis kezelés. Az adatbázis tágabb értelemben egy olyan adathalmaz, amelynek elemei – egy meghatározott tulajdonságuk alapján – összetartozónak tekinthetők.
Adatbázis kezelés.
Adatbázis-kezelés.
Adatbázisok Fleiner Rita, Tankönyv:
Adatbázis-kezelés Készítette: Asztalos Péter január 12.
ADATMODELLEZÉS ADATBÁZIS-KEZELÉS
Adatbázis-kezelés.
Kulcsok meghatározása a táblákban
Adatbázis alapfogalmak
(A logikai adatmodell kialakítása)
Relációs algebra Relációs sémák tervezése
Adatbázisok kialakítása 1 / 16. Adatbázisok kialakítása 2 / 16 Gáspár Bencéné Dr. Vér Katalin nyomán Barna Róbert KE GTK Informatika Tanszék Adatbázisok.
Normálformák Takács Gábor mérnök informatikus, okl. mérnöktanár
Adatbázis-kezelés. Alapfogalmak Adat: –észlelhető, felfogható ismeret –jelsorozat –valakinek, vagy valaminek a jellemz ő je –tény, közlés Információ:
Vállalati modellek 2007.
Gáspár Bencéné Dr. Vér Katalin
Információs rendszer fejlesztése 2. előadás
Adatbáziskezelés. Adat és információ Információ –Új ismeret Adat –Az információ formai oldala –Jelsorozat.
 Adatbázis:  Valamilyen szempont szerint rendszerezett adathalmaz.  Adatbázis kezelés:  Adatok tárolása  Műveletek végzése az adatbázison; (Adatok.
Adatbáziskezelés. Adatbáziskezelés az ACCESS programmal 2 A relációs adatbázis fogalmai A relációs adatbázis: egymással összefüggésben lévő adatokat tartalmazó.
Adatbázisszintű adatmodellek
Gazdasági informatika II (SZIE GTK GVAM 1. évfolyam) 2009/2010. tanév 2. félév.
KONFIGURÁCIÓKEZELÉS è A projektirányítás a költségekkel, erőforrásokkal és a felhasznált idővel foglalkozik. è A konfigurációkezelés pedig magukkal a termékekkel.
Táblák létrehozása és feltöltése adatokkal Rendezés Szűrés.
Alapfogalmak Adat: rögzített ismeret
Adatbáziskezelés.
Kovács Gergely Péter Bevezetés
"Ha nem tudod, hogy hová mész,
Logisztikai projekt - gyakorlat Adatbázis-elmélet
Relációs adatmodell, normálformák
Adatbázis-kezelés 2. Relációs adatbázisok.
Adatbázis-kezelés.
Többértékű függőségek
Előadás másolata:

Az RDA a nyers adatokat relációs formátumúvá alakítja felkutatja és feloldja az adatelem meghatározásokban az esetleges pontatlanságot/bizonytalanságot Az adatösszefüggések megértésére szolgál normalizálja a relációkat a tárolási (aktualizálási) anomáliák elkerülése érdekében ellenőrzi a választott LDM helyességét Információrendszer fejlesztés módszertana, Dr. Molnár Bálint egyetemi docens

MIÉRT? Adatorientált, nem folyamatorientált Különválasztja a fizikai és a logikai megfontolásokat Szabályok - könnyen alkalmazható - halmaza Matematikai alapokon nyugszik Valóságból indul ki, az alábbiakat felhasználva: létező kimenetek tervezett kimenetek bemenő dokumentációk képernyőképek B/K adatleírások Információrendszer fejlesztés módszertana, Dr. Molnár Bálint egyetemi docens

MIT EREDMÉNYEZ? Adatelemek közti összefüggések (belső adatfüggések) feltárását Kétértelműségek (félreérthetőségek) feloldását Az adatok optimális csoportokba szervezését Segíti a többször és többek által felhasznált adatok felismerését Az adatok pontosan meghatározottak Az adatok karbantartása könnyebb lesz Információrendszer fejlesztés módszertana, Dr. Molnár Bálint egyetemi docens

A RELÁCIÓ TULAJDONSÁGAI Vevő Kedv. NÉV Státusz száma KÓD 2234 Smith A 3 9999 Ivanov A 3 1417 Rubashov A 3 8053 Glenkin B 2 1421 Learmonth C 3 6219 Burchett C 4 nincs két azonos sor a sorok sorrendjének nincs jelentőssége az oszlopoknak egyedi nevei vannak az oszlopok sorrendjének nincs jelentőssége Dr. habil. Molnár Bálint egyetemi docens

KULCS TÍPUSOK Egyszerű kulcs (vevő száma) Kedv. Vevő száma Név Státusz kód 2234 Smith A 3 9999 Ivanov A 3 1417 Rubashov A 3 8053 Glenkin B 2 1421 Learmonth C 3 6219 Burchett C 4 Összetett (konkatenált) kulcs (Termékszám + rend.szám ) Termék szám Rendelés szám Mennyiség Státusz 10 100 25 250 11 100 10 80 12 100 46 960 13 106 133 266 13 107 5 10 15 109 66 34 10 111 10 100 Információrendszer fejlesztés módszertana, Dr. Molnár Bálint egyetemi docens

{ KULCS TÍPUSOK Hierachikus kulcs SZÁMLA SZÁMLASZÁM. DÁTUM VEVő NEVE 928321 80/08/14 VEVő NEVE 3621417 CÍME J M Jarman & Co. Ltd. 22 Newbolt Street Moss Side Manchester M31 1TD Termék Alap- Kedv. Leírás Menny. Ár Szám Ár Ár 42161 Dye Wash Benzole 93.50 90.00 10 900.00 63214 Beet Red Liquid 10.60 8.00 20 160.00 17719 Yara Yara Oil 14.30 12.00 30 360.00 19214 Citrus Marine 110.00 100.00 10 1000.00 32010 Peat Emulsifier 46.00 40.00 20 800.00 42161 Dye Wash Benzole 93.50 90.00 20 1800.00 Számla végösszeg 5020.00 A számla minden sorához a kulcs : Számlaszám { Jó lesz ez? - Nem ! Termékszám előfordulhat , hogy nem lesz egyedi Ezért generálunk egy mesterséges megoldást : Számlaszám Számlasor száma Információrendszer fejlesztés módszertana, Dr. Molnár Bálint egyetemi docens

KULCS TÍPUSOK Külső kulcs 3NF relációk Vevő száma Név Cím Kedvezmény kód Státusz *Raktárszám Raktárszám Elhelyezkedési kód Név Információrendszer fejlesztés módszertana, Dr. Molnár Bálint egyetemi docens

A RELÁCIÓS MEGKÖZELÍTÉS TULAJDONSÁGAINAK ÖSSZEFOGLALÁSA adatok egy táblázata nincs két azonos sor a sorok sorrendjének nincs jelentőssége az oszlopok sorrendjének nincs jelentőssége Az oszlopoknak egyedi nevük van a relációknak kell, hogy legyen egy kulcsa egyszerű = egymezős kulcs összetett = több egyszerű kulcsmező hierarchikus = egyszerű kulcs + nem egyedi elem(ek) Információrendszer fejlesztés módszertana, Dr. Molnár Bálint egyetemi docens

A NORMALIZÁLÁS ALAPJAI Az öt normalizációs lépés Hozzunk létre egy nem-normalizált relációt (0NF) Hozzuk első normálalakra (1NF) Hozzuk második normálalakra (2NF). Hozzuk harmadik normálalakra (3NF). Racionalizálás Információrendszer fejlesztés módszertana, Dr. Molnár Bálint egyetemi docens

Nem normalizált alak (0NF) létrehozása 1.lépés Nem normalizált alak (0NF) létrehozása Irányelvek a kulcs kiválasztásához: egyedi értékű az összes sorra vonatkozva nem ismétlődik egyetlen soron belül a lehető legkevesebb attribútumból áll ne legyen szöveges kulcs, ha lehetséges Információrendszer fejlesztés módszertana, Dr. Molnár Bálint egyetemi docens

Nem normalizált alak (0NF) létrehozása 1.lépés Nem normalizált alak (0NF) létrehozása ELőTTE TERMÉKSZÁM: 20541 LEÍRÁS: Zippo Washing Powder RENDELÉSI SZÁM RENDELÉS DÁTUM VEVő SZÁM. NÉV Menny. ÁR S87429 87/03/02 62098 T Leaf 4 26.60 S87437 87/03/02 76502 MT Bins 34 63.40 S87439 87/03/02 77566 Coopers 5 28.30 S87452 87/03/04 62098 T Leaf 6 30.00 S87457 87/03/06 22322 D Head 10 33.99 S87461 87/03/06 88722 ABC Ltd 7 31.50 S87475 87/03/06 62099 C Lyon 4 26.60 UTÁNA ADATELEMEK Első normál alak Második normál alak Harmadik normál alak Racionalizált TERMÉKSZÁM Leírás Rendelési szám Rendelési dátum Vevő száma Név Mennyiség Ár Információrendszer fejlesztés módszertana, Dr. Molnár Bálint egyetemi docens

Első normálalakra (1NF) hozás 2.LÉPÉS Első normálalakra (1NF) hozás Különítsük el az ismétlődő csoportokat Adatelemek olyan csoportja, vagy olyan adatelem, amelynek a kulcs egyetlen értéke esetén több értéke lehet. ELőTTE UTÁNA Adatelemek Első normálforma Második normálforma Termékszám Termékszám Leírás Leírás Rendelés szám Rendelés dátum Termékszám Vevő száma Rendelési szám Név Rendelés dátuma Mennyiség Vevő száma Ár Név Mennyiség Ár Információrendszer fejlesztés módszertana, Dr. Molnár Bálint egyetemi docens

Második normálalakra (2NF) hozás 3.LÉPÉS Második normálalakra (2NF) hozás Különítsük el a kulcs részeitől való függőségeket! (külön relációkba) Minden mező a teljes kulcshoz kapcsolódik vagy annak egy részéhez? ELőTTE UTÁNA Adatelemek Első normálalak Második normálalak Termékszám Termékszám Termékszám Leírás Leírás Leírás Rendelési szám Rendelés dátum Termékszám Termékszám Vevő száma Rendelési szám Rendelési szám Név Rendelés dátum Mennyiség Mennyiség Vevő száma Ár Ár Név Mennyiség Rendelési szám Ár Rendelés dátum Vevő száma Név Információrendszer fejlesztés módszertana, Dr. Molnár Bálint egyetemi docens

Harmadik normálformára (3NF) hozás 4. LÉPÉS Harmadik normálformára (3NF) hozás Határozzuk meg a belső adatfüggőségeket Az 'A' attribútum függ-e a 'B'-től és fordítva ? ELőTTE UTÁNA Első normálforma Második normálforma Harmadik normálforma Racionalizált Termékszám Termékszám Termékszám Leírás Leírás Leírás Termékszám Termékszám Termékszám Rend.szám Rend.szám Rend.szám Rend. dátum Mennyiség Mennyiség Vevő száma Ár Ár Név Mennyiség Rend.szám Rend.szám Ár Rendelés dátuma Rendelés dátuma Vevő száma * Vevő száma Név Vevő száma Név Információrendszer fejlesztés módszertana, Dr. Molnár Bálint egyetemi docens

AZ ELSő NÉGY LÉPÉS ÖSSZEFOGLALÁSA Soroljuk fel az adatokat és válasszuk ki a kulcs(oka)t Nem normalizált alak (0NF) létrehozása Első normálalakra hozás Különítsük el az ismétlődő csoportokat! Második normálformára (2NF) hozás. Határozzuk meg a kulcs részétől való függőségeket Harmadik normálalakra (3NF) hozás Határozzuk meg a belő adatfüggőségeket Információrendszer fejlesztés módszertana, Dr. Molnár Bálint egyetemi docens

5.LÉPÉS Racionalizálás Vonjuk össze az azonos kulcsokkal rendelkező relációkat! Vevő száma Cím Zóna Kedvezmény kód Hitelhatár Vevő száma Név Cím Információrendszer fejlesztés módszertana, Dr. Molnár Bálint egyetemi docens

A RELÁCIÓS MEGKÖZELÍTÉS TULAJDONSÁGAINAK ÖSSZEFOGLALÁSA Az adatok egy táblázata Nincs két azonos sor A sorok sorrendjének nincs jelentőssége Az oszlopok sorrendjének nincs jelentőssége Az oszlopoknak egyedi nevük van a relációknak kell, hogy legyen egy kulcsa egyszerű = egymezős kulcs összetett = több egyszerű kulcsmező hierarchikus = egyszerű kulcs + nem egyedi elem(ek) Információrendszer fejlesztés módszertana, Dr. Molnár Bálint egyetemi docens

A FEJEZET CÉLJA RDA a gyakorlatban A relációs adatelemzés alkalmazásához kapcsolódó gyakorlati kérdések megvizsgálása: Az ismétlődő csoportok felismerése adatfüggőségi ábra redundancia az elsődleges kulcsok esetén a racionalizálás veszélyei tárolási anomáliák Információrendszer fejlesztés módszertana, Dr. Molnár Bálint egyetemi docens

ISMÉTLőDő CSOPORTOK FELISMERÉSE Az eladások értékének területi megoszlása 14/1.oldal Dátum: 84.12.31. Eladások értéke Ügynök Terület Régió Felosztás Társaság HTCS Társaság - Háztartási termék csoport Tisztítási termékek 20000000 TT divizió 241000 É régió Északi 80000 ÉNy terület 37000 Eladók Jones Higgins Green 10000 15000 12000 ÉK terület 43000 Eladók Black Brown Smith 14000 17000 12000 D régió déli 161000 DNy terület 41000 Eladók Hayes Albion Morris 11000 12000 18000 Információrendszer fejlesztés módszertana, Dr. Molnár Bálint egyetemi docens

ISMÉTLőDő CSOPORTOK FELISMERÉSE Adatelemek Első normálalak Második normálalak Társ.kódja Dátum Társ. neve Társ. összes eladása Társ.kódja Társ. neve Dátum Társ. összes eladása Divízió kód Divízió eladások Régió kód Régió eladások Terül. kód Terül. eladások Eladó neve Eladói eladások stb... Társ.kódja Dátum Divizi kód Régió kód Terület kód Területi eladások Társ.kódja Dátum Divízió kód Divízió név Divízió eladók Társ.kódja Dátum Divízió kód Régió kód Terület kód Eladó neve Eladói eladások Társ.kódja Dátum Divízió kód Régió kód Régió eladások KÜLÖNÍTSÜNK EL MINDEN ISMÉTLőDő CSOPORTOT ITT Információrendszer fejlesztés módszertana, Dr. Molnár Bálint egyetemi docens

SOK RELÁCIÓ A termék osztályok eladása divízió/régió szerint Eladási divízió : Északi Dátum: 82.09.03. RÉGIÓ DIV. Term. csoport Termék osztály A B C D E F G H Eddig 1 1 2 1 1 5(2) 2 2(1) 4 6 1 5 1 19 A 3 7 1 4 3 15 4 6 7 13 Term.cs.összeg 2(3) 18 - 7 2 12 6 5 52(4) 1 3 2 1 4 7 17 2 3 3 B 3 9 6 15 4 1 4 5 term.cs.összeg 3 11 - 5 10 - 4 7 40 1 7 1 9 17 2 7 1 6 14 C 3 3 3 4 2 2 term cs. összeg 7 - 7 - 5 - - 17 36 12(5) 19 7 12 17 12 10 29 128(6) Információrendszer fejlesztés módszertana, Dr. Molnár Bálint egyetemi docens

SOK RELÁCIÓ Adatelemek Első normálalak Második normálalak Dátum Dátum Divízió Régió Termék csoport Termék osztály Összes eladások-1 Dátum Divízió Termék csoport Termék osztály Összes eladások-2 Dátum Divízió Régió Termék csoport Összes eladások - 3 Dátum Divízió Termék csoport Összes eladások - 4 Dátum Divízió Régió Összes eladások - 5 Dátum Divízió Összes eladások -6 Információrendszer fejlesztés módszertana, Dr. Molnár Bálint egyetemi docens

ADATFÜGGőSÉGI ÁBRA Segíti az adatfüggőségek feltárását az összetett, belső kapcsolatok esetén, attribútum szinten, a 2NF-t megelőzően. A B A D C A B D C Információrendszer fejlesztés módszertana, Dr. Molnár Bálint egyetemi docens

ELSőDLEGES KULCS REDUNDANCIA 1NF 2NF-é alakítása Távolítsuk el a szükségtelen attribútumokat az elsődleges kulcsból Eladási ter.száma Eladó-kód Eladó neve 1NF-ből Megcélzott eladások Aktuális eladások Eladási ter.száma stb. Eladó-kód Eladó neve Megcélzott eladások 2NF Aktuális eladások stb. Információrendszer fejlesztés módszertana, Dr. Molnár Bálint egyetemi docens

A RACIONALIZÁLÁS VESZÉLYEI Repülőgép típus: DC8 Leírás: 4 motoros N/B sugárhajtású Munkaszám Munkakezdés dátuma Munka típus 4143241 85/03/27 A 1219416 85/04/23 X 3147214 85/05/27 D 9763112 85/08/07 B 1112151 85/04/08 C * tegyük fel, hogy a munkaszám egyedi Adatelemek Első normálalak Második normálalak Harmadik normálalak Repülőgép típus Repülőgép típus Repülőgép típus Repülőgép típus Leírás Leírás Leírás Leírás Munkaszám Repülőgép típus Repülőgép típus Munkaszám Munkakezdet dát. Munka típusa Munkaszám Munkaszám Repülőgép típus Munkakezd.dátum Munka kezd.dátuma Munka típusa Munkaszám munkatípus Munka kezd.dátuma Munka típusa Információrendszer fejlesztés módszertana, Dr. Molnár Bálint egyetemi docens

A RACIONALIZÁLÁS VESZÉLYEI Repülőgép nyilvántartási száma: XJP-A Repülőgép típus: DC8 Típus leírás.: 4 motoros. N/B sugárhajtású Munkakezdés dátuma: 85/03/27 munkaszám munka típus Leírás 4143241 A Renew New Com. Unit Test APU 6142146 B Test Contact X241 7142167 A Adatelemek Első normálalak Második normálalak Harmadik normálalak Rep.Nyilv.Szám *Repülőgép típus Repülőgép típus Típus leírás Munkaszám Munkakezdet dátuma *Rep.Nyilv.Szám Munka típus Leírás Rep.Nyilv.Szám Repülőgép típus Típus leírás Munkakezdet dátuma Munkaszám Munka típus Leírás Rep.Nyilv.Szám Repülőgép típus Típus leírás Munkakezdet dátuma Munkaszám Munka típus Leírás Rep.Nyilv.Szám Munkakezdet dátuma Munkaszám Munka típus Leírás Információrendszer fejlesztés módszertana, Dr. Molnár Bálint egyetemi docens

A RACIONALIZÁLÁS VESZÉLYEI 3NF Munkaszám Munkaszám Munkakezdés Dátum *Rep.típus *Rep Nyilv.szám Munkakezdés dátum Munkatípus Munkatípus Munka leírás Munkaszám *Rep. típus Munkakezdés dátum Munkatípus *Rep.nyilv.száma Munka leírás Munkaszám Rep.Nyilv.szám *Rep. típus Munkakezdés dátum *Rep.nyilv.szám Munkatípus Munka leírás Információrendszer fejlesztés módszertana, Dr. Molnár Bálint egyetemi docens

TÁROLÁSI ANOMÁLIÁK Ha 1NF kerül implementálásra: beszúrás törlés függő módosítások Első normálalak Második normálalak Harmadik normálalak Racionalizált Termékszám Leírás Rendelés sz. Mennyiség Ár Rend. dátum Vevő száma Név Termékszám Leírás Rendelés sz. Mennyiség Ár Rend. dátum *Vevő száma Vevő száma Név Termékszám Leírás Rendelés sz. Rend. dátum Vevő száma Név Mennyiség Ár 1 2 3 4 Információrendszer fejlesztés módszertana, Dr. Molnár Bálint egyetemi docens

ÖSSZEFOGLALÁS A 3NF nem tartalmazhat fizikai tervezési döntéseket Információrendszer fejlesztés módszertana, Dr. Molnár Bálint egyetemi docens