Az előadás letöltése folymat van. Kérjük, várjon

Az előadás letöltése folymat van. Kérjük, várjon

Adatszervezés 1 / 46. Adatszervezés 2 / 46 Gáspár Bencéné Dr. Vér Katalin nyomán Barna Róbert KE GTK Informatika Tanszék Adatszervezés.

Hasonló előadás


Az előadások a következő témára: "Adatszervezés 1 / 46. Adatszervezés 2 / 46 Gáspár Bencéné Dr. Vér Katalin nyomán Barna Róbert KE GTK Informatika Tanszék Adatszervezés."— Előadás másolata:

1 Adatszervezés 1 / 46

2 Adatszervezés 2 / 46 Gáspár Bencéné Dr. Vér Katalin nyomán Barna Róbert KE GTK Informatika Tanszék Adatszervezés

3 3 / 46 Információ: olyan adat, amelyet úgy készítettek elő illetve dolgoztak fel, hogy az növeli az azt felhasználó személy tudásszintjét. Adat, információ

4 Adatszervezés 4 / 46 A számítógépes információrendszerek alapvető célja, hogy az adatokat (mint speciális erőforrásokat) új információvá alakítva (feldolgozva) gazdasági eredményt hozzanak létre.

5 Adatszervezés 5 / 46 Az adatok tárolása visszakeresése feldolgozása módosítása Az adatszervezési eljárások 2 csoportra oszthatók: → logikai adatszervezés → adatmodell létrehozása → fizikai adatszervezés → adatok tárolása Az adatszervezés feladata

6 Adatszervezés 6 / 46 A számítástudományban adatnak nevezzük a megjelenített információt, melyre jellemző annak jelentése típusa konkrét értéke Ez a fogalom alkalmas arra, hogy erre kiépítsük az információs rendszereket jellemző adatkapcsolatokat. Az adat fogalma: Egy mérhető,leírható tulajdonság, az információ rögzített megjelenési formája. Az információ fogalma: olyan tény, hír, közlés, amely számunkra új, és valamilyen jelentőséggel bír. Tehát az adat a számítógépben tárolt jelsorozat, amelyből a feldolgozás során nyerhetünk információt. Az ADAT

7 Adatszervezés 7 / 46 A megalapozott döntések (pénzügyi és egyéb gazdasági döntések) meghozatalához a rendszer mögött lévő adatoknak számos kritériumnak kell megfelelniük. ↓ Csak abból az adatból lesz valóban üzleti információ, amelyik legalább annyi hasznot hajt, mint amibe megszerzése, tárolása, kezelése, feldolgozása került. Információmenedzsment (http://ktk.pte.hu/VU/vim/imtemat.htm) nem működik http://ktk.pte.hu/VU/vim/imtemat.htm Adatokkal szembeni kritériumok

8 Adatszervezés 8 / 46 Az információk esetében a használhatóság, hasznosság azt jelenti, hogy az információ jó minőségű – pontos – teljes – releváns – időtűrése és forrása megfelelő elérhető, hozzáférhető felhasználásra alkalmas megjelenésű Hasznosság

9 Adatszervezés 9 / 46 Az adatot a vállalat/intézmény kulcsfontosságú stratégiai vagyonaként kell kezelni. Garantálni kell, hogy minősége elsőrangú legyen. A legfontosabb az alapadat. A legjobb szoftver, kimutatás sem ér semmit, ha a mögötte álló adatok – inkonzisztensek – redundánsak – hiányosak Fókuszban az adatminőség, IT-Business, október 28.

10 Adatszervezés 10 / 46 Adatminőségi problémák Az adatminőségi problémák fő okai lehetnek: sok forrásból származnak az adatok helytelen adatbevitel sérült adatok az Internetről pontatlan adatokat tartalmazó vásárolt adatbázis hibás alkalmazási logika pontatlan adatdefiníció a régi rendszer nem körültekintő migrációja Fókuszban az adatminőség, IT-Business, október 28.

11 Adatszervezés 11 / 46 Gyakran a különböző rendszerekből átvett, azonos megnevezésű, de ténylegesen különböző módon számított adatokat egymás mellé rendelik. Ebből később nem lehet eldönteni, melyik helyes és melyik helytelen - a helytelen mennyire az. Az Adattárház Intézet (TDWI) felmérése: adatainak minősége rosszabb, mint bárki gondolná (cégek 44%-a) gyenge adatminőség miatti veszteségről 40% számolt be

12 Adatszervezés 12 / 46 Probléma A szervezetek az adatminőség kérdését az informatika belügyének tekintik. PEDIG súlyos üzleti problémáról van szó MEGOLDANI az üzleti és az informatikai terület együttes erőfeszítésével lehet

13 Adatszervezés 13 / 46 Adatminőség-biztosítás Nem egyszeri informatikai tevékenység, hanem stratégiai üzleti folyamat az adatok definiálása (üzleti, informatikai) minőségi kritériumok meghatározása a minőség mérése eredmények kimutatása körkörös folyamat -> további adatminőség-növelő tevékenységeket generál.

14 Adatszervezés 14 / 46 Az adattisztítás lépései Üzleti szempontból: Meghatározni, hogy mely területeken okozzák a legnagyobb gondot a gyenge minőségű adatok (pl. címek, nevek) => első lépésben a törzsadatok tisztítása

15 Adatszervezés 15 / 46 Az adattisztítás lépései Informatikai szempontból: Auditálás – feltárja az adatmezőben előforduló gyakoriságokat, azonosítja a hiányzó és a ritka értékeket, max. és min. érték szerint rangsorolja a jelentéseket, a nem szabványos adatokat szektorelemzéssel azonosítja. Ekkor határozzák meg a tisztítás szabályait is. Adaterősítés (data enhancement) - külső adatok létező adatkészletekhez történő hozzáadása, megváltoztatása Adatminőség igazolása (verification) - az adatok ismert szabványokkal történő összehasonlítása

16 Adatszervezés 16 / 46 Az adatok minőségbiztosítását segítő megoldás Fontos, hogy még a forrásnál (pl. adattárház vagy CRM-projekt esetén) megtisztítsuk az adatokat. A módszer az ún. ETL folyamat kinyerés (extraction) átalakítás (transformation) betöltés (loading) amely, az adattárház építési folyamatnak is része. Ügyfélkapcsolati menedzsment (CRM - Customer Relationship Management)

17 Adatszervezés 17 / 46 Az adatszervezés célja: adatokat lehetőleg redundancia mentes, egymással összekapcsolt fájlokból álló adatbázisba úgy gyűjtsük össze, hogy lehetővé váljon sokszoros, gyors, kényelmes adatelérés könnyű adatmódosítás adatok rugalmas összefűzése tetszőleges kiértékelhetőség adatok védelme rövid elérési idő.

18 Adatszervezés 18 / 46 Az adatszervezéssel szemben támasztott követelmények minimális redundancia áttekinthetőség adatfüggetlenség - logikai (adatnézetek kialakítása) - fizikai (programok és adattárolás független) adatrugalmasság (későbbi igények kielégítése) adatintegritás - ellentmondás mentesség - adatbiztonság folytonosság

19 Adatszervezés 19 / 46 Az adatszervezés különböző szintű szemlélete Felhasználói szint 1. Felhasználón. Felhasználó … Külső adatszer- kezet/nézet … Koncepcionális adatmodell (logikai adatszerkezet) Fizikai adatszerkezet (belső adatszerkezet) Külső szint (konkrét felhasználáshoz kapcsolódik) Logikai szint (általános adatszerkezet) Belső gépi megvalósítási szint Adatleíró nyelvek Adatmanipulációs és adatlekérdező nyelvek Adattárolást leíró nyelvek

20 Adatszervezés 20 / 46 Programorientált (hagyományos) számítógépes adatfeldolgozás jellemzése A funkciók megvalósításához programokat rendelnek. A programokhoz tartozó adatokat fájlokban rögzítik. => Többszörös adattárolás (redundancia) A hozzáférés programorientált, így a rendszer rugalmatlan.

21 Adatszervezés 21 / 46 Programorientált (hagyományos) számítógépes adatfeldolgozás jellemzése Az adattárolás jelentős adatbiztonsági és adatvédelmi problémákkal jár. A rendszerkoncepció középpontjában a soros (szekvenciális) feldolgozás áll (batch feldolgozás)

22 Adatszervezés 22 / 46 Fájl- vagy adatorientált számítógépes adatfeldolgozás jellemzése Az adatok logikai szerkezetéből indul ki Az adatbázis szervezés során egy ún. szemantikus tartalomelemzésen alapuló) adatmodellt hoznak létre, => egy relációs adatbázismodellt alakítanak ki.

23 Adatszervezés 23 / 46 Fájl- vagy adatorientált számítógépes adatfeldolgozás jellemzése A különböző felhasználók adat- és információ- igénye eltérősége miatt az adatokat az egyes feldolgozási igényektől függetlenül kezelik és tárolják. A felhasználói programokat az adatbázishoz illesztve fejlesztik ki.

24 Adatszervezés 24 / 46 A szemantikus adatmodell különböző típusú adatokat, a közöttük fennálló kapcsolatokat, összefüggéseket, a velük kapcsolatos adatvédelmi eljárásokat tartalmazza. Az adatmodellnél nem törődünk az egyes adatok konkrét értékével.

25 Adatszervezés 25 / 46 Programorientált ↔ fájlorientált feldolgozás Fájlok Program1 Program2 Program3 Program1 Program2 Program3 Adatbázis menedzs- ment rendszer Adat- bázis

26 Adatszervezés 26 / 46 Fejlődési irányok Programorientált feldolgozás Fájlorientált feldolgozás Objektumorientált feldolgozás: az adatokat azok jellemzőivel és az azokon alkalmazott eljárásokkal együtt objektumokba foglalják. Az összetartozó objektumokból osztályokat képeznek.

27 Adatszervezés 27 / 46 Logikai adatszervezés hierarchikus fogalmai: jel (karakter) adatelem (mező) adatszegmens logikai rekord fájl adatbázis

28 Adatszervezés 28 / 46 Adatszervezés alapfogalmai

29 Adatszervezés 29 / 46 Adatbázis Személyi adatok nyilvántartása fájl Értékesítési adatok fájl Bér- és jövedelmi adatok fájl Logikailag összetartozó adatállományok (fájlok)

30 Adatszervezés 30 / 46 Adatfajták osztályozása Az adatok tárgya alapján: törzsadatok, változási adatok Az adatok időhöz való viszonya alapján: állapotorientált és akcióorientált Az adatok tartalma alapján: hasznos adatok, vezérlőadatok

31 Adatszervezés 31 / 46 Adatfajták osztályozása Az adatok formattálása alapján: formattált és nem formattált Az adatot tartalmazó jelek fajtája alapján: numerikus, alfanumerikus, grafikus, egyéb Az adatok feldolgozási állapota alapján: bemeneti, kimeneti, köztes eredmények Az adatok változtathatósága alapján: statikus és dinamikus

32 Adatszervezés 32 / 46 Állapot- és akcióorientált adatok Állapotorientált adatok: állapotot vagy jelenségeket írnak le úgy, hogy ezek az adatok bizonyos időbeli érvényességgel rendelkeznek. ∙ha az állapotorientált adatok csak igen ritkán változnak törzsadatokról, ∙ha gyakran változnak állományi adatokról beszélünk.

33 Adatszervezés 33 / 46 Állapot- és akcióorientált adatok Az akcióorientált adatok állapotváltozásokat (eseményeket) és akciókat írnak le (pl. lakcímváltozás, raktári állományváltozás). ∙általában a keletkezésükhöz fűződő időponttal együtt rögzítjük őket, ∙ehhez kapcsolva elemezhetjük (pl. pénzfelvétel a pénz-kiadó automatából).

34 Adatszervezés 34 / 46 Hasznos adatok, vezérlőadatok Az állapot- és az akcióorientált adatokat az adatfeldolgozás során felhasználjuk, hasznosítjuk, szemben azokkal a vezérlési adatokkal, amelyeket a hardver vagy a szoftver, esetleg bizonyos folyamatok vezérlésére használnak.

35 Adatszervezés 35 / 46 Formattált és nem formattált adatok A formattált és nem formattált adatok megkülönböztetésének alapja az, hogy a formattált adatok esetében az adatoknak van valamilyen struktúrája (pl. személyi adatok: név, lakcím, jövedelem), míg a nem formált adatok struktúramentesek (pl. grafika)

36 Adatszervezés 36 / 46 Az adatot alkotó jelek fajtája alapján Megkülönböztetünk: numerikus, alfanumerikus, grafikus és akusztikus adatokat. Numerikus adatok egy adott számrendszernek megfelelő számokból (jelekből) tevődnek össze. Az alfanumerikus adatok számokból, betűkből és különleges karakterekből álló adatok. Grafikus adatok képeket leíró adatok, amelyeket vagy bittérképes, vagy vektoros módszerrel adhatunk meg. Az akusztikus adatok hangok digitális ábrázolását megjelenítő adatok.

37 Adatszervezés 37 / 46 Az adat feldolgozási állapota alapján Bemeneti adatok Kimeneti adatok Köztes eredmények

38 Adatszervezés 38 / 46 Az adatok megváltoztatása alapján Statikus adatok Dinamikus adatok

39 Adatszervezés 39 / 46 Adatrekordok osztályozása Az adatrekord méretét tekintve rögzített hosszúságú ill. változó hosszúságú lehet. Az adatrekord struktúráját tekintve lehet rögzített struktúrájú, formattált adatokat tartalmazó, vagy meghatározott struktúra nélküli, nem formattált adatokat tartalmazó.

40 Adatszervezés 40 / 46 Az adatkulcs egy adatelem vagy adatelemek kombinációja, amely lehetővé teszi az egyes adatrekordok egyértelmű azonosítását.

41 Adatszervezés 41 / 46 Az adatkulcs Célja alapján: azonosító, osztályozó, összetett, párhuzamos Fajtái: elsődleges, másodlagos Adattárolás kapcsán: keresési, rendezési

42 Adatszervezés 42 / 46 Adatfeldolgozási műveletek Az adatok feldolgozása során azokkal különböző műveleteket végezhetünk. Műveletek osztályozása: az adatok kezelésére szolgáló műveletek ∙új adatállomány létrehozása, ∙adatállomány másolása, ∙adat-előfordulás meghatározása (leszámlálás)

43 Adatszervezés 43 / 46 Adatfeldolgozási műveletek az adatok megjelenítését végző műveletek ∙adatok kiolvasása adatállományból ∙adatcsoportok kiválasztása megadott szempontok alapján az adatállomány tartalmát megváltoztató műveletek ∙adatok beillesztése (adott helyre) az adatállományba, ∙adatok módosítása, ∙adatok törlése,

44 Adatszervezés 44 / 46 Adatfeldolgozási műveletek az adatállomány szerkezetét, illetve rendjét megváltoztató műveletek ∙rendezés (megadott szempont alapján), ∙adatállomány szétválogatása, ∙adatállomány összeválogatása.

45 Adatszervezés 45 / 46 Kimeneti eszközök Egy felhasználói program működése nem más, mint adatfeldolgozási műveletek sorozata.

46 Adatszervezés 46 / 46 A viszontlátásra!


Letölteni ppt "Adatszervezés 1 / 46. Adatszervezés 2 / 46 Gáspár Bencéné Dr. Vér Katalin nyomán Barna Róbert KE GTK Informatika Tanszék Adatszervezés."

Hasonló előadás


Google Hirdetések