Az előadás letöltése folymat van. Kérjük, várjon

Az előadás letöltése folymat van. Kérjük, várjon

Gáspár Bencéné Dr. Vér Katalin nyomán

Hasonló előadás


Az előadások a következő témára: "Gáspár Bencéné Dr. Vér Katalin nyomán"— Előadás másolata:

1

2 Gáspár Bencéné Dr. Vér Katalin nyomán
Adatszervezés Gáspár Bencéné Dr. Vér Katalin nyomán Barna Róbert KE GTK Informatika Tanszék

3 Adat, információ Információ: olyan adat, amelyet úgy készítettek elő illetve dolgoztak fel, hogy az növeli az azt felhasználó személy tudásszintjét.

4 A számítógépes információrendszerek alapvető célja, hogy az adatokat (mint speciális erőforrásokat) új információvá alakítva (feldolgozva) gazdasági eredményt hozzanak létre.

5 Az adatszervezés feladata
Az adatok • tárolása • visszakeresése • feldolgozása • módosítása Az adatszervezési eljárások 2 csoportra oszthatók: • logikai adatszervezés → adatmodell létrehozása • fizikai adatszervezés → adatok tárolása

6 Az ADAT A számítástudományban adatnak nevezzük a megjelenített információt, melyre jellemző annak • jelentése • típusa • konkrét értéke Ez a fogalom alkalmas arra, hogy erre kiépítsük az információs rendszereket jellemző adatkapcsolatokat. Az adat fogalma: Egy mérhető,leírható tulajdonság, az információ rögzített megjelenési formája. Az információ fogalma: olyan tény, hír, közlés, amely számunkra új, és valamilyen jelentőséggel bír. Tehát az adat a számítógépben tárolt jelsorozat, amelyből a feldolgozás során nyerhetünk információt.

7 Adatokkal szembeni kritériumok
A megalapozott döntések (pénzügyi és egyéb gazdasági döntések) meghozatalához a rendszer mögött lévő adatoknak számos kritériumnak kell megfelelniük. Csak abból az adatból lesz valóban üzleti információ, amelyik legalább annyi hasznot hajt, mint amibe megszerzése, tárolása, kezelése, feldolgozása került. Információmenedzsment (http://ktk.pte.hu/VU/vim/imtemat.htm) nem működik 

8 Hasznosság Az információk esetében a használhatóság, hasznosság azt jelenti, hogy az információ • jó minőségű – pontos – teljes – releváns – időtűrése és forrása megfelelő • elérhető, hozzáférhető • felhasználásra alkalmas megjelenésű

9 Garantálni kell, hogy minősége elsőrangú legyen.
Az adatot a vállalat/intézmény kulcsfontosságú stratégiai vagyonaként kell kezelni. Garantálni kell, hogy minősége elsőrangú legyen. A legfontosabb az alapadat. A legjobb szoftver, kimutatás sem ér semmit, ha a mögötte álló adatok – inkonzisztensek – redundánsak – hiányosak Fókuszban az adatminőség, IT-Business, október 28.

10 Adatminőségi problémák
Az adatminőségi problémák fő okai lehetnek: sok forrásból származnak az adatok helytelen adatbevitel sérült adatok az Internetről pontatlan adatokat tartalmazó vásárolt adatbázis hibás alkalmazási logika pontatlan adatdefiníció a régi rendszer nem körültekintő migrációja Fókuszban az adatminőség, IT-Business, október 28.

11 melyik helyes és melyik helytelen
Gyakran a különböző rendszerekből átvett, azonos megnevezésű, de ténylegesen különböző módon számított adatokat egymás mellé rendelik. Ebből később nem lehet eldönteni, melyik helyes és melyik helytelen - a helytelen mennyire az. Az Adattárház Intézet (TDWI) felmérése: adatainak minősége rosszabb, mint bárki gondolná (cégek 44%-a) gyenge adatminőség miatti veszteségről 40% számolt be

12 Probléma A szervezetek az adatminőség kérdését az informatika belügyének tekintik. PEDIG súlyos üzleti problémáról van szó MEGOLDANI az üzleti és az informatikai terület együttes erőfeszítésével lehet

13 Adatminőség-biztosítás
Nem egyszeri informatikai tevékenység, hanem stratégiai üzleti folyamat az adatok definiálása (üzleti, informatikai) minőségi kritériumok meghatározása a minőség mérése eredmények kimutatása körkörös folyamat -> további adatminőség-növelő tevékenységeket generál.

14 Az adattisztítás lépései
Üzleti szempontból: Meghatározni, hogy mely területeken okozzák a legnagyobb gondot a gyenge minőségű adatok (pl. címek, nevek) => első lépésben a törzsadatok tisztítása

15 Az adattisztítás lépései
Informatikai szempontból: Auditálás – feltárja az adatmezőben előforduló gyakoriságokat, azonosítja a hiányzó és a ritka értékeket, max. és min. érték szerint rangsorolja a jelentéseket, a nem szabványos adatokat szektorelemzéssel azonosítja. Ekkor határozzák meg a tisztítás szabályait is. Adaterősítés (data enhancement) - külső adatok létező adatkészletekhez történő hozzáadása, megváltoztatása Adatminőség igazolása (verification) - az adatok ismert szabványokkal történő összehasonlítása

16 Az adatok minőségbiztosítását
segítő megoldás Fontos, hogy még a forrásnál (pl. adattárház vagy CRM-projekt esetén) megtisztítsuk az adatokat. A módszer az ún. ETL folyamat • kinyerés (extraction) • átalakítás (transformation) • betöltés (loading) amely, az adattárház építési folyamatnak is része. Ügyfélkapcsolati menedzsment (CRM - Customer Relationship Management)

17 Az adatszervezés célja:
adatokat lehetőleg redundancia mentes, egymással összekapcsolt fájlokból álló adatbázisba úgy gyűjtsük össze, hogy lehetővé váljon sokszoros, gyors, kényelmes adatelérés könnyű adatmódosítás adatok rugalmas összefűzése tetszőleges kiértékelhetőség adatok védelme rövid elérési idő.

18 Az adatszervezéssel szemben támasztott követelmények
minimális redundancia áttekinthetőség adatfüggetlenség - logikai (adatnézetek kialakítása) - fizikai (programok és adattárolás független) adatrugalmasság (későbbi igények kielégítése) adatintegritás - ellentmondás mentesség - adatbiztonság folytonosság

19 Az adatszervezés különböző szintű szemlélete
Felhasználói szint 1. Felhasználó n. Felhasználó Adatmanipulációs és adatlekérdező nyelvek Külső szint (konkrét felhasználáshoz kapcsolódik) Külső adatszer- kezet/nézet Külső adatszer- kezet/nézet Logikai szint (általános adatszerkezet) Koncepcionális adatmodell (logikai adatszerkezet) Adatleíró nyelvek Belső gépi megvalósítási szint Fizikai adatszerkezet (belső adatszerkezet) Adattárolást leíró nyelvek

20 Programorientált (hagyományos) számítógépes adatfeldolgozás
jellemzése A funkciók megvalósításához programokat rendelnek. A programokhoz tartozó adatokat fájlokban rögzítik. => Többszörös adattárolás (redundancia) A hozzáférés programorientált, így a rendszer rugalmatlan.

21 Programorientált (hagyományos) számítógépes adatfeldolgozás
jellemzése Az adattárolás jelentős adatbiztonsági és adatvédelmi problémákkal jár. A rendszerkoncepció középpontjában a soros (szekvenciális) feldolgozás áll (batch feldolgozás)

22 Fájl- vagy adatorientált számítógépes adatfeldolgozás
jellemzése Az adatok logikai szerkezetéből indul ki Az adatbázis szervezés során egy ún. szemantikus tartalomelemzésen alapuló) adatmodellt hoznak létre, => egy relációs adatbázismodellt alakítanak ki.

23 Fájl- vagy adatorientált számítógépes adatfeldolgozás
jellemzése A különböző felhasználók adat- és információ-igénye eltérősége miatt az adatokat az egyes feldolgozási igényektől függetlenül kezelik és tárolják. A felhasználói programokat az adatbázishoz illesztve fejlesztik ki.

24 A szemantikus adatmodell
különböző típusú adatokat, a közöttük fennálló kapcsolatokat, összefüggéseket, a velük kapcsolatos adatvédelmi eljárásokat tartalmazza. Az adatmodellnél nem törődünk az egyes adatok konkrét értékével.

25 Programorientált ↔ fájlorientált feldolgozás
Fájlok Program2 Program2 Adatbázis menedzs-ment rendszer Fájlok Adat-bázis Program3 Program3 Fájlok

26 Fejlődési irányok Programorientált feldolgozás
Fájlorientált feldolgozás Objektumorientált feldolgozás: az adatokat azok jellemzőivel és az azokon alkalmazott eljárásokkal együtt objektumokba foglalják. Az összetartozó objektumokból osztályokat képeznek.

27 Logikai adatszervezés hierarchikus fogalmai:
jel (karakter) adatelem (mező) adatszegmens logikai rekord fájl adatbázis

28 Adatszervezés alapfogalmai

29 Logikailag összetartozó adatállományok (fájlok)
Adatbázis Logikailag összetartozó adatállományok (fájlok) Személyi adatok nyilvántartása fájl Bér- és jövedelmi adatok fájl Értékesítési adatok fájl

30 Adatfajták osztályozása
Az adatok tárgya alapján: törzsadatok, változási adatok Az adatok időhöz való viszonya alapján: állapotorientált és akcióorientált Az adatok tartalma alapján: hasznos adatok, vezérlőadatok

31 Adatfajták osztályozása
Az adatok formattálása alapján: formattált és nem formattált Az adatot tartalmazó jelek fajtája alapján: numerikus, alfanumerikus, grafikus, egyéb Az adatok feldolgozási állapota alapján: bemeneti, kimeneti, köztes eredmények Az adatok változtathatósága alapján: statikus és dinamikus

32 Állapot- és akcióorientált adatok
Állapotorientált adatok: állapotot vagy jelenségeket írnak le úgy, hogy ezek az adatok bizonyos időbeli érvényességgel rendelkeznek. ha az állapotorientált adatok csak igen ritkán változnak törzsadatokról, ha gyakran változnak állományi adatokról beszélünk.

33 Állapot- és akcióorientált adatok
Az akcióorientált adatok állapotváltozásokat (eseményeket) és akciókat írnak le (pl. lakcímváltozás, raktári állományváltozás). általában a keletkezésükhöz fűződő időponttal együtt rögzítjük őket, ehhez kapcsolva elemezhetjük (pl. pénzfelvétel a pénz-kiadó automatából).

34 Hasznos adatok, vezérlőadatok
Az állapot- és az akcióorientált adatokat az adatfeldolgozás során felhasználjuk, hasznosítjuk, szemben azokkal a vezérlési adatokkal, amelyeket a hardver vagy a szoftver, esetleg bizonyos folyamatok vezérlésére használnak.

35 Formattált és nem formattált adatok
A formattált és nem formattált adatok megkülönböztetésének alapja az, hogy a formattált adatok esetében az adatoknak van valamilyen struktúrája (pl. személyi adatok: név, lakcím, jövedelem), míg a nem formált adatok struktúramentesek (pl. grafika)

36 Az adatot alkotó jelek fajtája alapján
Megkülönböztetünk: numerikus, alfanumerikus, grafikus és akusztikus adatokat. Numerikus adatok egy adott számrendszernek megfelelő számokból (jelekből) tevődnek össze. Az alfanumerikus adatok számokból, betűkből és különleges karakterekből álló adatok. Grafikus adatok képeket leíró adatok, amelyeket vagy bittérképes, vagy vektoros módszerrel adhatunk meg. Az akusztikus adatok hangok digitális ábrázolását megjelenítő adatok.

37 Az adat feldolgozási állapota alapján
Bemeneti adatok Kimeneti adatok Köztes eredmények

38 Az adatok megváltoztatása alapján
Statikus adatok Dinamikus adatok

39 Adatrekordok osztályozása
Az adatrekord méretét tekintve rögzített hosszúságú ill. változó hosszúságú lehet. Az adatrekord struktúráját tekintve lehet rögzített struktúrájú, formattált adatokat tartalmazó, vagy meghatározott struktúra nélküli, nem formattált adatokat tartalmazó.

40 Az adatkulcs egy adatelem vagy adatelemek kombinációja,
amely lehetővé teszi az egyes adatrekordok egyértelmű azonosítását.

41 Az adatkulcs Célja alapján: azonosító, osztályozó,
összetett, párhuzamos Fajtái: elsődleges, másodlagos Adattárolás kapcsán: keresési, rendezési

42 Adatfeldolgozási műveletek
Az adatok feldolgozása során azokkal különböző műveleteket végezhetünk. Műveletek osztályozása: az adatok kezelésére szolgáló műveletek új adatállomány létrehozása, adatállomány másolása, adat-előfordulás meghatározása (leszámlálás)

43 Adatfeldolgozási műveletek
az adatok megjelenítését végző műveletek adatok kiolvasása adatállományból adatcsoportok kiválasztása megadott szempontok alapján az adatállomány tartalmát megváltoztató műveletek adatok beillesztése (adott helyre) az adatállományba, adatok módosítása, adatok törlése,

44 Adatfeldolgozási műveletek
az adatállomány szerkezetét, illetve rendjét megváltoztató műveletek rendezés (megadott szempont alapján), adatállomány szétválogatása, adatállomány összeválogatása.

45 Egy felhasználói program működése nem más, mint adatfeldolgozási
Kimeneti eszközök Egy felhasználói program működése nem más, mint adatfeldolgozási műveletek sorozata.

46 A viszontlátásra!


Letölteni ppt "Gáspár Bencéné Dr. Vér Katalin nyomán"

Hasonló előadás


Google Hirdetések