Számvitelszervezés Gyurkó György
Elektronikus adatfedolgozás (itt mint az alapvető IT-ismeretek témaköre) Másik jelentése (a 4. fejezetben): az IT történetének kezdeti korszaka
Elektronikus adatfeldolgozás témái Adatszervezés, adatelérés Adatbáziskezelő rendszerek Nem strukturált komplex adatok (S.A.) Feldolgozási műveletek, feldolgozási módok Néhány általánosan elterjedt szoftver használata a gyakorlatban (S.A.)
Adatszervezés, adatelérés
Adatábrázolás a számítógépeken Digitális adatábrázolás (bit, bináris számok) Legkisebb címezhető tárolóegység – a bájt Adattípus (ábrázolási mód, értékkészlet, végrehajtható műveletek, végrehajtás módja) Számok, szövegek Pénzösszeget képviselő adat adattípusa 1+1 ≠ 3: Decimálisból bináris számmá konvertálás és kerekítések miatti hiba. Ajtók: 2.612.314,21 Ablakok: 1.112.000,21 Összesen: 3.724.314,43
Összetett adatszerkezetek
Tárolási szerkezetek Vektor: Lista: 1. vektorelem (cime: C) (címe = C + vektorelem hossza) 3. vektorelem (címe = C + 2* vektorelem hossza) … Lista: 1. listaelem 2. listaelem 3. (utolsó) listaelem adat mutató = 2. listaelem címe 3. listaelem címe nullmutató
Tárolási szerkezetek / 2 Multilista: Háló reprezentálására alkalmas.
Mező, rekord, blokk, fájl
Adatelérési módok Soros: nem áll rendelkezésre [tartalom (kereső kulcs) tárolási cím] leképezés Direkt (véletlenszerű): matematikai leképező eljárás - csak egyféle kulcs szerinti keresést gyorsít. Indexszekvenciális: leképező indextábla - többféle kulcs szerinti keresést gyorsít.
Egyszerű (egyszintű) indextábla
Többszintű indextábla mint rendezőfa
Adatbáziskezelő rendszerek
Adatbázis (on-line eléréssel) Több konkurens felhasználója van. Benne az ismeretek egymással alkotott természetes összefüggéseik szerint szervezettek (az adatok kapcsolatait is tartalmazza). Független az őt feldolgozó programoktól (sémaleírás, adatszótár, adatbáziskezelő rendszer).
Adatbázis (on-line eléréssel) / 2
Adatbázis-koncepciók Hierarchikus-hálós modell (CODASYL DBTG) Relációs modell Objektumorientált modell (Objektumrelációs modell - hibrid) Többdimenziós modell
Hierarchikus-hálós modell (CODASYL DBTG) Alapegysége a rekordtípus. A rekordtípusok hierarchikus kapcsolatait tárolási mutatókkal fejezi ki. Az adatelérés tárolási mutatókkal való navigálása gyors adatelérés tesz lehetővé, ezért az OLTP rendszerekben legelőször (az 1970-es évek elejétől kezdődően) az ilyen modellt megvalósító adatbázisok terjedtek el.
Hierarchikus-hálós modell (CODASYL DBTG) / 2 Kapcsolatok kifejezése tárolási mutatókkal
Relációs modell Alapegysége a kétdimenziós táblázat. A táblázatok kapcsolatainak kezelését tartalmi szinten, idegen kulcsok használatával oldja meg. A újraszervezés szempontjából sokkal rugalmasabb, mint a CODASYL modell. Az adatelérés idegen kulcsokkal való navigálása lassúbb adatelérést eredményez, ezért a relációs adatbázisok az OLTP rendszerekben később (az 1980-as években) terjedtek el. (A relációs adatbázisok nagy előnye a közös SQL nyelv.)
Relációs modell / 2 Kapcsolat megvalósítása idegen kulccsal
Objektumorientált modell Alapegységei az objektumok, amelyek nemcsak adatokat és adatkapcsolatokat, hanem ezeken értelmezett műveleteket is reprezentálnak. Kapcsolatok kezelése: a CODASYL modellel rokon, a kapcsolatokat ez is tárolási mutatókkal fejezi ki. A „nem-strukturált” multimédia adatok, dokumentumok kezelésére elvben a legalkalmasabb. Mégsem terjedt el: (1) A mai nyilvántartások zöme még strukturált adatokat tárol, ezek kezeléséhez drága. (2) Nincs az SQL-hez hasonló közös nyelv.
Objektumrelációs modell Alapstruktúrája azonos a relációs modellével, ezért megvalósításai a relációs adatbázisok legújabb verziói. Az összetett objektumokat bonyolult táblakapcsolatok reprezentálják. A bonyolultságot a rendszer eltakarja: az objektumot felépítő kapcsolatok automatikus kezelését az adatbáziskezelő rendszer magára vállalja. Nagy előny: használható az SQL.
Többdimenziós modell Az on-line elemzések (OLAP alkalmazások) többdimenziós adatnézetének megvalósítására optimalizált modell. Alapegysége a többdimenziós elemi adatkocka (adatcella). Egy n-dimenziós adatcella m+n adatértéket reprezentál: m darab tényadatot és n darab dimenzióadatot. Dimenzióadat: osztályozási, aggregálási szempontot képező adat (pl. áru, vevő, szállító vagy hely azonosítója vagy időpont). Tényadat: bármi más (pl. mennyiség, érték). Kapcsolatok kezelése: tárolási mutatókat használnak, de ezekkel nemcsak hierarchikus kapcsolatokat írnak le, hanem olyan inverz táblákat építenek fel, amelyekkel bármely dimenzió szerinti bármely osztály elemei gyorsan elérhetők.
Speciális adatbázis – az adattárház Az adatokat lekérdezési, elemzési műveletekre optimalizált szerkezetben tárolja. A kiszolgált vezetési szintek igényeinek megfelelően aggregált adatokat is tartalmaz. Különböző forrásokból nem tranzakciónként, hanem adott periódusonként frissítődik. A frissítés az adatértékek történetiségének megőrzésével történik. Optimális megvalósítás: többdimenziós adatbázis. Gyakori megvalósítás: speciálisan szervezett relációs adatbázis (csillagszerkezet).
OLTP adatbázis és az adattárház Domináns műveletek Egy-egy tranzakcióban szerepet kapott adatokat érintő, karbantartó (aktualizáló) műveletek: beszúrás, módosítás, törlés. Nagy adathalmazokat érintő, bonyolult lekérdezések. Egyedek (objektumok, események) bizonyos ismérvek szerinti csoportosítása, hierarchiába sorolása, valamint adott csoportosítás vagy hierarchia szerinti elérése. Optimum-célkitűzés A karbantartó műveletek hatékonyságának javítása: elfogadható tranzakció-feldolgozási idő. A lekérdezések hatékonyságának javítása: elfogadható válaszidő. Optimális szerkezet Minimális redundancia. Elfogadható válaszidőhöz szükséges mértékre fokozott redundancia. Modell Relációs adatmodell – normalizált. Többdimenziós adatmodell Adatbázis-technológia Relációs adatbázis Két változat: 1. Relációs adatbázis csillagszerkezetet mutató táblakapcsolatokkal. 2. Többdimenziós adatbázis.
Adatfeldolgozási műveletek és feldolgozási módok
Számítógépes adatfeldolgozási műveletek Adatbevitel Adatkarbantartás (aktualizálás) Lekérdezés Archiválás
Adatbevitel Módja: Célja: Emberi beavatkozás (eszközei: intelligens űrlap, billentyűzet, egér, érintésérzékelő képernyő, fényceruza, újabban emberi beszéd) Automatikus mérés, érzékelés (eszközei: mérőműszer, szenzor, kártyaleolvasó, vonalkód-olvasó, szkenner, digitális fényképező-gép, kamera, mikrofon) Más forrásból átvétel (pl. OLTP adatbázis adattárház vagy migráció) Célja: Nyilvántartás karbantartása (aktualizálása) Lekérdezés szűrőfeltételeinek megadása Feldolgozás vezérlése
Adatkarbantartás (aktualizálás) Műveletek: Új adat hozzáadása (új objektum vagy esemény) Módosítás (elavult érték felülírása) Törlés (a törlendő objektum, esemény meghatározása) Esetei: Törzsadatok karbantartása Tranzakció feldolgozása Ellenőrzött karbantartás: A művelet visszautasítással, vagy logikus következményeket érvényesítő rejtett műveletekkel járhat. A nyilvántartások szokásos karbantartásában fizikai törlés helyett általában logikai törlést (érvénytelenítést, sztornózást) alkalmaznak. Fizika törlés: csak az archiválással összekötve.
Lekérdezés Rejtett lekérdezés (pl. tranzakció feldolgozása közben ellenőrzés vagy vezérlés céljából) Felhasználó által kezdeményezett lekérdezés Fixen előredefiniált (pl. fix szerkezetű jelentés) Ad-hoc lekérdezés (felhasználó által megadott szűrőfeltételek, találati halmaz vagy aggregált eredményérték megjelenítése)
Felhasználói felület Képernyő és a szokásos adatbeviteli eszközök (billentyűzet, egér, fényceruza, vonalkódolvasó, kártyaleolvasó, … ) A képernyőn megjelenő komponensek: Funkcióválasztás eszközei (menüparancsok, parancsgombok, …) Adatbevitelt és megjelenítést szolgáló mezők (egyszerű mező, táblázat, legördülő lista, rádiógomb-blokk) Egyéb vezérlő grafikai elemek (fejléc; görgetőléc; csúszka; a méretezés és mozgatás grafikus eszközei, térkép, … ) Képernyőtípusok: Vezérlő Adatbeviteli vagy adatmegjelenítő Lekérdező (szűrőfeltételeket fogadó) Találati lista Választéklista (vagy értéklista) Tájékoztató
Feldolgozási módok Osztályozási szempontok: Módok: Erőforrások, adatforrások kapcsolása, elérhetősége Adatok megosztásának módja Erőforrások terhelésének elosztása, skálázhatósága Események bekövetkezésének és feldolgozásának időbeli viszonya Adatfeldolgozás célja Módok: On-line / off-line feldolgozás (1.szempont) Osztott feldolgozás (2.szempont: kényszerűségből vagy biztonsági megfontolásból földrajzilag osztott, illetve szakterületek szerint osztott, 3. szempont: technikai funkciók szerint osztott – kliens, szerver) Kötegelt / on-line tranzakcióvezérelt - OLTP (4. szempont) On-line elemző feldolgozás – OLAP (5.szempont)