Tovább-hasznosítható adatstruktúrák szerepe az IB munkájában A PIVOT-technológia és a fogalmi-konszolidáció egy konzisztencia-orientált teljesítésben (esettanulmány)

Slides:



Advertisements
Hasonló előadás
ITE az innovatív Tudás Egyeteme az Innováció Innovációja Innovatív kérdések és válaszok a fenntartható gazdasági, társadalmi, környezeti-ökológiai, kulturális.
Advertisements

T ESZTELÉS. C ÉLJA Minél több hibát találjunk meg! Ahhoz, hogy az összes hibát fölfedezzük, kézenfekvőnek tűnik a programot az összes lehetséges bemenő.
Keresés a számítógépes katalógusokban
Az utólagos ellenőrzésre és az előzetes biztosításra épülő rendszerek összehasonlítása dr. Csikesz Tamás.
Táblázatkezelés - függvények
SZENT ISTVÁN EGYETEM GAZDASÁG- ÉS TÁRSADALOMTUDOMÁNYI KAR AUTO- SZŰRŐ FEJLESZTÉSE TÁBLÁZAT ALAPÚ JELENTÉSEK UTÓLAGOS, BÖNGÉSZŐN BELÜLI TOVÁBB- FELDOLGOZÁSÁRA.
Gazdasági Informatika Tanszék
Tengeralattjáró győzelmi hírek elmaradása – kilövés
A Krúdy Gyula Városi Könyvtár katalógusának használatáról…
INNOCSEKK 156/2006 ONLINE SZAKÉRTŐI KERETRENDSZER FEJLESZTÉSE Developing an online expert system generator Készítette: Gerendás László, ISZAM III. Szent.
OSIRIS avagy egy kézzel fogható határvonal, mely mentén a „mennyiség” végre átcsaphat „minőségbe”… FVM (69855/2004) kutatóintézetek Online Szaktanácsadási.
Online gazdasági informatika szótár fejlesztése OGIL Dr. Pitlik László, Pásztor Márta, Popovics Attila, Bunkóczi László, Pető István Szent István Egyetem,
Készítette:Horváth Henrietta (ISZAM3) Gödöllő,
Online hasonlóságelemzések: Inkonzisztenciák feltárása különböző földérték- kategóriák kapcsán Pitlik László, SZIE Gödöllő (Forrás: my-X.hu Hírlevél) 2007.
Fekvőbeteg adatbázis szervezés GyógyinfokPirisa Levente.
Döntés-előkészítő változatelemzések egy jogosultság kezelő alkalmazás Identity Management rendszerré alakítása kapcsán Készítette: Papp Zsuzsanna Belső.
Műveletek logaritmussal
Táblázat kezelő programok
DIFFERENCIÁLSZÁMÍTÁS ALKALMAZÁSA
A projekttől a pályázatig
1. Bevezetés 1.1. Alapfogalmak
Adatbáziskezelés az MSAccess programmal Makány György 2. rész: Adattáblák létrehozása külső adatforrásból.
Térinformatika (GIS) Házi feladat Keressen hibát a Google Earth vagy Maps adataiban, pl. az objektum jelölése nem esik egybe a műholdképen látható hellyel,
Gazdasági informatikából megkaptuk a félévi feladatot!!! Mindenki „nagy” örömére… 0. hét.
Gazdasági informatikából megkaptuk a félévi feladatot!!! Mindenki nagy örömére… 0. hét.
Hasonlóságelemzés COCO használatával a MY-X elemzőben
Gazdasági informatika II.félév
GAZDASÁGI INFORMATIKA II.
Agrárinformatikai kutatások helyzetének áttekintése Pitlik László (MAGISZ, SZIE) I. Agrárinformatikai Nyári Egyetem Gödöllő Szervezők:
INNOCSEKK 156/2006 Hasonlóságelemzés-alapú vizsgálat a COCO módszer használatával Készítette: Péter Gábor
Gyanúgenerálás HR-kockázatok minimalizálása érdekében hasonlóságelemzéssel Pitlik László SZIE Gödöllő, Gazdaság- és Társadalomtudományi Kar, TATA Kiválósági.
Online hasonlóságelemzések: Online hasonlóságelemzések: Tapasztalatok (kukorica) hozamfüggvények levezetése kapcsán Pitlik László, SZIE Gödöllő (Forrás:
Online hasonlóságelemzések: Online hasonlóságelemzések: Totó-automata?! Pitlik László, SZIE Gödöllő (Forrás: My-X.hu Hírlevél) október INNOCSEKK.
Online hasonlóságelemzések: Online hasonlóságelemzések: Tapasztalatok elítéltek képzésének engedélyezése kapcsán Pitlik László, SZIE Gödöllő (Forrás: My-X.hu.
Testre szabott Microsoft szoftver-licenc meghatározása online szakértői rendszerrel Készítette: Kurucz Eszter
Hasonlóságelemzés COCO használatával
Bázisérték, monitoring avagy szemléletváltás a vidékfejlesztési döntések előkészítésében Pitlik László, Horváth Henrietta, SZIE Gödöllő 9. MY-X szeminárium:
My-X Hírlevél: március A tartalomból: SCORE vs. FRAMINGHAM: Egyedi „biometriai” elemzések rendszerszintű kockázata Médiatorta a meteorológiai előrejelzések.
Online kommunikáció nappalos és levelezős tananyagok BA KMT II. Pitlik László, SZIE, GTK Gödöllő 2008 ősz INNOCSEKK 156/2006, ill. INNOCSEKK 438/2006.
A számvitelszervezés újszerű informatikai aspektusai
Készítette:Horváth Henrietta (ISZAM3) Gödöllő,
Kimutatáskészítés Segédanyag a Felszámolási és vagyonfelügyeleti szakközgazdász valamint Felszámolási és vagyonfelügyeleti specialista szakirányú továbbképzés.
Indikátorok a Magyar Egészségadattárban
Készítette: Kosztyán Zsolt Tibor
Vállalkozások elemzése
2. Argumentációs szabályok (É 50−55) argumentációs szabályok meghatározzák, hogy mi mellett és mivel kell érvelni 1. a feleknek érveléssel indokolniuk.
Statisztika.
Az Excel mint „interaktív” kérdőív
Közösségi érték (public value) vizsgálat Budapest, Szonda Ipsos.
Turizmus gazdaságtan 3..
Előadássorozat a Független Pedagógiai Intézetben fupi.hu Az internet: miért, hogyan? 7 / 10. Csada Péter Csada Bt. cspc.hu.
ÖNKOMRÁNYZATI PÉNZÜGYI INNOVÁCIÓK május 30. hétfő U D V A R H E L Y I ü g y v é d e k PPP KONSTRUKCIÓK: A VÁLLALKOZÓI TŐKE, AZ ÖNKORMÁNYZATI.
Kérelem elektronikus benyújtása a Szolgáltatói Nyilvántartásba
Mesterséges intelligencia az információbiztonság szolgálatában GOP /A ITBSZM Mesterséges intelligencia az információbiztonság szolgálatában.
Hozzárendelések, függvények
Kördokumentumok 1..
Területmérlegre vonatkozó konzisztencia-vizsgálat Gazdasági Informatika Tanszék 2004/2005. tanév Utolsó frissítés:
Keresés a weben Kulcsszavas keresés: Google (
Adatvizualizáció Segédanyag a Gazdasági informatika tárgyához
Weblap-szerkesztés. Információs hálózati szolgáltatások Internet fontosabb szolgáltatásai (szóbeli) Elektronikus levelezési rendszer használata (szóbeli)
A közszolgáltatásokra kifejlesztett általános együttműködési modell GYÁL VÁROS ÖNKORMÁNYZATÁNÁL Gyál, szeptember 30.
AZ ON-LINE ELEMZÉSI SZOLGÁLTATÁSOK FEJLESZTÉSE A MEZŐGAZDASÁGI VÁLLALKOZÁSOK SZÁMÁRA Pisartsov Andrei Nik.
Innovációs menedzserképzés (30 órás verzió) Pitlik László SZIE Gödöllő / INNOREG-KMRIÜ
 Rosling - vizualizáció multikulturális jelenségek esetén Rosling - animations in case of multicultural phenomena Pitlik László SZIE MY-X kutatócsoport.
Önértékelési projektterv
Bevezetés Tematika Számonkérés Irodalom
Kötelezettségvállalás nyilvántartása, számvitele
 Rosling - vizualizáció multikulturális jelenségek esetén Rosling - animations in case of multicultural phenomena Pitlik László SZIE MY-X kutatócsoport.
Az SZMBK Intézményi Modell
Előadás másolata:

Tovább-hasznosítható adatstruktúrák szerepe az IB munkájában A PIVOT-technológia és a fogalmi-konszolidáció egy konzisztencia-orientált teljesítésben (esettanulmány) Pitlik László

A feladat jellemzése •Az IB megrendelője szeretne képet nyerni egy adott területi egység (pl. ország, statisztikai régió, megye) növénytermesztési szerkezetéről éves bontásban, több évre kiterjedően. •A megrendelő elvárja, hogy minél kevesebb aggregált (különböző növényi kultúrákat összevonó) adat szerepeljen a kimutatás hektárban kifejezve. •A keresés eredményeként az IB két dokumentumot talál, melyek (látszólag) tartalmazzák a szükséges adatokat. – –

Az IB operatív feladatai I. •Tartalmi áttekintés: Ennek keretében auto-szűrő segítségével ellenőrizni lehet a felkínált adatmennyiség fogalmi rendjét, vagyis egy fajta metaadat-nézet szimulálható, –mely egyszerre engedi meg a tartalom részletes feltárását (a használt fogalmak listaszerű áttekintését), ill. –a forrás-dokumentum esetleges (pl. a későbbi konszolidációt nehezítő törzsadat-kezelési) hibáinak (pl. azonos tartalom eltérő megjelölés: buza<>búza) felismerését.

Az IB operatív feladatai II. •Források ellenőrzése és visszakövetése a primer adatforrásig: –Mivel a talált dokumentumok szakmaiatlanul forrásként nem egy konkrét URL-t, vagy egy jól körülhatárolható papír-alapú dokumentumot adtak meg, így az IB köteles annak utána járni, vajon az egyes számszerű adatok valóban gépelési és értelmezési hiba nélkül kerültek-e rögzítésre. –Ezt részben segíti az a tény, hogy a két forrás a 2001-es év tekintetében átfedést tartalmaz, vagyis egyfajta pozitív redundanciát mutat, mely ellenőrzési céllal kiaknázható (pl. FKERES-megoldással). –Az átfedés felfedezése egyben felveti a fogalmi konszolidáció igényét is, vagyis az IB-nek ellenőriznie kell azt is, vajon azonos jelenségek a két dokumentumban azonos jelöléssel kerültek-e kódolásra. Amennyiben nem, úgy ezt az adatok összevezethetőségének érdekében maga az IB kell, hogy megtegye. Ehhez pedig a primer adatközlés szakkifejezéseit (ill. ehhez közelebb álló terminológiát) kell előnyben részesítenie. Amennyiben az egyes fogalmak nem azonos aggregációs szinten kerültek meghatározásra, vagyis nem egy közös (kihagyás- és átfedés- mentes fogalmi) halmaz elemei, úgy a konszolidáció ki kell, hogy terjedjen az egyedi kategóriák összevonására (vö. legkisebb közös többszörös), ill. szerencsés esetben az egyes kategóriák újabb források alapján való elemekre bontására.

Helyes forrás-megadás •Nem elegendő tehát az intézmény megadása, ehelyett pontos URL, sőt lehetőség szerint további utalás oldalszámra, fejezetre is szükséges, mely biztosítja, hogy az egyébként strukturálatlan alapanyagban lehetőleg egyetlen kattintással oda jussunk, ahol a struktúrába emelt adat valóban megtalálható… •Az így megadott URL azt a veszélyt rejti magában, hogy a szolgáltató bármikor átszervezheti könyvtárait, átalakíthatja állományai nevét, megszűntetheti a dokumentum közlését. Ajánlatos tehát a talált dokumentumokat archiválni saját hatáskörben is…

Az IB operatív feladatai II. •Források ellenőrzése és visszakövetése a primer adatforrásig: –Mivel a talált dokumentumok szakmaiatlanul forrásként nem egy konkrét URL-t, vagy egy jól körülhatárolható papír-alapú dokumentumot adtak meg, így az IB köteles annak utána járni, vajon az egyes számszerű adatok valóban gépelési és értelmezési hiba nélkül kerültek-e rögzítésre. –Ezt részben segíti az a tény, hogy a két forrás a 2001-es év tekintetében átfedést tartalmaz, vagyis egyfajta pozitív redundanciát mutat, mely ellenőrzési céllal kiaknázható (pl. FKERES-megoldással). –Az átfedés felfedezése egyben felveti a fogalmi konszolidáció igényét is, vagyis az IB-nek ellenőriznie kell azt is, vajon azonos jelenségek a két dokumentumban azonos jelöléssel kerültek-e kódolásra. Amennyiben nem, úgy ezt az adatok összevezethetőségének érdekében maga az IB kell, hogy megtegye. Ehhez pedig a primer adatközlés szakkifejezéseit (ill. ehhez közelebb álló terminológiát) kell előnyben részesítenie. Amennyiben az egyes fogalmak nem azonos aggregációs szinten kerültek meghatározásra, vagyis nem egy közös (kihagyás- és átfedés- mentes fogalmi) halmaz elemei, úgy a konszolidáció ki kell, hogy terjedjen az egyedi kategóriák összevonására (vö. legkisebb közös többszörös), ill. szerencsés esetben az egyes kategóriák újabb források alapján való elemekre bontására.

Redundancia ellenőrzési célra •Két azonos/hasonló fogalomkészletű felsorolás értékeinek összevetését pl. az FKERES függvény jól támogatja… •A végső, a megrendelőnek szóló jelentésben célszerű azonban már csak egyetlen adatsorként szerepeltetni az ellenőrzés után helyesnek, azonosnak talált adatokat…

Az IB operatív feladatai II. •Források ellenőrzése és visszakövetése a primer adatforrásig: –Mivel a talált dokumentumok szakmaiatlanul forrásként nem egy konkrét URL-t, vagy egy jól körülhatárolható papír-alapú dokumentumot adtak meg, így az IB köteles annak utána járni, vajon az egyes számszerű adatok valóban gépelési és értelmezési hiba nélkül kerültek-e rögzítésre. –Ezt részben segíti az a tény, hogy a két forrás a 2001-es év tekintetében átfedést tartalmaz, vagyis egyfajta pozitív redundanciát mutat, mely ellenőrzési céllal kiaknázható (pl. FKERES-megoldással). –Az átfedés felfedezése egyben felveti a fogalmi konszolidáció igényét is, vagyis az IB-nek ellenőriznie kell azt is, vajon azonos jelenségek a két dokumentumban azonos jelöléssel kerültek-e kódolásra. Amennyiben nem, úgy ezt az adatok összevezethetőségének érdekében maga az IB kell, hogy megtegye. Ehhez pedig a primer adatközlés szakkifejezéseit (ill. ehhez közelebb álló terminológiát) kell előnyben részesítenie. Amennyiben az egyes fogalmak nem azonos aggregációs szinten kerültek meghatározásra, vagyis nem egy közös (kihagyás- és átfedés-mentes fogalmi) halmaz elemei, úgy a konszolidáció ki kell, hogy terjedjen az egyedi kategóriák összevonására (vö. legkisebb közös többszörös), ill. szerencsés esetben az egyes kategóriák újabb források alapján való elemekre bontására.

Konszolidációs igény •Eltérő írásmódú (pl. triticale vs. tritikálé), de azonos tartalmú törzsadatok esetén •Eltérő aggregációs szintű, de összevonható esetekben (pl. lucerna mag + széna) •Zavaros fogalmi részletek esetén pl. „egyéb növény” minden, ami csak az egyik, vagy csak a másik felsorolásban szerepel… •Nem konszolidációs kérdés az adathiány esete (pl. vetetlen terület, mely nem képezheti az „egyéb növény” részét, hiszen nem hasznosított területről van szó…

Az IB operatív feladatai III. •Az alapadatokból származtatott objektumok (jelentések, táblázatok, grafikonok) előállítási lépéseinek ellenőrzése: –Feldolgozott adatok tartományának ellenőrzése, mely rámutathat esetleges adathiányokra, ill. szakadásokra az alapadat-táblázatban. –A pivot frissítése, mely hibái esetén a származtatott adatok adott formájukban értéktelennek minősítendők, hiszen nem következnek szervesen az alapadatokból. –Az egyes táblázati adatok mögött megbújó egyedi adatsorok darabszámának ellenőrzése, mely rámutathat indokolatlan összegzésekre, értelmetlen átlagolásokra. –Amennyiben több adat kerül pl. összegzésre, átlagolásra, akkor ezen adatok mértékegység-azonosságának feltárása, (hiszen pl. hektárt a literrel nem ildomos összeadni…) –A pivot belső szerkezetének ellenőrzése, mely felfedheti a származtatott adatok logikai hibáit.

Konzisztencia-vizsgálatok •Olyan megrendelések esetében, ahol szakmai szempontból egyértelmű ellenőrzési pontok jelölhetők ki, az IB köteles ezen ellenőrzési lehetőségre a megrendelő figyelmét felhívni. •A vetésszerkezeti adatok (általában térinformatikai jellegű feladatok) esetén ilyen magától értetődő ellenőrzési pont egy, a vizsgált jelenség földrajzi kereteit jelentő objektum (Magyarország) teljes területével való elszámolás egységes fogalmi rend alapján. •Az ellenőrzés vagy a hibátlan vagy egy hibás állapotra mutathat rá. Hiba esetén ennek mértéke is vizualizálható (vö. korrekciós tényező). •A (mérlegszerű) konzisztencia vizsgálatokat PIVOT támogatás mellett például praktikusan el lehet végezni akkor, ha az aggregátumot szembe állítjuk ennek alkotórészeivel, s a pivot-táblázat összegzését a nulla eltérés kimutatására használjuk fel. •Ajánlott irodalom (MSZR-feladatok):

MSZR: területmérleg

…vissza az elejére… …vissza az elejére…