1 Anonimizálási és adathozzáférési eljárások a hivatalos statisztika gyakorlatában Szép Katalin – Gadácsi Katalin KSH Fényes Elek Műhely május 26.
2 Vázlat 1.Alapok: statisztikai cél 2.Adatkiadás, kockázatok, csatornák 3.Alapelvek 4.Dilemmák 5.Eurostat gyakorlat, fejlesztési irányok 6.Záró gondolatok
3 Milyen adatok vannak? „ 2008-ban XYZ Kft. nettó árbevétele ezer Ft ” Adóbevallás – adminisztratív adat KSH kérdőív – statisztikai adat …
4 Mitől függ? Minden esetben adott egységre vonatkozik, de a cél különbözik: Igazgatási/adminisztratív –felhasználása közvetlenül az adott egységet érinti, adott egységre vonatkozó intézkedések alapja Statisztikai – sokaságot akarjuk jellemezni.
5 Adatgyűjtés – feldolgozás - használat Adminisztratív cél AdatgyűjtésEllenőrzés, Egységet érintő nyilvántartás intézkedés Statisztikai cél AdatgyűjtésAdatellenőrzés,ösz- Sokaságot szesítés, becslés jellemző adat
6 Adatgyűjtés – feldolgozás - használat Adminisztratív cél AdatgyűjtésEllenőrzés, Egységet érintő nyilvántartás intézkedés Statisztikai cél AdatgyűjtésAdatellenőrzés,ösz- Sokaságot szesítés, becslés jellemző adat
7 Egy speciális kérdés: adat- összekapcsolás Célok –Költségcsökkentés –Adatszolgáltatói terheket ne növeljük –Meglévő adatokból max információ kinyerése Megoldás: adatösszekapcsolás –Kapcsolás a lehető legpontosabb adatokból –Összekapcsolt állomány gondos anonimizálása (kapcsolás előtti anonimizálás rontja a kapcsolás minőségét, és nem biztos, hogy anonim kapcsolt állományt eredményez)
8 EU Statisztikai Rendszer jövőképe Cél: adatszolgáltatói terhek mérséklése, minőség javítása Különböző adatforrások Statisztikai elemzések Feldolgozás Forrás: Communication from the Commission to the European Parliament and the Council …COM(2009) August 2009
9 Statisztikai célból gyűjtött/kezelt adat csak statisztikai célra használható, azaz a sokaság jellemzésére. Adatkiadáskor adminisztratív célra alkalmatlanná kell tenni, azaz ne legyen alkalmas egyedek azonosítására, egyedekre vonatkozó információ felfedésére.
10 Milyen információ felfedését akadályozzuk meg? Ország kultúrájától függ. Magyarországon: –különleges adat (jogi alap) –érzékeny adat (vállalati, lakossági kultúra)
11 Felfedés elleni védelem Felfedés kockázata függ: –Adat jellege (érzékeny, különleges+közvetlen és közvetett azonosítást lehetővé tevő) –Adathasználat közvetlen célja, adathasználó rendelkezésére álló egyéb információ, eszközök, nyilvántartás, adathasználó háttérintézményének feladata –Jogi védelem lehetősége Adatvédelem: felfedés elleni logikai, jogi, fizikai védelem Tökéletes védelem nincs, cél, hogy szokásos idő és eszközráfordítással ne legyen felfedhető
12 Felfedés tipikus esetei - Táblázatból Ha az érzékeny kategóriába túl kevés adatszolgáltató esik pl. személygépkocsi-gyártás megyei adatai Ha az érzékeny kategóriába túl sok/összes adatszolgáltató esik pl. „B régióban minden hajótulajdonos környezetszennyező” Védelem: aggregálás, cellaelnyomás, kerekítés
13 Felfedés tipikus esetei - Mikroadatokból Közvetlen azonosítókból (név, telephely, adószám) Ritka értékkombinációkból (főtevékenység, régió, létszámkategória) Védelem: közvetlen azonosítók törlése, csonkolás, cellaelnyomás, átkódolás- kerekítés, összekeverés
14 Főbb adatkiadási csatornák a KSH-ban Kutatók a Hivatal kutató- szobájában Jogi védelem EurostatStatisztikai Hivatal Kutatók az Eurostat kutató- szobájában EU-s mikroadatot használó kutatók Hazai mikroadatot használó kutatók Nyilvánosság c) b)b) a) b)b) c) Felfedés elleni védelem a) aggregált és mikroadatok nyilvánosságra hozása b) anonimizált mikroadatkiadás (kutatási célra) c) mikroadat-hozzáférés
15 Adatkiadási/hozzáférési csatornák Táblázatos –Kész táblázatok (kiadványok, Stadat vagy egyedi) –Adatbázisokból lekérdezéssel Mikroadat –Távoli hozzáférés –Kutatószoba –Adatállomány kiadása (kutatónak, v. publikus) –Adatállomány átadása kutatói adatbázisba
16 Maximális biztonság – minimális kockázat Minimális információveszteség Hatékonyság, összehangoltság Megalapozottság Különböző formában, különböző csatornákon Egyenkockázat elve Felfedés elleni védelem alapelvei
17 Dilemmák az adatkiadásban Felhasználók megkülönböztetése – egyenkockázat elve Egyedi igényeknek megfelelő anonimizálás – kockázatnövekedés - erőforrásigény - ingyenesség
18 EU: bizalmas adatokhoz való tudományos célú hozzáférés Bizottság 831/2002/EK rendelete Bizalmas adatok – statisztikai egység közvetlen azonosíthatóság nélkül Bizalmas adatokhoz való hozzáférés – hivatali helységben, vagy anonimizált mikroadat kiadása Kérelem: Intézmény (egyetem, tudományos kutatóintézet, statisztikai intézet, EKB, jegybankok) Bizottság 2004/452/EK határozata a szervezetek jegyzékéről Kutatók Kutatási cél Adatállomány
19
20 Fejlesztési irányok a világban Nemzetközi összehasonlítási igény, lehetőség Új technikai lehetőségek (távoli hozzáférés, adatbázisok mérete, hozzáférési eszközök, adatelemzési eszközök) Speciális kérések, kérdések Válaszok: kutatás, fejlesztés a felfedés elleni logikai védelemben, informatikai, jogi eszközökben
21 Adatvédelmi fejlesztések az EU- ban Adatvédelmi kézikönyv felülvizsgálata –érthetőség Hozzáférés mikroadatokhoz EU szinten (Eurostaton keresztül) –Intézményi engedélyeztetés egyszerűsítése –Adatállományok bővítése Hozzáférés kutatószobák hálózatán keresztül –Kutatószobák standardja –Anonimizálás, felhasználók minősítése, dokumentáció, szerződés standardja –Szabályozás standardizálása
22 Fejlesztések a KSH-ban Részvétel EU grantokban/fejlesztésekben Adathozzáférési csatornák bővítése Adatvédelmi szempontok egységesítése Csökkenő pénzügyi erőforrások, igen korlátozott emberi kapacitások mellett.
23 Összegzés (1) Statisztikai célokat szolgáló adat csak úgy adható ki (statisztikai szolgálaton kívülre), hogy ne szolgálhasson közvetlenül adminisztratív intézkedés alapjául. Eszköz: felfedés elleni logikai, technikai, jogi védelem Kiadható anonimizált mikroadat, biztonságos táblázat.
24 Összegzés (2) Statisztikai célnak való megfelelés –Befogadhat egyedi adatot –Kiad csak anonimizált adatot Mikroadatkiadáshoz –Termelési folyamat átalakítása –Módszertani felkészülés –Költség és emberi erőforrásigény Jogi környezet (koncepcionális összhang, EU konformitás)
25 Köszönöm a figyelmet!