Kutatásmódszertan Kérdőíves módszer & statisztikai adatfeldolgozási alapok
Kitöltetés Kérdezőbiztos által felvett kérdőív Önkitöltő kérdőív Helyszínen Telefonon Online Önkitöltő kérdőív Papír alapú Helyszíni Postai „Elviszi-visszahozza” Elektronikus Statikus Válaszadó: Egy vagy több Képzettség Érdekeltség
Forma Névadás Fejléc Hangnem A válaszadó megnyerése: bevezető, kutatásvezető, ellenőrizhetőség Kérdőívet azonosító adatok Olvashatóság, érthetőség Megfogalmazás Szerkezet Kivitelezés „Bolondbiztosság” Kitöltő felé Elemző felé Kérdezőbiztos felé Feldolgozási mód figyelembe vétele (szkenner?) Kérdések számozása Kódolás feltüntetése Köszönetnyilvánítás, kontaktlehetőség
Szerkezet Bevezető és átvezető jellegű kérdések Demográfiai vs. lényegi kérdések (végére v. elejére?) Gondolkodásmenet figyelembe vétele Logika Átvezető kérdések Egy vagy több kitöltő? Kérdések csoportosítása Kínos vagy személyes kérdések a végére Terjedelem Érdeklődés fenntartása (változatosság) Elektronikusnál: egyszeri vagy folytatható?
Kérdés-típusok Nyílt Félig nyílt (félig zárt): Zárt Fajtái (lehet szabad válasz vagy behelyettesítés): Numerikus Szöveges: Szavak Mondatok Hosszabb szöveg Egyéb (pl. ábra) Elektronikus rögzítésénél „kicsúszhat a képből” Félig nyílt (félig zárt): „Egyéb” „Éspedig?” Zárt
Zárt kérdések fajtái Q rendezés (nominális): Kétértékű Általában nominális skála. Ha 0 és 1, akkor „dummy” változó. A dummy változó skálaváltozóként viselkedik. Választás több lehetőség közül (nominális skála): Állítások, fogalmak, számértékek stb. Egy vagy több megjelölés engedélyezése Egyszeres választás Többszörös választás Q rendezés (nominális): csoportosítás hasonlóság alapján Ordinális skálán mérő eszközök Intervallum vagy arányskálán mérő eszközök
„Dummy” változóvá alakítás Dummy változók: Fővárosban lakik-e? 0 = nem, 1 = igen Megyeszékhelyen lakik-e? 0 = nem, 1 = igen Egyéb városban lakik-e? 0 = nem, 1 = igen Falun, községben lakik? 0 = nem, 1 = igen Egyéb lakhelyet megjelölt-e? 0 = nem, 1 = igen Eredeti változó: Lakóhely típusa? 1 = Főváros 2 = Megyeszékhely 3 = Egyéb város 4 = Falu, község 5 = Egyéb: ………… Milyen mérési skálájú a fenti változó? Ordinális. Ebből következően fontos a sorrend! Fontos-e a dummy változók sorrendje? Mikor? Ha sorban zárják ki egymást a lehetőségek. Ebben a példában fontos (mert a főváros is megyeszékhely, ami egyéb város is egyben).
Mit jelet a „skála”? Több kérdésből (itemekből) összállított mérőeszköz (valódi skálák). Skála Index Egy kérdésnek (itemnek), mint mérőeszköznek a skálája (pontosabb: kérdésformátum)
Index vs. skála Skála: Az egyes itemek súlyozott összegzése Index: Az itemek súlyozás nélküli összegzése
Néhány „valódi skála” Likert skála: Bogardus-skála: Thurstone-skála: Megállapítja,hogy az egyes itemekkel egyetértők átlagosan hány itemmel értettek egyet, majd ezt az étéket használja súlyként a skála kialakításánál. Bogardus-skála: Az itemek egyre növekvő intezitásúak és ezért a nagyobb intenzitás elfogadása a kisebb elfogadását is valósznűsíti. Thurstone-skála: Szakértői item-súlyozás és -szelekció (a nagy szórásúakat kizárjuk). Guttman-skála: Kérdések minta alapú (empirikus) súlyozása. Kumulativitás feltételezése a válaszokban (aki egy erősebbet megjelöl, az a gyengébbet is).
Zárt kérdések: mértékskálák Sorba rendezés (ordinális) Kombinálható a választással (pl. a legfontosabb 3-at sorrendbe) Ekkor a ki nem választottak rangszáma kérdéses Gyakori tévesztés („visszabutítani”, átkódolni) Szemantikus differenciál (ordinális vagy jobb) Szembenálló fogalmak, kijelentések (irány és intenzitás is) Eredetileg grafikus de lehet számozott Likert-kérdésformátum (Likert-”skála”) = „egyetértő skála” (ordinális?): Attitűdmérés: mennyire ért egyet? Alapesetben 5-ös skála, de lehet ettől magasabb is Stapel-skála: -5 -4 -3 -2 -1 0 +1 +2 +3 +4 +5 Kényszerített szétosztás + konstantösszeg-skála (arány) A mértékskálák értelmezhetőségét könnyíti: magyarázat indexálás
Értékelő-skálák tartománya, formája Érthetőség: minél kisebb Elemezhetőség: minél nagyobb Negatív értékek: elemzési nehézség Különböző skálák: együttes elemzés nehézsége Páros-páratlan értéktartomány: kutatási céltól függhet, lényegi különbség nincs Számok vagy grafikus skála: érthetőség Grafikus megoldások: Szakaszok; Körök, négyzetek stb.; Szimbólumok Fontos lehet az érdeklődés felkeltése, fenntartása is Magyarázott skálák: segítheti a válaszadót, de a megfogalmazás is befolyásol!
Kényes vagy nehéz kérdések Anonimitás Titkosság Indirekt megkérdezés Dialógus Proxy-változó mérése Asszociáció „Más szájába adás” Kategóriák
Ellenőrzés Ellenőrző kérdések: Újrakérdezés Pontosítás Ugyanúgy Átfogalmazva Pontosítás Kapcsolódó, korreláló kérdések Statisztikai ellenőrzés: Válaszok eloszlása (pl. diagramok, felezés) Mutatók, pl. Cronbach alfa „Benchmarking”
Cronbach alfa K = adott skálához tartozó itemek száma σ2X = teljes pontszám varianciája σ2Y = adott item pontszámának varianciája A belső konzisztencia legelterjedtebb összesített mérőszáma. Főleg pszichológiai, szociológiai kérdőíveknél használják, de akár iskolai teszteknél is helye van. 0-1 közt mozog. Feltétele, hogy a skála elemei egy dimenziót mérjenek. Bináris változókon is használható: Kuder-Richardson 20 (KR-20).
Kuder-Richardson 20 Kétérétékű változókra alkalmazható. Értéke 0-1 közt mozog. A mérőeszköz belső konzisztenciáját (ezáltal megbízhatóságát) méri. Megfelel a Cronbach alfának
Kuder-Richardson 20 Képlete K elemű tesztek esetén: ahol pi az i-dik kérdésre adott jó válaszok aránya, qi pedig a rossz válaszoké (pi + qi = 1). A nevezőben szereplő variancia pedig:
Gyakori hibák Pilot-teszt kihagyása! Kiválasztási torzítás: Oka: a minta nem véletlenszerű Egy típusa az önkiválasztási torzítás (internet, felvételi helyszín) Többértelmű megfogalmazás (ki-ki mást érthet) Többszörös kérdések (egy kérdésben több is megbújik) Nem közérthető (zsargon, bonyolult) Ismeretek adottnak vétele (nem fogják érteni) Érzések kiváltása, figyelembe nem vétele (érzelmi hatásokat el kellene kerülni) Irányító kérdések (sejtetik, hogy mi a „helyes” válasz) Nem lefedett választartomány (mit válaszoljon, aki egy nem szereplő opciót jelölne, ha lenne olyan?) Logikának ellentmondó sorrend vagy kódolás (összezavar)
Adatmentés Ha rossz a kérdés Hibás a válasz Hiányzik az adat („semmi vagy nulla” problémája) „Visszabutítás”: mérési skála „lerontása” Átlaggal helyettesítés Random válasz generálása Kikövetkeztetés Újrafelvétel Mindig rögzíteni a választott módszert! Függ a mintanagyságtól
Adatok feldolgozása Minta ismertetése: egyenes, leíró elemzés demográfiai változók válaszadási magatartás jellemzői Lényegi kérdések „egyenes” elemzése Kérdésenként Változónként: egy-egy változó több itemet is jelenthet Összefüggések statisztikai feltárása Indulhat a statisztika és a szakma felől is Mindig magyarázni kell szakmailag is! Értelmező elemzés (mit jelentenek az eredményeink a kutatási kérdésre nézve?) Szükség esetén új ciklus indul
Statisztikai módszerek és adatelemzés Mérési szintek (mérési skálák) azonosítása Elfogadott módszerek a szakirodalom alapján: ez maga is lehet szekunder elemzés tárgya A minta használhatósága: A nem használható elemszámú (túl kicsi) csoportokat kihagyni, amikor a csoportok vannak terítéken, de visszatenni, ha az egyes csoportfüggetlen esetek, vagy más szempontú csoportok elemzését végezzük „Egyenes” elemzés: Gyakoriságok: célszerű ábrázolni (sorrend, ábratípus) Relatív gyakoriság: százalék, ha „illik” Primitív kereszttáblák: mutatók nélkül
A minta bemutatása Leíró technikákkal történik: Nominális skálájú változóknál: gyakoriság, relatív gyakoriság, esetleg módusz Ordinális változóknál: ha kevés értékkel rendelkezik: gyakoriság, relatív gyakoriság terjedelem (minimum, maximum) valamely kvantilisek, vagy az ezekkel képzett csoportok (medián, tercilis, kvartilis, kvintilis, decilis…) Intervallum skálájú változóknál, a fentebbieken kívül: átlag + szórás (vagy a szórás helyett variancia) A skálák megbízhatósága: Cronbach’s alpha A mintának azokat az alcsoportjait külön-külön (is?) le kell írni, amelyek a későbbi elemzés szempontjából fontosak (pl. a hallgatók évfolyam/szak kombinációit).
Néhány gyakran alkalmazott teszt: Egy változó tulajdonságai Kétértékű változóknál: sokaságon belüli arányokra: binomiális próba az egymást követő értékek véletlenszerűségére: sorozatpróba Átlagértékre: Egymintás t-teszt Eloszlásra: vizuálisan: hisztogram „számokkal”: Kolmogorov–Szmirnov próba
Néhány gyakran alkalmazott teszt: Két csoport összehasonlítása Nominális vagy magasabb, viszonylag kevés érték (de csoportonként legalább 5 eset értékenként várható lenne véletlen eloszlásnál): kereszttábla: khí-négyzet, Cramer’s V Legalább ordinális skála: Mann–Whintney U Legalább intervallum skála, feltételezhető a normális eloszlás: Student t-teszt
Néhány gyakran alkalmazott teszt: Több csoport összehasonlítása Az előzőek is elvégezhetők minden lehetséges párosításra Nominális vagy magasabb, viszonylag kevés érték (…): kereszttábla: khí-négyzet, Cramer’s V Legalább ordinális skála: Kruskall–Wallis H Legalább intervallum skála, feltételezhető a normális eloszlás: ANOVA (post-hoc tesztekkel kiegészíthető) binomiális logisztikus regresszió-elemzés
Néhány gyakran alkalmazott teszt: Két változó összehasonlítása, struktúrája Legalább ordinális: Wilcoxon teszt (rangok összevetése) Spearman rangkorreláció (együttmozgás) Legalább intervallum: páros t-teszt (átlagok összevetése) Pearson (lineáris) korreláció (együttjárás)
Néhány gyakran alkalmazott teszt: Több változó struktúrája Léteznek-e rejtett háttérváltozók? Feltáró faktor-elemzés Az előre feltételezett háttérváltozó-struktúra tesztelése? Ellenőrző faktor-elemzés
Néhány gyakran alkalmazott teszt: Többváltozós elemzések Leggyakrabban valamilyen regresszió-elemzést alkalmazunk. Ezek feltételezik (de nem ellenőrzik!) az oksági kapcsolatot a függő és független változók közt. Lineáris korreláció 1 függő és több független változó, mindegyik legalább intervallum szintű (vagy a függetlenek esetében dummy) és a magyarázó változók függetlenek A nem linerási összefüggések a változók átalakításával kezelhetőek A magyarázó változók közti kapcsolatot új változókkal kezelhetjük (pl. a változók szorzata) Logisztikus regresszió: Ha nem lineáris az összefüggés Binomiális, ordinális vagy multinomiális logisztikus regresszió: Ha a függő változó mérési szintje alacsonyabb, mint intervallum
Út-elemzés (path analysis) Ha a magyarázó változók nem csak közvetlenül hatnak a függő változóra, vagy egymásra, hanem mediátor-változókon keresztül is. A mediátor változókat is regresszióval becsüljük, és ezek a regressziós függvények „állnak” a fő regresszióban a mediátor helyén.
Structural equation modeling (SEM) Ha több függő és több független konstrukció szintű változónk van, amelyeket több mérési változóból becslünk, és a konstrukciók közt is lehetnek regressziós, illetve korrelációs kapcsolatok. Nagyon sok alapfeltétele van, így inkább a modellek ellenőrzésére és nem kialakítására használható.
Adatközlés statisztikai elemzés után Elfogadhatóság: Praktikus szempontok Szignifikancia-szintek Jóságmutatók (pl. R-négyzet) Egymást kiegészítő információk: pl. átlag és szórás Az elégséges és szokásos minimum Melléklet: nagy adattáblák Outputokat, grafikonokat mindig átszerkeszteni, fordítani Értelmezést segítő ábrák, szöveges magyarázatok Néha az adatbázist is elérhetővé kell tenni Bizonyíthatóság, feltevések explicitté tétele!
A szoftverek Számolni mind tud, de kérdés, hogy közöl-e mindent, ami nekünk kell! És az is, hogy mit tudunk kezelni… Excel – a minimumot tudja, de sokszor nem közöl szignifikanciát SPSS – kényelmes, közismert de fizetős Gretl, R-nyelv, PSPP és célprogramok Google: online alkalmazások Amit nem közölnek, „gyalog” sokszor kiszámolható
Köszönöm a figyelmet!