Mit üzennek az agrárszakos szakdolgozatok a statisztika oktatásnak? Challenges and Innovations in Statistics Education Kihívások és innovációk a statisztikaoktatásban Szeged, 2017. szeptember 7-9. Mit üzennek az agrárszakos szakdolgozatok a statisztika oktatásnak? Menyhárt László PE Georgikon Kar menyhart-l@georgikon.hu
Kérdések Milyen mértékben van jelen a statisztika a szakdolgozatokban? Milyen statisztikai módszereket használtak? Van-e jellemző mintázat az egyes szakok statisztika használatában? Mik a leggyakrabban használt módszerek? Mely módszerek hiányoznak a szakdolgozatokból? Mit változtassunk a statisztika oktatáson? Szeretnénk tudni, hogy mit tanítsunk, mire lenne szükség. Nagyon kevés visszajelzés jön. Ami jön, az általában nem is a stat ism hiánya, hanem a szgép kezelés hiánya.
Szakdolgozatok száma – képzési szintenként # Plot 1
Szakdolgozatok száma – szakcsoportonként # Plot 2 Isgt = informatikai statisztikus és gazdasági tervező Informatika =
Módszer A szakdolgozatok feldolgozása „sekély” szövegbányászati eszközökkel Dokumentum-szó mátrix Önálló szavakból Szópárokból
Mely szavakat keressük? Kifejezések tematikusan 10 területről: szoftver, leíró statisztika, idősorelemzés, varianciaanalízis, regressziószámítás, korrelációszámítás, adatábrázolás, gazdaságstatisztika, többváltozós módszerek, egyéb 5 db statisztika jegyzet: Huzsvai László – Vincze Szilvia: SPSS-könyv. Seneca Books, 2012 Kovács Péter: Statisztikai alapismeretek Kovács Erzsébet: Többváltozós adatelemzés. Typotex, 2014 Nagy Lajos – Balogh Péter: Ökonometria (Elméleti jegyzet). DE AGTC, 2013 Hancz Csaba: Kísérleti statisztika. Kaposvári Egyetem, 2014
Módszer 4-szeres szótövezés (kifejezés-gyűjteményre és a szakdolgozatokra is) 768 kifejezés a jegyzetekből és a tematikus gyűjtésből Ebből ténylegesen szerepelt: 598
Eszközök Reguláris kifejezések R programnyelv + következő csomagok: tm ggplot2 wordcloud snowballC stringr dplyr reshape2
Mit tanítunk?
Statisztika tematika – gazdasági BSc Viszonyszámok Középérték-számítás, szóródás-vizsgálat, koncentrációelemzés Standardizálás, indexszámítás, főátlag- és értékindex-kör. Sztochasztikus összefüggés: vegyes kapcsolat, regresszió- és korrelációszámítás. Mintából végzett következtetések; főbb paraméterbecslések, a statisztikai hipotézisek ellenőrzése. Idősorok Akik a szakdolikat írták, még szgép nélkül tanulták.
Statisztika tematika – agrár BSc Viszonyszámok Középérték-számítás, szóródás-vizsgálat, koncentrációelemzés Standardizálás, indexszámítás, főátlag- és értékindex-kör. Sztochasztikus összefüggés: vegyes kapcsolat, regresszió- és korrelációszámítás. Mintából végzett következtetések; főbb paraméterbecslések, a statisztikai hipotézisek ellenőrzése. Idősorok A gazdasági és az agrár tematika ugyanaz, csak az óraszám különböző.
Statisztika tematika – agrár MSc Becslések Hipotézisvizsgálat Korreláció- és regresszióelemzés Kereszttábla elemzés Egy-tényezős varianciaanalízis Több-tényezős varianciaanalízis Faktoranalzis Klaszteranalízis +SPSS
Statisztika tematika – gazdasági MSc Becslések Hipotézisvizsgálat Korreláció- és regresszióelemzés Többváltozós regresszióelemzés Parciális korreláció Változó és modell szelekció Logisztikus regresszió Főkomponens elemzés Idősorelemzés +SPSS
Eredmények
100 leggyakoribb szó (szógyakoriság alapján) # Plot 4
100 leggyakoribb szó (dokumentumgyakoriság alapján)
Indexszámítás – képzési szintenként Plot 28 Mindenféle index
Indexszámítás évenként Plot 29
Indexszámítás – szakcsoportonként Plot 30
Leggyakoribb indexek dokumentumgyakorisága árindex 125 cms index 17 különbözőségindex 10 testtömegindex 71 jövedelmezőség index 16 profilindex 9 öregedési index 70 részvényindex diverzitás index 8 levélfelület 55 szelekciós index 15 f-index volumenindex 53 brojlerindex 14 bázisindex 7 ariditás index 43 stresszindex irritációs index aroma 33 tőzsdeindex extrémindex 6 fertőzöttség index szezonindex 13 fenolindex g-index 25 bux index 12 súlyindex termékenyítés index 24 termelési index 11 testarányindex értékindex 19 tőgyindex testindex szemindex 18 alakindex testméretindex 105 egybeírt index
Varianciaanalízis – képzési szintenként Plot 5
Varianciaanalízis - évenként BSc-MSc uolyan arányban használja, de a BSc-n csak érintőlegesen szerepel. Plot 6
Varianciaanalízis – szakcsoportonként Plot 7
Varianciaanalízis – természetvédelmi mérnök Plot 8
Varianciaanalízis - páronkénti összehasonlítás Valamelyiket használta: 56% Plot 9
Regresszióelemzés - képzési szintenként Plot 10
Regresszióelemzés - évenként Plot 11
Regresszióelemzés – szakcsoportonként Plot 12
Idősorelemzés - szakcsoportonként Plot 13
Idősorelemzés - szakcsoportonként Plot 14
Korrelációszámítás – képzési szintenként Plot15
Korrelációszámítás – szakcsoportonként Plot 16
KSH - szakcsoportonként Plot 17
KSH - szakcsoportonként Plot 18
SWOT elemzés - szakcsoportonként Plot 19
SWOT elemzés - szakcsoportonként Plot 20
Statisztikai szoftverek Gyakoriság Excel 530< SPSS 239 StatSoft Statistica 12 R 4< Minitab 4 Maple 3 Matlab 2 Scilab 1 Python Plot 21
SPSS Plot 22
t-próba - szakcsoportonként 191 dolgozat Plot 23
Egyéb statisztikai tesztek Plot 24
Kérdőív 690 dolgozat Plot 25
Kérdőív – jellemző szakokon Plot 26
Kérdőív – jellemző szakokon Plot 27
Konklúziók, tervek Agrárszakokon már BSc szinten is kellene a kísérlettervezés és kiértékelés. Fontos, hogy MINDEN statisztika óra gépteremben legyen! Kevesebb időt a részletekre, több időt az alkalmazásra! Nagyobb hangsúly az alkalmazásra: felismerjék mikor milyen módszer kell +1: Fontos mellékhatás: haladó szintű számítógép használat
megtisztelő Köszönöm a figyelmet!