Csoportjellemzők szövegbányászati feltárása és vizualizációja Kruzslicz F., Kovács B., Hornyák M. TÁMOP C-11/1/KONV , I/4 - Jól-lét az információs PTE-KTK
Forrás: Practical Text Mining and Statistical Analysis for Non-Structured Text Data Apps, (Miner et al. 2012)
Szövegreprezentációk „To be, or not to be, that is the question…” to be or not question that is the WordFreq. BE 2 IS 1 NOT 1 OR 1 QUESTION 1 THAT 1 THE 1 TO 2
Szövegreprezentációk „To be, or not to be, that is the question…” → BEISNOTORQUEST.THATTHETO BE0001/20 00 IS NOT OR QUEST THAT THE TO to be or not the that question is 1 1/
VP – verb phrase NP – noun phrase DT – determiner VB – base form verb NN – singular noun S – sentence part CC – cord. conjuct. RB – adverb VBZ – verb 3rd pers. TO – toSzövegreprezentációk Item Wordtobeornottobethatisthequestion POSTOVBCCRBTOVBDTVBZDTNN „To be, or not to be, that is the question…” „ To/TO be/VB, or/CC not/RB to/TO be/VB, that/DT is/VBZ the/DT question/NN … ” tokenelés stopszavazás „ To be, or not to be, that is the question … ”
Szövegreprezentációk „To be, or not to be, that is the question…” to be or is notthat thequestion S SS VP CC RB VP TO VP VB TOVP VB NP VP DT VBZ NP DT NN VP – verb phrase NP – noun phrase DT – determiner VB – base form verb NN – singular noun S – sentence part CC – cord. conjuct. RB – adverb VBZ – verb 3rd pers. TO – to
Numerikus elemzéssel Kredit kitöltöttség (6. blokk) Képzés közös: 51,2% Szakirányú: 68,7% Gyakorlati (min): 97,7% Szabadon választható: 100% Szakdolgozat: 100% Teljes gyak.átlag: 37,9% kredit Szöveges elemzéssel Feldolgozási lépések (8. blokk) Tokenelés Stopszavazás (spec. is!) Összetett szavak felbontása Szótövezés Szinonimák (pl. labor) Gyakorlat aránya: 39,2% említés KKK szövegelemzés KKK szövegelemzés Gyakorlati6 félév7 félév8 félév BA szint 38,62% (61 db) 46,43% (8 db) 24,30% (3 db) BSc szint 37,88% (16 db) 36,44% (38 db) 35,50% (5 db) SzógyakoriságEmlítés (db) gyakorlat 158 elmélet oldal, 14+7 képzési terület, 154 alapszak, 10 szempont
Emlékszik : bemutat, áttekint, felsorol, ismétel, felismer Megért : kifejt, azonosít, meghatároz, megmagyaráz Alkalmaz : használ, eldönt, tervez, felfedez, kitűz Elemez : definiál, megvitat, megkülönböztet Alkot : megtervez, kifejleszt, vonatkoztat Értékel : visszajelzést ad, minősít, véleményez Bloom-féle taxonómia igéi KKK szövegelemzés KKK szövegelemzés
Szöveg alapú szaktávolságok h=33% vágással 38 db egyke szak Kirajzolódnak a képzési területek Érdekességek: 15. élelmiszermérnök, 168. jármű-mérnök, 58. közszolgálati Informatika szak: h(31.GI; 63.PTI) = 44%, h(31.GI; 84.MI) = 43% és h(63.PTI; 84.MI) = 35% KKK szövegelemzés KKK szövegelemzés
HasonlóságAlapszak1Alapszak2 0, bűnügyi igazgatási87. rendészeti igazgatási 0, vegyészmérnöki9. biomérnöki 0, kerámiatervezés116. üvegtervezés 0,7171. alkalmazott közgazdaságtan29. gazdaságelemzés 0, mezőgazdasági mérnöki76. növénytermesztő mérnöki 0, kereskedelem és marketing82. pénzügy és számvitel 0, kereskedelem és marketing72. nemzetközi gazdálkodási 0, szociális munka94. szociálpedagógia 0, turizmus-vendéglátás49. kereskedelem és marketing 0, gazdálkodási és menedzsment82. pénzügy és számvitel 0, turizmus-vendéglátás82. pénzügy és számvitel 0, fémművesség118. formatervezés 0, turizmus-vendéglátás28. gazdálkodási és menedzsment 0,5633. állattenyésztő mérnöki65. mezőgazdasági mérnöki 0, gazdálkodási és menedzsment72. nemzetközi gazdálkodási 0, gazdálkodási és menedzsment49. kereskedelem és marketing 0, kameraman127. gyártásszervező 0, táncművész134. táncos és próbavezető 0,5271. alkalmazott közgazdaságtan58. közszolgálati 0, nemzetközi gazdálkodási82. pénzügy és számvitel 0, munkaügyi és társ.bizt. igazgatási73. nemzetközi igazgatási 0, gazdaságelemzés58. közszolgálati 0, turizmus-vendéglátás72. nemzetközi gazdálkodási Egymástól 50%-ban nem eltérő szakpárok
Polaritás vizsgálatok Sentiment Orientation +1 pozitív, 0 semleges, -1 negatív Gyakorlat (+1) vs. Elmélet (-1)Tudomány (+1) vs. Művészet (-1) kémia pedagógia zene irodalom társadalom fizika menedzsment informatika statisztika matematika gazdaság matematika gazdaság kémia statisztika fizika informatika menedzsment társadalom irodalom pedagógia zene KKK szövegelemzés KKK szövegelemzés
KE Nógrád BAZ Fejér Jellemzően negatív Jellemzően pozitív HirIX értékek százalékos megoszlása megyénként PozitívNegatív Fejér: 328,11KE: 13,49 BAZ: 325,28Nógrád: 7,4 Támogat, Kér, Szeret, Jog, Szerez, Tiszta Vég, Fél, Rossz, Sért, Súlyos, Kár
KE Nógrád Jellemzően jövő FOI2012 értékek százalékos megoszlása megyénként Jellemzően múlt Preis et. al (2012)
Szófelhők fejlődése Mental Map of Paris Milgram (1976) Zeitgeist Flanagan (1997)
Szófelhők fejlődése Fortune (2001)
Szófelhők fejlődése Prefix szófelhő Burch et al. (2013) Sziluett szófelhő Tagxedo (2006)
Szófelhők fejlődése Sparklines by Microsoft Research Lee et al. (2010)
Szófelhők fejlődése
Scopus Neuro Science Agykutatás Magyarország Co-Citation Időszak: szakújság szerző/kutató publikáció
Scopus Neuro Science
Forrás:
Conway szófelhők CikkSzaklap Brain Research Neuro Science Letters J. of Neuroscience J. of Neurochemistry Neuroscience J. of Neurophysiology Percept. & Motor Skills Haplotípus : a fenotípusnak az a része, amelyet egy kromoszómán elhelyezkedő, szorosan kapcsolt gének határoznak meg. (lásd HapMap 2010)
Conway szófelhők
Brain Research EMBO Journal VOS mappings