Az előadás letöltése folymat van. Kérjük, várjon

Az előadás letöltése folymat van. Kérjük, várjon

Előadás az MTA KTI szemináriumán

Hasonló előadás


Az előadások a következő témára: "Előadás az MTA KTI szemináriumán"— Előadás másolata:

1 Előadás az MTA KTI szemináriumán
Rejtett tartalmak nyomában Mire jó Textplore dokumentumelemző szoftver? Czibik Ágnes – Tóth István János Előadás az MTA KTI szemináriumán Budapest, Budaörsi út 2011. május óra

2 Elöljáróban Jellemzők HU és NYT Siemens MatStat Tervek
Tartalom Elöljáróban A Textplore jellemzői és elemzési eszközei Teszt1: Magyarország a New York Times-ban Teszt2: Siemens és a korrupció Teszt3: Matematikai statisztika, MNB és KTI További tervek

3 Elöljáróban Jellemzők HU és NYT Siemens MatStat Tervek

4 Elöljáróban Jellemzők HU és NYT Siemens MatStat Tervek
A projektről A Textplore program a TEXTREND (http://www.textrend.org/) projekt keretében a Nemzeti Innovációs Hivatal Jedlik Ányos programjának támogatásával készül (2008- ). (Projekt száma: NKFP_07_A2-TEXTREND, Szerződésszám: OM-00002/2008). Konzorcium: Universitas Press Felsőoktatás-kutató Műhely Kft.; Eötvös Lóránd Tudományegyetem; Glia Számítástechnikai és Tanácsadó Kft.; MKIK GVI; MTA SZTAKI; Szegedi Tudományegyetem.

5 Elöljáróban Jellemzők HU és NYT Siemens MatStat Tervek
A bemutató célja Felhasználói ötletek, vélemények A Textplore ismertetése Teszt elemzések, első eredmények

6 Elöljáróban Jellemzők HU és NYT Siemens MatStat Tervek
A koncepció a számítógép, a program és a felhasználó - három fejlődési lépés dióhéjban Web alapú fejlesztések: böngésző a netbook-on, táblagépen, a mobilon gyors internetkapcsolat, szolid szerver kapacitás, program, adatok a szerveren

7 Elöljáróban Jellemzők HU és NYT Siemens MatStat Tervek
A koncepció On-line (segéd)eszköz tartalomelemzéshez Kapcsolódás off-line programokhoz [spss, stata, r, ucinet, statistica, stb.] megfelelő szerver kapacitás, program, adatok a szerveren felhasználói fiókok, személyre szabott alkalmazás (MyTextplore)

8 Lehetséges felhasználók
Elöljáróban Jellemzők HU és NYT Siemens MatStat Tervek Lehetséges felhasználók kormányzat üzleti szféra, non-profit szektor egyetemek, tudományos kutatók újságírók egyéb érdeklődők

9 A Textplore jellemzői és elemzési eszközei
Elöljáróban Jellemzők HU és NYT Siemens MatStat Tervek A Textplore jellemzői és elemzési eszközei

10 Elemezhető dokumentumok
Elöljáróban Jellemzők HU és NYT Siemens MatStat Tervek Elemezhető dokumentumok Feltöltött dokumentumok: pdf, doc, zip, rtf, txt, odt, stb. Textplore gyűjtemény – hírportálok, intézmények honlapjai Kereséssel érhetőek el (kulcsszó, dátum, forrás, hossz alapján) Honlapok megadásával, ahonnan a szoftver letölti a dokumentumokat

11 Elöljáróban Jellemzők HU és NYT Siemens MatStat Tervek
Keresés

12 Elemzési lehetőségek - Szókörnyezet
Elöljáróban Jellemzők HU és NYT Siemens MatStat Tervek Elemzési lehetőségek - Szókörnyezet

13 Elöljáróban Jellemzők HU és NYT Siemens MatStat Tervek
Elemzési lehetőségek - Szóstatisztika

14 Elöljáróban Jellemzők HU és NYT Siemens MatStat Tervek
Elemzési lehetőségek – Kereszttábla

15 Elöljáróban Jellemzők HU és NYT Siemens MatStat Tervek
További elemzési lehetőségek Korreláció Átlagok összehasonlítása K-Means klaszter Hierarchikus klaszter Tulajdonnév felismerő alkalmazás – továbbfejlesztve kapcsolatháló elemzésekhez lehet hasznos

16 Elöljáróban Jellemzők HU és NYT Siemens MatStat Tervek
További funkciók Kategória-szótárak létrehozása

17 Elöljáróban Jellemzők HU és NYT Siemens MatStat Tervek
További funkciók Eredmények mentése a szerverre és saját gépre

18 Elöljáróban Jellemzők HU és NYT Siemens MatStat Tervek
Tesztelemzések

19 Elöljáróban Jellemzők HU és NYT Siemens MatStat Tervek
Kérdések Milyen a New York Times-ban kirajzolódó Magyarország kép? [a kormányzati kommunikáció szakemberei] Mi jellemzi a TOP10 magyar vállalat megjelenését az on-line médiában között? A Siemens említései mennyire kapcsolódnak össze a cég korrupciós botrányával? [a cégek pr szakemberei] Kimutatható-e a MTA KTI és a Magyar Nemzeti Bank tanulmányaiban a matematikai statisztikai és ökonometriai eszközök erősödő használata? [tudományszociológusok, tudománytörténészek]

20 Milyen a New York Times-ban kirajzolódó Magyarország kép?
Elöljáróban Jellemzők HU és NYT Siemens MatStat Tervek Milyen a New York Times-ban kirajzolódó Magyarország kép?

21 Elöljáróban Jellemzők HU és NYT Siemens MatStat Tervek
Adatok 37 cikk Milyen országokra vonatkoznak? (Magyarország, poszt-szocialista országok, egyéb országok) Milyen témákat érintenek? (gazdasági, politikai, társadalmi) Utalnak-e kockázatokra? (igen, nem) Milyen irányú értékelést tartalmaznak? (pozitív, semleges, negatív)

22 Elöljáróban Jellemzők HU és NYT Siemens MatStat Tervek
Cikkek száma havonta

23 Országok és országcsoportok
Elöljáróban Jellemzők HU és NYT Siemens MatStat Tervek Országok és országcsoportok Kifejezetten Magyarországra vonatkozó cikkek száma > 1: médiatörvény Alaptörvény

24 Elöljáróban Jellemzők HU és NYT Siemens MatStat Tervek
Az értékelés iránya Magyarország = nem pozitív döntően negatív kontextusban jelenik meg

25 Mikor volt a legrosszabb?
Elöljáróban Jellemzők HU és NYT Siemens MatStat Tervek Mikor volt a legrosszabb? mélypontok: 1. Ír válság 2. Médiatörvény, EU parlamenti vita 3. Új Alaptörvény

26 Mikor utaltak inkább a kockázatokra?
Elöljáróban Jellemzők HU és NYT Siemens MatStat Tervek Mikor utaltak inkább a kockázatokra? kockázatok: 1. Ír válság 2. Médiatörvény, EU parlamenti vita 3. Új Alaptörvény

27 Az értékelés iránya és a cikk témája
Elöljáróban Jellemzők HU és NYT Siemens MatStat Tervek Az értékelés iránya és a cikk témája Negatív értékelés: Ha Magyarország a téma akkor 8/9 negatív értékelés; de ott is erősen negatív, ahol más ország a voltaképpeni téma (pl. nők diszkriminálása Olaszországban)

28 Az értékelés iránya és a politikai témák
Elöljáróban Jellemzők HU és NYT Siemens MatStat Tervek Az értékelés iránya és a politikai témák A negatív értékelések szignifikánsan nagyobb arányban kapcsolódnak politikai témákhoz, mint más témákhoz: 9/11 arányban; [Ugyanez a helyzet a kockázatokkal is]

29 Elöljáróban Jellemzők HU és NYT Siemens MatStat Tervek
A miniszterelnök megjelenésének hárommondatos környezetében - a legalább kétszer említett igék to say 8 to criticize 6 to accuse 4 to insult to antagonize 2 to drift to fight to impose to muzzle to reject to single out to stifle to undermine

30 Elöljáróban Jellemzők HU és NYT Siemens MatStat Tervek
A miniszterelnök megjelenésének hárommondatos környezetében - jelzők, jelzős szerkezetek worries 4 controversal 3 overwhelming majority against 2 incompatible Továbbá: bad start, blunty, competitive, concentration of power, confident, consolidated power, desperatly, fiery language, highlighted, nationalist fervor, negative comments, paradoxically, questioned, radically different way, revealing speech, revolutionary rhetoric, secure, seriously damaged, severely, significant distraction, stromy scenes, successful, uneasy, unfortunate start, volatile

31 A miniszterelnök és politikájának jellemzése
Elöljáróban Jellemzők HU és NYT Siemens MatStat Tervek A miniszterelnök és politikájának jellemzése nationalist politics 1 hungarian nationalism churchgoing father political charisma cultlike leadership leading dissident economic nationalism new Ataturk new de Gaulle dictator oppurtunistic populist conservative authoritarian national populist very good european

32 A miniszterelnök megjelenésének hárommondatos környezetében - főnevek
Elöljáróban Jellemzők HU és NYT Siemens MatStat Tervek A miniszterelnök megjelenésének hárommondatos környezetében - főnevek critics / criticism 9 austerity 6 Putin 2 violation Továbbá: accusation, assertions, bouts, controversy, danger, din, discussion, doubts, exaggeration, fears, gamble, Hitler, hope, Hugo Chavez, humor, Il Duce, indebtedness, nationalism, new Ataturk, new de Gaulle, polarization, populism, protests, reservations, tension, the belorussian president, uncertainties

33 Elöljáróban Jellemzők HU és NYT Siemens MatStat Tervek
A legnagyobb magyar vállalatok megjelenése az online médiában Siemens és korrupció

34 A vizsgált vállalatok I.
Elöljáróban Jellemzők HU és NYT Siemens MatStat Tervek A vizsgált vállalatok I. Figyelő TOP20 + OTP, Siemens, MÁV „Rejtőz-ködő” energia-ipari cégek

35 A vizsgált vállalatok II.
Elöljáróban Jellemzők HU és NYT Siemens MatStat Tervek A vizsgált vállalatok II. Vállalaton-ként erősen eltér Forráson-ként eltérhet

36 A Siemens megjelenése Index és Origo cikkekben (2000-2010)
Elöljáróban Jellemzők HU és NYT Siemens MatStat Tervek A Siemens megjelenése Index és Origo cikkekben ( ) A két portál nem mindig mozog együtt

37 A Siemens és a korrupció együttes megjelenése
Elöljáróban Jellemzők HU és NYT Siemens MatStat Tervek A Siemens és a korrupció együttes megjelenése Forráson-ként máskor tetőzik Az Index 2001-es „ébersége”

38 Siemens és a korrupció kategória előfordulása (2000-2010)
Elöljáróban Jellemzők HU és NYT Siemens MatStat Tervek Siemens és a korrupció kategória előfordulása ( ) : csak az Indexben jelenik meg 2010: az Indexen több a nem korrupciós Siemens-téma

39 A Siemens és a közbeszerzés együttes megjelenése
Elöljáróban Jellemzők HU és NYT Siemens MatStat Tervek A Siemens és a közbeszerzés együttes megjelenése Forráson-ként eltérő 2010: kiemelkedő téma az Indexen

40 A Siemens, a korrupció és közbeszerzés együttes megjelenése
Elöljáróban Jellemzők HU és NYT Siemens MatStat Tervek A Siemens, a korrupció és közbeszerzés együttes megjelenése Nem gyakori az együtt-említés Index: 6 cikk Origo: 2 cikk

41 Elöljáróban Jellemzők HU és NYT Siemens MatStat Tervek
Matematikai statisztikai és ökonometriai kifejezések használata az MNB és az MTA KTI tanulmányaiban

42 A vizsgált tanulmányok száma 1998 és 2010 között
Elöljáróban Jellemzők HU és NYT Siemens MatStat Tervek A vizsgált tanulmányok száma és 2010 között MTA KTI: erőteljes növekedés

43 Elöljáróban Jellemzők HU és NYT Siemens MatStat Tervek
Leíró, statisztikai és ökonometriai kategóriákat tartalmazó dokumentumok száma Leíró és MStat kifejezések általános használata 56% ökonometria

44 Elöljáróban Jellemzők HU és NYT Siemens MatStat Tervek
Leíró, statisztikai és ökonometriai kategóriák megjelenése a dokumentumokban intézményenként MNB: több ökonometria Kutatási területtől is függ

45 Az ökonometria kategória megjelenése a tanulmányokban (1998-2010)
Elöljáróban Jellemzők HU és NYT Siemens MatStat Tervek Az ökonometria kategória megjelenése a tanulmányokban ( ) Erős ingadozás Nem egyértelmű tendencia

46 Az ökonometria kategória megjelenése angol és magyar tanulmányokban
Elöljáróban Jellemzők HU és NYT Siemens MatStat Tervek Az ökonometria kategória megjelenése angol és magyar tanulmányokban Angol nyelvű tanulmányok-ban gyakoribb az ökonometria Mindkét intézmény esetében

47 Elöljáróban Jellemzők HU és NYT Siemens MatStat Tervek
A matematikai statisztika kategória normalizált előfordulása intézményenként Az MNB esetében magasabb Szóhaszná-lattól is függ

48 Az ökonometria kategória normalizált előfordulása intézményenként
Elöljáróban Jellemzők HU és NYT Siemens MatStat Tervek Az ökonometria kategória normalizált előfordulása intézményenként Az MNB esetében magasabb Szóhaszná-lattól is függ Az MNB-ben erősebben ingadozik évente

49 Elöljáróban Jellemzők HU és NYT Siemens MatStat Tervek
Kényelmesebb használat kialakítása Angol nyelvű felület Új (a jelenleginél jobb) angol szótövező; További források letöltése (historikus adatok); További elemzési lehetőségek (kapcsolathálózat) és grafikus ábrázolás; Magyar (politikai?) értékelő szótár beépítése; Szöveg-összehasonlító modul beépítése.

50 Elöljáróban Jellemzők HU és NYT Siemens MatStat Tervek
Köszönjük a figyelmet! Az előadáson ismertetett elemzések adatbázisai letölthetők:

51 Számítógépek, szoftverek és felhasználók - dióhéjban
Elöljáróban Jellemzők HU és NYT Siemens MatStat Tervek Számítógépek, szoftverek és felhasználók - dióhéjban ~ ~ ~2007- III. gen. nagykapacitású gépek (IBM 360), integrált áramkörök, grafikus monitor, perifériák, multiprogramozás, kötegelt üzemmód A felhasználó egy „terminálon” keresztül kapcsolódik a „nagy géphez” PC-k; DOS, programok, adatok a PC-n; amelyek egyre nagyobb kapacitásúak A felhasználó megveszi a programot és a PC-jén futtatja „cloud computing” , szélessávú internetkapcsolat, kis teljesítményű táblagép, mobiltelefon Böngésző a gépen, az op. rendszer, a programok, adatok a szerveren


Letölteni ppt "Előadás az MTA KTI szemináriumán"

Hasonló előadás


Google Hirdetések