Az előadás letöltése folymat van. Kérjük, várjon

Az előadás letöltése folymat van. Kérjük, várjon

Automatikus értékelés- és érzelemelemzés magyar nyelvű szövegeken V ARJÚ Z OLTÁN Precognox Informatikai kft. A NYÍLT INFORMÁCIÓGYŰJTÉS.

Hasonló előadás


Az előadások a következő témára: "Automatikus értékelés- és érzelemelemzés magyar nyelvű szövegeken V ARJÚ Z OLTÁN Precognox Informatikai kft. A NYÍLT INFORMÁCIÓGYŰJTÉS."— Előadás másolata:

1 Automatikus értékelés- és érzelemelemzés magyar nyelvű szövegeken V ARJÚ Z OLTÁN Precognox Informatikai kft. zvarju@precognox.com A NYÍLT INFORMÁCIÓGYŰJTÉS FEJLŐDŐ TERÜLETEI nemzetközi tudományos-szakmai konferencia 2015. november 3-4. S ZABÓ M ARTINA K ATALIN Precognox Informatikai kft. mszabo@precognox.com Szegedi Tudományegyetem, Szláv Intézet, Orosz Filológiai Tanszék szabo.martina@lit.u-szeged.hu

2 R-index és nowcasting

3

4

5

6 Racionalitás és érzelmek

7 Racionalitás?

8 Descartes tévedése Érzelmek hiányában döntésképtelenek vagyunk, mivel nem tudjuk gyorsan rangsorolni a lehetséges alternatívákat

9 Darwin Az érzelmek kifejezéséről embernél és állatoknál

10 Ekman Hat alapvető emóció Mikrokifejezések akaratlan megjelenése az arcon

11 Mi a helyzet a nyelvvel? A gazdasági döntésekre nagy hatással vannak a gazdasági hírek A mindennapi döntéshozatal során gyorsan kell határoznia a szereplőknek Találhatunk-e összefüggést a hírekben megjelenő emóciók és a makromutatók alakulása között?

12 Az értékelés- és az érzelemelemzés Az új megoldások

13 Cél és haszon A nyelvtechnológia részfeladatai Céljuk: automatikus tartalmi elemzés nagy mennyiségű szövegről Magas hasznosíthatóság különböző alkalmazásokban; pl. o gazdasági trendek azonosítása és előre jelzése; o A vásárlói hangulat mérése; o politikusokkal, pártokkal szembeni aktuális beállítódás mérése; o egy adott társadalmi, gazdasági jelenségre reflektáló közönséghangulat; o pszichológiai szempontú szövegelemzés; o stb.

14 Bővebben az értékeléselemzésről Másképpen: szentimentelemzés A feladat: az értékelő véleményt kifejező tartalmak automatikus kivonatolása. Pl. 94 millió forintos vagyoni hátrányt okozott a győri kórház gazdálkodásért felelős vezetője. (forrás: index.hu) A közelmúltban ötletes szuperhősös könyvtartó duójával hívta fel magára a figyelmet (…) az ügyesen kitalált, rajzfilmfigura-szerű minimalista, mágneses sziluettcsalád gyerekeket és felnőtteket egyaránt képes levenni a lábairól. (forrás: index.hu)

15 És … …nem csak a detektálás, a következők is fontosak: o az értékelés típusa (másképpen: polaritás): pozitív vagy negatív o intenzitás o az értékelés tárgya (target)

16 Bővebben az érzelemelemzésről A nyelvtechnológiában kisebb jelentőséget tulajdonítanak a az emócióknak, mint a szentimenteknek. Az érzelemelemzés új irány máshol központi szerep, pl. viselkedéstudomány vagy pszichológia. A magyar nyelvre: Precognox Informatikai kft. foglalkozik A feladat célja: a szövegekben tükröződő érzelmek kivonatolása.

17 Példák Félelem, aggodalom: Tisztaság- és illatmániásként először féltem a folyékony mosódiótól. Mi lesz, ha nem a megszokott tisztaság lesz az eredmény? (forrás: hazipatika.com) Bánat, elkeseredettség: Nem értem. Semmit nem fogyok, értem hogy mozogni kell, minden nap biciklivel járok, és gyaloglok sokat. (…) Már nagyon el vagyok keseredve. (forrás: gyakorikerdesek.hu) Meglepetés: Amikor a műtétem után terveztem a szezont, nem is hittem volna, hogy ilyen gyorsan javul az állapotom. Nincs semmilyen panaszom. (forrás: mob.hu)

18 A technikai háttér Szentiment- és emóciószótárak Szentimentszótáraink: pozitív polaritású kifejezések negatív polaritású kifejezések Emóciószótáraink: az Ekman-féle hat kategória szerint: ÖRÖM, DÜH, BÁNAT, FÉLELEM, UNDOR, MEGLEPŐDÉS nyolc kategória szerint: + FESZÜLTSÉG, VONZALOM

19 Értékelés- és érzelemelemzés a gyakorlatban

20 A vizsgált korpusz Az I NDEX -korpusz o A szöveggyűjtés eszköze: az index.hu keresője o A szöveggyűjtés időpontja: 2015. január 2. o Kritériumok: o azok a szövegek, amelyek tartalmazták a válság és a recesszió szavak valamelyikét o a 2006. január 1. és 2014. december 31. közé eső időszakból o A korpusz mérete: összesen 1731 cikk

21 A fontosabb események és jelenségek, amelyekre figyelünk országgyűlési választások 2006 zavargások negatív gdp növekedési időszakok

22 Szófelhők a szentimentek relatív arányából

23 Szentimentelemzés a korpuszon

24 Düh

25 Bánat

26 Félelem

27 Meglepő dés

28 Undor

29 Öröm

30 Összegzés, távlatok Az érzelmek feldolgozása olyan folyamatokra is rámutat, amelyekre semmilyen más tartalomelemző megoldás nem A targeteket kezelnünk kell az egyik jelenlegi projektünk

31

32 Elérhetőségek: http://precognox.com/ http://kereses.blog.hu/ SEMANTIC SEARCH TEXT MINING AGILE SOFTWARE DEVELOPMENT Phone: +36-82-222-193 Fax: +36-82-222-193 Email: info at precognox dot com S ZABÓ M ARTINA K ATALIN mszabo@precognox.com V ARJÚ Z OLTÁN zvarju@precognox.com


Letölteni ppt "Automatikus értékelés- és érzelemelemzés magyar nyelvű szövegeken V ARJÚ Z OLTÁN Precognox Informatikai kft. A NYÍLT INFORMÁCIÓGYŰJTÉS."

Hasonló előadás


Google Hirdetések