Az előadás letöltése folymat van. Kérjük, várjon

Az előadás letöltése folymat van. Kérjük, várjon

Véleménydetekció különböző szinteken Richard Farkas SZTE.

Hasonló előadás


Az előadások a következő témára: "Véleménydetekció különböző szinteken Richard Farkas SZTE."— Előadás másolata:

1 Véleménydetekció különböző szinteken Richard Farkas rfarkas@inf.u-szeged.hu SZTE

2 Blogok, fórumok, tweet termékekről politikáról szociális témákról Véleménydetekció

3 ... különböző szinteken Dokumnetum szint Entitás szint Entitások egyes tulajdonságainak (aspektus) szintje „I get more compliments on my mazda then my old modded subaru #mazdalove" „Az ételek nagyon ízletesek, de hétfköznapi halandónak megfizethetetlen."

4 Véleménydetekciós rendszer 1. Releváns-e a dokumentum? 2. Cél entitásra vonatkozó aspektusok azonosítása 3. Polaritás eldöntése 4. Aspektusok/témák kategórizálása

5 Megoldás 3(4) osztályos osztályozási feladat (2db bináris osztályozó mindig rosszabb volt) N-gramok Extra jellemzők

6 Jellemzők dokumentum -> entitás szint Átsúlyozás a cél entitás és az egyes szavak közti tokentávolsággal: I do agree that money can't buy happiness. But somehow, it's more confortable to sit and cry in a BMW than on a bicycle.

7 Vonatkozó szövegrész azonosítása – Konstituencia elemzés – Olyan részfa választása, mely Tartalmazza az adott aspektust Legalább 5 token hosszú Nem tartalmaz 5 távolságnál távolabb levő más aspektust S vagy PP-nél vágás

8 I charge it at night and skip taking the cord with me because of the good battery life. Vonatkozó szövegrész azonosítása

9 Negáció kezelése Negáció indikátora listából Negáció hatóköre: and, but,,,. A hatókörbe eső unigrammok megjelölése NOT_bad

10 Extra jellemzők SentiWordNet – Szavak synset-be sorolása bigram előfordulási valószínűségek alapján (GoogleNgram) – Adott dokumentumban {High, Low}X{Positive, Negative} szavak száma Klaszterezésből származó eloszlások

11 Semeval 2014 - Adatbázis 6000 angol nyelvű értékelés – Laptop – Étterem Osztályok – Pozitív – Negatív – Semleges – Ellentmondó

12 Eredmények RendszerPontosság (10-fold) Baseline52% Sima-unigram64% Összes jellemző69% Baseline –Ha a trainben volt már az adott aspektus akkor ezen train dokumentek leggyakoribb polaritása –Különben egész train leggyakoribb polaritása

13 Véleménydetekció különböző szinteken Dokumnetum szint Entitás szint Entitások egyes tulajdonságainak (aspektus) szintje Vonatkozó szövegrész azonosítása


Letölteni ppt "Véleménydetekció különböző szinteken Richard Farkas SZTE."

Hasonló előadás


Google Hirdetések