Előadást letölteni
Az előadás letöltése folymat van. Kérjük, várjon
KiadtaBéla Tamás Megváltozta több, mint 10 éve
1
Véleménydetekció különböző szinteken Richard Farkas rfarkas@inf.u-szeged.hu SZTE
2
Blogok, fórumok, tweet termékekről politikáról szociális témákról Véleménydetekció
3
... különböző szinteken Dokumnetum szint Entitás szint Entitások egyes tulajdonságainak (aspektus) szintje „I get more compliments on my mazda then my old modded subaru #mazdalove" „Az ételek nagyon ízletesek, de hétfköznapi halandónak megfizethetetlen."
4
Véleménydetekciós rendszer 1. Releváns-e a dokumentum? 2. Cél entitásra vonatkozó aspektusok azonosítása 3. Polaritás eldöntése 4. Aspektusok/témák kategórizálása
5
Megoldás 3(4) osztályos osztályozási feladat (2db bináris osztályozó mindig rosszabb volt) N-gramok Extra jellemzők
6
Jellemzők dokumentum -> entitás szint Átsúlyozás a cél entitás és az egyes szavak közti tokentávolsággal: I do agree that money can't buy happiness. But somehow, it's more confortable to sit and cry in a BMW than on a bicycle.
7
Vonatkozó szövegrész azonosítása – Konstituencia elemzés – Olyan részfa választása, mely Tartalmazza az adott aspektust Legalább 5 token hosszú Nem tartalmaz 5 távolságnál távolabb levő más aspektust S vagy PP-nél vágás
8
I charge it at night and skip taking the cord with me because of the good battery life. Vonatkozó szövegrész azonosítása
9
Negáció kezelése Negáció indikátora listából Negáció hatóköre: and, but,,,. A hatókörbe eső unigrammok megjelölése NOT_bad
10
Extra jellemzők SentiWordNet – Szavak synset-be sorolása bigram előfordulási valószínűségek alapján (GoogleNgram) – Adott dokumentumban {High, Low}X{Positive, Negative} szavak száma Klaszterezésből származó eloszlások
11
Semeval 2014 - Adatbázis 6000 angol nyelvű értékelés – Laptop – Étterem Osztályok – Pozitív – Negatív – Semleges – Ellentmondó
12
Eredmények RendszerPontosság (10-fold) Baseline52% Sima-unigram64% Összes jellemző69% Baseline –Ha a trainben volt már az adott aspektus akkor ezen train dokumentek leggyakoribb polaritása –Különben egész train leggyakoribb polaritása
13
Véleménydetekció különböző szinteken Dokumnetum szint Entitás szint Entitások egyes tulajdonságainak (aspektus) szintje Vonatkozó szövegrész azonosítása
Hasonló előadás
© 2024 SlidePlayer.hu Inc.
All rights reserved.