Az előadás letöltése folymat van. Kérjük, várjon

Az előadás letöltése folymat van. Kérjük, várjon

{ Közösségi spammelés felismerése és eliminálása Kivonat – Pletser József.

Hasonló előadás


Az előadások a következő témára: "{ Közösségi spammelés felismerése és eliminálása Kivonat – Pletser József."— Előadás másolata:

1 { Közösségi spammelés felismerése és eliminálása Kivonat – Pletser József

2  Közösségi mézesmadzagok  Profilok statisztikai analízise  Közösségi spammerek a Twitteren és a MySpace-en.  Mézesmadzag alapú felderítő rendszerek  Statisztika a spammerekről Absztrakt

3  Az internethasználók több időt töltenek közösségi oldalakon  A cégeknek máshol kell megtalálni a célközönségüket  Közösségi média rendszerek függenek a felhasználóktól  Spammerek azonosíthatók viselkedésük és profilképük alapján Bevezetés

4 Facebook  500 millió felhasználó  14 millió közösségi oldal különféle témákban  Videó, fénykép, és oldalmegosztás  Felhasználói kultúra  A cikk írásakor a legnépszerűbb oldalnak rajongója volt

5  Felhasználók 80%-a kapott kéretlen ismerős felkérést  Óvatlan felhasználók kiadják az adataikat  Nem feltétlenül csak reklámozás céljából spammelnek  Felderítésükhöz HIL adatbővítés szükséges  Mindig visszajönnek Szomorú tények

6  Emberi interakció nélkül   Közösségi oldalak spamprofiljainak a begyűjtésére   Statisztikai felhasználói modell fejlesztése   Nulla napos spammerek kiszűrése Mézesmadzag alapú felderítés

7 Online közösség modellezése

8  Kép hisztogramja alapján (illetve emberi logika alapján)  Szövegek alapján (URL a szövegben, kulcsszavak)  Felhasználói profilok alapján (spammer profilok jellemzői – kevés ismerős) Jellemzők kinyerése

9   A közösségi spam felismerési probléma megállapítani egy c osztályozó egységen keresztül, hogy melyik u i a spammer, úgy, hogy p i adott. Egy osztályozó   c: u i  {spammer, törvényes felhasználó}   halmazba képző függvény, megállapítja, hogy u i spammer, vagy sem.   C-hez szükség van különböző jellemzőket tartalmazó halmazra.   F= {f 1, f 2, …, f m }, mely U elemeire hivatkozik. A probléma meghatározása

10 Megoldás megközelítése

11   A profilok spammelő viselkedése különböző jól elkülöníthető mintákra épülnek.   A legnépszerűbb spammelési célpontok a középnyugati állapok, és a legtöbb spam profil Californiában lakik.   A spammer profilok 57.2%-a egy másik profilról másolta a „Rólam” részt.   Sok spam profil megkülönböztethető demográfiai jellemzőket alakítottak ki (pl. kor, kapcsolat, stb.) MySpace megfigyelések

12  Click traps  Friend Infiltrators  Pornographic storytellers  Japanese Pill pushers  Winnies Spammer profilok statisztikái

13  Duplicate spammers  Pornographic spammers  Promoters  Phisers  Friend infiltrators Twitter megfigyelések

14 { A spammerek azonnali kiküszöbölése Research Study 2

15   A kivehető spammelésre utaló jelek a begyűjtött spammer profilokból használhatóak-e arra, hogy automatikusan megkülönböztethessük a spammereket a törvényes felhasználóktól.   Ha biztos mintáink vannak (ahogy a megfigyelések az előző fejezetben kimutattak bizonyos mintákat), akkor az osztályozó egység megfigyelhet jeleket, amik alapján megjósolhatunk egy új spamet Probléma megfogalmazása

16   Felhasználói demográfia: kor, nem, lakóhely és egyéb a felhasználót jellemző információk   A felhasználó által megosztott információk: például a „Rólam” mező, blog bejegyzések, kommentek.   Felhasználói aktivitás jellemzői: Posztolási gyakoriság, csirip gyakoriság   Felhasználói kapcsolatok: barátok száma, követők, illetve követett személyek. Osztályozó egység megközelítése és metrikája

17  104 törvényes felhasználó  168 spammer (spammer és hirdető)  Minden felhasználó adata  Cél: a felhasználó törvényes, spammer, vagy hirdető? Twitter spammerek osztályozása

18

19   Követők és a követettek átlaga, és a kétirányú barátságok (követettek ∩ követők) / követettek   Csiripek és az azokból levonható tanulságok:   A linkek számának aránya   A különböző linkek száma   kifejezések aránya   Az kifejezések aránya Támpontok a Twitteren

20  A spammereknek saját taktikáik vannak  Azonosításuk nem lehetetlen  Profilok alapján beskatulyázhatóak  Különböző jellemzők segítenek. Összegzés


Letölteni ppt "{ Közösségi spammelés felismerése és eliminálása Kivonat – Pletser József."

Hasonló előadás


Google Hirdetések