Egy új spamszűrő módszer Sass Bálint
Egy új spamszűrő módszer A spam Definíció Tömeges, automatikus, nagyjából azonos tartalmú, kéretlen üzenet „Minden, amire nem vagyok kíváncsi.” Definiálja a felhasználó! Történet Az első spam: 1994 Az internet egyik fő problémája
Egy új spamszűrő módszer Spamszűrés Kétkategóriás aszimmetrikus szövegosztályozás Paul Graham módszere 1. Spam és rendes levelek korpusza 2. Az egyes szavak ún. spamvalószínűsége 3. A beérkező levél értékelése 20 legszélsőségesebb szava alapján 4. 0,9 fölött: spam
Egy új spamszűrő módszer Tesztelés Hét hónap levélforgalmán Tanítás: , , Eredmények RRRR 1702 SSSS 526 RSRS 7 SRSR 27 pontosság= 98,7% lefedettség= 95,1%
Egy új spamszűrő módszer Kumulált lefedettség
Egy új spamszűrő módszer „Pillanatnyi” lefedettség
Egy új spamszűrő módszer Összefoglalás Eredmény A néhány hónaponkénti újratanítást automatizálva a spamforgalomhoz folyamatosan adaptálódó szűrőt kapunk A módszer az elmúlt évben a spamszűrés fontos eszközévé vált