Előadást letölteni
Az előadás letöltése folymat van. Kérjük, várjon
KiadtaJenő Boros Megváltozta több, mint 10 éve
1
Stephen Baker - Numerátorok A blogíró - avagy miért éljük nyilvánosan az életünket
2
Kik a numerátorok? Olyan matematikusokból és statisztikusokból álló elit alakulat, amely különböző eszközökkel és technikákkal elemzi az ember személyiségjegyeit és a megszerzett adatokat hasznosítható információvá alakítja.
3
A szerző blogjáról Stephen Baker Montclair NJ, feleség + 3 gyerek Kétszintes ház, két macska Előzőleg Párizsban élt Előző munkahelyek Tanulmányai, zenei előképzettsége, kedvenc elfoglaltsága Személyes fotók
4
Adatbányászat – data mining Az adatbányászat a nagymennyiségű adatokban rejlő információk fél-automatikus feltárása mesterséges intelligencia algoritmusok alkalmazásával (például neurális hálók, szabálygenerálók, asszociációs modellek). Alterület: webmining – az interneten található képi, szöveges és egyéb adatok feldolgozhatóvá való alakítása. Hasznosítható: kereskedelem, piackutatás, felmérések, hírszerzés.
5
Az embertől az adathalmazig Fókuszcsoport: nehezen szervezhető, költséges Előzmények, látogatott oldalak megfigyelése, elemzése Banki tranzakciók Szokás-modell készítése Ajánlatok (pop-up ads, email, levél) vásárlásösztönzés
6
Umbria Communications Az Umbria Communications-t 2004-ben alapította Howard Kaushansky Célja: a blogok világának matematikára fordítása, továbbá az emberi viselkedés modellezése
7
Bloggerek megoszlása
8
Piackutatás Keresőmotorok: Google, Yahoo!...etc. Miért nem? témához kapcsolódás mértéke alapján, nem időszerű Miért jobb a blog-megfigyelés? már az első héten hasznos információt közöl a fogyasztói visszajelzésekről Törzsekre való osztás korcsoportok és a vizsgált termék közti kapcsolat
9
Törzsek és kapcsolatok Pl.: Gatorade ital elsődleges célcsoport: Sportolók Másodlagos: „iszákos egyetemisták” az elektrolit-tartalom csökkenti a másnaposság hatásait Pl.: Bluetooth adatforgalom áremelkedése: Negatív menedzseri visszajelzés Megoldás: készülék áremelés+”ingyenes” bluetooth
10
Megosztó oldalak
11
Mit tudhatnak meg rólunk az adatlapunk alapján? Név Kinézet Ismerősök Érdeklődési kör Családi állapot Szexuális beállítottság Lakhely Születési dátum Tanulmányok Vallás Politikai beállítottság Gondolatok Új kapcsolatok Csoportok, alkalmazások, kedvencek
12
Keresőmotorok használatának gyakorisága
13
Kommentátorok és feladataik A kommentátorok egy olyan emberekből álló csoport, amely saját, személyes gondolkodása alapján kategorizálja a blogokat, sajátos személyiségjegyeket keresve az adott csoportnak megfelelően. Ezt címkézett digitális mappákba helyezik és felhasználják a gép tanítására, töredékét pedig a tesztelési fázisra hagyják. A keresést nem csak szavakra, de többszörös szókapcsolatokra terjesztik ki, hogy az esetleges hibázás mértékét csökkentsék. A kutatás első kérdése a nem és kor szerinti megkülönböztetés, különböző stílusjegyek alapján.
14
Hibafaktor Túl sok hiba Kommunikáció okozta félreértések mondat- kiegészítés, irónia, szarkazmus Egyetlen szó megváltoztathatja a gépi eredményt. Szócsoportok tanítása: bigrammák, tigrammák, n-grammák. Törzsekbe való besorolási hiba stílusjegyek nem 100%-os előfordulása. Pontosabb eredmény elérése: nem hasonlóság, hanem különbség-vizsgálattal.
15
Splog: Spam blogok Álblog Célja: a Google jövedelemszerzésének kiaknázása a blogreklámokból Adsense Megoldás: többdimenziós vektorgeometria
16
Megosztás Post ping Umbria feldolgozás Ha a postot vektorrá alakíthatják, akkor az embert is lehet matematikailag modellezni? Tévedés: mekkora károkat okozhat, ha hibásan szűrik ki a veszélyt jelentő egyedeket?
17
Köszönöm a figyelmet!
Hasonló előadás
© 2024 SlidePlayer.hu Inc.
All rights reserved.