Az előadás letöltése folymat van. Kérjük, várjon

Az előadás letöltése folymat van. Kérjük, várjon

Stephen Baker - Numerátorok A blogíró - avagy miért éljük nyilvánosan az életünket.

Hasonló előadás


Az előadások a következő témára: "Stephen Baker - Numerátorok A blogíró - avagy miért éljük nyilvánosan az életünket."— Előadás másolata:

1 Stephen Baker - Numerátorok A blogíró - avagy miért éljük nyilvánosan az életünket

2 Kik a numerátorok? Olyan matematikusokból és statisztikusokból álló elit alakulat, amely különböző eszközökkel és technikákkal elemzi az ember személyiségjegyeit és a megszerzett adatokat hasznosítható információvá alakítja.

3 A szerző blogjáról Stephen Baker Montclair NJ, feleség + 3 gyerek Kétszintes ház, két macska Előzőleg Párizsban élt Előző munkahelyek Tanulmányai, zenei előképzettsége, kedvenc elfoglaltsága Személyes fotók

4 Adatbányászat – data mining Az adatbányászat a nagymennyiségű adatokban rejlő információk fél-automatikus feltárása mesterséges intelligencia algoritmusok alkalmazásával (például neurális hálók, szabálygenerálók, asszociációs modellek). Alterület: webmining – az interneten található képi, szöveges és egyéb adatok feldolgozhatóvá való alakítása. Hasznosítható: kereskedelem, piackutatás, felmérések, hírszerzés.

5 Az embertől az adathalmazig Fókuszcsoport: nehezen szervezhető, költséges Előzmények, látogatott oldalak megfigyelése, elemzése Banki tranzakciók Szokás-modell készítése Ajánlatok (pop-up ads, email, levél)  vásárlásösztönzés

6 Umbria Communications Az Umbria Communications-t 2004-ben alapította Howard Kaushansky Célja: a blogok világának matematikára fordítása, továbbá az emberi viselkedés modellezése

7 Bloggerek megoszlása

8 Piackutatás Keresőmotorok: Google, Yahoo!...etc. Miért nem?  témához kapcsolódás mértéke alapján, nem időszerű Miért jobb a blog-megfigyelés?  már az első héten hasznos információt közöl a fogyasztói visszajelzésekről Törzsekre való osztás  korcsoportok és a vizsgált termék közti kapcsolat

9 Törzsek és kapcsolatok Pl.: Gatorade ital  elsődleges célcsoport: Sportolók Másodlagos: „iszákos egyetemisták”  az elektrolit-tartalom csökkenti a másnaposság hatásait Pl.: Bluetooth adatforgalom áremelkedése: Negatív menedzseri visszajelzés Megoldás: készülék áremelés+”ingyenes” bluetooth

10 Megosztó oldalak

11 Mit tudhatnak meg rólunk az adatlapunk alapján? Név Kinézet Ismerősök Érdeklődési kör Családi állapot Szexuális beállítottság Lakhely Születési dátum Tanulmányok Vallás Politikai beállítottság Gondolatok Új kapcsolatok Csoportok, alkalmazások, kedvencek

12 Keresőmotorok használatának gyakorisága

13 Kommentátorok és feladataik A kommentátorok egy olyan emberekből álló csoport, amely saját, személyes gondolkodása alapján kategorizálja a blogokat, sajátos személyiségjegyeket keresve az adott csoportnak megfelelően. Ezt címkézett digitális mappákba helyezik és felhasználják a gép tanítására, töredékét pedig a tesztelési fázisra hagyják. A keresést nem csak szavakra, de többszörös szókapcsolatokra terjesztik ki, hogy az esetleges hibázás mértékét csökkentsék. A kutatás első kérdése a nem és kor szerinti megkülönböztetés, különböző stílusjegyek alapján.

14 Hibafaktor Túl sok hiba Kommunikáció okozta félreértések  mondat- kiegészítés, irónia, szarkazmus Egyetlen szó megváltoztathatja a gépi eredményt. Szócsoportok tanítása: bigrammák, tigrammák, n-grammák. Törzsekbe való besorolási hiba  stílusjegyek nem 100%-os előfordulása. Pontosabb eredmény elérése: nem hasonlóság, hanem különbség-vizsgálattal.

15 Splog: Spam blogok Álblog Célja: a Google jövedelemszerzésének kiaknázása a blogreklámokból Adsense Megoldás: többdimenziós vektorgeometria

16 Megosztás Post  ping  Umbria  feldolgozás Ha a postot vektorrá alakíthatják, akkor az embert is lehet matematikailag modellezni? Tévedés: mekkora károkat okozhat, ha hibásan szűrik ki a veszélyt jelentő egyedeket?

17 Köszönöm a figyelmet!


Letölteni ppt "Stephen Baker - Numerátorok A blogíró - avagy miért éljük nyilvánosan az életünket."

Hasonló előadás


Google Hirdetések