Lábnyomok a világhálón Arató Bence, szakmai igazgató
Bemutatkozás A cégről Üzleti intelligenciára specializált tanácsadó cég Elemzés, tanácsadás, oktatás Tanácsadási területek Adattárház-építés Kontrolling rendszerek kialakítása Vezetői információs rendszerek készítése BI stratégiai tanácsadás Oktatás Publikációs tevékenység Piacelemző tanulmányok Üzleti intelligencia évkönyv (
De mi is az üzleti intelligencia? Olyan informatikai megoldások összessége, amelyek célja a vállalati döntéshozatal intelligens támogatása Adatok, számok, elemzések alapján hozott döntések, általában speciális informatikai eszközökkel támogatva Nem keverendő össze az üzleti hírszerzéssel (angolul szintén Business Intelligence)! Tipikus alkalmazási területek Telekom cégek, pénzintézetek, szolgáltató vállalatok, gyártás, kereskedelem Mindenhol, ahol sok értékes adat gyűlik össze Ez egyre inkább igaz az online világra is!
Lábnyomok a világhálón IP Címek
Klasszikus logelemzés Böngészés közben a számítógépünk tulajdonképpen állományokat tölt le a webszerverekről Ezek az állományok vegyesen szövegek (HTML oldalak), képek illetve egyéb állományok A webszerverek minden egyes állomány letöltését naplózzák - ez a weblog Látogatás dátuma, IP cím, lekért oldal, honnan érkezett, technikai paraméterek
[22/Dec/2008:09:58: ] "GET /index.html HTTP/1.1" " "Opera/9.63 (Windows NT 5.1; U; hu)" Mi is a weblog? IP Cím Dátum Letöltött oldal Böngésző típusa Honnan érkezett
Látogatási statisztika
Geolokáció
Részletek adatok
Mire használható az IP-cím? Az IP cím egy adott géphez tartozik, de időben változhat Dinamikus IP címek Lehet közös több látogató számára Tűzfalak, gyorsító kiszolgálók elrejtik az igazi IP címet A fentiek miatt az IP cím nem alkalmas Látogató személy közvetlen azonosítására Egy látogatás lépéseinek összekötésére Különböző időpontban történt látogatások összerendelésre Alkalmas lehet viszont a látogató személy hivatalos úton történő azonosítására Tartalomszolgáltatók rögzítik az IP címet Internetszolgáltatók képesek összerendelni valós személlyel Liskula Cohen vs. Google per
Lábnyomok a világhálón Sütik
Sütik alkalmazása Amikor a böngészővel felkeresünk egy weboldalt, akkor szinte mindig letöltésre kerül egy picike „azonosító csomag”, amit a böngészőnk tárol, és amelyet minden újabb oldal lekérésekor elküld a webszervernek Ennek a kis csomagnak a neve cookie, és egy átlagos gépen több száz van belőle
A sütik haszna Egy látogatás lépéseinek azonosítása Elég az első védett oldal elolvasásakor bejelentkezni, a többinél már nem kell A látogató azonosítása, ha később visszatér Jegyezz meg! szolgáltatások
Sütik listája a böngészőben
Veszélyek A sütiknél megadható ugyan érvényesség, de ezzel a szolgáltatók sokszor elég „nagyvonalúan” bánnak
Veszélyek Az egy tartalomszolgáltathoz tartozó sütik minden egyes webes kattintásunknál elküldésre kerülnek, ezért könnyen összeköthetőek különböző adataink Hírlevél megrendelésekor megadott cím Regisztrációnál megadott egyéb személyes adatok Olvasási szokáso Kommentek Keresések
Lábnyomok a világhálón Keresések
Keresők Az óriási mennyiségű weboldal között a a legegyszerűbb a keresők segítségével tájékozódni (Google, AOL, hazai keresők) Természetesen minden keresésről készül logállomány, amit a keresőmotor üzemeltetője saját belátása szerint használ A keresés optimalizálása Javaslatok felkínálása Személyes keresési történet nyilvántartása Még szerencse, hogy a nyilvánosság előtt ezek rejtve maradnak…
Keresők Az AOL-botrány Az AOL keresőóriás 2006 augusztusában közzétette 21 millió keresés eredményét, ami több százezer felhasználóra tartalmazott adatokat Az egyes felhasználók ugyan csak számokkal voltak jelölve, de ez nem bizonyult elegendőnek A keresések között az orvosi problémáktól a gyilkosságon terveken keresztül a családon belüli erőszakig minden előfordul Az AOL nyilvánosan elnézést kért, fejek hullottak, de az adatok máig elérhetőek az interneten
AOL Search Data elérhetőségei
Lábnyomok a világhálón Integrált szolgáltatások
A Google-birodalom A Google jóval több, mint egyszerű keresőmotor, számtalan szolgáltatást nyújt Keresés Levelezés - Gmail Naptárkezelés – Google Calender Blogolvasó – Google Reader Befektetések nyomonkövetése – Google Finance Térkép – Google Maps Hírek – Google News Jegyzetek – Google Notebook
A Google-birodalom
Hazai példa
Veszélyek Egy helyen gyűlik számos különböző online tevékenységünk adatai Bármelyikben szolgáltatásban fellépő adatvédelmi hiba akár az összes személyes adatunkat veszélyezteti Ha több szolgáltatást használunk, akkor szinte biztos, hogy állandóan be leszünk jelentkezve, tehát azonosíthatóak vagyunk
Egy egyszerű keresés
Összeáll a kép Integrált szolgáltatások Keresések Sütik IP Címek Online profilozás
Összeáll a kép Online profilozás Az online azonosítási technikáknak és a szorgalmas adatgyűjtésnek köszönhetően igen széles köre nyílik az online profilok készítésének Olvasási szokások, keresések, levelezés témái, szociális háló, kedvenc időtöltések, politikia vélemények, egészségügyi problémák, online töltött idő mennyisége és eloszlása, társas kapcsolatok Mind-mind elérhető a szolgáltatóknál, számunkra (általában) láthatatlanul
Online profilozás
Köszönöm a figyelmet!