Ajánló rendszerek ápr. 13. Copyright: Dietmar Jannah, Markus Zanker and Gerhard Friedrich (slides based on their IJCAI talk „Tutorial: Recommender Systems”)

Slides:



Advertisements
Hasonló előadás
Ajánló rendszerek ápr. 24. Copyright: Dietmar Jannah, Markus Zanker and Gerhard Friedrich (slides based on their IJCAI talk „Tutorial: Recommender Systems”)
Advertisements

Vatera-forintok a kalapács alatt Gerő Viktor. A vatera marketing céljai - Minél több vevő (több felhasználó) ‏ - Minél többször (gyakoribb tranzakció)‏
Lengyelország: Allegro Magyarország: TeszVesz és Vatera
Alberti Rita Apró Zoltán Bálint Zsolt Baranyi Zsuzsanna Balázs Dorottya Szabó Gergely.
Skálázható kollaboratív filtering módszerek a Netflix Prize versenyen The Budapest New Technology July Meeting július 2. Tikk Domonkos Gravity Research.
Logók és logfájlok Az online közönségmérés kihívásai.
Hogy keressünk pénzt azzal, amit ingyen adunk?
Allegroup.hu Grando.hu – Az online pláza.
Reklámok az interneten: célozni tudni kell! Erőss Csaba.
IWiW Problémák és megoldások Lécz Balázs iWiW Üzemeltetési vezető Virgo Systems Kft
Készítette / Author: Tuska Katalin
Számítástudományi módszerek a webes szolgáltatásokban Rácz Balázs október 20.
Bevezetés a gépi tanulásba február 16.. Mesterséges Intelligencia „A számítógépes tudományok egy ága, amely az intelligens viselkedés automatizálásával.
Osztályozás -- KNN Példa alapú tanulás: 1 legközelebbi szomszéd, illetve K-legközelebbi szomszéd alapú osztályozó eljárások.
Rangsorolás tanulása ápr. 24..
Szintaktikai elemzés március 1.. Gépi tanulás Osztályozási feladat: Adott egyedek egy halmaza és azok osztályba tartozási függvénye (tanító halmaz),
MEMM (Maximum Entrópia Markov Modell). A label-bias probléma Tanító adatbázis gold standard címkéin tanulunk, kiértékelni a generálton. Túl tökéletes,
MI 2003/ Alakfelismerés - még egy megközelítés: még kevesebbet tudunk. Csak a mintánk adott, de címkék nélkül. Csoportosítás (klaszterezés, clustering).
Minőségmenedzsment 1. előadás
Klaszterező algoritmusok smart city alkalmazásokhoz Gonda László Témavezető: Dr. Ispány Márton.
Ozsváth Károly TF Kommunikációs-Informatikai és Oktatástechnológiai Tanszék.
A virtuális technológia alapjai Dr. Horv á th L á szl ó Budapesti Műszaki Főiskola Neumann János Informatikai Kar, Intelligens Mérnöki Rendszerek.
Vállalati információs rendszerek értékelése numerikus hasonlóság-elemzéssel TDK-dolgozat Készítette: Pető István GTK V. évfolyam november.
Webbányászat (web mining) Mártonffy A: Kutakodom, tehát vagyok cikke nyomán.
Hozam-előrejelzés a gabonatermesztésben
Az SPSS technológiával háromszorosára nőtt az online eladásokból származó bevétel.
A cég alapítója, és tulajdonosa James Ward
Hierarchikus klaszteranalízis
A fejlesztő értékelés.
Élet a Ságvári Bence digitális VII. Nemzetközi Médiakonferencia, Balatonalmádi, szeptember 25. ökoszisztémában kisgyerekként...
A partneri kapcsolatok értékelése hálózati együttműködés esetén
Implementált képfeldolgozó algoritmusok
Statisztika.
Fogyasztói magatartást befolyásoló tényezők
Adatbányászat és WEB2 Németh Bottyán Web2.0 Symposium.
Make the Greener Choice Greener One Make the Greener Choice!
Mobilra optimalizált webáruházak, avagy felkészülés az új évtizedre Zajdó Csaba.
Belami beszámoló – Doménadaptációs alkalmazások. Problémafelvetés Felügyelt tanulás elvégzéséhez gyakran kevés jelölt adat áll rendelkezésre  doménadaptáció.
LOGISZTIKA Előadó: Dr. Fazekas Lajos Debreceni Egyetem Műszaki Kar.
Kooperatív oktatással a befogadás támogatásáért
"Kulturális honlapjaink minősége - európai szemmel" Integrált egyetemi könyvtár honlapkészítésének dilemmái Karácsony Gyöngyi Debreceni Egyetem Egyetemi.
CMMI 1.3 – Verifikáció Készítette: Kis Gergely. Bevezetés A specifikációt, követelményt vetjük össze a kész/készülő termékkel Itt nem vizsgáljuk, hogy.
Personalization and privacy: a survey of privacy risks and remedies in personalization-based systems Eran Toch · Yang Wang · Lorrie Faith Cranor.
Struktúra predikció Struktúra lehet Felügyelt tanulási probléma
E-Learning, E-Kereskedelem, és E-Gazdaság fejlődései
Gépi tanulási módszerek
1.Gyógyszeripari kommunikáció célcsoportja 2.Direkt mail és mérési lehetőségei 3.Direkt és alapfogalmak 4.Direkt mérési lehetőségei 5.Direkt.
1.Kanonikus felügyelt tanulási feladat definíciója (5p) 1.Input, output (1p) 2.Paraméterek (1p) 3.Hipotézisfüggvény (1p) 4.Hibafüggvény/költségfüggvény.
Online és e-könyvek Hasonlóságok és különbségek. Tartalom és funkcionalitás A hagyományos print könyv tartalma elektronikus formátumban + kiegészítő funkciókkal:
Personalization and privacy: a survey of privacy risks and remedies in personalization-based systems Eran Toch · Yang Wang · Lorrie Faith Cranor.
Készlet- és termelésoptimalizálás bevezetésének tapasztalatai egy dinamikusan fejlődő KKV vállalatnál Esettanulmány Dr. Lelkes Zoltán.
Mennyit ér az adatbázisod?. Amennyit kihozol belőle…
Papíron túl… Szűcs Roland. E-könyv jelenség képlete 2 E-könyv Üzleti modell Nagyobb kiadói árrés Kockázatmentes Olcsó terjesztés Kultúra Értékek megőrzése.
Soós Sándor: tudományos folyóiratok szakterületi rangsorolása
9. tétel.
A könyvtári integrált rendszerek statisztikai moduljának használata
ECONOMSOL a Kis- és Középvállalkozások kontrolling szolgáltatója
„Adatbázis építés, adatállományok felhasználása, frissítése, targetálás; egy sikeres DM esettanulmány bemutatása” Vörös Gergely online média értékesítési.
Cseres-Gergely Zsombor
Üzleti terv bemutatása
Ezek a stratégia elemek sorban
MIT ígér neked a Kampányépítő Mesterkurzus?
Gazdaságstatisztika Konzultáció a korreláció- és regressziószámítás, idősorok elemzése témakörökből.
Ajánló rendszerek ápr. 13. Copyright: Dietmar Jannah, Markus Zanker and Gerhard Friedrich (slides based on their IJCAI talk „Tutorial: Recommender Systems”)
Márkakereskedői helyzetkép
Készítette: Pető István Szent István Egyetem
Kutatási terv bemutatása: diszkriminációtesztelés a gyakorlatban
Kereskedés a tőzsdén.
ROMA STRATÉGIAVÁLTÁS A MUNKAERŐGAZDÁLKODÁSBAN
valamint korábbi befejeződés/csúszás/ átfedés és kombinációik
Előadás másolata:

Ajánló rendszerek ápr. 13. Copyright: Dietmar Jannah, Markus Zanker and Gerhard Friedrich (slides based on their IJCAI talk „Tutorial: Recommender Systems”)

Ajánló rendszerek – motiváció Joseph Pine: „Mass Customization” (1993) a szabványos, egyenvásárlóra tervezett tömegtermékek ideje lejárt többféle vásárló, többféle igényét kielégítő, heterogén (sokféle) termékek gyártásának irányába kell elmozdulni Jeff Bezos (Amazon, CEO) „Ha 2 millió vásárlóm van akkor 2 millió boltom kell, hogy legyen a Weben” dia: Engedy Balázs: Ajánlórendszerek

Ajánló rendszerek – motiváció A heterogenitás dilemmája Megvan a sokféle termék, változatos kínálat Így a vásárlónak rengeteg lehetőségből kell választani (információ túlterhelés)  A kínálatot szűrni/rangsorolni kell! Ajánló rendszerek: A vásárlónak csak a releváns termékeket mutassuk Egyénre/testreszabott vásárlás!  Webes vásárlásokat (vásárlói kosarak) könnyű nyomon követni Járulékos eladások, visszatérő vásárlók  dia: Engedy Balázs: Ajánlórendszerek

100K film, 10M user, 1000M értékelés

„Long tail” Eladások 30%-a (amazon)

Ajánlási feladat U - felhasználók (users), I - termékek (items), egy f : U×I → R leképezésből néhány példa (R halmaz, teljes rendezéssel). explicit értékelés: milyen skálán? implicit értékelés: kattintások, oldallátogatások, eltöltött idő stb. Tanulási feladat: határozzuk meg azt az f’: U×I → R leképezést, amely a lehető legjobban közelíti f-et, és teljesen definiált a teljes U×I téren. Ajánló rendszer:

Ajánló rendszerek - megközelítések Kollaboratív ajánlás: a predikció inputjához hasonló adatok is felhasználásra kerülnek a predikció során user-based: a cél felhasználóhoz hasonló ízlésű felhasználók szavazatainak felhasználásával történik a predikció item-based: a cél termékhez hasonló termékekre tett értékelések használatával készül a predikció Tartalomalapú módszerek: a célfelhasználó korábbi értékelései alapján történik a predikció Hibrid módszerek: az előző két módszer ötvözete

Ajánló rendszerek - kiértékelés Valós célfüggvények: Ügyfélelégedettség! Ajánlott elemek megvásárlása (likeolása) Többet vásárolnak mintha nem lenne ajánlás?

„Online” kiértékelés Élő rendszer, kontrollcsoport (Jannach, Hegelich 2009) játék app letöltő oldal 150K user 6+1 csoportra osztva oldalmegnyitás, mint (implicit) értékelés 3.6%-al több letöltés azokban a csoportokban ahol volt ajánlás nincs szignifikáns különbség az egyes ajánlórendszerek mellett

„Offline” kiértékelés Hisztorikus adatokból tanító és teszt adatbázis leválasztása):

Kollaboratív ajánlás

Kollaboratív ajánlás Alapgondolat: Felhasználók (explicit vagy implicit) értékelik a tartalmakat Azok a felhasználók akik a múltban hasonló dolgokat kedveltek a jövőben is hasonlóan fognak viselkedni

Felhasználó-alapú legközelebbi szomszéd alapú ajánlás Válasszunk ki hasonló felhasználókat (peer) akik értékelték a kérdéses tartalmat Becslésünk az értékelésre legyen a peerek értékelésének átlaga (aggregáció)

Felhasználó-alapú legközelebbi szomszéd alapú ajánlás Hogyan mérjük a hasonlóságot? Hány peert válasszunk? Átlagolás?

Hasonlósági mérték: korreláció két felhasználó hasonlósága csak azokon az elemeken ahol mindketten értékeltek

Becslés az értékelésre hasonlósággal súlyozunk a felhasználók saját átlagától való eltérésre normalizálunk (pesszimista vs. optimista felhasználók)

Problémák Nem minden értékelés ugyanolyan súlyú ahol mindenki egyetért az kevésbé számít, mint ahol vegyesek a vélemények szórást vegyük figyelembe! Ha a közösen értékelt elemek száma alacsony (minden párra más az N) az nagyon torzíthat súlyozzuk a hasonlósági metrikát a metszet elemszámával! Szomszédság meghatározása: fix K, vagy küszöbérték

Elem-alapú legközelebbi szomszéd alapú ajánlás |U| >> |I|

A „hidegindítás” probléma Ha érkezik egy új felhasználó vagy elem akkor ahhoz nincs értékelésünk. Hogyan találunk hasonló egyedeket? „Kényszerítjük” az új felhasználót néhány ajánlásra vagy Rekurzív kollaboratív ajánlás:

Dimenzió csökkentés alapú ajánlás

Dimenzió csökkentés alapú ajánlás

Kollaboratív ajánlás – összegzés Intuitív Jól működik számos környezetben Nem kell hozzá „jellemzőtér-tervezés” Sok felhasználó, sok értékelés kell Ritka mátrix probléma… Külső információt nehéz bevonni Az egyes változatok teljesítményére különböző eredmények (nincs konszezus)

Tartalom alapú ajánló rendszerek

Tartalom alapú ajánló rendszerek Kizárólag a célfelhasználó korábbi értékelései alapján ajánlunk Az elemeket jellemzőkkel írjuk le pl: színészek, stáb, kategória, leírás szavai A jellemzőkre egy osztályozót/regresszort építhetünk Tanítás a célfelhasználó korábbi értékelésein

Tartalom alapú ajánló rendszerek

Tartalom alapú ajánlás – előnyök Független a többi felhasználótól (megj: jellemzőtérbe beépíthetjük az információt) egyetlen felhasználó esetén is életképes a rendszer Hidegindítás problémája kisebb Ritkaság nem okoz gondot „egyéniségek”-nél is működik új, vagy nem felkapott elemeket is ajánlhat (long tail) Értelmezhető modell (pl. legnagyobb súlyú tüzelő jellemzők)

Tartalom alapú ajánlás – hátrányok Jellemzőtér kialakítása probléma specifikus és gyakran nehézségekbe ütközik Túlspecializáció: Elképzelhető, hogy nem mindig a már magasan értékeltekhez leginkább hasonló elem ajánlása az ideális Pl. Étterem ajánló rendszer: amennyiben a felhasználó még csak kínai és magyar ételeket értékelt, soha nem fogunk neki görög éttermet ajánlani (még ha az a legjobb is a városban), hiszen túlságosan különböző az eddig (jónak) értékelt elemektől Egy új felhasználónak egy ideig nem tudunk értékelést adni (megfelelő méretű tanító adatbázis kell)