Rangsorolás tanulása ápr. 24..

Slides:



Advertisements
Hasonló előadás
Készítette: Kosztyán Zsolt Tibor
Advertisements

Ajánló rendszerek ápr. 24. Copyright: Dietmar Jannah, Markus Zanker and Gerhard Friedrich (slides based on their IJCAI talk „Tutorial: Recommender Systems”)
Összetett kísérleti tervek és kiértékelésük:
Nevezetes algoritmusok
Miskolci Egyetem Informatikai Intézet Általános Informatikai Tanszé k Pance Miklós Adatstruktúrák, algoritmusok előadásvázlat Miskolc, 2004 Technikai közreműködő:
Lekérdezések SQL-ben Relációs algebra A SELECT utasítás
1 AIBO Robotfoci Bodor László IAR Bevezetés AIBO RoboCup AIBO RoboCup Célok Célok Rendszer elemei Rendszer elemei Megvalósítás terve Megvalósítás.
Függvények Egyenlőre csak valós-valós függvényekkel foglalkozunk.
MI 2003/9 - 1 Alakfelismerés alapproblémája: adott objektumok egy halmaza, továbbá osztályok (kategóriák) egy halmaza. Feladatunk: az objektumokat - valamilyen.
MI 2003/ A következőkben más megközelítés: nem közvetlenül az eloszlásokból indulunk ki, hanem a diszkriminancia függvényeket keressük. Legegyszerűbb:
Foltkeresés tüdő röntgen képeken
Euklidészi gyűrűk Definíció.
4. VÉGES HALMAZOK 4.1 Alaptulajdonságok
Címkézett hálózatok modellezése
Programozási alapismeretek 8. előadás. ELTE 2/  További programozási tételek További programozási tételek 
Szintaktikai elemzés február 23..
Bevezetés a gépi tanulásba február 16.. Mesterséges Intelligencia „A számítógépes tudományok egy ága, amely az intelligens viselkedés automatizálásával.
3(+1) osztályozó a Bayes világból
Gépi tanulási módszerek
Osztályozás -- KNN Példa alapú tanulás: 1 legközelebbi szomszéd, illetve K-legközelebbi szomszéd alapú osztályozó eljárások.
Gépi tanulási módszerek febr. 20.
Szintaktikai elemzés március 1.. Gépi tanulás Osztályozási feladat: Adott egyedek egy halmaza és azok osztályba tartozási függvénye (tanító halmaz),
MEMM (Maximum Entrópia Markov Modell). A label-bias probléma Tanító adatbázis gold standard címkéin tanulunk, kiértékelni a generálton. Túl tökéletes,
Összefüggés vizsgálatok
Táblázatkezelés alapjai MS Excel, OpenOffice Calc
Statisztika II. VI. Dr. Szalka Éva, Ph.D..
A digitális számítás elmélete
Lineáris korreláció és lineáris regresszió. A probléma felvetése y = 1,138x + 80,778r = 0,8962.
Valós számok Def. Egy algebrai struktúra rendezett test, ha test és rendezett integritási tartomány. Def. Egy (T; +,  ;  ) rendezett test felső határ.
6. SZÁMELMÉLET 6.1. Oszthatóság
Hasonlóságelemzés COCO használatával a MY-X elemzőben
Online hasonlóságelemzések: Online hasonlóságelemzések: Totó-automata?! Pitlik László, SZIE Gödöllő (Forrás: My-X.hu Hírlevél) október INNOCSEKK.
Microsoft Excel Függvények VII..
Microsoft Excel Függvények VI..
Dr. Szalka Éva, Ph.D.1 Statisztika II. VI.. Dr. Szalka Éva, Ph.D.2 Regresszióanalízis.
1 Bevezetés a funkcionális programozásba 2009.
Az Alakfelismerés és gépi tanulás ELEMEI
Nominális adat Módusz vagy sűrűsödési középpont Jele: Mo
Előrendezéses edényrendezés – RADIX „vissza”
Statisztika.
Textúra elemzés szupport vektor géppel
Rendezési algoritmusok
Szemantikus keresők.
Gépi tanulás Tanuló ágens, döntési fák, általános logikai leirások tanulása.
Problémás függvények : lokális optimalizáció nem használható Globális optimalizáció.
Leíró statisztika III..
Többváltozós adatelemzés
Következtető statisztika 9.
Alapsokaság (populáció)
Belami beszámoló – Doménadaptációs alkalmazások. Problémafelvetés Felügyelt tanulás elvégzéséhez gyakran kevés jelölt adat áll rendelkezésre  doménadaptáció.
– SQL 3: SELECT - 1. – Tarcsi Ádám, január 31. Adatbázis gyakorlat.
Adatbázis-kezelés 3-4. Adatok lekérdezése utasítás általános formája SELECT [ALL/DISTINCT] {*/, …, } FROM [ ], …, [ ] [WHERE GROUP BY, …, HAVING ORDER.
Algebrai struktúrák: csoport, gyűrű, test. RSA Cryptosystem/ Titkosítási rendszer Rivest, Shamir, Adelman (1978) RSA a neten leggyakrabban használt.
Valószínűségszámítás II.
Programozási alapismeretek 8. előadás. ELTE Szlávi-Zsakó: Programozási alapismeretek 8.2/  További programozási.
Könyvtár- és informatikai alapismeretek kurzus október 1.
1.  Szerzői:  Panagiotis Bouros (University of Hong Kong),  Shen Ge (University of Hong Kong),  Nikos Mamoulis (University of Hong Kong)  Esemény:
Csoportkeresési eljárások Vassy Zsolt. Tematika Girvan Newman klaszterezés Diszkrét Markov lánc: CpG szigetek Rejtett Markov lánc ADIOS.
Struktúra predikció Struktúra lehet Felügyelt tanulási probléma
Gépi tanulási módszerek
1 Megerősítéses tanulás 4. előadás Szita István, Lőrincz András.
Huffman kód.
Mediánok és rendezett minták
Kovács Gergely Péter Bevezetés
Rangsorolás tanulása ápr. 13..
A maximum kiválasztás algoritmusa
Ajánló rendszerek ápr. 13. Copyright: Dietmar Jannah, Markus Zanker and Gerhard Friedrich (slides based on their IJCAI talk „Tutorial: Recommender Systems”)
III. előadás.
Gépi tanulási módszerek febr. 18.
A mesterséges neuronhálók alapjai
Előadás másolata:

Rangsorolás tanulása ápr. 24.

Állásra jelentkezők rangsorolása

Rangsorolási feladat Adott elemek egy halmaza o1…n és egy q lekérdezés Az {oi,q} párokat (gazdag) jellemzőtérrel írjuk le Rangsoroljuk o1…n elemeket q-szerinti relavancia szempontjából! A kimenet az o1…n elemek egy rendezett listája

Rangsorolás tanulása Tanító adatbázis: Modell:

Rangsorolás vs. regresszió Egyszerű megoldás: helyezést, mint valós értéket regresszáljuk Célfüggvény más! Konkrét értékek nem érdekesek, csak a rendezés Az egyes lekérdezések közti normalizáció problémás: pl. f(q1,o1,18) = f(q2, o2,72) = 1

Rangsorolás vs. osztályozás Sokszor a gyakorlatban csak néhány releváns elem ismert a lekérdezéshez (nem teljes rangsor). Releváns/nem-releváns bináris osztályozás? Egy halmazból mindig a legrelevánsabbakat kell kiválasztani! (globális osztályozó predikálhat mindent nem-relevánsnak) Rangsorolásnál az adott O belüli (relatív) rangsor a kérdés és nem egy abszolút rangsor.

Kiértékelési metrikák Kendall tau: Releváns elem választásnál: reciprok rangsor = 1/rank, ahol rank az első releváns elem helyezése MRR: reciprok rangsor átlagolva több q,O pár felett rel(k): a k.-nak visszaadott elem releváns-e P(k)= precízió@k MAP: AveP átlagolva több q,O pár felett

Megközelítések Pontszerű (pointwise) megközelítés Regressziós (teljes rangsorolás) vagy osztályozási (releváns elemek) problémaként kezeljük Pár-alapú (pairwise) megközelítés Az egyes O-kon belül párokat formálunk, arra az osztályozási feladatra vezetjük vissza, hogy oi elem relevánsabb-e, mint oj. Rangsorolásnál mindenki mindenkivel versenyez. Lista-alapú (listwise) megközelítés A rangsorolást közvetlenül tanuljuk. Egy q,O pár egy egyed

SVMrank

SVMrank

SVMrank Tfh. f(x) lineáris, ekkor: … http://www.cs.cornell.edu/people/tj/svm_light/svm_rank.html

ListMLE – Plackett Luce Modell π egy rangsorolása O elemeinek π-1(i) a rangsor i. pozíciójában álló elem s egy pontszám az egyes értékekhez P egy eloszlás s szerint csökkenő(növekvő) sorrendnek a legnagyobb(legkissebb) a valószínűsége

ListMLE Legyen Keressük azt az paramétervektort ami maximalizálja a tanító adatbázis megfigyelésének valószínűségét (MLE) a Plackett-Luce modell alapján:

sorrend helyett releváns találatok ListMLE sorrend helyett releváns találatok Jelölje Yi az i. lekérdezéshez releváns találatok halmazát ?

Megjegyzések A pontszerű megközelítésnél számottevően jobbak a pár- ill. lista-alapú módszerek A gyakorlatban a pár- és lista-alapú módszerek versenyképesek Tanító példák száma: Pár-alapúnál |Q\|O|2 Lista-alapúnáé |Q\ tanító példa

Összegzés Rangsorolási feladat Pontszerű (pointwise) megközelítés Teljes rangsor Releváns elemek Pontszerű (pointwise) megközelítés Regresszió Releváns/nem releváns osztályozás Pár-alapú (pairwise) megközelítés SVMrank Lista-alapú (listwise) megközelítés ListMLE