Az előadás letöltése folymat van. Kérjük, várjon

Az előadás letöltése folymat van. Kérjük, várjon

Struktúra predikció ápr. 2.. Struktúra predikció minta IID feltevésének elvetése Felügyelt tanulási probléma –Egyedek = struktúrák Struktúra lehet –Szekvencia.

Hasonló előadás


Az előadások a következő témára: "Struktúra predikció ápr. 2.. Struktúra predikció minta IID feltevésének elvetése Felügyelt tanulási probléma –Egyedek = struktúrák Struktúra lehet –Szekvencia."— Előadás másolata:

1 Struktúra predikció ápr. 2.

2 Struktúra predikció minta IID feltevésének elvetése Felügyelt tanulási probléma –Egyedek = struktúrák Struktúra lehet –Szekvencia –Fa, gráf

3

4 slide copyright of Nicolas Nicolov

5

6

7

8 Szekvenciajelölés Legegyszerűbb struktúra Példa: Minden képkockához rendeljük, hozzá, hogy milyen cselekvést végez az alany

9 Rejtett Markov Modellek

10 Diszkrét Markov Folyamat –Adott N állapot, a rendszer minden időpontban az egyik állapotban van – jelentése, hogy a t-dik időpillanatban a rendszer az S i állapotban van

11 A rendszer állapota a megelöző állapotoktól függ : Elsőrendű Markov Modell esetén: Rejtett Markov Modellek

12 Átmeneti valószínűségek Tfh. az átmeneti valószínűségek függetlenek az időtől: Kezdeti valószínűségek:

13 Megfigyelési valószínűségek Az q t állapotok rejtettek, nem megfigyelhetőek. Viszont rendelkezésre áll egy megfigyelési szekvencia. Amit meg tudunk figyelni annak M értéke lehet: megfigyelései (emissziós) valószínűség:

14 Rejtett Markov Modellek

15 RMM példa Tőzsdei előrejelzés S = {derűs, borús, stagnáló} hangulat O = {emelkedő, csökkenő} árfolyam

16 A RMM három feladata 1.Ismert λ valószínűségek mellett mi egy megfigyeléssorozat előfordulásának valószínűsége? 2.Ismert λ valószínűségek mellett mi a legvalószínűbb rejtett állapot-szekvencia egy megfigyelés-sorozathoz? argmax 3. tanító adatbázis alapján becsüljük meg a λ valószínűségeket !

17 Kiértékelési (1.) feladat Adott λ és, =?

18 Kiértékelési (1.) feladat Forward(-backward) algoritmus erre: forward változók: rekurzív eljárással számítható inicializálás: időigény: O(N T T)

19 Forward algoritmus időigény: O(N 2 T)

20 Legvalószínűbb szekvencia megtalálása (2. feladat) Adott λ és, argmax P(Q| λ,O) =? Viterbi algoritmus Dinamikus programozás δ t (i) a legvalószínűbb 1..t szekvencia valószínűsége ahol q t =S i

21 Viterbi algoritmus

22 Rejtett Markov Modellek

23 RMM tanulása (3. feladat) Adott (ha Q is ismert lenne simán relatív gyakoriságokkal becsülhetnénk) Maximum likelihood: argmax

24 RMM tanulása

25

26 Backward algoritmus

27 Baum-Welch algoritmus Annak a valószínűsége, hogy S i -ben vagyunk a t-edik lépésben:

28 Expectation-Maximisation (EM) Maximum Likelihood kiterjesztése arra az esetre ha vannak rejtett változóink is Keressük azt a Φ paramétervektort ami a megfigyelhető X és rejtett Z változók együttes előfordulásának valószínűségéz maximalizálják

29 Expectation-Maximisation (EM) Iteratív algoritmus. l-edik lépésben: –(E)xpectation lépés: megbecsüljük Z értékeit (várható érték) Φ l alapján –(M)aximization lépés: Maximum likelihood a Z értékeinek rögzítésével Bizonyítottan konvergál:

30 EM példa Adott két cinkelt pénzérme. Egyszerre dobunk, de csak a fejek összegét tudjuk megfigyelni: h(0)=4 h(1)=9 h(2)=2 Mennyire cinkelt a két érme? Φ 1 =P 1 (H), Φ 2 =P 2 (H) ?

31 EM példa egyetlen z rejtett változó: a h(1)=9 esetből hányszor volt az első érme fej init Φ 1 0 =0,2 Φ 2 0 =0,5 E-lépés

32 EM példa M-lépés

33 Baum-Welch algoritmus (folytatás) Baum-Welch egy EM algoritmus Rejtett változók: Célváltozók:

34 Baum-Welch algoritmus E-lépés (forward-backward algoritmussal kiszámoljuk) M-lépés

35 Diszkriminatív szekvencia jelölők

36 P(D|c) P(c|D)

37 Balról jobbra haladva y i =argmax P(y|x i,y i-1 ) Maximum Entrópia Markov Modell MEMM

38 A label-bias probléma Lokális döntések, a megfigyelés későbbi elemeinek abszolút nincsen hatása a döntésnél

39 Conditional Random Fields Egyetlen feltételes (exponenciális) modell ami az egész eseményegyüttest kezeli

40

41 Lánc (linear-chain) CRF

42 Dekóder lánc-CRFnél

43 Viterbi lánc-CRFhez inicializáció :

44 CRF tanulás gradiens alapú módszerek…

45 Struktúrált perceptron online tanulás aktuális paraméterekkel (az egész struktúrára vonatkozik a jellemzőtér) dekódolás ha nem egyezik az igazi struktúrával frissítjük a modellt frissítés a két jellemzővektor különbségével

46 Struktúrált perceptron Viterbi dekóder szekvenciajelölésnél: Paraméterek frissítése:

47 A szekvenciákon túl...

48 Fa predikcó - PCFG

49 Fa predikció – CYK algoritmus


Letölteni ppt "Struktúra predikció ápr. 2.. Struktúra predikció minta IID feltevésének elvetése Felügyelt tanulási probléma –Egyedek = struktúrák Struktúra lehet –Szekvencia."

Hasonló előadás


Google Hirdetések