Előadást letölteni
Az előadás letöltése folymat van. Kérjük, várjon
KiadtaDániel Kocsis Megváltozta több, mint 10 éve
1
Szintaktikai elemzés 2007. március 1.
2
Gépi tanulás Osztályozási feladat: Adott egyedek egy halmaza és azok osztályba tartozási függvénye (tanító halmaz), találjuk meg a szabályosságokat ami alapján korábban nem látott egyedeket be tudjuk az adott osztályokba.
3
Gépi tanulás Legfontosabb részfeladatok: egyed-jellemzők megtalálása megfelelő tanuló módszer kiválasztása, hangolása kiértékelés és visszacsatolás
4
Jellemzők Cél minden olyan jellemző összegyűjtése ami segítheti a predikciót (manuális) Tartsuk szem előtt a problémát! Típusai: diszkrét: értékek véges halmaza, nincs rendezés folytonos
5
Tanuló algoritmus
6
Kiértékelés és visszacsatolás Kiértékelési metrika: a jelölés jóságának (gold standard címkékhez viszonyított) leképezése egyetlen értékre. Feladatonként más és más metrika: „Hány spam-et jelöltünk spamnek” Visszacsatolás: elemzzük a hibáinkat! Lehetőségek: új jellemzők felvétele, paraméterek hangolása, stb.
7
Például egyedek: e-mailek osztályok: SPAM vagy HAM adott egy tanuló adatbázis és ismeretlenelemek egy halmaza (teszt) feladat: tesztegyedek osztályba sorolása jellemzők: projekt munka tanuló algoritmus: J48 (C4.5) döntési fa kiértékelés (program) visszacsatolás…
8
A tanuló adatbázis mérete
9
POS tagger gépi tanulással jellemzők: első X morfológiai kódja a kérdéses szónak és a környező szavak (+/- 3 szó) lehetséges kódjai Másik lehetőség: iteratív javítás (rule induction) 1. minden szó kapjon véletlen kódot 2. Jellemzők: szó lehetséges kódja és szomszédok „jelölt” kódjai
10
Szintaktikai elemzés A mondat egységeinek azonosítása, a közöttük lévő szintaktikai kapcsolatok feltárása. Megközelítések: alany, állítmány, tárgy … szintaxis fa (syntactic parsing) Függőségi nyelvtan (dependency parsing)
11
Szintaxis fa S: mondat VP: igei csoport NP: főnévi csoport Egy példa a Szeged TreeBank-ből
12
Szintaxis fa Főige: robbed alany: the burglar robbed tárgya: the appartament
13
Strukturális többértelműség Láttam a lányt távcsővel. S VP NP
14
Strukturális többértelműség Láttam a lányt távcsővel. S VP NP
15
Szintaxis fa Haszna: gépi fordítás információ kinyerés … Megjegyzés: ~környezetfüggetlen nyelvtan (CFG), amit tényleg alkalmazásokban használnak: PCFG Másfajta megközelítés: zárójelezés (bracketing) ((A kutya)(nagyon ugatott).)
16
Top - Down elemzés a doghas a bone DetN S NPVP DetN VNP
17
Bottom-Up elemzés adoghasabone S DetNV N NP VP
18
Shift Reduce elemzés Bottom – Up, backtrack nélkül Verem segítségével dolgozik, O(n) Shift: Leválasztja a mondat legbaloldalibb elemét, és a verembe teszi. Reduce: A veremben lévő elemekre próbál szabályt illeszteni.
19
Shift Reduce elemzés →| StepActionStackInput 0(start)the dog barked 1shiftthedog barked 2reduceddog barked 3shiftdog dbarked 4reducen dbarked 5reducenpbarked 6shiftbarked np 7reducev np 8reducevp np 9reduce s
20
Shift Reduce tanulás Tanító halmaz alapján: reduce szabályok generálása szabályok közötti sorrend felállítása (maximum likelyhood) akciók (S/R) alkalmazásának tanulása
21
Függőségi nyelvtan Irányított, bináris kapcsolat szavak közt Kiindulási pont a főige Eltérés a szintaktikai fától: Nincsenek frázisok (szavak komponensei) Nem csak az egymást követő szavak közti kapcsolatokat vizsgálja
22
Függőségi nyelvtan Különösen alkalmas szabad szórendű nyelvek kezelésére!
Hasonló előadás
© 2024 SlidePlayer.hu Inc.
All rights reserved.