Előadást letölteni
Az előadás letöltése folymat van. Kérjük, várjon
KiadtaJudit Tóthné Megváltozta több, mint 10 éve
1
Belami beszámoló – Doménadaptációs alkalmazások
2
Problémafelvetés Felügyelt tanulás elvégzéséhez gyakran kevés jelölt adat áll rendelkezésre doménadaptáció Cél: teszt halmaz doménjétől eltérő eloszlású doménen tanított modell adaptálása –Az adaptált modell pontosságának maximalizálása (hibájának minimalizálása) a teszt halmazon
3
Doménadaptáció Adottak forrás (F) és cél (C) doménből származó adatok Adateloszlásuk és méretük (|F|>>|C|) azonban nagy mértékű kiegyensúlyozatlanságot mutathat Feladat: forrás doménen szerzett tudás átültetése cél doménre
4
Hagyományos felügyelt tanulás Tanuló Modell Adott domén teszt adatainak eloszlása Predikció Adott domén tanító adatainak eloszlása
5
Doménadaptációs tanulás TanulóModell Forrás domén teszt adatainak eloszlása Cél domén tanító adatainak eloszlása Cél domén teszt adatainak eloszlása Transzformáció tanulása Transzformált modell Predikció Forrás domén tanító adatainak eloszlása Predikció
6
Transzformáció alapú doménadaptáció * * * ** * * * * * * * * * * * oo o o o o o o o o Cél doménForrás domén * * * * * * * * * * * * * * * * o o o o o o o o o o Ismert határ Ismeretlen határ Φ transzformáció * * * * * * * * * * * * o o o o Feladat: a hibafüggvény minimalizálása Gépi tanulás
7
Kísérletek szintetikus adathalmazon 2D pontok, 2 osztály |Forrás domén| = 1000 Tanító-teszt példákra bontás 80-20% arányban Lineáris SVM Cél domén eloszlása az eredeti 90°-os elforgatásával
8
Eredmények a szintetikus adathalmazon
14
Doménadaptáció a véleménydetekcióban Véleménydetekció –Írott felhasználói vélemények osztályozása, annak megfelelően, hogy pozitív vagy negatív tartalmat fejeznek ki –Doménadaptáció: a tanítás során túlsúlyban vannak a kiértékelés doménjétől eltérő típusú dokumentumok Amazon.com-ról gyűjtött 4 eltérő terméktípussal (domén) kapcsolatos véleményezések szövegei –Könyvek, DVD-k, elektronikai berendezések, konyhai eszközök
15
Előfeldolgozás Kiegyensúlyozott adathalmazok –1000-1000 pozitív és negatív példa ~ 5000 dimenziós jellemzőtér Véletlenszerű (20%-os) teszthalmaz kialakítása Jellemzőredukció (InfoGain és PCA) –> 0 értékűek megtartása –dimenziócsökkentés főkomponens analízissel Az elért eredmények 10 tanulás átlagából számítottak
16
Eredmények valós adatokon
17
Összegzés Kis számú céldoménbeli tanítópélda használata melletti eredményes tanulás A forrásdomén példáinak ismerete nélküli adaptáció képessége (csupán a tanult modell módosításán keresztül) –Előny pl., amennyiben a forrásdomén tanítópéldái érzékeny adatokat tartalmaznak, nem hozzáférhetők
18
Témában megjelent publikáció Róbert Ormándi, István Hegedűs, Richárd Farkas: Opinion Mining by Transformation-Based Domain Adaptation. ProceedingTSD'10 Proceedings of the 13th international conference on Text, speech and dialogue
Hasonló előadás
© 2024 SlidePlayer.hu Inc.
All rights reserved.