Belami beszámoló – Doménadaptációs alkalmazások. Problémafelvetés Felügyelt tanulás elvégzéséhez gyakran kevés jelölt adat áll rendelkezésre  doménadaptáció.

Slides:



Advertisements
Hasonló előadás
Összetett kísérleti tervek és kiértékelésük:
Advertisements

Vélemények a tehetségről
Kompetencia alapú oktatás TÁMOP pályázat Rumi Rajki István ÁMK Rum.
Tisztelt Látogatóink! Szeretnénk rövid tájékoztatást adni az általános iskolában megvalósuló új tanulásszervezési eljárásokról és azok tartalmáról a TÁMOP.
Iskolai teljesítmény pszichológiai determinánsai
Horváth Cz. János Új tanulási környezetek a tudásalapú társadalom oktatási rendszerében Magyarországon.
Tanfolyam megszervezése Képzés módszerei SZTE JGYPK Felnőttképzési Intézet 2009/2010. I. félév Szeged.
Minőségi adatok biztosítása az adattárházakban Készítette: Fehér Péter
MI 2003/9 - 1 Alakfelismerés alapproblémája: adott objektumok egy halmaza, továbbá osztályok (kategóriák) egy halmaza. Feladatunk: az objektumokat - valamilyen.
E-learning és a multimédia
Önálló Laboratórium II. Készítette: Varga Róbert
Agy-számítógép interfész virtuális terekben
Sűrűségfüggvény Parzen becslés Mintapontszám, szigma.
SAS Enterprise Miner 2. gyakorlat
Bevezetés a gépi tanulásba február 16.. Mesterséges Intelligencia „A számítógépes tudományok egy ága, amely az intelligens viselkedés automatizálásával.
Gépi tanulási módszerek
Osztályozás -- KNN Példa alapú tanulás: 1 legközelebbi szomszéd, illetve K-legközelebbi szomszéd alapú osztályozó eljárások.
Rangsorolás tanulása ápr. 24..
Szintaktikai elemzés március 1.. Gépi tanulás Osztályozási feladat: Adott egyedek egy halmaza és azok osztályba tartozási függvénye (tanító halmaz),
Adatbányászat. Miért kell menedzselni a tudást és az adatokat? Az adatok mennyisége folyamatosan nő Az elektronikus dokumentáltság növeli az átláthatatlan.
Zákányszéki Általános Iskola és Alapfokú Művészetoktatási Intézmény prezentációja 2009.
Mesterséges neuronhálózatok
Tudástranszfer egyetemi városokban
TERMELÉSI FÜGGVÉNYEK A PRECÍZIÓS MEZŐGAZDASÁGBAN SZENT ISTVÁN EGYETEM GAZDASÁG- ÉS TÁRSADALOMTUDOMÁNYI KAR TUDOMÁNYOS DIÁKKÖRI KONFERENCIA NOVEMBER.
TÁMOP / „Átfogó minőségfejlesztés a közoktatásban ” A Magyar Képesítési Keretrendszer fejlesztése 5. pillér – MKKR és a közoktatás.
Készítette: Kosztyán Zsolt Tibor
2009. április 24.XVI.Budapesti Nemzetközi Könyvfesztivál Kereslet és kínálat e-book témában Moldován István OSZK.
Az Alakfelismerés és gépi tanulás ELEMEI
Lázár István Témavezető: Hajdu András
Egytényezős variancia-analízis
Hasznos információk a kétszintű kémia érettségiről
Textúra elemzés szupport vektor géppel
1 Az EMC témaköre, EMC Irányelv Zavarok frekvencia tartomány szerinti elhelyezkedése Az EMC megvalósításának módszere.
„Kompetencia alapú oktatás, egyenlő hozzáférés – Innovatív intézményekben” TÁMOP / /0065 Moduláris oktatás Az egészséged a Te kezedben van!
Gépi tanulás Tanuló ágens, döntési fák, általános logikai leirások tanulása.
1 Tudásalapú információ-kereső rendszerek elemzése és kifejlesztése Célkitűzés: Információk téma-specifikus, különböző típusú forrásokból (internet, intranet.
Az ember futhat, de nem menekülhet a megmérettetés elől. Az egyetlen gyerek se maradjon ki a mérésből jelszavát hangoztató korban az oktatásban dolgozóknak.
Tanulói laptopokkal a középszintű magyar érettségi felé
Alapsokaság (populáció)
UNIVERSITY OF SZEGED D epartment of Software Engineering UNIVERSITAS SCIENTIARUM SZEGEDIENSIS 5.4 Szolgáltatói Keretrendszerek Prof. Dr. Gyimóthy Tibor,
Részecskenyom analízis és osztályozás Pálfalvi József MSc, Intelligens Rendszerek, Önálló labor 1.
Differenciált tanulásszervezés 2. TKM1016L
Gyermekvilág régen és ma
Orvosbiológiai képkereső rendszer teljesítményének képek osztályozásán alapuló javítása Június 23, 2008 Budapest Altrichter Márta Konzulens: dr. Horváth.
Kooperatív oktatással a befogadás támogatásáért
Mérnöki tervezés december Hangelemző rendszer fejlesztése Symbian OS-re Hegedűs Iván Mihály Pázmány Péter Katolikus Egyetem Információs Technológiai.
Véleménydetekció különböző szinteken Richard Farkas SZTE.
Valószínűségszámítás II.
Automatikus dokumentum- feldolgozó megoldások
Részecskenyom analízis és osztályozás Pálfalvi József MSc, Intelligens Rendszerek, Önálló labor 1. Egyetemi konzulens: dr. Dobrowiecki Tadeusz (BME MIT)
MI 2003/8 - 1 Alakfelismerés alapproblémája: adott objektumok egy halmaza, továbbá osztályok (kategóriák) egy halmaza. Feladatunk: az objektumokat - valamilyen.
Tóth Gergely, február BME-MIT Miniszimpózium, Folytonos idejű rendszerek anonimitása Tóth Gergely Konzulens: Hornák Zoltán.
Gépi tanulási módszerek
PhD beszámoló 2003/2004 I. félév Készítette: Iváncsy Renáta Konzulens: Dr. Vajk István.
Hatékony-e az e-olvasás? – e-könyv vs. papír
Varga Noémi Judit. Mi köze a szövegnek a matematikához?
Kompetenciafejlesztés - Tankönyvek
Gépi tanulási módszerek febr. 9.
Idegen nyelvek tanítása az alternatív iskolákban
Balázsi Ildikó Oktatási Hivatal
Gépi tanulási módszerek febr. 18.
Tóth Zoltán és Szalay Luca
Szani Ferenc, Pitlik László, Balogh Anikó
IRODALOMKUTATÁSI MÓDSZEREK Varga Attila Testnevelési Egyetem Sporttudományi Doktori Iskola PhD II. évfolyam Témavezető: Dr.Kokovay Ágnes
Szupportvektor-gépek A diák többsége innen származik: csd
A mesterséges neuronhálók alapjai
3. osztályban.
GÉPI TANULÁSI ALAPFOGALMAK
Gépi tanulási alapfogalmak
Adat-előfeldolgozás jellemzőtér-transzformációs módszerekkel
Előadás másolata:

Belami beszámoló – Doménadaptációs alkalmazások

Problémafelvetés Felügyelt tanulás elvégzéséhez gyakran kevés jelölt adat áll rendelkezésre  doménadaptáció Cél: teszt halmaz doménjétől eltérő eloszlású doménen tanított modell adaptálása –Az adaptált modell pontosságának maximalizálása (hibájának minimalizálása) a teszt halmazon

Doménadaptáció Adottak forrás (F) és cél (C) doménből származó adatok Adateloszlásuk és méretük (|F|>>|C|) azonban nagy mértékű kiegyensúlyozatlanságot mutathat Feladat: forrás doménen szerzett tudás átültetése cél doménre

Hagyományos felügyelt tanulás Tanuló Modell Adott domén teszt adatainak eloszlása Predikció Adott domén tanító adatainak eloszlása

Doménadaptációs tanulás TanulóModell Forrás domén teszt adatainak eloszlása Cél domén tanító adatainak eloszlása Cél domén teszt adatainak eloszlása Transzformáció tanulása Transzformált modell Predikció Forrás domén tanító adatainak eloszlása Predikció

Transzformáció alapú doménadaptáció * * * ** * * * * * * * * * * * oo o o o o o o o o Cél doménForrás domén * * * * * * * * * * * * * * * * o o o o o o o o o o Ismert határ Ismeretlen határ Φ transzformáció * * * * * * * * * * * * o o o o Feladat: a hibafüggvény minimalizálása Gépi tanulás

Kísérletek szintetikus adathalmazon 2D pontok, 2 osztály |Forrás domén| = 1000 Tanító-teszt példákra bontás 80-20% arányban Lineáris SVM Cél domén eloszlása az eredeti 90°-os elforgatásával

Eredmények a szintetikus adathalmazon

Doménadaptáció a véleménydetekcióban Véleménydetekció –Írott felhasználói vélemények osztályozása, annak megfelelően, hogy pozitív vagy negatív tartalmat fejeznek ki –Doménadaptáció: a tanítás során túlsúlyban vannak a kiértékelés doménjétől eltérő típusú dokumentumok Amazon.com-ról gyűjtött 4 eltérő terméktípussal (domén) kapcsolatos véleményezések szövegei –Könyvek, DVD-k, elektronikai berendezések, konyhai eszközök

Előfeldolgozás Kiegyensúlyozott adathalmazok – pozitív és negatív példa ~ 5000 dimenziós jellemzőtér Véletlenszerű (20%-os) teszthalmaz kialakítása Jellemzőredukció (InfoGain és PCA) –> 0 értékűek megtartása –dimenziócsökkentés főkomponens analízissel Az elért eredmények 10 tanulás átlagából számítottak

Eredmények valós adatokon

Összegzés Kis számú céldoménbeli tanítópélda használata melletti eredményes tanulás A forrásdomén példáinak ismerete nélküli adaptáció képessége (csupán a tanult modell módosításán keresztül) –Előny pl., amennyiben a forrásdomén tanítópéldái érzékeny adatokat tartalmaznak, nem hozzáférhetők

Témában megjelent publikáció Róbert Ormándi, István Hegedűs, Richárd Farkas: Opinion Mining by Transformation-Based Domain Adaptation. ProceedingTSD'10 Proceedings of the 13th international conference on Text, speech and dialogue