Gépi tanulási módszerek febr. 9.

Slides:



Advertisements
Hasonló előadás
Tutori tevékenység a gyakorlatban
Advertisements

ADATBÁZISOK.
Informatikai tudásleképezés paradigmái és problémái Szekeres András Márk.
Pac-Man játék tanulása Megerősítéses Tanulással Mesterséges Intelligencia algoritmusok tesztelése játékokon Gyenes Viktor Eötvös Loránd Tudományegyetem.
Képességszintek.
A partnerközpontú intézmények plusz anyagi forrásai a kompetencia alapú oktatás vonatkozásában Előadó: Danyi Gyula.
MI 2003/9 - 1 Alakfelismerés alapproblémája: adott objektumok egy halmaza, továbbá osztályok (kategóriák) egy halmaza. Feladatunk: az objektumokat - valamilyen.
A PEDAGÓGIAI KUTATÁS FOLYAMATA
Készítette: Zaletnyik Piroska
Digitális képanalízis
Szoftver minőség és menedzsment Mérés és elemzés Sziládi Zoltán.
SAS Enterprise Miner 2. gyakorlat
Vizuális modellezés Uml és osztálydiagram UML eszközök
Bevezetés a gépi tanulásba február 16.. Mesterséges Intelligencia „A számítógépes tudományok egy ága, amely az intelligens viselkedés automatizálásával.
Gépi tanulási módszerek febr. 13.
Számítógépes nyelvészeti alkalmazások Farkas Richárd szept 7.
Gépi tanulási módszerek
Osztályozás -- KNN Példa alapú tanulás: 1 legközelebbi szomszéd, illetve K-legközelebbi szomszéd alapú osztályozó eljárások.
Gépi tanulási módszerek febr. 20.
Rangsorolás tanulása ápr. 24..
Szintaktikai elemzés március 1.. Gépi tanulás Osztályozási feladat: Adott egyedek egy halmaza és azok osztályba tartozási függvénye (tanító halmaz),
MI 2003/ Alakfelismerés - még egy megközelítés: még kevesebbet tudunk. Csak a mintánk adott, de címkék nélkül. Csoportosítás (klaszterezés, clustering).
Objektum osztályozás Képfeldolgozás 2. Blaskovics Viktor, Hantos Norbert, Papp Róbert Sándor.
A SAT probléma különböző reprezentációinak vizsgálata oktatási szempontból (újratöltve) Az általánosítás fegyvere a kutatásban Kusper Gábor,
Adatbázis-kezelés ACCESS program:
Modellezés és tervezés c. tantárgy Óbudai Egyetem Neumann János Informatikai Kar Alkalmazott Matematikai Intézet Mérnöki Informatikus MSc 9. Előadás és.
Online hasonlóságelemzések: Online hasonlóságelemzések: Tapasztalatok (kukorica) hozamfüggvények levezetése kapcsán Pitlik László, SZIE Gödöllő (Forrás:
ISMERETALAPÚ RENDSZEREK SZAKÉRTŐ RENDSZEREK
Az Alakfelismerés és gépi tanulás ELEMEI
Vámossy Zoltán 2004 (H. Niemann: Pattern Analysis and Understanding, Springer, 1990) DIP + CV Bevezető II.
Szakértők és rendszerek
Marketingkutatás 3. szeminárium Nagy Gábor március. 29.
Textúra elemzés szupport vektor géppel
Gépi tanulás Tanuló ágens, döntési fák, általános logikai leirások tanulása.
Kézdi Árpád Államháztartási Szabályozási Főosztály
Többváltozós adatelemzés
Alapsokaság (populáció)
Belami beszámoló – Doménadaptációs alkalmazások. Problémafelvetés Felügyelt tanulás elvégzéséhez gyakran kevés jelölt adat áll rendelkezésre  doménadaptáció.
Részecskenyom analízis és osztályozás Pálfalvi József MSc, Intelligens Rendszerek, Önálló labor 1.
Mire jó a FIT elemző szoftver?
Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika és Információs Rendszerek Tanszék Megerősítő elemzés „Big Data” elemzési módszerek Salánki.
Nyelvi interfészek. IBM Watson 8:20 ill. 3:00.
Marketing információs
Részecskenyom analízis és osztályozás Pálfalvi József MSc, Intelligens Rendszerek, Önálló labor 1. Egyetemi konzulens: dr. Dobrowiecki Tadeusz (BME MIT)
MI 2003/8 - 1 Alakfelismerés alapproblémája: adott objektumok egy halmaza, továbbá osztályok (kategóriák) egy halmaza. Feladatunk: az objektumokat - valamilyen.
Kutatási beszámoló 2002/2003 I. félév Iváncsy Renáta.
Példa fogalom tanulására
Chapter 2 Human Information Processing
PÁRHUZAMOS ARCHITEKTÚRÁK – 13 INFORMÁCIÓFELDOLGOZÓ HÁLÓZATOK TUDÁS ALAPÚ MODELLEZÉSE Németh Gábor.
Gépi tanulási módszerek
Fejmozgás alapú gesztusok felismerése Bertók Kornél, Fazekas Attila Debreceni Egyetem, Informatikai Kar Debreceni Képfeldolgozó Csoport KÉPAF 2013, Bakonybél.
Bevezetés a tudományos kutatás és írás gyakorlatába 3. alkalom október 21.
Bevezetés a tudományos kutatás és írás gyakorlatába 2. alkalom október 7.
Természetes nyelvi interfészek
Projektorientált matematikaoktatás
“Tudásmegosztás és szervezeti problémamegoldás a mesterséges intelligencia korában” Levente Szabados Technológiai Igazgató.
A problémamegoldás 7 lépéses módszere:
Számításelmélet Tárgykód: NGM_IN006_1 és LGM_IN006_1
„Big Data” elemzési módszerek
Gépi tanulási módszerek febr. 11.
Gépi tanulási módszerek febr. 18.
A gépi tanulás célja Cél: Olyan programok létrehozása, amelyek a működésük során szerzett tapasztalatok segítségével képesek javítani a saját hatékonyságukon.
A évi kompetenciamérés FIT-jelentéseinek új elemei
Pattern Classification All materials in these slides were taken from Pattern Classification (2nd ed) by R. O. Duda, P. E. Hart and D. G. Stork, John.
Pattern Classification All materials in these slides were taken from Pattern Classification (2nd ed) by R. O. Duda, P. E. Hart and D. G. Stork, John.
Gépi tanulás.
A mesterséges neuronhálók alapjai
Nyelvi és képi problémák
Mesterséges neuronhálók és alkalmazásaik
GÉPI TANULÁSI ALAPFOGALMAK
Előadás másolata:

Gépi tanulási módszerek febr. 9. Bevezetés Gépi tanulási módszerek febr. 9.

Gépi tanulás Hogyan építhető olyan számítógépes rendszer, amelynek a teljesítménye automatikusan javul tapasztalatok gyűjtésével?

Teljesítés szóbeli vizsga elégséges: a húzott tételhez kapcsolódó alapfogalmakat, magát a problémát érti, a megoldás alapjaival tisztában van közepes: a húzott tételt mélységében (fontosabb képletek is) érti jó: az egész anyagot átlátja, a tételen kívüli kérdésekre (összefüggések) is tud válaszolni jeles: matematikai mélységeket is ismeri (minden képlet, levezetések stb.)

Spam szűrés

arc/személy felismerés demo

Ajánló rendszerek

Robotika

Természetesnyelv-feldolgozás

még alkalmazási területek Biometrikus azonosítás Objektumok felismerése képeken Beszédfelismerés és generálás Gyógyszerkutatás Banki adatok, tőzsde elemzése Folyamatoptimalizálás Pattern Classification, Chapter 1

Big Data

Szabály-alapú rendszerek vs. gépi tanulás 11 Szabály-alapú rendszerek vs. gépi tanulás szakértőre szükség van szabályírás vagy tanítópéldák, tulajdonságok Melyik a költségesebb? szakértő tud szabályrendszert írni? tanító adatbázis költsége? mennyire specifikus a probléma?

Gépi tanulás jelen és jövő 12 Gépi tanulás jelen és jövő egyre több alkalmazásban van jelen „úszunk az adatban, miközben szomjazunk az információra” technológiai fejlettség és elterjedtség igény az egyre nagyobb fokú automatizálásra és perszonalizációra Vannak megoldott problémák, de számos nyitott kutatási kérdés is!

http://www.ml-class.org/course

Alakfelismerés Most of the materials in these slides were taken from Pattern Classification (2nd ed) by R. O. Duda, P. E. Hart and D. G. Stork, John Wiley & Sons, 2000 with the permission of the authors and the publisher

Gépi tanulás definíciója 16 Gépi tanulás definíciója Gépi Tanulás (Mitchell): „a computer program said to learn from experience E with respect to some class of tasks T and performance measure P, if its performance at tasks in T, as measured by P, improves with experience E.”

17 Példa Osztályozzunk halakat egy szállítószalagon, optikai érzékelőt használva! tengeri sügér (see bass) Fajok lazac (salmon) Modell (fogalmak és rendszerek szerkezeti leírása): itt a vizsgált objektumok leírása (pl. lazac – rövidebb) Pattern Classification, Chapter 1

18 Osztályozás (T) Felügyelt (induktív) tanulás (supervised learning): tanító halmaz (training examples, E) alapján olyan modell tanulása ami korábban nem látott példákon is helyesen működik. Osztályozás: előre definiált kategóriákba besorolás. Pattern Classification, Chapter 1

19 Pattern Classification, Chapter 1 19

Példa - előfeldolgozás 20 Példa - előfeldolgozás Használjunk valamilyen szegmentálót a halak egymástól és a háttértől való elválasztására Az egy halról meglevő információt egy információkinyerőnek küldjük, hogy bizonyos tulajdonságok kinyerésével (feature extraction) csökkentsük az adatok mennyiségét A tulajdonságokat egy osztályozónak adjuk tovább Pattern Classification, Chapter 1

Példa - tulajdonságok tulajdonság=jellemző (feature) 21 Példa - tulajdonságok tulajdonság=jellemző (feature) néhány lehetséges tulajdonság: Hossz Világosság Szélesség Az uszonyok száma és alakja A száj elhelyezkedése, stb Pattern Classification, Chapter 1

Osztályozás alapfogalmai Jellemző (attribútum, feature) ID Hossz Fényesség Típus 1 28 0.5 Sügér 2 23 0.7 3 17 Lazac Egyed (példány, instance) Osztálycímke (class label)

23 Pattern Classification, Chapter 1

24 Példa - tulajdonságok A hossz gyenge megkülönböztetési erővel rendelkezik. Válasszuk a fényességet egy második próbálkozáshoz tulajdonságként. Pattern Classification, Chapter 1

25 Pattern Classification, Chapter 1

Döntéselméleti feladat! 26 Hibafüggvény (P) fals pozitív/fals negatív hiba A kétfajta hiba azonos költségű? Például ha csökkentjük a döntési küszöbértéket csökken azon tengeri sügérek száma, amelyeket tévesen lazacnak osztályoztunk Döntéselméleti feladat! Pattern Classification, Chapter 1

Pontosság és Fedés (P) Találati arány (accuracy): TP+TN / TP+TN+FP+FN elvárt predikált P N TP FP FN TN Találati arány (accuracy): TP+TN / TP+TN+FP+FN Pontosság (precision): TP / TP+FP Fedés (recall): TP / TP+FN F-mérték: harmónikus közép

Tulajdonságvektor A fényességet mellé vegyük a szélességét is 28 Tulajdonságvektor A fényességet mellé vegyük a szélességét is Hal xT = [x1, x2] Fényesség Szélesség Pattern Classification, Chapter 1

29 Pattern Classification, Chapter 1

30 Tulajdonságvektor További tulajdonságokat is vehetünk még hozzá. Óvatosnak kell lenni, hogy túl „zajos” (pl. mérési hiba) felesleges (pl. erősen korrelál másik tulajdonsággal) tulajdonságokkal ne rontsuk a rendszer hatékonyságát! Jól diszkrimináló tulajdonságokat keressünk! Erősen problémafüggőek lehetnek a tulajdonságok! Pattern Classification, Chapter 1

31 Pattern Classification, Chapter 1

32 Általánosítás Ez sajnos nem valószínű, hogy ideális lesz, hiszen eddig még nem látott inputokra kell jó osztályozást adnunk! Általánosítás vs. túltanulás/túlillesztés (overfitting) Pattern Classification, Chapter 1

33 Pattern Classification, Chapter 1

Reprezentáció Tulajdonságok száma? Egyszerű felület? Gyors döntés? 34 Reprezentáció Tulajdonságok száma? Egyszerű felület? Gyors döntés? A problémáról való ismeret beépítése csökkenti a komplexitást! Pattern Classification, Chapter 1

Kiértékelés Kiértékelési metrika (pl. hibaarány kiszámítása) 35 Kiértékelés Kiértékelési metrika (pl. hibaarány kiszámítása) Túltanulás elkerülésére elkülönítünk egy teszt adathalmazt szimuláljuk a „nem ismert” példákat Pattern Classification, Chapter 1

Példa - Gépi tanulás definíciója 36 Példa - Gépi tanulás definíciója Task (feladat): osztályozzunk kértdimenziós valós vektorokat két osztályba (lazac, tengeri sügér) Experience (tapasztalat): egy tanító halmaz, amelyikben ismert osztályba tartozó halaknál mért számpárok adottak Performance (hatékonyság): eddig nem látott halakhoz tartozó számpárok alapján helyes osztályozás aránya

Gépi tanulási ciklus Adatgyűjtés Tulajdonság(ok) kiválasztása 37 Gépi tanulási ciklus Adatgyűjtés Tulajdonság(ok) kiválasztása Modell választása Tanítás Kiértékelés Pattern Classification, Chapter 1

38 Adatgyűjtés Honnan tudjuk, hogy elegendően nagy és reprezentatív mintát (példát, samples) gyűjtöttünk a rendszer tanításához és teszteléséhez? Pattern Classification, Chapter 1

Modell kiválasztása és tanítás 39 Modell kiválasztása és tanítás A halak osztályozására eddig használt módszerrel elégedetlenek vagyunk, új módszer Az adatokat használjuk az osztályozó meghatározásához. Nagyon sok módszer az osztályozók tanítására és a modell választására… No free lunch! Pattern Classification, Chapter 1

Tematika Osztályozás Regresszió Klaszterezés Ajánló rendszerek 40 Tematika Osztályozás Regresszió Klaszterezés Ajánló rendszerek Rangsorolás Struktúra előrejelzés Visszacsatolásos tanulás

Aktívan kutatott területek 41 Aktívan kutatott területek Komplex kimenetek (csoportok hierarchiái, sorozatok, gráfok) Tanulás kevesebb tanuló adatból félig felügyelt tanulás, egyosztályos tanulók… (inter)aktív tanulás Domain adaptáció Gépi tanulási rendszerek „big data” data privacy

https://www.kaggle.com/competitions

Véleménydetekció

Előnyök Hátrányok Klasszikus közvélemény-kutatásnál nagyobb minta Jóval olcsóbb Dinamika/trendek monitorozhatóak Reprezentatív? Speciális témákról kevés adat Hátrányok

Kihívások Emberi nyelv/kreativitás nagyon gazdag Elgépelések Mire vonatkozik a vélemény? Különböző nyelvek Különböző források Különböző témák Sokszor a kontextus nagyon fontos

~10K tanító adatbázis gépi tanult modellek ~10M predikció naponta