Arci jellemzők kinyerése és vizsgálata ember-gép interakciókban

Slides:



Advertisements
Hasonló előadás
ÉRDEKES PONTOK KINYERÉSE DIGITÁLIS KÉPEKEN. BEVEZETÉS  ALAPPROBLÉMA  Jellemzőpontok detektálása mindkét képen  Kinyert pontok megfeleltetése  Megfeleltetések.
Advertisements

Fejmozgás alapú gesztusok felismerése
Néhány fontos terület a Kreatív Ipar fejlődéséhez
F IGYELMI ALGORITMUSOKKAL VEZÉRELT HELYSZÍNANALÍZIS A BIONIKUS SZEMÜVEGBEN Persa György.
Balogh Tamás, Koós Krisztián, Laczi Balázs, Tari Tamás 2013 Tavasz.
1 AIBO Robotfoci Bodor László IAR Bevezetés AIBO RoboCup AIBO RoboCup Célok Célok Rendszer elemei Rendszer elemei Megvalósítás terve Megvalósítás.
MI 2003/9 - 1 Alakfelismerés alapproblémája: adott objektumok egy halmaza, továbbá osztályok (kategóriák) egy halmaza. Feladatunk: az objektumokat - valamilyen.
MI 2003/ A következőkben más megközelítés: nem közvetlenül az eloszlásokból indulunk ki, hanem a diszkriminancia függvényeket keressük. Legegyszerűbb:
Foltkeresés tüdő röntgen képeken
Globális helymeghatározás Zárthelyi dolgozat Relatív helymeghatározás fázisméréssel.
Sűrűségfüggvény Parzen becslés Mintapontszám, szigma.
Digitális képanalízis
Térinformatikai elemzések. Megválaszolható kérdések Pozíció - mi van egy adott helyen Feltétel - hol vannak …? Trendek - mi változott meg? Minta - milyen.
Klasszikus mechanikai kéttestprobléma és merev test szabad mozgása állandó pozitív görbületű sokaságon Kómár Péter témavezető: Dr. Vattay Gábor
Csoportosítás megadása: Δx – csoport szélesség
Mozgó Objektumok Detektálása és Követése Robotkamera Segítségével
Naïve Bayes, HMM.
Gépi tanulási módszerek
Balogh Tamás, Koós Krisztián, Laczi Balázs, Tari Tamás 2013 Tavasz.
MI 2003/ Alakfelismerés - még egy megközelítés: még kevesebbet tudunk. Csak a mintánk adott, de címkék nélkül. Csoportosítás (klaszterezés, clustering).
Intelligens ébresztő óra Számítógépes látás projekt 2011.
Objektum osztályozás Képfeldolgozás 2. Blaskovics Viktor, Hantos Norbert, Papp Róbert Sándor.
Dr. Szalka Éva, Ph.D.1 Statisztika II. VII.. Dr. Szalka Éva, Ph.D.2 Mintavétel Mintavétel célja: következtetést levonni a –sokaságra vonatkozóan Mintavétel.
Vámossy Zoltán 2004 (Mubarak Shah, Gonzales-Woods anyagai alapján)
Vámossy Zoltán 2006 Gonzales-Woods, SzTE (Kató Zoltán) anyagok alapján
Szabó Attila, Cross-entrópia alkalmazása a megerősítéses tanulásban.
Hierarchikus klaszteranalízis
Az Alakfelismerés és gépi tanulás ELEMEI
Dr. Balogh Péter Gazdaságelemzési és Statisztika Tanszék DE-AMTC-GVK
Implementált képfeldolgozó algoritmusok
HATÉKONY SAJÁTSÁGKIEMELŐK KÉPEK ÖSSZEHASONLÍTÁSÁHOZ MobileAssistant workshop, május 4. Főnix Inkubátorház, 4029 Debrecen, Csapó u. 42. A ép III/2.
Fejmozgás alapú gesztusok felismerése Bertók Kornél, Fazekas Attila Debreceni Egyetem, Informatikai Kar Debreceni Képfeldolgozó Csoport KÉPAF 2013, Bakonybél.
Fejmozgás alapú gesztusok felismerése Bertók Kornél, Fazekas Attila Debreceni Egyetem, Informatikai Kar Debreceni Képfeldolgozó Csoport KÉPAF 2013, Bakonybél.
Fejmozgás alapú gesztusok felismerése Bertók Kornél, Fazekas Attila Debreceni Egyetem, Informatikai Kar Debreceni Képfeldolgozó Csoport KÉPAF 2013, Bakonybél.
3. Vetületi ábrázolások számítási eljárásai
Ipari képfeldolgozás projekt II. mérföldkő
Textúra elemzés szupport vektor géppel
Lineáris programozás.
Problémás függvények : lokális optimalizáció nem használható Globális optimalizáció.
Optimalizáció modell kalibrációja Adott az M modell, és p a paraméter vektora. Hogyan állítsuk be p -t hogy a modell kimenete az x bemenő adatokon a legjobban.
Valószínűségszámítás
Képfeldolgozási módszerek alkalmazása kajszimagok morfológiai tulajdonságainak leírására Felföldi J. 1, Hermán R. 2, Pedryc A. 2, Firtha F. 1 1 Budapesti.
Adatbányászati módszerek a térinformatikában
Többváltozós adatelemzés
Többváltozós adatelemzés
Alapsokaság (populáció)
Budapesti Műszaki Főiskola Neumann János Informatikai Kar Informatikai Automatizált Rendszerek Konzulens: Vámossy Zoltán Projekt tagok: Marton Attila Tandari.
Kézmozdulat felismerő rendszer
Belami beszámoló – Doménadaptációs alkalmazások. Problémafelvetés Felügyelt tanulás elvégzéséhez gyakran kevés jelölt adat áll rendelkezésre  doménadaptáció.
Költség-minimalizálás az ellenőrző kártyák alkalmazásánál Feladatmegoldás, kiegészítés.
Digitális képanalízis Pontoperátorok, matching. Nézzünk egy példát!
KINECT© szenzor intelligens terekben
Paleobiológiai módszerek és modellek 7. Hét TÖBBVÁLTOZÓS ADATELEMZÉS
Valószínűségszámítás II.
F IGYELMI ALGORITMUSOKKAL VEZÉRELT HELYSZÍNANALÍZIS Persa György.
előadások, konzultációk
Bevezetés a méréskiértékelésbe (BMETE80ME19)
MI 2003/8 - 1 Alakfelismerés alapproblémája: adott objektumok egy halmaza, továbbá osztályok (kategóriák) egy halmaza. Feladatunk: az objektumokat - valamilyen.
1.  Szerzői:  Panagiotis Bouros (University of Hong Kong),  Shen Ge (University of Hong Kong),  Nikos Mamoulis (University of Hong Kong)  Esemény:
Kutatási beszámoló 2002/2003 I. félév Iváncsy Renáta.
Csoportkeresési eljárások Vassy Zsolt. Tematika Girvan Newman klaszterezés Diszkrét Markov lánc: CpG szigetek Rejtett Markov lánc ADIOS.
Struktúra predikció Struktúra lehet Felügyelt tanulási probléma
Gépi tanulási módszerek
OpenCV CV = Computer Vision
Fejmozgás alapú gesztusok felismerése Bertók Kornél, Fazekas Attila Debreceni Egyetem, Informatikai Kar Debreceni Képfeldolgozó Csoport KÉPAF 2013, Bakonybél.
Több irányú, alaksablonok nélküli épület detekció légiképeken Manno-Kovács Andrea, Szirányi Tamás Elosztott Események Elemzése Kutatócsoport MTA SZTAKI.
3D grafika összefoglalás
Innováció és fenntartható felszíni közlekedés konferencia 2016
ELEMI GEOMETRIAI ISMERETEK
A mesterséges neuronhálók alapjai
Előadás másolata:

Arci jellemzők kinyerése és vizsgálata ember-gép interakciókban Bertók Kornél, Dr. Fazekas Attila Debreceni Egyetem, Informatikai Kar Debreceni Képfeldolgozó Csoport PhD Konferencia, Hollókő 2013. április 4 – 5.

Bevezetés Human-Computer Interaction (HCI) Cél: ember és gép közötti kapcsolatot az ember számára természetesebbé tenni Arcra és arci jellemzőkre korlátozódunk Arcnak meghatározó szerepe van a kommunikációban Emberek megkülönböztetése Életkor, nem, érzelmek felismerése Figyelem középpontjának meghatározása Metakommunikáció (mimika, gesztusok)

Arci jellemzők követése Arc-alapú HCI kutatások alapja: Arci jellemzők követése Az eljárások két nagy csoportba oszthatók Modell mentes módszerek Általános célú pontkövető eljárások Objektum hozzávetőleges helyét detektálják Nem a teljes objektumot keresik, hanem annak csak néhány fontos jellemzőjét Nem rendelkeznek előzetes információval az objektumokról

Arci jellemzők követése Modell mentes módszerek Kevésbé érzékenyek a kezdeti pozícióra Érzékenyek a zajra, takarásra Az objektumnak nagy felbontásúnak kell lennie: Elegendő információ a fontos jellemzők detektálásához Modell alapú módszerek A modellezni kívánt objektum (alakzat) körvonalára fókuszálnak Valamint a körvonal melletti megjelenésre

Arci jellemzők követése Modell alapú módszerek Számos példa létezik a szakirodalomban a deformálható objektumok modellezésére Aktív kontúr modellek (Snake) Deformálható sablonok Active Shape Models (ASM) Active Appearance Models (AAM) Constrained Local Models (CLM) Előzetes tudással rendelkeznek a modellezni kívánt objektumról Probléma: multi-view rendszerre van szükség a forgatás-invarianciához

Active Shape Models Paraméteres statisztikai alakbecslő modell Tanító adatbázis: objektum + körvonal Modell készítés: az alakzatra és az alakzat körüli megjelenésre Az alakzatokat közös koordináta-rendszerben kell ábrázolni Prokrusztész analízis (GPA) Alakzatok pontfelhőt képeznek a 2N dimenziós térben: Egy valószínűségi sűrűségfüggvény egy-egy mintájának tekinthetők

Active Shape Models Konfigurációk segítségével szeretnénk új és hasonló alakzatokat generálni Dimenziószám csökkentés: PCA Kovariancia mátrix: S legnagyobb sajátértékeihez (λi) tartozó sajátvektorai (φi): Alakzatok közelítése: b vektor variálásával újabb x alakzatokat kapunk Modell illesztése: költség függvény minimalizálása

Active Shape Models Modell illesztése Szükségünk van a tanító halmazban lévő alakzatok körüli pixelmintákra, az alakzat határán merőleges irányban Abszolút pixelértékek helyett azok centrális differenciája Differenciák normalizálása, minták átlaga és kovarianciája Mahalanobis-távolság: egy új mintának a modellhez való illeszkedésének mértéke Korreláció vizsgálata a pont környezetében lévő pixelek intenzitás-profiljára

Active Appearance Models ASM hátrányai Nem robosztus a tanítóhalmazban nem szereplő objektumokra Lokális optimalizáció miatt nincs garancia a helyes konvergenciára Nem használja fel az összes szürkeskálás információt az alakzatról AAM: nagyban hasonlít az ASM-re Alakzat modell (lásd ASM) Textúra modell: határpontok között megjelenő mintázat

Active Appearance Models Textúra modell Az egyes mintákat kifeszíti az átlagalakzat felé Textúra vektort kapunk, melyet normalizálunk PCA alkalmazása a normalizált textúra vektorra Újabb PCA alkalmazása az alakzat-, és textúra modell kombinációjára Keresés: a kombinált modell paraméter terében való mozgás

Arci jellemzők követése Hibrid módszerek Lokalizálják az objektum pár fontos jellemzőpontját, majd ezek környékén hajtják végre a mintaillesztést Active Conditionals Models (ACM) Helyi template detektorok: alakzat és textúra modellből Skálázás invariáns jellemzők (SIFT) Egy modell – több nézőpont Textúra modell: valószínűségi sablonok generálása Jellemzők feletti textúrák szórása

Színérzékelés Bőr-, szem-, hajszín meghatározás Megoldandó feladatok Képi tartalomalapú keresőrendszer Megoldandó feladatok Az emberek eltérően érzékelik a színeket Humán megfigyelések alapján válaszoltuk meg azokat a kérdéseket, mint pl. „Milyen színű a képen látható ember szeme?” Az RGB színtér nem strukturált a színek elhelyezkedését illetően HSV színtér: az intenzitás információ elválik a szín információtól ~16.7M különböző árnyalat Osztályozás meghatározása HSV felett: minden arci jellemzőhöz 5 db színosztály került kialakításra

Színérzékelés Megoldandó feladatok 3D HSV tér klaszterezése HV sík: kromatikus-akromatikus osztályozás SV sík: előre definiált 5-5 db kromatikus színosztály kialakítása HV sík szegmentálása: (a) átlagos hajszínek az adatbázisban, (b) konvex sokszögek, (c) távolság transzformált, (d) az öt darab előredefiniált klaszter a síkon.

Színérzékelés

Fejpozíció és orientáció Problémafelvetés Fejpozíció és orientáció meghatározása (nem sztereó) kameraképeken Az euklideszi tér azon pontjait keressük, melyek csak a síkon ismertek (AAM) POS with ITerations (POSIT) Alkalmas a perspektíva helyreállítására Ismernünk kell az arc térbeli geometriáját, Illetve négy vagy több, nem egy síkba eső pontot a kamerasíkon A fenti két modell ismeretében egy iteratív eljárás segítségével számítja ki a térbeli pozíciót és orientációt

Fejpozíció és orientáció

Gesztusfelismerés Tudatos fejmozgások, mint mozdulat-sorok felismerése Hatékony reprezentáció: térben és időben POSIT nem elég stabil az orientáció meghatározására Multi-view AAM, mozgóátlag, Kálmán-szűrő Modell alapú gesztusfelismerő rendszerek HMM – EM algoritmus: E: rejtett változók várható értékének kiszámítása, majd ezek használata megfigyelt értékekként M: log likelihood maximalizálása a paraméterek szerint

Gesztusfelismerés Mintaillesztéses módszerek Modell alapú gesztusfelismerő rendszerek HMM tökéletesítése szemantikus hálókkal, nem-paraméteres HMM-ek, Hidden Conditional Random Field Mintaillesztéses módszerek Elkerülhető a modell alapú nehézségek egy része Szükséges a gesztusok invariáns ábrázolása az illesztéshez Mozdulatsorok eltérő ütemben történő végrehajtása

Fejmozgás meghatározása Fejmozgás térbeli behatárolása MHI reprezentáció: időtől függő sablon, ahol minden egyes pixel értéke a fejmozgás egy függvénye Képszekvencia mozgó objektumainak változásait írja le A mozgás tekintetében hasznos régiók meghatározása: FAST sarokdetektor

Fejmozgás iránya Optical Flow vektorok kiszámítása a FAST jellemzőpontokra Fejmozgás iránya: n db optikai folyam vektor számtani közepe Irány: a vektornak az y tengely pozitív oldalával bezárt szöge Szögek osztályozása a kezelhetőség miatt

Gesztusfelismerés Gesztus időbeli szegmentálása Szegmens Gesztus MHI átlagintenzitás alapján Szegmens Képkockák sorozata Alacsony átlagintenzitással a szekvencia elején és végén Gesztus Adott szegmens szomszédos tagjaira számított szögek sorozata {"fejrázás"; [90°,90°,90°,270°,270°,225°,135°]}

Gesztusadatbázis A mozdulatok eltérő ütemben kerülnek végrehajtásra Komplexebb döntések hozatala Szögsorozatok gyűjteménye Osztály: egy gesztushoz, több sorozat Felismerés javítása Több adat a szeparáláshoz Igazodás a felhasználóhoz: futás során bővítjük a felismert gesztusokkal

Dinamikus idővetemítés Illesztés: DTW segítségével az adat-bázis elemeihez Besorolás: adott osztály elemeitől vett átlagos távolság egy küszöbszám alá esik Eredmények Maximális gesztushossz ~5 sec, 30 FPS mellett: 150 hosszúságú szögsorozatok, mint gesztusok Mintavételezés csökkentése a harmadára Főbb mozgáskomponensek megmaradnak

Eredmények Minimális gesztushossz: >1 sec Maximális DTW hiba Így a rövid gesztusok nem illeszkednek a kicsit is hasonlókra Maximális DTW hiba Gesztusok közötti távolság Empirikus úton: DTW távolság < 15 Az osztályonkénti átlagos DTW távolság 20 darab körkörös fejmozgásra. Látható, hogy javul a DTW szeparáló teljesítménye, ha bizonyos határok között növeljük az egyes osztályok számosságát.

Demó videó

Jövőbeli tervek Érzelem, nem, életkor felismerés Globális képi jellemzők (LBP, HOG, Gabor, stb.) SVM Meglévő rendszerek fúziója: Face API Data Flow alapú keretrendszer Hátralévő teendők a fokozatszerzésig 1 db nyelvvizsga 1 db cikk Tézis megírása

Köszönöm a megtisztelő figyelmet!