Péter Pázmány Catholic University, Department of Information Technology Videó előfeldolgozás Audio előfeldolgozás Szinkronizált Audio-vizuális adatbázis.

Slides:



Advertisements
Hasonló előadás
Merre jár a tekintetünk?
Advertisements

Tamás Kincső, OSZK, Analitikus Feldolgozó Osztály, osztályvezető A részdokumentumok szolgáltatása az ELDORADO-ban ELDORADO konferencia a partnerkönyvtárakkal.
1/13 Péter Tamás, Bécsi Tamás, Aradi Szilárd INNOVÁCIÓ ÉS FENNTARTHATÓ FELSZÍNI KÖZLEKEDÉS KONFERENCIA Budapest, szeptember 3-5. Útmenti objektumok.
Kommunikációs Rendszerek A kommunikáció Forrás kódolás Feladat: -az információ tömörítése.
Néhány fontos terület a Kreatív Ipar fejlődéséhez
Beszéd alapfrekvencia meghatározása - Pitch detektor algoritmusok - Pázmány Péter Katolikus Egyetem, Információs Technológia Kar Bárdi Tamás doktorandusz.
Informatikai alapfogalmak
INFORMATIKA OKTATÁS GYÓGYÁSZAT KÖZLEKEDÉS TÁVKÖZLÉS HADITECHNIKA
TransMotion1 TransMotion Projekt BMF-NIK, IAR szakirány Kertész Tamás Rieger Péter Szolyka Sándor Konzulens: Vámossy Zoltán.
Miskolci Egyetem Gépészmérnöki és Informatikai Kar Alkalmazott Informatikai Tanszék Dr. Kulcsár Gyula egyetemi adjunktus.
Szintetikus látható beszéd bemutató és megbeszélés Pázmány Péter Katolikus Egyetem Információs Technológiai Kar 1083 Budapest, Práter u. 50/a június.
Híranyagok tömörítése
Intelligens ébresztő óra Számítógépes látás projekt 2011.
Számítógépes képelemzés 2007/08 I. félév Előadó:Dr. Gácsi Zoltán Gyakorlatvezető:Póliska Csaba Koncz-Horváth Dániel.
MECHANIZMUSOK SZÁMÍTÓGÉPES MODELLEZÉSE
Beszéd és érzelem Pázmány Péter Katolikus Egyetem, Információs Technológia Kar Beszédfelismerés és szintézis - előadás április 12. Bárdi Tamás.
T.Gy. Intrernetes médiakommunikáció Internetes médiakommunikáció Microsoft DisectShow (adatfolyam kezelő rendszer Windows alapon) Takács.
Beszéd alapfrekvencia meghatározása - Pitch detektor algoritmusok - Pázmány Péter Katolikus Egyetem, Információs Technológia Kar Beszédfelismerés és szintézis.
Péter Pázmány Catholic University, Department of Information Technology Beszéd és érzelem Beszédfelismerés és szintézis 7. előadás március 13. Bárdi.
Önálló laboratórium december 19.1 Fejlesztő rendszer kialakítása SYMBIAN operációs rendszerű GSM terminálokhoz Hegedűs Iván Mihály Pázmány Péter.
Persa György Témavezető: Szabó Csanád Pázmány Péter Katolikus Egyetem Információs Technológiai Kar 1.
Óbudai Egyetem Neumann János Informatikai Kar
A virtuális technológia alapjai Dr. Horv á th L á szl ó Budapesti Műszaki Főiskola Neumann János Informatikai Kar, Intelligens Mérnöki Rendszerek.
Multimodális beszéd Facial Animation alapjai (szabványok, rendszerelemek, megvalósítások) Srancsik Bálint Pázmány Péter Katolikus Egyetem Információs.
ESzabványok Workshop 1. előadás: Bevezető, eAdatmodell október 13.
A ZMNE költséghatékony Vezetői Információs Rendszerének bemutatása Kis Ferenc Veloxnet Kft.
Fejmozgás alapú gesztusok felismerése Bertók Kornél, Fazekas Attila Debreceni Egyetem, Informatikai Kar Debreceni Képfeldolgozó Csoport KÉPAF 2013, Bakonybél.
Számítógépes grafika 3. gyakorlat.
Budapesti Műszaki Főiskola Bánki Donát Gépészmérnöki Főiskolai Kar Forgácsolási technológia számítógépes tervezése 4. Előadás Vezérlésfüggetlen NC ciklusok.
Nyelv-ész-gép Új technológiák az információs társadalomban.
Prószéky Gábor MorphoLogic DAT-2006, november 21. Prószéky Gábor MorphoLogic
Intelligens felderítő robotok Készítette: Györke Péter Intelligens rendszerek MSC szakirány Konzulens: Kovács Dániel László Méréstechnika és Információs.
DR. habil, Dr. Dr. VASS CSABA
IKT struktúra.
Információ, adat, jel, kód
vizuális kommunikáció
TransMotion Emberi mozgás digitalizálása
Többszintű Tenyéralapú Biometrikus Azonosító Rendszer
Belami beszámoló – Doménadaptációs alkalmazások. Problémafelvetés Felügyelt tanulás elvégzéséhez gyakran kevés jelölt adat áll rendelkezésre  doménadaptáció.
BUDAPEST UNIVERSITY OF TECHNOLOGY AND ECONOMICS DEPARTMENT OF ELECTRONICS TECHNOLOGY PRECÍZIÓS, GYÁRTÁSKÖZI OPTIKAI MÓDSZEREK ÉS RENDSZEREK ELEKTRONIKAI.
Rezgésakusztikai és Audio Laboratórium Department of Telecommunications Budapest University of Technology and Economics 1-es villamos átvezetése a Lágymányosi.
Készítők: Fajt Péter Vácz István Konzulens: Vámossy Zoltán Rendszám Felismerő Rendszer 3. évf.
Rendszám Felismerő Rendszer
Az arcfelismerés és arc detektálás alapjai Matusinka Roland OE-NIK
Üdvözöljük a Semmelweis Egyetem Testnevelési és Sporttudományi Karán! TF.
Orvosbiológiai képkereső rendszer teljesítményének képek osztályozásán alapuló javítása Június 23, 2008 Budapest Altrichter Márta Konzulens: dr. Horváth.
CALDERONI FORRÁSKEZELŐ RENDSZER ACalderoni Program során fejlesztésre kerülő rendszer vázlatos bemutatása.
MPEG-2 és az MPEG-4 AVC videó kódolás összehasonlítása
LOGISZTIKA Előadó: Dr. Fazekas Lajos Debreceni Egyetem Műszaki Kar.
Budapest University of Technology and Economics Department of Measurement and Information Systems Monitor komponensek fejlesztése okostelefon platformra.
Mérnöki tervezés december Hangelemző rendszer fejlesztése Symbian OS-re Hegedűs Iván Mihály Pázmány Péter Katolikus Egyetem Információs Technológiai.
1 AZ IKTA-2000 projektjeinek szakmai bemutatója IKTA-144/2000 projekt november 28.
CALDERONI FORRÁSKEZELŐ RENDSZER A Calderoni Program során fejlesztésre kerülő rendszer vázlatos bemutatása.
CALDERONI FORRÁSKEZELŐ RENDSZER A Calderoni Program során fejlesztésre kerülő rendszer vázlatos bemutatása.
TÁMOP /1-2F Modern informatikai eszközök Multimédia az interneten Papp Szabolcs 2009.
Videó-szerkesztő programok és videó-formátumok
Assoc. Prof. Ján Gunčaga, PhD. Faculty of Education Catholic University in Ružomberok Nyílt forráskódú szoftverek és IKT az oktatásban.
Fejmozgás alapú gesztusok felismerése Bertók Kornél, Fazekas Attila Debreceni Egyetem, Informatikai Kar Debreceni Képfeldolgozó Csoport KÉPAF 2013, Bakonybél.
Telekocsi szolgáltatás kialakítása “Ruby on Rails” és lokalizációs megoldások felhasználásával Pázmány Péter Katolikus Egyetem Információs Technológiai.
Nagyfeloldású Mikroszkópia Dr. Szabó István 3. Térion mikroszkóp és leképező atompróba módszerek TÁMOP C-12/1/KONV projekt „Ágazati felkészítés.
Adatstruktúrák Algoritmusok Objektumok
Multimédia.
Beépített függvények használata programozáskor
Mozgásvizsgálat gyakorlat
Beszéd alapfrekvencia meghatározása - Pitch detektor algoritmusok -
Neumann János Informatikai Kar
Takács György, Olaszy Gábor, Podoletz György, Tihanyi Attila
KÖZÉPISKOLAI TANULÓK TÉRSZEMLÉLETÉNEK FEJLETTSÉGE Tóth Péter Óbudai Egyetem TMPK.
IT hálózat biztonság Összeállította: Huszár István
Előadás másolata:

Péter Pázmány Catholic University, Department of Information Technology Videó előfeldolgozás Audio előfeldolgozás Szinkronizált Audio-vizuális adatbázis Ellenőrzés Eredmények Szájmozgást előállító rendszer NN MFCC w 1 … w 6 főkomponens súlytényezők PCA -1 MPEG-4 alapú mozgó száj megjelenítés Akusztikus lényegkiemelés FP tartópont koordináták

Képfeldolgozási érdekességek, MPEG-4 alapú fejmodellek Srancsik Bálint, Tihanyi Attila Pázmány Péter Katolikus Egyetem Információs Technológiai Kar 1083 Budapest, Práter u. 50/a június 28.

Péter Pázmány Catholic University, Department of Information Technology Videó előfeldolgozás Audio előfeldolgozás Szinkronizált Audio-vizuális adatbázis Ellenőrzés Eredmények Szájmozgást előállító rendszer NN MFCC w 1 … w 6 főkomponens súlytényezők PCA -1 MPEG-4 alapú mozgó száj megjelenítés Akusztikus lényegkiemelés FP tartópont koordináták

Péter Pázmány Catholic University, Department of Information Technology Arcanimáció (FA) – informatikai megközelítés Kutató Művész  MPEG-4

Péter Pázmány Catholic University, Department of Information Technology Kódolás, dekódolás Kódoló ? Dekódoló ? Adat formátum Az MPEG-4 FA-ban nincs szabványosítva a kódoló és a dekódoló

Péter Pázmány Catholic University, Department of Information Technology Paraméterezés

Péter Pázmány Catholic University, Department of Information Technology Kódolás-dekódolás szerkezete FDP – Face Definition Parameter FP – Feature Point FAP – Facial Animation Parameter FAPU – Facial Animation Parameter Unit (FAT – Face Animation Tables)

Péter Pázmány Catholic University, Department of Information Technology Arckifejezések MPEG-4-es megvalósítása Az első csoportba tartozó két FAP magas szintű paraméter -> előre definiált komplexebb mozgásokat lehet végrehajtani velük. Számítógépes modell - Neme (fiú, lány) - Kora - Érzelmi állapota

Péter Pázmány Catholic University, Department of Information Technology Vizuális adatbázis létrehozása

Péter Pázmány Catholic University, Department of Information Technology Döntéshozás FP meghatározás Eredeti Lényeg- kiemelés Invertálás Dilatáció Erózió

Péter Pázmány Catholic University, Department of Information Technology Referencia alkalmazása

Péter Pázmány Catholic University, Department of Information Technology Videó előfeldolgozás Audio előfeldolgozás Szinkronizált Audio-vizuális adatbázis Ellenőrzés Eredmények Szájmozgást előállító rendszer NN MFCC w 1 … w 6 főkomponens súlytényezők PCA -1 Akusztikus lényegkiemelés FP tartópont koordináták MPEG-4 alapú mozgó száj megjelenítés

Péter Pázmány Catholic University, Department of Information Technology Lucia -Bőr (15736) -Haj (4608) -Szemek (5376) -Fogak (1033) -Nyelv (236) -Torok (318)

Péter Pázmány Catholic University, Department of Information Technology Animáció megvalósítás  Tartópont mozgatás  Tartópontok egymásra hatása  Száj körül a bőrfelült részekre osztásával valósítható meg a mozgatás

Péter Pázmány Catholic University, Department of Information Technology Tartópontok egymásra hatása Álkapocs forgáspont rögzítése szükséges Közeli pontok hatóköre összeér Álcsúcs mozgatásának a hatóköre nagy!

Péter Pázmány Catholic University, Department of Information Technology Műveletek MPEG-4 adatokkal Alapállású fej Érzelmet, szájállást megjelenítő fej  A modell méretarányának ismeretében határozhatók meg az egyes FDP-k elmozdulásának mértékei Érzelmet, szájállást megjelenítő fej Alapállású fej

Péter Pázmány Catholic University, Department of Information Technology Animáció meggyorsítása  A modell méretarányának ismeretében határozhatók meg az egyes FDP-k elmozdulásának mértékei  Előre legkésőbb a modell betöltésekor meghatározhatók az FDP-k által mozgatott hálópontok  Modellt alkotó háló pontjainak válogatása, sorba állítása elmozdulás mértéke szerint  Rendelkezésre álló gép kapacitásnak azonnali automatikus skálázása valósítható meg.

Péter Pázmány Catholic University, Department of Information Technology Szájmozgást előállító rendszer Videó előfeldolgozás Audio előfeldolgozás Szinkronizált Audio-vizuális adatbázis Ellenőrzés Eredmények NN MFCC w 1 … w 6 főkomponens súlytényezők PCA -1 MPEG-2 alapú mozgó száj megjelenítés Akusztikus lényegkiemelés FP tartópont koordináták

Péter Pázmány Catholic University, Department of Information Technology Teszt eredmények Markerekkel vezérelve Hanggal vezérelve EllenőrzésEredmény

Péter Pázmány Catholic University, Department of Information Technology Teszt eredmények  A: Video felvételek  B: LUCIA FP koordinátákkal vezérelve  C: LUCIA hanggal vezérelve

Péter Pázmány Catholic University, Department of Information Technology Továbblépések Előfeldolgozás Szájmozgást előállító rendszer Adatbázis

Péter Pázmány Catholic University, Department of Information Technology Modellek

Péter Pázmány Catholic University, Department of Information Technology Videó előfeldolgozás Audio előfeldolgozás Szinkronizált Audio-vizuális adatbázis Ellenőrzés Eredmények Szájmozgást előállító rendszer NN MFCC w 1 … w 6 főkomponens súlytényezők PCA -1 MPEG-4 alapú mozgó száj megjelenítés Akusztikus lényegkiemelés FP tartópont koordináták Bemutató következik

Péter Pázmány Catholic University, Department of Information Technology  Gy.Takacs, A. Tihanyi, T. Bárdi, G. Feldhoffer, B. Srancsik Database Construction for Speech to Lip- readable Animation Conversion Proceedingd Elmar Zadar, pp june  Takacs Gy., Tihanyi A., Bárdi T.,Fedlhoffer G., Srancsik B Beszédjel átalakítása mozgó száj képévé siketek kommunikációjának segítésére Hiradástechnika LXI évf. 3. szám old 2006