T.Gy. Beszedfelism es szint. 2011.05. 17. 1 Beszédfelismerés és beszédszintézis Beszélő személy felismerés beszélő személy azonosítás beszélő személy verifikálás.

Slides:



Advertisements
Hasonló előadás
Bevezető Innovációs területek S+S Epilógus. pptPlex Section Divider Bevezető The slides after this divider will be grouped into a section and given the.
Advertisements


„Esélyteremtés és értékalakulás” Konferencia Megyeháza Kaposvár, 2009
Mobile Voice Communication Project Review •Cooperating partners: Cisco and T- Mobile, HTTP Foundation •Aim: new course on Cisco WLAN and Mobile.
3 5 6 Application Services Deployment Services Databinding USER INTERFACE SERVICES XAML Accessibility Property System Input & Eventing BASE SERVICES.
English version A sablon nyelvének választása: /Format/Slide Design /majd jobb oldalt válaszd a másik be- ágyazott sablont! Projekt logó beállítása: /View/Master.
The Hungarian language
Nyereményjátékok és a Facebook - aki mer, az nyer!?”
Erőállóképesség mérése Találjanak teszteket az irodalomban
© 2008 Cisco Systems, Inc. All rights reserved.Cisco ConfidentialPresentation_ID 1 Üzleti Megoldások a KKV szegmens számára Cisco partner nap 2009 április.
"Shoes on the Danube Bank” "נעליים בטיילת הדנובה"
21 Years of Partnership and Innovation 1989 Citrix Systems founded 2010 Citrix signed licensing agreement with Microsoft for NT Server Introduced Independent.
Nyugdíjreform folyt. köv.? Pension Reform To Be Continued? Bodor András “PENSION REFORM IN HUNGARY: DO WE NEED ONE (PILLAR) MORE?” symposium Washington.
Dreams. How much does our dream cost? If we plan something or dream about somthing we hope them to come true. If we plan something or dream about somthing.
Les meilleures photos de L'année 2005 D'après NBC A life for two, full of tenderness, obtains happiness as they get closer to heaven. Az élet kettesben.
PRESENT CONTINUOUS PRESENT CONTINUOUS Folyamatos jelen idő.
What is the Mission Situation in Hungary?. Dr. György KOVÁCS What Is The Mission Situation In Hungary? Presentation Design by Ed Nickle – United World.
ENEREA - Észak –Alföld Regional Energy Agency Gábor Vámosi Managing director.
Árvai Zoltán Számalk Oktató központ.
Bevezetés a tárgyakhoz Tárgyak  Objects are the containers for values of a specified type  Objects are either signals, variables or constants  Once.
Kortárs diagnózisok helyzetfelmérés.
Fehérjék 4 Simon István. Predicting protein disorder - IUPred Basic idea: If a residue is surrounded by other residues such that they cannot form enough.
Basics A few things one must know. Slides Insert a title slide Put a title on it.
Mérés és adatgyűjtés laboratóriumi gyakorlat Karakterisztikák mérése 1 Makan Gergely, Mingesz Róbert, Nagy Tamás V
„21. századi közoktatás – fejlesztés, koordináció” TÁMOP / számú kiemelt projekt eTwinning: a digital touch in teacher training Klaudia.
Az erőátviteli rendszer
Infokommunikációs rendszerek 12
Infokom. rendsz. 11. előadás nov Kommunikációs rendszerek alapjai 11. előadás Rádiós adathálózatok Bluetooth, ZigBee, WiFi, WiMAX, Takács.
Infokommunikációs rendszerek 11
Course Situation and Event Driven Models for Multilevel Abstraction Based Virtual Engineering Spaces Óbuda University John von Neumann Faculty of Informatics.
Darupályák tervezésének alapjai
Magyarország pénzügyi megítélése nemzetközi aspektusból László Csaba október 12.
Bevezetés a kísérleti részecskefizikába 2OO7.
Európai Neutronkutató Központ létesítése Magyarországon
Alertet indíthat egy: SQL Server esemény (LOG) SQL Server performancia érték WMI events Alert végezhet: Operátor értesítést JOB indítás (válasz az eseményre)
Projektmunka az NI-nál
szakmérnök hallgatók számára
Elektroanalitikához segédábrák Az ábrák több, részben szerzői jogokkal védett műből, oktatási célra lettek kivéve. Csak az intranetre tehetők, továbbmásolásuk,
WAP, WML Felhasznált források: Developer’s Guide v1.2 (Nokia WAP Toolkit) WML Reference v1.1.
Egy GAZDAG HIBAJELENTÉS elég információt tartalmaz ahhoz, hogy AZONNALI LÉPÉSEKET lehessen tenni, a javítás érdekében.
Kajcsos Zsolt MTA KFKI Részecske-és Magfizikai Kutató Intézet Nagyspinű és kisspinű állapotok tanulmányozása pozitrónium kölcsönhatások által.
Biometria I. SANB_BI1019 Pearson-féle Chi-négyzet (χ2) teszt Molnár Péter Állattani Tanszék
Null Hypothesis (H 0 ) is true He truly is not guilty Alternative Hypothesis (H 1 ) is true He truly is guilty Accept Null Hypothesis Acquittal Right decision.
EGEE-II INFSO-RI Enabling Grids for E-sciencE EGEE and gLite are registered trademarks P-GRADE Portal gyakorlat ismertető Gergely.
4. Feladat (1) Foci VB 2006 Különböző országok taktikái.
Veleszületett szívhibában szenvedők szív transzplantációjának jelene, jövője Prof. Dr. Bodor Elek.
var q = ( from c in dc.Customers where c.City == "London" where c.City == "London" select c).Including( c => c.Orders ); select c).Including(
Tanulni, tanulni, tanulni Értékesítői képességek, a személyzet képzése.
Könyvtár, csomag és alprogramokVHDL Könyvtár, csomag és alprogram n Library és use n Package n Alprogramok –Procedure –Function –Resolution function Egy.
Budapesti Műszaki és Gazdaságtudomanyi Egyetem Elektronikus Eszközök Tanszéke 1 Tokozások termikus tesztje, minősítése.
Készült az ERFP – DD2002 – HU – B – 01 szerzősésszámú projekt támogatásával Chapter 6 / 1 C h a p t e r 6 Elastic Critical Plate Buckling Loads.
Készült az ERFP – DD2002 – HU – B – 01 szerzősésszámú projekt támogatásával Chapter 1 / 1 C h a p t e r 1 Introduction.
A magyar nyelv nagyszótára ‘Comprehensive Dictionary of Hungarian’ (Dictionary of the Academy) A brief history Tamás Péter Szabó Department of Lexicography.
Tények Tartományok Érdekességek.
3. lesson made by Gönczi Zsófia. You can sit down only, if you say the following words correct!
- Group Policy - Group Policy Preferences - Group Policy 4x5 - Optimális munkakörnyezet – az első lépcsőfok.
TALÁLTAM EGY OLDALT AHOL EZEKET A “TOJÁSOKAT” LEHET LÁTNI. NAGY MÛVÉSZNEK KELLET LENNI, HOGY ILYEN SZÉPEN TUDTA FORMÁZNI A TOJÁSOK HÉJÁT, DE SZERINTEM.
Web Application 1 Web Application 3 Web Application 2 Web Application 4 Shared Service Provider 1 Shared Service Provider 2 Excel Services1 Search1.
Design Thinking módszertan Juhász Dániel UI Designer / DT Coach Buday Balázs Product Owner / DT Coach.
1 KÖZÖSSÉG AZ ÚJ TESTAMENTUMBAN Romans 12:10Romans 12:10 Romans 12:16Romans 12:16 Romans 15:14Romans 15:14 1 Corinthians 11:331 Corinthians 11:33 2 Corinthians.
A KÖVETKEZŐKBEN SZÁMOZOTT KÉRDÉSEKET VAGY KÉPEKET LÁT SZÁMOZOTT KÉPLETEKKEL. ÍRJA A SZÁMOZOTT KÉRDÉSRE ADOTT VÁLASZT, VAGY A SZÁMOZOTT KÉPLET NEVÉT A VÁLASZÍV.
Beszédfelismerés és beszédszintézis Beszédfelismerés neurális hálózatokkal Beszélő személy felismerése Takács György 15. előadás Beszedf
D2A Pathway 2: End of Life Care – Home (usual place of residence)
Systems Hardware Business challenge
Nokia C5 Data Sheet Planned Market Introduction • Q Category
TECHNICAL TRAINING December 2012.
What would x have to be in order for the mean to be 8?
Eastern Analytical Symposium, Princeton NJ
Developing, understanding and using nutrient boundaries
Antibiotic Drug Prescription
Előadás másolata:

T.Gy. Beszedfelism es szint Beszédfelismerés és beszédszintézis Beszélő személy felismerés beszélő személy azonosítás beszélő személy verifikálás Takács György 16. előadás

T.Gy. Beszedfelism es szint Speaker recognition: who is speaking Speaker verification (voice authentication) : the speaker claims to be of a certain identity and the voice is used to verify this claim. Speaker verification is a 1:1 match where one speaker's voice is matched to one template Speaker identification is the task of determining an unknown speaker's identity. Speaker identification is a 1:N match where the voice is matched to N templates. Speaker identification problems generally fall into two categories: –Differentiating multiple speakers when a conversation is taking place. –Identifying an individual's voice based upon previously supplied data regarding that individual's voice.

T.Gy. Beszedfelism es szint Biometriai alapú személyfelismerés Tényleges személyes testi jellemzőkön alapszik Gyakorlatilag letagadhatatlan és utánozhatatlan Példák: –Ujjlenyomat –Szem felvétel –DNS vizsgálat –Hanglenyomat

T.Gy. Beszedfelism es szint Mennyire megbízható a „hanglenyomat”? Összemérhető az aláírással –biztonsági szempontból? –gépesítés szempontjából? –költség szempontjából? Összemérhető az ujjlenyomattal –biztonsági szempontból? –gépesítés szempontjából? –költség szempontjából?

T.Gy. Beszedfelism es szint

This credit card might be too secure for you I've been checking out a new high-tech credit card that reminds me of a security lesson I learned years ago. Soon after I started a tech reporting job at the San Jose Mercury News in 1999, I was lucky enough to land a cubicle next to a guy named David L. Wilson. Dave, who covered the Microsoft anti-trust trial, was a geek's geek and a treasure trove of information. One of the things he explained to me early on was a basic concept in security — something called three-factor authentication. If you want to make it hard to break into something — I mean, really lock it down — demand three unique pieces of information from people before they're allowed in. 1.Something they carry, like a key. 2.Something they know, like a password. 3.Something they are — a piece of biometric data like a fingerprint, a voice print or a retinal scan.

T.Gy. Beszedfelism es szint

8

9

10

T.Gy. Beszedfelism es szint

T.Gy. Beszedfelism es szint

T.Gy. Beszedfelism es szint

T.Gy. Beszedfelism es szint Automatic speaker recognition is the use of a machine to recognize a person from a spoken phrase. These systems can operate in two modes: to identify a particular person or to verify a person’s claimed identity.

T.Gy. Beszedfelism es szint Alapkérdések a beszélő személy felismerésben Milyen jellemzőket mérjünk? Hogyan normalizáljunk? Szövegfüggő vagy szöveg-független legyen? Hogyan ítélhető meg a döntés biztonsága? Mennyire utánozható? Mennyire változtatható el tudatosan (esetleg náthától magától is)? Menyire eredeti vagy manipulált a bemondás/felvétel?

T.Gy. Beszedfelism es szint Mért jellemzők Anatómiai meghatározottságúak (magasabb formánsok, zárfelpattanási idő, toldalékcső hossza, arcüreg, homloküreg rezonanciái, akusztikus csőmodell paraméterei – LPC paraméterek) Tanult vonások (egyes hangok ejtése, intonáció, ritmus, tempó, szófordulatok…)

T.Gy. Beszedfelism es szint Normalizálás Kétszer nem tudunk pontosan ugyanúgy elmondani még egy szót sem. A hangerő, környezeti zaj, tempó viszonylag széles skálán változhat. Normalizálás lehetséges az időben, szintben (mint izolált szavas felismerésnél) Normalizálás lehetséges a szövegfüggetlen beszélő felismerésnél hosszabb időre vett átlagok alapján a paraméter térben.

T.Gy. Beszedfelism es szint Szövegfüggő vagy szövegfüggetlen legyen?

T.Gy. Beszedfelism es szint ) Fixed password system, where all users share the same password sentence. This kind of system is not likely to be used in a real application, instead, every user would have a unique password to improve security. However, it is a good way to test speaker discriminability in a text-dependent system 2) User-specific text-dependent system, where every user has his own password 3) Vocabulary-dependent system, where a password sequence is composed from a fixed vocabulary to make up new password sequences. Note that the password may or may not be prompted by the system. Examples: randomised digit sequences. 4) Speech-event-dependent system, where the system spots, and depends on specific speech events. Phonetic events, such as the occurrence of vowels, fricatives or nasals, are candidates for the characteristic speech events 5) Machine-driven text-independent system, where the system prompts for an unpredictable text to be spoken. In this case, speaker recognition is combined with speech recognition techniques to verify that the right text was uttered 6) User-driven text-independent system, where the user can say any text he wants

T.Gy. Beszedfelism es szint Szövegfüggőség és rendszerjellemzők kategóriákba rendezve: 1 – gyenge, 2 – közepes, -- jó

T.Gy. Beszedfelism es szint Hogyan ítélhető meg a döntés biztonsága egy rendszerben?

T.Gy. Beszedfelism es szint

T.Gy. Beszedfelism es szint

T.Gy. Beszedfelism es szint

T.Gy. Beszedfelism es szint Mennyire utánozható? Mennyire változtatható el tudatosan (esetleg náthától magától is)? Menyire eredeti vagy manipulált a bemondás/felvétel?

T.Gy. Beszedfelism es szint VoiceID 99,5% biztonság

T.Gy. Beszedfelism es szint Azonosítási vagy verifikálási hibákhoz vezető tényezők:

T.Gy. Beszedfelism es szint

T.Gy. Beszedfelism es szint

T.Gy. Beszedfelism es szint Azonos személyek mért beszédjellemzőinek változásai a felvételek közötti idő függvényében

T.Gy. Beszedfelism es szint

T.Gy. Beszedfelism es szint

T.Gy. Beszedfelism es szint

T.Gy. Beszedfelism es szint System Operation Microphone A/D Conversion Filtering Feature Extraction Pattern Matching Speaker Model Decision Enrollment

T.Gy. Beszedfelism es szint Technical Overview Feature Extraction Preprocessing Sample Utterence End Point Detection Silence Removal Emphasis Filtering Segmentation Cepstrum Coefficient Cepstral Normalization Expansion by Polynomial Function Feature Selection Speaker Model Dynamic Time Warping Reference Template Weight Pattern Matching Distance Computation Comparison Accept/Reject A/D Conversion

T.Gy. Beszedfelism es szint

T.Gy. Beszedfelism es szint

T.Gy. Beszedfelism es szint