Az előadás letöltése folymat van. Kérjük, várjon

Az előadás letöltése folymat van. Kérjük, várjon

T.Gy. Beszedfelism es szint

Hasonló előadás


Az előadások a következő témára: "T.Gy. Beszedfelism es szint"— Előadás másolata:

1 T.Gy. Beszedfelism es szint. 2010.02.18.
Beszédfelismerés és beszédszintézis Emberi beszédkeltés és beszédérzékelés Takács György 2. előadás T.Gy. Beszedfelism es szint

2 T.Gy. Beszedfelism es szint. 2010.02.18.
Tartalom Az emberi beszéd alapelemei Beszédszervek, beszédszervek működése A beszédérzékelésben résztvevő szervek és működésük Beszéddel kapcsolatos alapfogalmak T.Gy. Beszedfelism es szint

3 T.Gy. Beszedfelism es szint. 2010.02.18.
Nyelv és beszéd A nyelv az emberi kommunikáció és az emberi gondolkodás legfőbb eszköze A kommunikáció a társadalmi élet és a munkamegosztás alapvető feltétele A nyelv egy jelrendszer, amelynek elemeihez egy nyelvközösségen belül ugyanaz a jelenség tartozik A beszéd a nyelv elsődleges megnyilvánulása A beszéd útján közvetíthető információ sebessége 15…20 bit/s értéket érhet el. (Webster, J.C.: Information in simple multidimensional speech messages. J.A. S. A. Vol. 33. pp ) T.Gy. Beszedfelism es szint

4 Az emberi információ-feldolgozás egy általános modellje
Forrás: Christopher D. Wickens and Justin G. Hollands, Engineering Psychology and Human Performance, Third ed. (Upper Saddle River, NJ: Prentice Hall, 2000) T.Gy. Beszedfelism es szint

5 A természetes beszédlánc
T.Gy. Beszedfelism es szint

6 T.Gy. Beszedfelism es szint. 2010.02.18.
Beszédhang A legkisebb olyan egységek, amelyek sorozatával egy nyelvet megvalósító beszéd akármilyen részlete az agy számára reprodukálható, beszédhangnak nevezzük. A beszédhangok a beszéd olyan szegmensei, részletei, amelyeket a nyelvet beszélő egymástól elkülöníteni és felismerni teljes biztonsággal képes. A beszédhangok a nyelvre jellemzőek! Egyes nyelvekben a hangmagasság hajlítása is megkülönböztet beszédhangokat. Az élő beszéd olyan leírása, amely a beszéd hangzásának leírására törekszik – a fonetikai átírás. Ennek elterjedt rendszerei az APhI és a SAMPA. T.Gy. Beszedfelism es szint

7 A beszédhangok folytonos és diszkrét természete
T.Gy. Beszedfelism es szint

8 T.Gy. Beszedfelism es szint. 2010.02.18.
A beszéd szerkezete A beszéd egymástól megkülönböztethető elemek szervezett időbeni egymásutánisága – soros szerkezet. Elem lehet egy összefüggő mondanivaló, egy hosszabb szünetekkel elhatárolt beszédrész, egy mondat, egy szó, egy beszédhang. Egy ötven beszédhangból álló nyelvben (leszámítva, hogy nem minden hang mondható egymás után) kb. egymillió különböző tíz hangból álló szó képezhető. A beszéd szerkezete felülről gyakorlatilag nyitott, alulról zárt. T.Gy. Beszedfelism es szint

9 T.Gy. Beszedfelism es szint. 2010.02.18.
A fonéma Egy nyelv fonémakészlete elemek olyan minimális számosságú halmaza, amelyből minden szó jelentéshelyesen, de csak egyféleképpen állítható elő A fonémakészlet elemei a fonémák. Az azonos fonémákat képviselő beszédhangok az allofonok. T.Gy. Beszedfelism es szint

10 T.Gy. Beszedfelism es szint. 2010.02.18.

11 T.Gy. Beszedfelism es szint. 2010.02.18.

12 T.Gy. Beszedfelism es szint. 2010.02.18.

13 T.Gy. Beszedfelism es szint. 2010.02.18.

14 T.Gy. Beszedfelism es szint. 2010.02.18.

15 T.Gy. Beszedfelism es szint. 2010.02.18.

16 T.Gy. Beszedfelism es szint. 2010.02.18.

17 T.Gy. Beszedfelism es szint. 2010.02.18.

18 T.Gy. Beszedfelism es szint. 2010.02.18.

19 T.Gy. Beszedfelism es szint. 2010.02.18.

20 T.Gy. Beszedfelism es szint. 2010.02.18.

21 T.Gy. Beszedfelism es szint. 2010.02.18.

22 T.Gy. Beszedfelism es szint. 2010.02.18.

23 T.Gy. Beszedfelism es szint. 2010.02.18.

24 T.Gy. Beszedfelism es szint. 2010.02.18.

25 T.Gy. Beszedfelism es szint. 2010.02.18.

26 T.Gy. Beszedfelism es szint. 2010.02.18.

27 T.Gy. Beszedfelism es szint. 2010.02.18.

28 T.Gy. Beszedfelism es szint. 2010.02.18.

29 T.Gy. Beszedfelism es szint. 2010.02.18.

30 A hallás frekvencia és szintfüggése
Weber-Fechner:hangosságérzet 40dB+40dB=43dB Fletcher-Stevens:hangosság 40 dB felett igaz csak!!! 40phon=1son 1son+1son=2son Helmholtz rezonátor Fülkagyló hatása Szabad térben (süketszobában) mért görbesereg Létezik diffúz térben és fejhallgatóval mért görbesereg is! T.Gy. Beszedfelism es szint

31 T.Gy. Beszedfelism es szint. 2010.02.18.
phon, son, dB Inger érzet W-F szerint : logaritmikus, százszoros intenzitású hangot hússzor hangosabbnak hallunk Fl-St szerint : hatványkitevős (0,3), százszoros intenzitású hangot négyszer hangosabbnak hallunk Kísérlet: 10 hang 500Hz-től 500 Hz-enként, 60 dB intenzitással szól, mekkora intenzitású 1 kHz-es hangot hallunk ugyanolyan erősnek? Eredmény: a 93 dB-est! W-F szerint: a 70 dB-est kellene ugyanolyan erősnek hallani! Milyen átszámítás a jó, hogy a 10 jelet 10-szer olyan hangosnak halljuk? 60 phon=4 son, 10 x 4=40 son=93 dB T.Gy. Beszedfelism es szint

32 A phon-son átszámítási görbe
(Tarnóczy Tamás) T.Gy. Beszedfelism es szint

33 A hallás kritikus sávjai
Bizonyos feltételekkel a W-F törvény igaz! Bizonyos frekvenciasávokon belül az intenzitások összegződnek! Ezek a sávok a kritikus sávok. (Tarnóczy Tamás) Barkhausen tiszteletére „Bark”-ak nevezték el a sávokat, 24 db létezik. Sávszélességük változó, 400 Hz-ig 100 Hz, 1 kHz felett a frekvencia logaritmusával arányosan növekszik. T.Gy. Beszedfelism es szint

34 Hangelfedés a frekvencia tartományban
Megszólaló színuszos hang, vagy keskenysávú zörej a hallásküszöb görbét módosítja, a jel frekvencia környezetében érzéketlenebb lesz hallásunk. 1) Nagyobb intenzitású elfedő jel szélesebb frekvenciasávban okoz elfedést 2) A fedőgörbe nem szimmetrikus, nagyobb frekvenciák felé szélesebb sávban hat (kórus: basszus, szoprán) A görbe alatti intenzitású hangokat nem halljuk! A hangesemény dinamikusan változó fedőgörbét alakít ki, ami a görbe alatt van energiában, azt nem kell átvinni! (Digitális jelek adatredukciója) T.Gy. Beszedfelism es szint

35 Hangelfedés az időtartományban
Utóelfedés: egy erős hang- inger után, míg az alaphártya rezgései lecsillapodnak, a kisebb intenzitású hang nem hallható! Előelfedés: a korábban meg- Szólaló hangot egy később érkező erős hang elfed! Az idegpályákon az áramimpulzusok sebessége a kiváltó inger nagyságától függ? Az időbeli elfedés jelenségét szintén kihasználjuk a digitális jelek adatredukciójánál! T.Gy. Beszedfelism es szint

36 Két hang hangosságának összege
Figyelembe kell venni a kritikus sávokat és a hangelfedés jelenségét a hang intenzitásának függvényében! Ha a két hang frekvenciában távol van egymástól, és nem túl nagy intenzitású (elfedési görbének nincs szerepe), a son-ok összegződnek. Minél nagyobb energiájú a két hang, annál távolabb kell lenni egymástól frekvenciában, pl. 90 dB esetén kritikus sáv távolság szükséges! Kritikus sávon belül az intenzitások összegződnek. Ha az egyik hang sokkal hangosabb, elfedi a másikat! (Nem szimmetrikus az elfedés, mély-magas hang, nem mindegy, melyik az erősebb! Digitális hang adatredukciója: pl. 32 frekvenciasávra bontva a jelet egyszerű összegzési és elfedési törvények érvényesek! T.Gy. Beszedfelism es szint

37 Dinamikus hallásküszöb kialakulása
p(dB) 50 40 30 20 10 0, , , f (kHz) Abszolút hallásküszöb Eredő hallásküszöb T.Gy. Beszedfelism es szint

38 Hangesemény sávszélessége és a hangosság kapcsolata
Kísérlet: 50 dB-es színuszjel hangossága 2 son Tíz db. 40 dB-es színuszjel összhangossága 7,9 son A két jel energiája azonos, de a nagyobb sávszélesség miatt hangosabbnak halljuk! Rövid ideig tartó hang hangosságának fokozása: kissé torzítva a hangot, több spektrumvonal jelenik meg, az eredeti jelhez hozzáadva,a hangosság nagyobb lesz! (Exciter) T.Gy. Beszedfelism es szint

39 T.Gy. Beszedfelism es szint. 2010.02.18.
A hallás időállandói Hallásunk több rezgőrendszer kapcsolata útján alakul ki Minden rezgőrendszer rendelkezik feléledési (berezgési) és lecsengési idővel (időállandóval, a végállapot 63 %-a) Mély hangokra 50 ms, 1000 Hz feletti hangokra 20 ms A teljes hangérzet kialakulásához kb. 200 ms szükséges, ez idő elteltével kapja meg az agy a teljes információ mennyiséget! A 200 ms „ablakozás” miatt a hangmagasság érzékelésünk nem pontos! (Megérthető a színuszjel, ill. a kapuzott színuszjel Fourier-transzformáltja alapján!) - Egy 200 ms időtartamig észlelt színuszjelet 5 Hz pontossággal hallunk Az 50 ms időállandó miatt több, különböző frekvenciájú mély hangot azonos magasságúnak érzünk! - A hangmagasság érzékelése függ az intenzitástól is! T.Gy. Beszedfelism es szint


Letölteni ppt "T.Gy. Beszedfelism es szint"

Hasonló előadás


Google Hirdetések