Hallás 2.

Slides:



Advertisements
Hasonló előadás
KOGNITÍV FOLYAMATOK VEGETATÍV IDEGRENDSZERI KORRELÁTUMAINAK VÁLTOZÁSAI KIS DÓZISÚ ALKOHOL HATÁSA ALATT Benyovszky Máté.
Advertisements

A hangtan Az akusztika Lingvay Dániel XI. oszt.
Számok összehasonlítása mentális számegyenes nélkül
Elme tudat nélkül: a változások és szabálytalanságok detekciójának pszichofiziológiája a látásban CZIGLER ISTVÁN MTA PSZICHOLÓGIAI KUTATÓINTÉZET MAKOG-TIHANY.
Szélessávú jelfeldolgozás kihívásai Készítette : Fürjes János.
Információ és közlemény
Összehasonlitó Élettan III. Gyakorlat
ZAJVÉDELEM Koren Edit 4..
A hallás és a pszichoakusztika alapfogalmai
Segédlet a Kommunikáció-akusztika c. tárgy tanulásához
Hang és fény (Akusztika, fénytechnika)
Készítette: Glisics Sándor
Tartalom Klasszikus hangtan
Hangfrekvencia, Fourier analízis 5. (III. 28)
Jelkondicionálás.
A második nyelv elsajátítás elméletei 2.
Multimédiás technikák 1. kérdés Melyik diszkrét médium? a)hang b)videó c)animáció d)kép.
Analóg jelek digitalizálása
Speciális tranzisztorok, FET, Hőmodell
Az információ és kódolása Kovácsné Lakatos Szilvia
Fizika 5. Hangtani alapok Hangtan.
Fizikai átviteli jellemzők, átviteli módok
Audióállományok.
Számítógépes hálózatok I.
Gazdálkodási modul Gazdaságtudományi ismeretek II. Vezetés és kommunikációs ismeretek KÖRNYEZETGAZDÁLKODÁSI MÉRNÖKI MSc TERMÉSZETVÉDELMI MÉRNÖKI MSc.
2007 december Szuhay Péter SPECTRIS Components Kft
Fizika 3. Rezgések Rezgések.
A mikrofon -fij.
Agykérgi lassú alvási oszcilláció vizsgálata epilepsziás betegben Csercsa Richárd PPKE-ITK december 16.
Gábor Dénes Főiskola Informatikai Rendszerek Intézete Informatikai Alkalmazások Tanszék Infokommunikáció Beszédjelek Spisák 1. példa Beszéd 4,5 s hosszú.
Change blindness Változás -vakság.
Patkány EEG.
Mentális állapot felmérés BCI segítségével
Idegsejtek élettana I.
Gyakorlati alkalmazás Biológiai felmérés és monitoring.
Hallási illúziók 1 Bőhm Tamás
Balaton Marcell Balázs
Hangtechnika.
Hangszerkesztés elmélet
Továbbképző előadás Eger márc. 28
A hang digitalizálása.
Kommunikációs Rendszerek
Adatátvitel elméleti alapjai
FARKAS VIVIEN. MINTAVÉTELEZÉSI FREKVENCIA  A digitalizálás során használt legfontosabb minőségi tényező a mintavételezési frekvencia, vagy mintavételezési.
Digitális audio tömörítése, hangfájlformátumok
Chapter 2 Human Information Processing
Mikroelektródás agyi mérések elemzése Kőrössy Csaba, IV. éves fizikus ELTE Biofizika szeminárium Budapest 2007.
Beszédinformációs rendszerek Szegmentális és szupraszegmentális elemek a beszédtechnológiában.
TÁMOP /1-2F Modern informatikai eszközök Multimédia az interneten Papp Szabolcs 2009.
Mechanikai hullámok.
Adat és információ. Információ, tudás  A latin informatio = felvilágosítás, tájékoztatás, oktatás szóból  Minden, ami megkülönböztet  Új ismeretté.
Hangtan.
A DIGITÁLIS HANG Mi a hang? A hang valamilyen rugalmas közegben terjedő rezgéshullám ami az élőlényekben hangérzetet kelt. A hang terjedési sebessége.
Hallás 2 Neszmélyi Bence MTA TTK Kognitív Idegtudományi és Pszichológiai Intézet BME Kognitív Tudományi Tanszék
A címben feltett kérdésre több válasz is lehetséges, egyszerűen mondhatjuk azt is, hogy „hang az, amit hallunk” – ezzel nem is járunk messze az igazságtól,
Mechanikai rezgések és hullámok
Mintavételezési frekvencia A digitalizálás során használt legfontosabb minőségi tényező a mintavételezési frekvencia, vagy mintavételezési gyakoriság (angolul:
ELQ 30A+ egyoldalas manuális mérései
Rezgések Műszaki fizika alapjai Dr. Giczi Ferenc
Összefoglalás Hangok.
Multimédia.
Műholdas helymeghatározás 6. előadás
Mozgástan, mozgásfejlődés, neurobiológia
Komplex természettudomány 9.évfolyam
Mozgástan, mozgásfejlődés, neurobiológia
Tanulás és emlékezet 5. előadás.
Jelkondicionálás.
HANG Multimédia tananyag Huszár István.
A hang digitalizálása.
Hangtani alapfogalmak
Előadás másolata:

Hallás 2

EEG Az agy elektromos aktivitásának elvezetése a fejbőrön elektródák segítségével Két pont közti feszültség különbség (referencia-elektróda) Egy adott csatornán enek a feszültségkülönbségnek az időbeni változását rögzítjük (pl. 1000 Hz mintavételi frekvencia: másodpercenként 1000 minta) Különböző frekvenciájú hullámok (frekvencia sávok): különböző éberségi-, tudatállapothoz, kognitív folyamatokhoz kapcsolhatóak Előnyök: jó idői felbontás,nem invazív,„olcsó” Hátrány: rossz téri felbontás Action potential are not sufficiently correlated over space and time to contribute to dipoles

Mit mérünk A fejfelszínről elvezethető EEG-t az idegsejtek posztszinaptikus potenciáljai (EPSP,IPSP) okozzák. Ahhoz, hogy a fejbőrön mérhető nagyságú jel keletkezzen, a sejtek orientációjának hasonlónak kell lenni.  kéregben pyramidális sejtek Több sejt szinkronizált polarizációja Dipólusok  sejten belüli és sejten kívüli áram

Forrás-lokalizáció A fejbőrről elvezetett EKP hullámformák sok esetben több forrás párhuzamos aktivitását tükrözik. A különböző források bizonyos esetekben szelektíven manipulálhatók, ami a fejbőrről elvezetett jel megváltozását okozhatja: megváltozhat a hullámforma amplitúdója, topográfiája, csúcslatenciája. De egy adott (mért) potenciál-eloszlás nem határoz meg egyértelműen egyetlen dipólus összeállítást, ami az adott eloszlást generálja!!! Egy adott eloszlást végtelen sok különböző dipólus konfiguráció létrehozhat

Eseményhez kötött potenciálok (EKP) Event-related potentials (ERP) Az elektroenkefalogramban megfigyelhető, adott eseményhez (ingerbemutatás, gombnyomás, stb.) kapcsolható szisztematikus változások. (time-locked) Az ERP módszer alapfeltevései: - jel(t) = EEG(t) + ERP(t) - EEG(t) és ERP(t) függetlenek Több jelszakaszt átlagolunk EEG(t) egy-másfél nagyságrenddel nagyobb mint ERP(t)

A kortikális EKP 2-10 mikrovolt, az agytörzsből eredő jelek ennél kisebbek, kb. 1 mikrovolt. Agytörzsi válaszok: 1,5-15 ms poststim., a VIII. agyidegből és agytörzsi struktúrákból erednek.

Agytörzsi válaszok

Közép látenciájú válaszok 25-50 ms poststim., Na (felső agytörzsből vagy a cortex-ből ered), Pa (hallókéregből bilaterálisan) Alacsony frekvenciákra érzékenyek Nagy variabilitást mutat, akár egyéneken belül és elektródák között is. Akár Nb, Pb, Nc hullámok is követhetik őket.

Lassú hullámok 50-150 ms poststim. P1-N1-P2-N2 hullámokat jelenti P1 & N1 az inger regisztrációját jelzi P2: Szenzoros input összevetése emlékezeti reprezentációkkal??? N2: inger felismerése, pontosan mi is az inger

Késői hullámok (150 ms poststim.) MMN: mismatch negativity 150-250 ms Standard ingerek közötti deviáns váltja ki Frontocentrális eloszlású Nem figyelt helyzetben is kiváltható ORN: object-related negativity 240-250 ms két külön akusztikus tárgy jelzőmozzanata (precedence effect) Összetett hangot egy forrásból érkezőnek halljuk, mert a frekvenciakomponensei jó harmonikus kapcsolatban vannak, de amennyiben akár egy komponenst 4%-kal elhangolunk, hajlamosak vagyunk azt két hangforrásból érkezőnek észlelni

Késői hullámok II. P300: inger kategorizációját jelöli, inger elhelyezése egy feladatfüggő kategóriában. Két komponensből áll: P3a: „újdonság P3”, 250-280 ms, frontocentrális eloszlású, figyelem irányításában szerep és az újdonság feldolgozásában. P3b: kb. 300 ms, parietális területek felett a legnagyobb az amplitúdója, információfeldolgozás, valószínűtlen események váltják ki; döntéshozatal; kognitív terhelés N400: válasz szavakra, vagy más értelemmel bíró ingerre (olvasott szóra is)

Hallókészülékek Kompenzációs „profil” meghatározásában segíthet a pszichoakusztika Példa: loudness recruitment Nem lehet minden hangerősséget azonos mértékben erősíteni AGC: automatic gain control Erősítés mértéke az input erősségétől függ Input: széles terjedelemoutput: szűk terjedelem Az input erőssége egy intervallum átlagos intenzitásából kerül meghatározásra

Kihívások Lassú változások: beszédszituációtól függően az átlagos intenzitásban 30 dB különbség is lehet Gyors változás (pl. ajtó csapódás) Melyiket kövesse az erősítés? Lassú vs. gyors AGC  kombinált Gyors változás a beszédben is pl. mgh –msh: ez is lehet 30 dB Syllabic compression: msh-k nagyobb mértékű erősítése  Cross modulation:több beszélőhöz kapcsolódó hangingerek egyszerre változnak  „közös sors”  egy forrásnak hallatszik

A hallási küszöb eltolódása frekvenciától is függhet Input frekvencia-sávokra bontása ~ hallási filterek, sávok külön erősítése Személyenként változhat, hogy melyik eszköz a legmegfelelőbb Beállítás:normál halláshoz hasonló, vagy minden frekvencián azonos erősség

Cochlear implants Ép hallóideg, auditoros területek, sérülés csigában (általában szőrsejtek) Hallóideg elektromos ingerlése

Frekvencia kód: Helykód: ingerlés frekvenciájának növelésével a hangmagasság érzete is nő 300-600 Hz, de nagy egyéni különbségek Frekvencia változásának észlelése: min. 5% Probléma: szűk sáv az észlelési- és a fájdalomküszöb közt Helykód: több elektróda  a csiga/hallóideg különböző frekvenciákért felelős részeit stimulálják (csúcshoz közeli részek: tompa, alaphoz közel eső részek: éles hangérzet  hangszín is) Nehéz az elektródák által ingerelt területet élesen behatárolni 4 elektróda már elég lehet a beszédészleléshez Idői tényezők nehezen megragadhatóak

Beszéd kódolása elektromos jellé AGC Hallási filterek szimulációja band-pass filterekkel Az egyes filterek kimenete kerül a megfelelő elektródákhoz: analóg hullám, vagy kb.800 Hz-es impulzusok (CIS) CIS: minden elektróda folyamatosan közvetíti az impulzusokat, de az elektródák sose aktívak egyszerre Filter kimenete az impulzusok amplitúdóját, vagy időtartamát határozza meg SMPS (Spectral Maxima Sound Processor): 16 band-pass filter , centrális frekvenciák:250-5400 Hz), 4 ms-onként kiválasztásra kerül az a 4 filter, aminek a legnagyobb az outputja  megfelelő elektródák közvetítik a jelet az outputnak megfelelő amplitudóval SPEAK (Spectral Peak): 20 filter, output folyamatos számítása, 5-10 filter kiválasztása

Digitális hang Analóg hangfelvétel: Digitális hang időben változó nyomás  időben változó feszültség 122 kHz-ig képes a frekvenciák kódolására Érzékeny, könnyen zajos lesz Digitális hang Analóg jel  szabályos időközönként mintavétel  az érték bináris jelként tárolva

Hány különböző értéket vehet fel a jel? Mintavételi frekvencia (Hz): másodpercenként hány jel-értéket rögzítünk (egyenletes időközönként). CD: 44100 Hz DVD-Audio: 44.1 – 192 kHz Nyquist kriterium: maximális frekvencia a mintavételi frekvencia fele lehet (többértelműség elkerülése) CD-nél kb. 20 kHz Felbontás: Hány különböző értéket vehet fel a jel? Gyakran bit egységekben van megadva. Pl. 16 bit felbontás azt jelenti, hogy 216 számú lehetőség van a jelek ábrázolására. CD: 16 bit DVD-Audio:16, 20, 24 bit Felbontás és amplitúdó: Mekkora a legnagyobb jel-amplitúdó (kitérés), amit le tudunk képezni? Pl.: 16 bit: az amplitúdó határai -215 -től + 215 -ig -32768-től +32767-ig Az intenzitást a legtöbb esetben decibel (dB) „egységekben” fejezzük ki, ami egy arányt takar: LdB = 20*log10(A1/A0), ahol A1 a mért amplitúdó, A0 pedig a referencia Ha a referencia a legkisebb ábrázolható amplitúdó (azaz 1 egység), akkor 70 dB ~ 3160 egységnyi 80 dB = 10000 egységnyi 90 dB ~ 31600 egységnyi amplitúdónak felel meg Kerekítés miatt szisztematikus torzítások Kivédése: zaj hozzáadásával (dither)

Tömörítés Tömörítés nélküli, veszteségmentes formátum pl. wav, aiff Tömörítéssel , veszteségmentesen tárol pl. WavPack, FLAC Tömörítéssel , veszteségesen tárol pl. MP3, AAC. Perceptuális kódolás  a nem, vagy csak kevéssé észlelt elemek kihagyása Pszichoakusztikus modell: az emberi észlelés sajátságainak figyelembevétele

Perceptuális kódolás Hallási szűrőkhöz hasonló szűrők sorozata sávokra bontás (32) Elfedési jelenség: maszkolt hangok kihagyása Bitmélység az adott szakasz és sáv átlagos szintjéhez igazítva  kisebb felbontás is elég (maszkolás és hallási küszöb figyelembevétele itt is) kb. 10-szeres tömörítés

A szenzoros elnyomás Az önindított cselekvéshez kapcsolódó szenzoros ingereket kisebb intenzitásúnak észleljük reafferencia csökkentése külső relevánsabb ingerek kiemelése (állatvilágban is) öntudat Kapuzás vs. Szenzoros elnyomás Klasszikus példa: nem tudjuk önmagunkat csikizni (Blakemore, 1998) Fontos tényező: bejósolhatóság Első vizsgálatok:szomatoszenzoros, később egyéb modalitások is

Hallási modalitás Saját-beszéd észlelése (Curio és mtsai, 2000; Heinks-Maldonado és mtsai, 2005) Gombnyomással is EKP: N1 csökkenése (Baess és mtsai, 2011; Horváth, 2012, 2013 ) viselkedéses adatok is: szubjektív egyenlőségi pont - PSE (Sato, 2008; Weiss és mtsai, 2011, 2012) bejósolhatóság, kongruencia, ágencia-kauzalitás, koincidencia Hughes és mtsai (2013)

Elméletek Preaktivációs hipotézis Forward modellek  Figyelmi tényezők Bays és Wolpert (2007) Preaktivációs hipotézis Waszak és mtsai (2012)

Kérdések bejósolhatóság, kongruencia, ágencia-kauzalitás, koincidencia tanulás Érzékenység vagy válasz kritérium? (detekció) Figyelem, orientációs-reakció (N1 komponensek) Módszertani kérdések (gombnyomás) én-felfogás szerepe