Beszédinformációs rendszerek 5. gyakorlat Mintavételezés, kvantálás, beszédkódolás Csapó Tamás Gábor 2015 tavasz.

Slides:



Advertisements
Hasonló előadás
Elektronika A/D és D/A átalakítók.
Advertisements

Készítette: Nagy Balázs
Shannon Tétel A sávszélesség egy négy pólus jellemző, amit hertzben mérnek. A sávszélesség alapvető jelentőséggel bír több területen, legfontosabbak ezek.
Gábor Dénes Főiskola Informatikai Rendszerek Intézete Informatikai Alkalmazások Tanszék Infokommunikáció Beszédjelek Házman DIGITÁLIS BESZÉDJEL ÁTVITEL.
Információ és közlemény
Az analóg jelek digitalizálása, az ADC-k típusai működésük.
NYILVÁNOS MOBIL HÁLÓZAT
Kötelező alapkérdések
Diszkrét idejű bemenet kimenet modellek
Műholdas hangátvitel Műholdas kapcsolatrendszer Előadó: Kovács Iván (MR Rt. Külső Közvetítések Osztálya)
Híranyagok tömörítése
Digitális eszközök a rádiókban
Mintavételezési frekvencia
Zajok és véletlen jelenségek interdiszciplináris területeken való alkalmazásának kutatása és oktatása. TÁMOP A/2-11/ Műszerelektronika.
A verem működése fpga-n
Multimédiás technikák 1. kérdés Melyik diszkrét médium? a)hang b)videó c)animáció d)kép.
7. Óra Tömörítés, csomagolás, kicsomagolás
3. óra Kódok, adatok.
MULTIMÉDIA ELEMEI.
Erősítők.
Az információ és kódolása Kovácsné Lakatos Szilvia
Hangtechnika I. 5-8 Schiffer Ádám
T.Gy. Beszedfelism es szint Beszédfelismerés és beszédszintézis Beszédjelek lineáris predikciója Takács György 4. előadás
Audióállományok.
Számítógépes hálózatok I.
Regresszióanalízis 10. gyakorlat.
Gábor Dénes Főiskola Informatikai Rendszerek Intézete Informatikai Alkalmazások Tanszék Infokommunikáció Beszédjelek Spisák 1. példa Beszéd 4,5 s hosszú.
Diszkrét változójú függvények Fourier sora
Hiba-előjel alapú spektrális megfigyelő Orosz György Konzulensek: Sujbert László, Péceli Gábor Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika.
Tömörítés, csomagolás, kicsomagolás
Csipkézettség csökkentés (anti-aliasing) Szirmay-Kalos László.
Hallási illúziók 1 Bőhm Tamás
Prímrekord, 2005 Csajbók Tímea, Farkas Gábor, Kasza János.
Analóg digitális átalakítás
2005. Információelmélet Nagy Szilvia 4. A gyakorlatban használt tömörítő eljárások.
Fixpontos, lebegőpontos
Algoritmizálás, adatmodellezés tanítása 8. előadás.
Alapfogalmak, módszerek, szoftverek
Hangszerkesztés elmélet
Zajok és véletlen jelenségek interdiszciplináris területeken való alkalmazásának kutatása és oktatása. TÁMOP A/2-11/ Fehérzaj-generátor.
Jelfeldolgozás alapfogalmak
A hang digitalizálása.
Kommunikációs Rendszerek
Adattömörítés.
Beépített analóg I/O terület 4-3. Beépített analóg I/O terület Beépített analóg bemeneti bitek: CIO 200 … CIO 203 ( 4 szó ) Beépített analóg kimeneti.
Adatátvitel elméleti alapjai
2005. Információelmélet Nagy Szilvia 12. A hibacsomók elleni védekezés.
A DIGITÁLIS HANG.
FARKAS VIVIEN. MINTAVÉTELEZÉSI FREKVENCIA  A digitalizálás során használt legfontosabb minőségi tényező a mintavételezési frekvencia, vagy mintavételezési.
Digitális audio tömörítése, hangfájlformátumok
Memóriakezelés feladatok Feladat: 12 bites címtartomány. 0 ~ 2047 legyen mindig.
Beszédinformációs rendszerek Szegmentális és szupraszegmentális elemek a beszédtechnológiában.
Beszédinformációs rendszerek 6. gyakorlat Beszédszintetizátorok és adatbázisaik Olaszy Gábor 2015 tavasz.
Zajok és véletlen jelenségek interdiszciplináris területeken való alkalmazásának kutatása és oktatása. TÁMOP A/2-11/ Műszerelektronika.
Adat és információ. Információ, tudás  A latin informatio = felvilágosítás, tájékoztatás, oktatás szóból  Minden, ami megkülönböztet  Új ismeretté.
Analóg jel, digitális jel
Készítette Csapó Levente 9.e osztályból A kettes számrendszer.
Mészáros István. Átviteli rendszerek 1Mészáros István Átviteli módok - szimplex (egyirányú) - félduplex (kétirányú, de váltogatva) - duplex (kétirányú)
A DIGITÁLIS HANG Mi a hang? A hang valamilyen rugalmas közegben terjedő rezgéshullám ami az élőlényekben hangérzetet kelt. A hang terjedési sebessége.
Mintavételezési frekvencia A digitalizálás során használt legfontosabb minőségi tényező a mintavételezési frekvencia, vagy mintavételezési gyakoriság (angolul:
Ilyen számítógépet szeretnék
Multimédia.
Segédlet a Kommunikáció-akusztika tanulásához VIHIAV 035
HANG Multimédia tananyag Huszár István.
A hang digitalizálása.
Munkagazdaságtani feladatok
A számítógép működésének alapjai
SZÁMVÁLTOZÁS BEMONDÓ AUTOMATA
Digitális hangtechnikaH
Cache példák 2019 (IMSC).
Előadás másolata:

Beszédinformációs rendszerek 5. gyakorlat Mintavételezés, kvantálás, beszédkódolás Csapó Tamás Gábor 2015 tavasz

MINTAVÉTELEZÉS 2

1. Egy 6 kHz-es szinusz jelet szűrés nélkül mintavételezünk 10 kHz-en. A mintavett jelben hol jelenik meg a bemeneti szinusz jel? – 4 kHz-en – 16 kHz-en – 5 kHz-en – 3 kHz-en – 2 kHz-en – 1 kHz-en 3

1. 4 a) eredeti b) mintavételezett, átlapolásmentesítő szűrő nélkül

2. Egy 5,5 kHz es mintavételi frekvenciával dolgozó mintavételező-visszaállító rendszer bemenetén nincs átlapolás mentesítő szűrő, a kimenetén pedig 2,5 kHz-es határfrekvenciájú jó minőségű aluláteresztő szűrő található. a) A bemenetre a “Sás” szó felnőtt női ejtésű alakját kapcsolva milyen jellegű kimenti jelet kapunk? (Írja le, mi történik a bemenő jellel, és indokolja a válaszát számadatokkal!) (8 pont) b) Mekkora mintavételi frekvenciát, milyen paraméterű bemeneti és kimeneti szűrőt alkalmazna, ha a cél a bemondás torzításmentes átvitele? (8 pont) 5

2. „sás” 6

2. 7 a) eredeti b) mintavételezett, átlapolásmentesítő szűrő nélkül

3. Egy ismeretlen mintavételi frekvenciával és PAM típusú, H(f) karakterisztikájú simító visszaállítóval működő mintavételező rendszer bemenetére váltakozva kerül beszédjel és zongoraszóló. A kimeneten a beszéd érthetően szól, viszont a zongoraszóló hangzása torzult. a) Adja meg a rendszer ismeretlen jellemzőit, amelyek mellett ez a kimenet előállhatott (több jó megoldás is lehet)! (10 pont) b) Javasoljon olyan megoldást, amely az eredeti jelet helyesen és elfogadható komplexitással megvalósítva átviszi! (10 pont) 8

3. 9 zongora

3. 10 b) mintavételezett, átlapolásmentesítő szűrő nélkül a) eredeti

4. Egy A4-es oldalnyi szöveget (50 sor soronként 80 betűkarakter) kell felolvastatni, digitálisan tárolni. Hogyan számolná ki számológép nélkül, hogy közelítőleg mennyi memóriába férne el a digitalizált anyag, ha 44,1 kHz 16 bit PCM formátumban tároljuk? Női beszélőt akarnak alkalmazni. Adja meg a számítás lépéseit pontokba szedve! A végén adja meg az eredményt MB- ban. 11

5. Hogyan fejezhető be következő a mondat, hogy az állítás igaz legyen? Átlapolásmentesítő szűrő nélkül 10kHz-en mintavételezve a beszédjelet, majd 4,5kHz-es aluláteresztővel visszaállítva – a hangminőség a telefonosnál biztosan jobb lesz. – átlapolódást (aliasing) kivédtük. – 9kHz körüli beszédkomponens biztosan kiszűrhető. – biztosan érthetetlen, használhatatlan lesz a kimenet. – tökéletesen visszaállítható a jel minden esetben. – többnyire érthető, de zajos lesz a jel. 12

KVANTÁLÁS 13

6. Hány bites a lineáris kvantáló, ha a maximális kivezérlésű jel és a kvantálási zaj viszonya kb. 72 dB? – 12 – 72 – 20 – 16 – 8 – 32 14

6. 15 Forrás:

7. Hogyan fejezhető be következő a mondat, hogy az állítás igaz legyen? A kvantálás(t) – lépésköze nem függ a mintavételi frekvenciától. – lépésköze függ a mintavételi frekvekvenciától. – veszteségmentesen visszaállítható. – lépésköze nem befolyásolja a hangminőséget. – csak egyenletes közökkel használják beszédre. – függ a beszéd alapfrekvenciájától. 16

7. 17 a) eredeti b) alacsony bitmélységgel kvantált

BESZÉDKÓDOLÁS 18

8. Tegye sorrendbe az alábbi 3 kódolót beszédminőség szempontjából. (2 + 2 pont) Indokolja állítását! – 8 kHz 8 bit A­law kvantálás – 2kHz 32bit lineáris kvantálás – 13 kbps GSM full rate kódoló Igaz-­e, hogy a beszédkódolók által igényelt bitsebesség, és a beszédminőségük között lineáris a kapcsolat? (3 pont) 19

9. Egy beszédadatbázist képező 15 órányi hanganyagot 44.1kHz-es mintavételi frekvenciával monóban rögzítettek a stúdióban. Juliska 64 kbps sebességű MP3-as kódolóval kódolta a beszédadatbázist, majd az anyagot MP3 formátumban odaadta Jancsinak. Jancsi a kapott hanganyagot dekódolta, majd egy A-law PCM algoritmust használó kódolóval újrakódolta. Jancsi merevlemezén kb. 412 MB-ot foglalt el az újratömörített hanganyag. Elfér-e 1 GB méretű felhő tárhelyen az adat, amit Juliska Jancsinak adott? Megfelelő minőségű-e telefonos beszédinformációs rendszerhez a Jancsi által tömörített hanganyag? Kell-e Jancsinak a kódolás előtt valamilyen jelfeldolgozási lépést végeznie? 20

10. Egy órányi 8kHz, 8 bites PCM kódolású férfi bemondó beszédanyagát szeretnénk LPC-10 kódolóval tömöríteni: ehhez az F0 értékeket 12 biten, a maradékjel energiáját és az LP együtthatókat biten tároljuk 25ms-os szegmensenként. a) Hányad részére tömöríthető így az eredeti felvétel? b) Hogyan tudna monoton (állandó hangmagasságú) beszédet előállítani a fenti eljárással? c) Miben különbözik a suttogó beszéd a normál beszédtől? Hogyan alakítaná át a fenti beszédanyagot suttogóvá? 21

10. 22

10. Eredeti LPC-10 LPC-10 + monoton LPC-10 + suttogó 23

11. Az LPC analízisnél előállított maradékjelre mi jellemző? – Az a jel a maradékjel, ami nem fért bele az analízisablakba. – Nagyobb az energiája az eredeti jelnél. – Eldobható, az eredeti jel e nélkül is visszaállítható. – Kevesebb biten kvantálható mint az eredeti jel. – Kinyerhetők belőle a formánsfrekvencia értékek. – LPC szintézis megvalósítható az eredeti maradékjel nélkül is. 24

SZORGALMI FELADAT 25

12. Egy beszédet és zenét is tartalmazó zajmentes hangfelvételt 16 biten, 24kHz-es mintavételi frekvenciával digitalizálunk, 8kHz-es bemeneti aluláteresztő szűrő használata mellett. A lejátszáshoz 0-5V eff kivezérlési tartományú 16 bites D/A átalakítót, 24 kHz-es mintalejátszási frekvenciát és 8 kHz-es kimeneti aluláteresztő szűrőt alkalmazunk. a) Mennyit romlik a jel-zaj viszony a 16 bites esethez képest (teljes kivezérlés esetén), ha a lejátszásnál 8 bites, lineáris kvantálású, D/A átalakítót alkalmazunk? b) Hogyan változna a kimeneti jel, ha a bemeneti szűrő törésponti frekvenciáját kétszereznénk meg? 26