Az előadás letöltése folymat van. Kérjük, várjon

Az előadás letöltése folymat van. Kérjük, várjon

Beszédinformációs rendszerek 5. gyakorlat Mintavételezés, kvantálás, beszédkódolás Csapó Tamás Gábor 2015 tavasz.

Hasonló előadás


Az előadások a következő témára: "Beszédinformációs rendszerek 5. gyakorlat Mintavételezés, kvantálás, beszédkódolás Csapó Tamás Gábor 2015 tavasz."— Előadás másolata:

1

2 Beszédinformációs rendszerek 5. gyakorlat Mintavételezés, kvantálás, beszédkódolás Csapó Tamás Gábor 2015 tavasz

3 MINTAVÉTELEZÉS 2

4 1. Egy 6 kHz-es szinusz jelet szűrés nélkül mintavételezünk 10 kHz-en. A mintavett jelben hol jelenik meg a bemeneti szinusz jel? – 4 kHz-en – 16 kHz-en – 5 kHz-en – 3 kHz-en – 2 kHz-en – 1 kHz-en 3

5 1. 4 a) eredeti b) mintavételezett, átlapolásmentesítő szűrő nélkül

6 2. Egy 5,5 kHz es mintavételi frekvenciával dolgozó mintavételező-visszaállító rendszer bemenetén nincs átlapolás mentesítő szűrő, a kimenetén pedig 2,5 kHz-es határfrekvenciájú jó minőségű aluláteresztő szűrő található. a) A bemenetre a “Sás” szó felnőtt női ejtésű alakját kapcsolva milyen jellegű kimenti jelet kapunk? (Írja le, mi történik a bemenő jellel, és indokolja a válaszát számadatokkal!) (8 pont) b) Mekkora mintavételi frekvenciát, milyen paraméterű bemeneti és kimeneti szűrőt alkalmazna, ha a cél a bemondás torzításmentes átvitele? (8 pont) 5

7 2. „sás” 6

8 2. 7 a) eredeti b) mintavételezett, átlapolásmentesítő szűrő nélkül

9 3. Egy ismeretlen mintavételi frekvenciával és PAM típusú, H(f) karakterisztikájú simító visszaállítóval működő mintavételező rendszer bemenetére váltakozva kerül beszédjel és zongoraszóló. A kimeneten a beszéd érthetően szól, viszont a zongoraszóló hangzása torzult. a) Adja meg a rendszer ismeretlen jellemzőit, amelyek mellett ez a kimenet előállhatott (több jó megoldás is lehet)! (10 pont) b) Javasoljon olyan megoldást, amely az eredeti jelet helyesen és elfogadható komplexitással megvalósítva átviszi! (10 pont) 8

10 3. 9 zongora

11 3. 10 b) mintavételezett, átlapolásmentesítő szűrő nélkül a) eredeti

12 4. Egy A4-es oldalnyi szöveget (50 sor soronként 80 betűkarakter) kell felolvastatni, digitálisan tárolni. Hogyan számolná ki számológép nélkül, hogy közelítőleg mennyi memóriába férne el a digitalizált anyag, ha 44,1 kHz 16 bit PCM formátumban tároljuk? Női beszélőt akarnak alkalmazni. Adja meg a számítás lépéseit pontokba szedve! A végén adja meg az eredményt MB- ban. 11

13 5. Hogyan fejezhető be következő a mondat, hogy az állítás igaz legyen? Átlapolásmentesítő szűrő nélkül 10kHz-en mintavételezve a beszédjelet, majd 4,5kHz-es aluláteresztővel visszaállítva – a hangminőség a telefonosnál biztosan jobb lesz. – átlapolódást (aliasing) kivédtük. – 9kHz körüli beszédkomponens biztosan kiszűrhető. – biztosan érthetetlen, használhatatlan lesz a kimenet. – tökéletesen visszaállítható a jel minden esetben. – többnyire érthető, de zajos lesz a jel. 12

14 KVANTÁLÁS 13

15 6. Hány bites a lineáris kvantáló, ha a maximális kivezérlésű jel és a kvantálási zaj viszonya kb. 72 dB? – 12 – 72 – 20 – 16 – 8 – 32 14

16 6. 15 Forrás: http://www.skillbank.co.uk/SignalConversion/quanterror.htm

17 7. Hogyan fejezhető be következő a mondat, hogy az állítás igaz legyen? A kvantálás(t) – lépésköze nem függ a mintavételi frekvenciától. – lépésköze függ a mintavételi frekvekvenciától. – veszteségmentesen visszaállítható. – lépésköze nem befolyásolja a hangminőséget. – csak egyenletes közökkel használják beszédre. – függ a beszéd alapfrekvenciájától. 16

18 7. 17 a) eredeti b) alacsony bitmélységgel kvantált

19 BESZÉDKÓDOLÁS 18

20 8. Tegye sorrendbe az alábbi 3 kódolót beszédminőség szempontjából. (2 + 2 pont) Indokolja állítását! – 8 kHz 8 bit A­law kvantálás – 2kHz 32bit lineáris kvantálás – 13 kbps GSM full rate kódoló Igaz-­e, hogy a beszédkódolók által igényelt bitsebesség, és a beszédminőségük között lineáris a kapcsolat? (3 pont) 19

21 9. Egy beszédadatbázist képező 15 órányi hanganyagot 44.1kHz-es mintavételi frekvenciával monóban rögzítettek a stúdióban. Juliska 64 kbps sebességű MP3-as kódolóval kódolta a beszédadatbázist, majd az anyagot MP3 formátumban odaadta Jancsinak. Jancsi a kapott hanganyagot dekódolta, majd egy A-law PCM algoritmust használó kódolóval újrakódolta. Jancsi merevlemezén kb. 412 MB-ot foglalt el az újratömörített hanganyag. Elfér-e 1 GB méretű felhő tárhelyen az adat, amit Juliska Jancsinak adott? Megfelelő minőségű-e telefonos beszédinformációs rendszerhez a Jancsi által tömörített hanganyag? Kell-e Jancsinak a kódolás előtt valamilyen jelfeldolgozási lépést végeznie? 20

22 10. Egy órányi 8kHz, 8 bites PCM kódolású férfi bemondó beszédanyagát szeretnénk LPC-10 kódolóval tömöríteni: ehhez az F0 értékeket 12 biten, a maradékjel energiáját és az LP együtthatókat 10-10 biten tároljuk 25ms-os szegmensenként. a) Hányad részére tömöríthető így az eredeti felvétel? b) Hogyan tudna monoton (állandó hangmagasságú) beszédet előállítani a fenti eljárással? c) Miben különbözik a suttogó beszéd a normál beszédtől? Hogyan alakítaná át a fenti beszédanyagot suttogóvá? 21

23 10. 22

24 10. Eredeti LPC-10 LPC-10 + monoton LPC-10 + suttogó 23

25 11. Az LPC analízisnél előállított maradékjelre mi jellemző? – Az a jel a maradékjel, ami nem fért bele az analízisablakba. – Nagyobb az energiája az eredeti jelnél. – Eldobható, az eredeti jel e nélkül is visszaállítható. – Kevesebb biten kvantálható mint az eredeti jel. – Kinyerhetők belőle a formánsfrekvencia értékek. – LPC szintézis megvalósítható az eredeti maradékjel nélkül is. 24

26 SZORGALMI FELADAT 25

27 12. Egy beszédet és zenét is tartalmazó zajmentes hangfelvételt 16 biten, 24kHz-es mintavételi frekvenciával digitalizálunk, 8kHz-es bemeneti aluláteresztő szűrő használata mellett. A lejátszáshoz 0-5V eff kivezérlési tartományú 16 bites D/A átalakítót, 24 kHz-es mintalejátszási frekvenciát és 8 kHz-es kimeneti aluláteresztő szűrőt alkalmazunk. a) Mennyit romlik a jel-zaj viszony a 16 bites esethez képest (teljes kivezérlés esetén), ha a lejátszásnál 8 bites, lineáris kvantálású, D/A átalakítót alkalmazunk? b) Hogyan változna a kimeneti jel, ha a bemeneti szűrő törésponti frekvenciáját kétszereznénk meg? 26


Letölteni ppt "Beszédinformációs rendszerek 5. gyakorlat Mintavételezés, kvantálás, beszédkódolás Csapó Tamás Gábor 2015 tavasz."

Hasonló előadás


Google Hirdetések