數(shù)字通信原理第3章

上傳人：6*** IP屬地：湖北上傳時(shí)間：2021-12-15 格式：PPT 頁(yè)數(shù)：174 大?。?.93MB 積分：28 舉報(bào) 版權(quán)申訴

已閱讀5頁(yè)，還剩169頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第三章第三章語(yǔ)言信號(hào)壓縮編碼語(yǔ)言信號(hào)壓縮編碼3.1 語(yǔ)言信號(hào)壓縮編碼的基本概念3.2 自適應(yīng)差值脈沖編碼調(diào)制3.3 參量編碼3.4 混合編碼3.5 低速率語(yǔ)言壓縮編碼的應(yīng)用一.壓縮編碼原因語(yǔ)音信號(hào)的壓縮編碼是研究如何降低語(yǔ)音信號(hào)編碼速率的問題。以語(yǔ)音信號(hào)為例，模擬形式下帶寬一般不到以語(yǔ)音信號(hào)為例，模擬形式下帶寬一般不到4KHz4KHz，經(jīng)過調(diào)制后，所需傳輸帶寬不會(huì)超過經(jīng)過調(diào)制后，所需傳輸帶寬不會(huì)超過8KHz8KHz。但是以但是以8KHz8KHz抽樣，并且每個(gè)樣值用抽樣，并且每個(gè)樣值用8 8位二進(jìn)制代碼表位二進(jìn)制代碼表示時(shí)，即采用示時(shí)，即采用A A率率1313折線折線PCMPCM數(shù)字語(yǔ)音信號(hào)

2、時(shí)，信息速率數(shù)字語(yǔ)音信號(hào)時(shí)，信息速率為為64Kbit/s64Kbit/s。利用二進(jìn)制理想基帶傳輸系統(tǒng)傳輸利用二進(jìn)制理想基帶傳輸系統(tǒng)傳輸一路這樣的數(shù)字語(yǔ)音信號(hào)。所占一路這樣的數(shù)字語(yǔ)音信號(hào)。所占系統(tǒng)的最小頻帶寬度為系統(tǒng)的最小頻帶寬度為32KHz32KHz。頻帶利用率頻帶利用率=傳輸速率傳輸速率/帶寬帶寬二.什么是語(yǔ)音壓縮編碼？把數(shù)碼率低于64Kbit/s64Kbit/s的語(yǔ)音編碼方法稱為語(yǔ)音壓縮編碼技術(shù)三. .語(yǔ)音編碼分類根據(jù)編碼器的實(shí)現(xiàn)機(jī)理，分成三大類波形編碼波形編碼參數(shù)編碼參數(shù)編碼混合編碼混合編碼了解語(yǔ)音信號(hào)數(shù)字化的目的和要求；理解語(yǔ)音信號(hào)的波形編碼、參數(shù)編碼、混合編碼的定義；掌握對(duì)語(yǔ)音編碼

3、信號(hào)性能的評(píng)價(jià)方法。理解標(biāo)量量化和矢量量化的原理及異同點(diǎn)。了解語(yǔ)音信號(hào)的參數(shù)模型；掌握線性預(yù)測(cè)的概念、線性預(yù)測(cè)聲碼器的工作原理。掌握參數(shù)編碼中合成分析算法的基本原理和優(yōu)缺點(diǎn)；了解常用的語(yǔ)音信號(hào)的混合編碼方法。要求語(yǔ)音編碼方法的分類：波形編碼參數(shù)編碼混合編碼一、語(yǔ)音編碼的方法1. 語(yǔ)音信號(hào)的波形編碼原理：從語(yǔ)音信號(hào)波形的特點(diǎn)出發(fā)，在時(shí)間軸上對(duì)模擬語(yǔ)音按一定的速率抽樣，對(duì)波形的采樣值，或其預(yù)測(cè)值，或其預(yù)測(cè)的誤差值進(jìn)行量化并編碼，編碼后的信號(hào)為二進(jìn)制數(shù)字序列。解碼是其反過程，將收到的數(shù)字序列經(jīng)過解碼和濾波恢復(fù)成模擬信號(hào)。一、語(yǔ)音編碼的方法特點(diǎn)：以重構(gòu)語(yǔ)音波形為目的，力圖使重建語(yǔ)音波形保持原語(yǔ)音信

4、號(hào)的波形形狀。適應(yīng)能力強(qiáng)、語(yǔ)音質(zhì)量好。編碼速率高。在16至64kbit/s的速率上獲得較高的編碼質(zhì)量，當(dāng)速率進(jìn)一步下降時(shí)，其性能會(huì)下降較快。一、語(yǔ)音編碼的方法常見的波形編碼方式：脈沖編碼調(diào)制（PCM）、增量調(diào)制（M）自適應(yīng)增量調(diào)制（ADM）、自適應(yīng)預(yù)測(cè)編碼（APC）、自適應(yīng)差分編碼（ADPCM）子帶編碼（SBC）一、語(yǔ)音編碼的方法2. 語(yǔ)音信號(hào)的參量編碼原理：從語(yǔ)音信號(hào)的產(chǎn)生機(jī)理出發(fā)，構(gòu)造語(yǔ)音信號(hào)的模型，提取描述語(yǔ)音信號(hào)的特征參數(shù)，對(duì)模型參數(shù)或其預(yù)測(cè)值進(jìn)行編碼。在收端，根據(jù)特征參數(shù)通過模型重構(gòu)語(yǔ)音信號(hào)。一、語(yǔ)音編碼的方法特點(diǎn)：編碼速率低，可壓縮到2kbit/s-800bit/s；合成的話音質(zhì)

5、量差，只能達(dá)到中等，自然度較低；不以重構(gòu)語(yǔ)音波形為目的，在解碼端重構(gòu)一個(gè)新的有相似聲音但波形不盡相同的語(yǔ)音信號(hào)。常見的方式：線性預(yù)測(cè)編碼（LPC），及其各種改進(jìn)型，如MBE等。一、語(yǔ)音編碼的方法3. 語(yǔ)音信號(hào)的混合編碼原理：混合編碼將波形編碼和參量編碼組合起來，克服了原有波形編碼和參量編碼的弱點(diǎn)，結(jié)合各自的長(zhǎng)處，力圖保持波形編碼的高質(zhì)量和參量編碼的低速率，目前在1.2-16Kbit/s速率上能夠得到高質(zhì)量的合成語(yǔ)音。特點(diǎn)：低速率、高質(zhì)量一、語(yǔ)音編碼的方法常見混合編碼方式：多脈沖激勵(lì)線性預(yù)測(cè)編碼（MPLPC）規(guī)則脈沖激勵(lì)線性預(yù)測(cè)編碼（RPELPC）碼本激勵(lì)線性預(yù)測(cè)編碼（CELP）矢

6、量和激勵(lì)線性預(yù)測(cè)編碼（VSELP）多帶激勵(lì)（MBE）及改進(jìn)型IMBE（Improved MBE）和AMBE(Advanced MBE) 混合激勵(lì)線性預(yù)測(cè)（MELP）一、語(yǔ)音編碼的方法說明上述語(yǔ)音編碼器的分類方法只是一種較通用的方法，并非十分嚴(yán)格。除了傳統(tǒng)的波形編碼器和參數(shù)編碼器以外，許多新型的語(yǔ)音編碼技術(shù)都比較復(fù)雜，很難嚴(yán)格分類。基于分析合成技術(shù)的線性預(yù)測(cè)編碼器則既可以視為參量編碼，也可以視為混合編碼。一、語(yǔ)音編碼的方法 1、語(yǔ)音編碼質(zhì)量、語(yǔ)音編碼質(zhì)量 2、編碼速率、編碼速率 3、編解碼的復(fù)雜度、編解碼的復(fù)雜度 4、編解碼延時(shí)、編解碼延時(shí) 在給定編碼速率的條件下，用盡量小的編解碼延時(shí)和在給定

7、編碼速率的條件下，用盡量小的編解碼延時(shí)和復(fù)雜度，得到盡量好的重建語(yǔ)音質(zhì)量復(fù)雜度，得到盡量好的重建語(yǔ)音質(zhì)量。二、語(yǔ)音編碼性能的評(píng)價(jià)1 1、語(yǔ)音編碼質(zhì)量、語(yǔ)音編碼質(zhì)量語(yǔ)音編碼質(zhì)量是衡量語(yǔ)音編碼算法優(yōu)劣的關(guān)鍵性能語(yǔ)音編碼質(zhì)量是衡量語(yǔ)音編碼算法優(yōu)劣的關(guān)鍵性能之一，在數(shù)字通信中常把語(yǔ)音質(zhì)量分為四級(jí)：之一，在數(shù)字通信中常把語(yǔ)音質(zhì)量分為四級(jí)：廣播級(jí)質(zhì)量廣播級(jí)質(zhì)量長(zhǎng)途電話質(zhì)量長(zhǎng)途電話質(zhì)量通信質(zhì)量通信質(zhì)量合成語(yǔ)音質(zhì)量合成語(yǔ)音質(zhì)量二、語(yǔ)音編碼性能的評(píng)價(jià)語(yǔ)音編碼質(zhì)量用質(zhì)量評(píng)估指標(biāo)衡量，分為以客觀評(píng)定語(yǔ)音編碼質(zhì)量用質(zhì)量評(píng)估指標(biāo)衡量，分為以客觀評(píng)定方法和主觀評(píng)定方法兩大類。方法和主觀評(píng)定方法兩大類。是以人類

8、聽話時(shí)對(duì)語(yǔ)音質(zhì)量的感覺來評(píng)是以人類聽話時(shí)對(duì)語(yǔ)音質(zhì)量的感覺來評(píng)定。國(guó)際上常用的主觀評(píng)定標(biāo)準(zhǔn)主要有：定。國(guó)際上常用的主觀評(píng)定標(biāo)準(zhǔn)主要有：平均意見得分平均意見得分MOSMOS（Mean Opinion ScoreMean Opinion Score）判斷韻字測(cè)試判斷韻字測(cè)試DRTDRT（Diagnostic Rhyme TestDiagnostic Rhyme Test）判斷滿意度測(cè)量判斷滿意度測(cè)量DAMDAM（Diagnostic Acceptability Diagnostic Acceptability MeasureMeasure）可懂度指數(shù)可懂度指數(shù)AI (Articulation

9、 Index)AI (Articulation Index)二、語(yǔ)音編碼性能的評(píng)價(jià) 由于語(yǔ)音質(zhì)量高低的直接感受者是聽眾的主觀感覺，由于語(yǔ)音質(zhì)量高低的直接感受者是聽眾的主觀感覺，因此目前廣泛采用的評(píng)定方法是因此目前廣泛采用的評(píng)定方法是MOS。獲取。獲取MOS的方法是，的方法是，由數(shù)十名試聽者在不同的信道環(huán)境中試聽并給予評(píng)分，然由數(shù)十名試聽者在不同的信道環(huán)境中試聽并給予評(píng)分，然后求出統(tǒng)計(jì)平均分。后求出統(tǒng)計(jì)平均分。采用采用5級(jí)分制：級(jí)分制：5分為優(yōu)，分為優(yōu)，4分為良，分為良，3分為中，分為中，2分為差，分為差，1分為不可接受。分為不可接受。4分以及分以及4分以上為高質(zhì)量語(yǔ)音編碼，達(dá)到分以上為高質(zhì)量

10、語(yǔ)音編碼，達(dá)到長(zhǎng)途電話質(zhì)量，長(zhǎng)途電話質(zhì)量， 3.5分左右為通信級(jí)質(zhì)量，分左右為通信級(jí)質(zhì)量，3分以及分以及3分以下分以下為合成語(yǔ)音質(zhì)量。為合成語(yǔ)音質(zhì)量。二、語(yǔ)音編碼性能的評(píng)價(jià)對(duì)應(yīng)于主觀評(píng)定等級(jí)，還有一個(gè)收聽注意力等級(jí)對(duì)應(yīng)于主觀評(píng)定等級(jí)，還有一個(gè)收聽注意力等級(jí)（Listening Effort ScaleListening Effort Scale）。表）。表2.12.1給出了主觀評(píng)定等級(jí)制給出了主觀評(píng)定等級(jí)制的質(zhì)量等級(jí)、分?jǐn)?shù)和相應(yīng)的收聽注意力等級(jí)。的質(zhì)量等級(jí)、分?jǐn)?shù)和相應(yīng)的收聽注意力等級(jí)。二、語(yǔ)音編碼性能的評(píng)價(jià)時(shí)域：信噪比、加權(quán)信噪比、平均分段信噪比等時(shí)域：信噪比、加權(quán)信噪比、平均分段信噪比等頻域

11、：譜失真測(cè)度、頻域：譜失真測(cè)度、LPC倒譜距離測(cè)度等倒譜距離測(cè)度等以上方法都建立在度量均方誤差的基礎(chǔ)上，其特點(diǎn)是以上方法都建立在度量均方誤差的基礎(chǔ)上，其特點(diǎn)是計(jì)算簡(jiǎn)單，但不能完全反映人對(duì)語(yǔ)音質(zhì)量的感覺，對(duì)于計(jì)算簡(jiǎn)單，但不能完全反映人對(duì)語(yǔ)音質(zhì)量的感覺，對(duì)于速率為速率為16kb/s以下的中低速率語(yǔ)音編碼尤為突出。主要以下的中低速率語(yǔ)音編碼尤為突出。主要適用于速率較高的波形編碼的質(zhì)量測(cè)量。適用于速率較高的波形編碼的質(zhì)量測(cè)量。二、語(yǔ)音編碼性能的評(píng)價(jià)2. 編碼速率語(yǔ)言編碼后的速率用“比特/秒”度量或用“比特/樣點(diǎn)”度量。后者表示平均每個(gè)樣點(diǎn)所需的編碼比特?cái)?shù)。通常編碼速率高，則編碼后的語(yǔ)音質(zhì)量高，但

12、所需的傳輸帶寬就寬。二、語(yǔ)音編碼性能的評(píng)價(jià)好的語(yǔ)音編碼方法，是在保持語(yǔ)音質(zhì)量的前提下好的語(yǔ)音編碼方法，是在保持語(yǔ)音質(zhì)量的前提下降低速率。降低速率。3. 編解碼的復(fù)雜程度編解碼的復(fù)雜度與算法有關(guān)。通常算法復(fù)雜，則話音質(zhì)量好，編碼速率低，但實(shí)現(xiàn)復(fù)雜，且體積大、功耗高、成本高，甚至編解碼延時(shí)大。二、語(yǔ)音編碼性能的評(píng)價(jià)二、語(yǔ)音編碼性能的評(píng)價(jià)4. 編解碼延時(shí)編解碼延時(shí)也與算法有關(guān)。通常算法復(fù)雜，則編解碼延時(shí)大。也有專為減小延時(shí)的短延時(shí)算法。不過，質(zhì)量好、延時(shí)短的算法，相應(yīng)的編碼速率也高。5. 5. 對(duì)語(yǔ)音編碼的要求對(duì)語(yǔ)音編碼的要求在滿足用戶對(duì)語(yǔ)音質(zhì)量要求的前提下，編碼速率在滿足用戶對(duì)語(yǔ)音質(zhì)量要求

13、的前提下，編碼速率盡可能低。盡可能低。在強(qiáng)噪聲環(huán)境中，算法應(yīng)有較好的抗誤碼性在強(qiáng)噪聲環(huán)境中，算法應(yīng)有較好的抗誤碼性能，也就是說，當(dāng)誤碼率較低時(shí)（例如為能，也就是說，當(dāng)誤碼率較低時(shí)（例如為10-2）仍能保持良好的話音質(zhì)量。仍能保持良好的話音質(zhì)量。編、解碼延遲應(yīng)控制在幾十毫秒之內(nèi)，越短越編、解碼延遲應(yīng)控制在幾十毫秒之內(nèi)，越短越好。好。復(fù)雜性要適度，以便于使用大規(guī)模集成器件。復(fù)雜性要適度，以便于使用大規(guī)模集成器件。二、語(yǔ)音編碼性能的評(píng)價(jià)二、語(yǔ)音編碼性能的評(píng)價(jià)6. 6. 幾種語(yǔ)音編碼的質(zhì)量比較幾種語(yǔ)音編碼的質(zhì)量比較LD-CELP：低時(shí)延：低時(shí)延-碼激勵(lì)線性預(yù)測(cè)碼激勵(lì)線性預(yù)測(cè)MP-MLQ：多脈沖最

14、大似然量化：多脈沖最大似然量化ACELP：代數(shù)碼激勵(lì)線性預(yù)測(cè)：代數(shù)碼激勵(lì)線性預(yù)測(cè)CS-ACELP：共軛結(jié)構(gòu)：共軛結(jié)構(gòu)-代數(shù)碼激勵(lì)線性預(yù)測(cè)代數(shù)碼激勵(lì)線性預(yù)測(cè)三、語(yǔ)音編碼的標(biāo)準(zhǔn)ETSI：歐洲電信標(biāo)準(zhǔn)協(xié)會(huì)：歐洲電信標(biāo)準(zhǔn)協(xié)會(huì)TIA：（北美）電信工業(yè)協(xié)會(huì)：（北美）電信工業(yè)協(xié)會(huì)RCR：（日本）無線通信系統(tǒng)研究發(fā)展中心：（日本）無線通信系統(tǒng)研究發(fā)展中心DVSI：數(shù)字聲音系統(tǒng)公司：數(shù)字聲音系統(tǒng)公司三、語(yǔ)音編碼的標(biāo)準(zhǔn)保密電話語(yǔ)音編碼標(biāo)準(zhǔn)保密電話語(yǔ)音編碼標(biāo)準(zhǔn)三、語(yǔ)音編碼的標(biāo)準(zhǔn) 窄帶保密電話應(yīng)用于帶寬受限信道，目前只有美國(guó)公窄帶保密電話應(yīng)用于帶寬受限信道，目前只有美國(guó)公布了所用保密電話的標(biāo)準(zhǔn)。布了所用保密電話的標(biāo)準(zhǔn)

15、。 FS-1015FS-1015標(biāo)準(zhǔn)：標(biāo)準(zhǔn)：2.4kb/s2.4kb/s的的LPCLPC聲碼器，聲碼器，DRTDRT為為90%90% FS-1016 FS-1016標(biāo)準(zhǔn)：標(biāo)準(zhǔn)：4.8kb/s4.8kb/s的的CELPCELP聲碼器，比聲碼器，比FS-1015FS-1015具具有好得多的自然度及環(huán)境噪聲能力。有好得多的自然度及環(huán)境噪聲能力。混合激勵(lì)線性預(yù)測(cè)（混合激勵(lì)線性預(yù)測(cè)（MELPMELP）標(biāo)準(zhǔn)：編碼速率為）標(biāo)準(zhǔn)：編碼速率為2.4kb/s2.4kb/s，語(yǔ)音質(zhì)量?jī)?yōu)于，語(yǔ)音質(zhì)量?jī)?yōu)于FS-1016FS-1016。各種語(yǔ)音編碼標(biāo)準(zhǔn)的相對(duì)效果各種語(yǔ)音編碼標(biāo)準(zhǔn)的相對(duì)效果三、語(yǔ)音編碼的標(biāo)準(zhǔn)第三章第三章

16、語(yǔ)言信號(hào)壓縮編碼語(yǔ)言信號(hào)壓縮編碼3.1 語(yǔ)言信號(hào)壓縮編碼的基本概念3.2 自適應(yīng)差值脈沖編碼調(diào)制3.3 參量編碼3.4 混合編碼3.5 低速率語(yǔ)言壓縮編碼的應(yīng)用自適應(yīng)差值脈沖編碼調(diào)制原理（ADPCMADPCM）3.1.1差值脈沖編碼（DPCM）v1.編碼思想編碼思想提高通信質(zhì)量提高通信質(zhì)量必須必須減小量化誤差減小量化誤差減小量化級(jí)減小量化級(jí)當(dāng)抽樣值范圍確定時(shí)當(dāng)抽樣值范圍確定時(shí)增加編碼增加編碼位數(shù)位數(shù)N增加編碼位數(shù)可獲得大的信噪比在編碼位數(shù)固定時(shí)，減小抽樣值的變化在編碼位數(shù)固定時(shí)，減小抽樣值的變化范圍，也同樣可以提高信噪比范圍，也同樣可以提高信噪比即：若縮小抽樣值（被編碼信號(hào)）的即：若縮小抽樣值

17、（被編碼信號(hào)）的變化范圍，就可以在保證信噪比不變變化范圍，就可以在保證信噪比不變的情況下，減小編碼的位數(shù)。這就是的情況下，減小編碼的位數(shù)。這就是差值編碼的中心思想差值編碼的中心思想二、差值編碼模型圖在原來的抽樣值中減去某一個(gè)值，然后在原來的抽樣值中減去某一個(gè)值，然后對(duì)兩者之差進(jìn)行編碼。在接收端將解碼對(duì)兩者之差進(jìn)行編碼。在接收端將解碼值再加上發(fā)送端所減去的值便可恢復(fù)出值再加上發(fā)送端所減去的值便可恢復(fù)出原始值。原始值。 x(n) + d(n) c(n) d(n) x(n） - x(n) x(n) 差值編碼模型譯碼譯碼+編碼編碼+圖中：x(n)是原始樣值（n時(shí)刻的抽樣值）x(n)為減去量d(n)=

18、x(n)-x(n) 為差值可以看出：可以看出：（1）、）、d(n)越小，在相同的編碼位數(shù)時(shí)越小，在相同的編碼位數(shù)時(shí)信噪比越大信噪比越大（2）、收發(fā)端必須有相同的減去量）、收發(fā)端必須有相同的減去量x(n)根據(jù)前些時(shí)刻的樣值來預(yù)測(cè)現(xiàn)時(shí)刻的樣值，只要傳遞預(yù)測(cè)值和實(shí)際值之差，而不需要每個(gè)樣值的編碼都傳。這種方法就稱為DPCMDPCM編碼。三、DPCM系統(tǒng)1、DPCM系統(tǒng)的概念：系統(tǒng)的概念：舉例來說,設(shè)以1/Ts1/Ts的速率對(duì)信號(hào)S S（t t）抽樣,在時(shí)刻前可得到，等一組樣值.以前面N N個(gè)樣值作為基礎(chǔ)對(duì) 的預(yù)測(cè)值是snTt sSTnTSsSTnTS2sSNTnTSSnTSSSNiiSiTnT

19、SWnTS1不同時(shí)刻樣值的加權(quán)系數(shù):根據(jù)相關(guān)性情況，可設(shè)根據(jù)相關(guān)性情況，可設(shè) 為常量或變量為常量或變量iWiW2 2、實(shí)現(xiàn)預(yù)測(cè)的橫向?yàn)V波器（NN階預(yù)測(cè)器）在每個(gè)抽樣時(shí)刻到來時(shí)，濾波器輸出將會(huì)給出下一個(gè)樣值的預(yù)測(cè)值。SnTS一般來說，在抽樣時(shí)刻一般來說，在抽樣時(shí)刻 t=nTs 時(shí)所得的預(yù)測(cè)時(shí)所得的預(yù)測(cè)值值與真正的樣值與真正的樣值并不相同。并不相同。SnTSSSNiiSiTnTSWnTS1N階預(yù)測(cè)器輸出：階預(yù)測(cè)器輸出：差值脈沖編碼就是對(duì)真正的樣值與過去的樣值為基礎(chǔ)得到的估值之間的差值進(jìn)行量化和編碼。SnTSSnTS3 3、DPCMDPCM系統(tǒng)模型框圖量化器量化器預(yù)測(cè)器預(yù)測(cè)器預(yù)測(cè)器預(yù)測(cè)器下張

20、圖中：x(n)為抽樣信號(hào)的實(shí)際值d(n)=x(n)-x(n)圖x(n)=x(n)+d(n)該系統(tǒng)的量化誤差可以表示為：e(n)=x(n)-x(n) =d(n)+x(n)-x(n)+d(n) =d(n)-d(n)上式表明：系統(tǒng)的傳輸誤差就是差值（）的量化誤差4 4、DPCMDPCM系統(tǒng)的抗噪聲性能分析系統(tǒng)信噪比定義為：)()(22neEnxE=)()()()(2222neEndEndEnxE=qPSNRG 預(yù)測(cè)器增益預(yù)測(cè)器增益量化器的量化量化器的量化信噪比信噪比GP1預(yù)測(cè)器有預(yù)測(cè)器有增益增益加預(yù)測(cè)器后加預(yù)測(cè)器后反而不利反而不利2x2d2eGP ： DPCM系統(tǒng)相對(duì)于PCM系統(tǒng)而言的信噪比增益。量

21、化器產(chǎn)生的信噪比qSNR即非預(yù)測(cè)的PCM系統(tǒng)的量化信噪比提高系統(tǒng)信噪比采取的措施)()()()(2222neEndEndEnxE)(2ndE)(2neE減小 x(n)精確)(2ndEd(n)d(n)=x(n)-x(n)最佳預(yù)測(cè))(2neE量化誤差最佳量化小結(jié)一.壓縮編碼的原因二.什么是語(yǔ)音壓縮編碼三.語(yǔ)音編碼分類3.1ADPCM系統(tǒng)3.3.1DPCM一.差值編碼思想二.差值編碼系統(tǒng)模型圖三.DPCM系統(tǒng)1.概念2.預(yù)測(cè)器模型圖3.DPCM系統(tǒng)模型4.DPCM系統(tǒng)的抗噪聲性能分析自適應(yīng)差值脈沖編碼調(diào)制（ADPCMADPCM）1、實(shí)質(zhì)：DPCM+自適應(yīng)量化和自適應(yīng)預(yù)測(cè)固定預(yù)測(cè)固定預(yù)測(cè) 固定量化固定

22、量化2 2、定義能夠?qū)崿F(xiàn)自適應(yīng)預(yù)測(cè)功能，或者自適應(yīng)量化功能或者同時(shí)實(shí)現(xiàn)兩種自適應(yīng)功能的DPCMDPCM系統(tǒng)稱為ADPCMADPCM系統(tǒng)。3.3.設(shè)計(jì)的目的ADPCM充分利用了語(yǔ)音波形的統(tǒng)計(jì)特征和人耳聽覺特性,其設(shè)計(jì)思路主要瞄準(zhǔn)了兩個(gè)目標(biāo):a: 盡可能去掉語(yǔ)音信號(hào)中的冗余信號(hào)b:以有效的方式將可用比特分配給語(yǔ)音信號(hào)對(duì)消除冗余后的信號(hào)對(duì)消除冗余后的信號(hào),從自適應(yīng)角度從自適應(yīng)角度進(jìn)行最佳編碼進(jìn)行最佳編碼1.11.1預(yù)測(cè)的自適應(yīng)(1).極點(diǎn)預(yù)測(cè)器1.預(yù)測(cè)器的結(jié)構(gòu)(用重建信號(hào)x(n)進(jìn)行的預(yù)測(cè)）+量化器量化器預(yù)測(cè)器預(yù)測(cè)器+X(n)X(n)d(n)d(n)編碼編碼X(n)P（Z）X（n）a:極點(diǎn)預(yù)測(cè)器的方

23、框圖極點(diǎn)預(yù)測(cè)器的方框圖b:b:預(yù)測(cè)器傳遞函數(shù)P(z)P(z) )()()(ZXZXZPN階預(yù)測(cè)器公式：X(n)=)(1jnxaNjj進(jìn)行Z變換后得：jNjjzzxazx)()(1則預(yù)測(cè)器的傳遞函數(shù)為：)()()(ZXZXZPjNjjza1為預(yù)測(cè)系數(shù)為預(yù)測(cè)系數(shù)jac:c:重建濾波器+預(yù)測(cè)器預(yù)測(cè)器x(n)x(n)X(n)d(n)H(Z)重建濾波器重建濾波器=)1 ( 2 12Px2d2x=E x(n)+Ex(n-1)-2Ex(n)x(n-1)22=2E x(n)-2Ex(n)x(n-1)2分析：分析：)()(22ndEnxEPG=)1 ( 211p（）一階（）一階最佳最佳線性預(yù)測(cè)線性預(yù)測(cè)求最佳預(yù)測(cè)

24、系數(shù)求最佳預(yù)測(cè)系數(shù)h1N=1時(shí)；時(shí)；X(n)=h1x(n-1)則差值信號(hào)為：則差值信號(hào)為：d(n)=x(n)-h1x(n-1)+ +Ed (n)=2d2=Ex(n)- h1x(n-1) 2=E x(n)+h1Ex(n-1)-2h1Ex(n)x(n-1)22=2x2d21xh2- -2112xPh=)21 (1112Phhx2求使求使最小的最小的h1的值的值2012hdmin2)(d221)1 (xp令令得最佳預(yù)測(cè)系數(shù)得最佳預(yù)測(cè)系數(shù)h1opt=p1當(dāng)當(dāng)N=1時(shí)的最大預(yù)測(cè)增益為：時(shí)的最大預(yù)測(cè)增益為：)1 (121maxpGpb.b.二階線性預(yù)測(cè)（N=2N=2）d(n)=x(n)-h1x(n-1)-

25、h2x(n-2)2d=Ed (n)2=Ex(n)- h1x(n-1)-h2(n-2) 2令令012hd022hd得最佳得最佳h1,h2212111)1 (ppphopt2121221 ppphopt2212222121min21)(1 )(xdpppp大于或者大于或者等于零等于零故二階預(yù)測(cè)器總是優(yōu)于一階預(yù)測(cè)器第三章第三章語(yǔ)言信號(hào)壓縮編碼語(yǔ)言信號(hào)壓縮編碼3.1 語(yǔ)言信號(hào)壓縮編碼的基本概念3.2 自適應(yīng)差值脈沖編碼調(diào)制3.3 參量編碼3.4 混合編碼3.5 低速率語(yǔ)言壓縮編碼的應(yīng)用波形編碼的語(yǔ)音質(zhì)量較高，實(shí)現(xiàn)簡(jiǎn)單，但速率較高占頻帶較寬，因而將影響通信系統(tǒng)的容量。尋求低速高質(zhì)的語(yǔ)音編碼方法一直是數(shù)

26、字通信領(lǐng)域的一個(gè)重要研究課題。一個(gè)重要概念：對(duì)反映語(yǔ)音信號(hào)特征的參量進(jìn)行編碼與傳輸而不是對(duì)信號(hào)的時(shí)域波形本身，即所謂參量編碼。可大大降低編碼信號(hào)的速率。參量編碼的基礎(chǔ)是語(yǔ)音信號(hào)特征參數(shù)的提取與語(yǔ)音信號(hào)的恢復(fù)，這將涉及到語(yǔ)音產(chǎn)生的物理模型。一、語(yǔ)音信號(hào)產(chǎn)生模型及其特征參數(shù) 人的發(fā)音系統(tǒng)由聲帶、聲道及次聲門系統(tǒng)構(gòu)成。聲道從聲帶的開口即聲門處開始，直至嘴唇，包括咽喉、口、舌等。聲道的截面積是可變化的，它取決于舌、唇等器官的位置。次聲門系統(tǒng)由肺、氣管等級(jí)聯(lián)，是產(chǎn)生語(yǔ)音的能量來源。簡(jiǎn)化的發(fā)音系統(tǒng)如圖所示。濁音與清音濁音又稱為有聲音：氣流通過聲門時(shí)，如果聲帶振動(dòng)并產(chǎn)生一個(gè)準(zhǔn)周期的空氣脈沖激勵(lì)聲道，就得到

27、濁音。典型的濁音波形如圖所示，其中（a）為聲門處的氣流速度，（b）為通過聲道后在唇口處形成的聲壓波形，濁音波形具有明顯準(zhǔn)周期性。聲帶振動(dòng)的頻率稱為基音頻率fb，周期為基音周期Tp，基音頻率fb一般在70300 Hz的范圍內(nèi)，相當(dāng)于Tp為315 ms?；糁芷赥p是語(yǔ)音信號(hào)的主要特征之一。清音又稱無聲音：聲道在某處發(fā)生收縮，同時(shí)迫使空氣以高速?zèng)_過一收縮部位而產(chǎn)生湍流，就得到清音。發(fā)清音時(shí)聲帶不振動(dòng)，此時(shí)是由湍流建立的寬帶噪聲源激勵(lì)著聲道。清音波形類似于噪聲，如圖（c）所示。聲道的無損聲管模型聲道包括口腔和鼻腔，相當(dāng)于一個(gè)非均勻截面的管道。當(dāng)產(chǎn)生聲音的氣流順著這個(gè)管道傳播時(shí)，其頻譜特征就由管道的

28、選擇性所改變聲道的諧振頻率稱為共振峰頻率，簡(jiǎn)稱共振峰，其中第一共振峰就是上面提到的基音頻率fb。聲道截面面積與聲道長(zhǎng)度方向之間的依賴關(guān)系稱為聲道的面積函數(shù)，聲道諧振特性主要取決于其面積函數(shù)。實(shí)際聲道可以用一個(gè)級(jí)聯(lián)的無損聲管來表示。當(dāng)選用較多數(shù)量的短管級(jí)聯(lián)，使得各管的截面積逼近聲道的面積函數(shù)時(shí)，就可以期望級(jí)聯(lián)聲管的諧振頻率接近于聲道的諧振頻率。由N個(gè)等長(zhǎng)無損聲管級(jí)聯(lián)的系統(tǒng)的傳遞函數(shù)為： 1( )1NkkkGV zz70一、語(yǔ)音信號(hào)的基本特性語(yǔ)音信號(hào)的基本特性語(yǔ)音信號(hào)是非穩(wěn)態(tài)信號(hào)，特征隨時(shí)間變化；但在一個(gè)很短的時(shí)間段內(nèi)（約5ms-50ms）具有相對(duì)穩(wěn)定的特征，稱為準(zhǔn)平穩(wěn)信號(hào)。語(yǔ)音信號(hào)通?？梢苑譃?/p>

29、濁音、清音和混合音。濁音在時(shí)域上具有準(zhǔn)周期性，在頻域上，精細(xì)譜具有周期性起伏的諧波特性，譜包絡(luò)具有共振峰結(jié)構(gòu)。清音類似于隨機(jī)噪聲，其頻帶較寬。濁音段的信號(hào)能量要比清音段的能量高，這一特點(diǎn)可用于判斷區(qū)分清、濁音。語(yǔ)音產(chǎn)生模型無損聲管模型等效為時(shí)變線性數(shù)字濾波器，濾波器極點(diǎn)對(duì)應(yīng)聲道振峰頻率，增益參數(shù)G和濾波器系數(shù)都隨時(shí)間而變化，且依賴于面積函數(shù)。終端等效的概念：當(dāng)線性系統(tǒng)的一組參數(shù)被控制之后其輸出就具有所希望的語(yǔ)音特征，而這組參量是和實(shí)際語(yǔ)音產(chǎn)生過程有關(guān)的。語(yǔ)音信號(hào)具有慢變化特征：其激勵(lì)和聲道的特征在1020 ms時(shí)間內(nèi)保持不變。語(yǔ)音產(chǎn)生模型包括激勵(lì)源、聲道和反映嘴唇處聲輻射影響的部分，如圖所示。

30、語(yǔ)音特征參數(shù)激勵(lì)源分為濁音激勵(lì)和清音激勵(lì)，用濁音/清音開關(guān)進(jìn)行控制。在濁音段，激勵(lì)由沖激序列發(fā)生器和聲門脈沖模型G(z)級(jí)聯(lián)構(gòu)成，前者產(chǎn)生周期為Tp的單位沖激響應(yīng)，后者為波形成形系統(tǒng)。在清音段，激勵(lì)模型為一個(gè)隨機(jī)噪聲源及控制清音激勵(lì)強(qiáng)度的增益參數(shù)。聲道模型為一個(gè)時(shí)變線性系統(tǒng)，輻射模型為R(z)。語(yǔ)音特征參數(shù)有：基音周期、共振峰頻率、語(yǔ)音強(qiáng)度、清音/濁音判決及時(shí)變?yōu)V波器參數(shù)等。特征參量的提取提取方法是基于數(shù)字信號(hào)處理的理論和技術(shù)。語(yǔ)音信號(hào)的準(zhǔn)平穩(wěn)特性，即在1020 ms的短時(shí)間內(nèi)認(rèn)為語(yǔ)音的特征參數(shù)不變。這樣，可將實(shí)際語(yǔ)音信號(hào)分成短的時(shí)間段，在各個(gè)段內(nèi)分別進(jìn)行參量提取。簡(jiǎn)單介紹一下基音提取問題

31、：包括兩個(gè)方面：首先進(jìn)行濁音/清音判決，然后再確定濁音段語(yǔ)音波形的周期Tp。濁音/清音判決或稱基音檢測(cè)，就是判決一個(gè)時(shí)間段是濁音段還是清音段，這就要利用濁音和清音在時(shí)域和頻域上的差別。濁音信號(hào)具有準(zhǔn)周期性，頻譜有峰值，即基音及其諧波。濁音信號(hào)有較強(qiáng)的相關(guān)性。清音信號(hào)的波形近似于噪聲，沒有準(zhǔn)周期性，其頻譜沒有明顯的峰值，時(shí)域中也不存在相關(guān)性?；籼崛〉姆椒ê芏?，可分為三類。利用語(yǔ)音信號(hào)的時(shí)域特征，如自相關(guān)函數(shù)法；利用語(yǔ)音信號(hào)的頻域特征，主要是利用濁音頻譜的峰值特征；綜合利用語(yǔ)音信號(hào)頻域與時(shí)域特征，如線性預(yù)測(cè)技術(shù)等。 76一、語(yǔ)音信號(hào)的基本特性語(yǔ)音信號(hào)的基本特性語(yǔ)音信號(hào)是非穩(wěn)態(tài)信號(hào)，特征隨時(shí)

32、間變化；但在一個(gè)很短的時(shí)間段內(nèi)（約5ms-50ms）具有相對(duì)穩(wěn)定的特征，稱為準(zhǔn)平穩(wěn)信號(hào)。語(yǔ)音信號(hào)通?？梢苑譃闈嵋簟⑶逡艉突旌弦?。濁音在時(shí)域上具有準(zhǔn)周期性，在頻域上，精細(xì)譜具有周期性起伏的諧波特性，譜包絡(luò)具有共振峰結(jié)構(gòu)。清音類似于隨機(jī)噪聲，其頻帶較寬。濁音段的信號(hào)能量要比清音段的能量高，這一特點(diǎn)可用于判斷區(qū)分清、濁音。77pjjjzaGzH11)(全極點(diǎn)數(shù)字濾波器時(shí)變數(shù)字濾波器-線性預(yù)測(cè)（LP）綜合濾波器pjjjnsanGxns1)()()(全極點(diǎn)數(shù)字濾波器的輸出(LPC差分方程) 輸出值s(n)可以用當(dāng)前的輸入值Gx(n)和過去輸出樣值的加權(quán)和來表示二、語(yǔ)音信號(hào)的產(chǎn)生模型78 清/濁音類型；

33、基音周期TP；代表聲道的時(shí)變?yōu)V波器的系數(shù)aj及濾波器階數(shù)p；增益系數(shù)G；說明：根據(jù)語(yǔ)音信號(hào)慢變化的特點(diǎn)，可以每隔10-30ms左右預(yù)測(cè)一次上述各參數(shù)的值。即以每10-30ms為一幀傳送一次參數(shù)樣值的編碼，并不傳送話音樣值的編碼，因此比特速率低得多。二、語(yǔ)音信號(hào)的產(chǎn)生模型79清濁音判決濾波器參數(shù) 分析Ga1ap量化編碼器U/V解碼器Ga1apTPU/V激勵(lì) 信號(hào)產(chǎn)生合成濾波器信道基音周期提取TPs(n)預(yù)加重加窗s(n)LPC聲碼器的原理框圖三、LPCLPC聲碼器的工作原理801、全極點(diǎn)數(shù)字濾波器參數(shù)的確定模型階數(shù)P的選擇，應(yīng)該從頻譜估計(jì)精度、計(jì)算量、存儲(chǔ)量等多

34、方面綜合進(jìn)行考慮。 P取很大值時(shí)，可以獲得很好的信號(hào)譜估計(jì)，但增加的計(jì)算量和存儲(chǔ)量代價(jià)太大。語(yǔ)音譜估計(jì)時(shí)主要關(guān)心的是聲道的諧振特性，P值過大，估計(jì)的譜中保留許多信號(hào)譜細(xì)節(jié)，反而使共振峰分析效果變壞。階數(shù)P的經(jīng)驗(yàn)值在8-12之間。通常采用10個(gè)極點(diǎn)的濾波器，模型就能正確描述共振峰特性和譜的基本形狀。三、LPCLPC聲碼器的工作原理81三、LPCLPC聲碼器的工作原理 )()()(212pjjjnsansEneEE 設(shè)計(jì)的濾波器系數(shù) aj就是使得誤差e(n)在某個(gè)預(yù)定的準(zhǔn)則下最小，通常是根據(jù)最小均方誤差準(zhǔn)則求解ajpjjjnsansne1)()()(在LPC模型中，信號(hào)s(n)的估計(jì)誤差e(n)

35、為：82三、LPCLPC聲碼器的工作原理在語(yǔ)音信號(hào)保持平穩(wěn)的短時(shí)段內(nèi)，令E對(duì)aj的偏導(dǎo)數(shù)為零，得到：piinsjnsansEpjj, 10)( )()(1即：piijianpjnj, 1)0 ,(),(1其中：)()(),(jnsinsEjin 根據(jù)最小均方誤差準(zhǔn)則通過求解P個(gè)方程來得到P個(gè)未知數(shù)aj83三、LPCLPC聲碼器的工作原理2、基音檢測(cè)根據(jù)語(yǔ)音信號(hào)的特性檢測(cè)基音周期的方法有：利用時(shí)域特性檢測(cè)；利用頻域特性檢測(cè)；同時(shí)利用時(shí)域和頻域特性檢測(cè)；這里只介紹利用時(shí)域特性檢測(cè)84 基本原理：利用語(yǔ)音信號(hào)的時(shí)域波形的相似性，通過比較原始信號(hào)和它的移位信號(hào)的相似程度來尋找基音周期。如果

36、移位的距離等于基音周期，則兩個(gè)信號(hào)之間將具有最大的相似性。常用方法：短時(shí)自相關(guān)函數(shù)和短時(shí)平均幅度差函數(shù)AMDF。三、LPCLPC聲碼器的工作原理85 設(shè)sw(n)是一段加窗的語(yǔ)音信號(hào)，它的非零區(qū)域?yàn)椋簄 = 0N-1。 )()()(nwnsnsw s(n)語(yǔ)音輸入信號(hào)，w(n)是加權(quán)窗，一般取矩形窗或哈明窗。三、LPCLPC聲碼器的工作原理86三、LPCLPC聲碼器的工作原理 sw(n)的自相關(guān)函數(shù)稱為語(yǔ)音信號(hào)s(n)的短時(shí)自相關(guān)函數(shù)，用Rw(l)表示。)()()()()(10lnslslnslslRwlNnwwnww 如果s(n)是濁音，其短時(shí)自相關(guān)函數(shù)Rw(l)呈現(xiàn)出明顯的周期性，其周期

37、等于s(n)的基音周期?；糁芷诰褪堑谝粋€(gè)峰值點(diǎn)到零點(diǎn)之間的距離。87其它值哈明窗其它值矩形窗nNnNnnwnNnnw0) 1(012cos46. 054. 0)(0) 1(01)(三、LPCLPC聲碼器的工作原理88 設(shè)sw(n)是一段加窗的語(yǔ)音信號(hào)，它的非零區(qū)域?yàn)椋簄 = 0 N-1。 sw(n)的短時(shí)平均幅度差函數(shù)rw(l)定義為：10)()()()()(lNnwwnwwwnslnsnslnslr三、LPCLPC聲碼器的工作原理89三、LPCLPC聲碼器的工作原理如果s(n)是濁音，其AMDF也呈現(xiàn)出明顯的周期性，其周期等于s(n)的基音周期。與Rw(l)不同的是在基音周期的各個(gè)整數(shù)倍點(diǎn)

38、上，rw(l)具有谷值而非峰值，要通過尋找最深谷值點(diǎn)的位置來確定基音周期。 90周期性語(yǔ)音信號(hào)短時(shí)自相關(guān)函數(shù)和AMDF示例三、LPCLPC聲碼器的工作原理91AMDF方法計(jì)算簡(jiǎn)單，只需減法和取幅度運(yùn)算，不需要乘法運(yùn)算。AMDF的動(dòng)態(tài)范圍較小，易于算法的定點(diǎn)實(shí)現(xiàn)。AMDF在基音周期點(diǎn)上，它的谷點(diǎn)銳度較之短時(shí)自相關(guān)函數(shù)的峰點(diǎn)銳度更尖銳，估值精度更高、更穩(wěn)健。但信號(hào)不夠平穩(wěn)時(shí)，這個(gè)特點(diǎn)不明顯。短時(shí)自相關(guān)函數(shù)法的特點(diǎn)是對(duì)相位不敏感，在信號(hào)有相位失真時(shí)能較好地檢測(cè)基音。三、LPCLPC聲碼器的工作原理92 窗長(zhǎng) 為了使較好地反映sw(n)的周期性，窗長(zhǎng) N 至少應(yīng)大于兩個(gè)基音周期，一般取長(zhǎng)度為10-30

39、ms。克服共振峰特性造成的干擾由于共振峰的干擾，會(huì)出現(xiàn)Rw(l)的第一最大峰值點(diǎn)或rw(l)的第一最深谷值點(diǎn)與基音周期不一致的情況，當(dāng)基音周期性和共振峰周期性混在一起時(shí)，檢測(cè)出來的周期可能是NpNf（Np是基音周期， Nf是第一共振峰的周期）。三、LPCLPC聲碼器的工作原理93a. 用低通濾波器（60Hz900Hz）對(duì)語(yǔ)音信號(hào)進(jìn)行濾波，去除大部分共振峰的影響，基音頻率最高約450Hz，濾波后可以保留其一、二次諧波。b. 先對(duì)語(yǔ)音信號(hào)進(jìn)行非線性變換（例如“中心削波”），然后再求Rw(l)或rw(l)，這樣可以明顯地改善基音估計(jì)的效果，基音周期點(diǎn)上，峰值點(diǎn)或深谷值點(diǎn)比削波前得到的要尖銳、突

40、出。三、LPCLPC聲碼器的工作原理94 清/濁音類型；基音周期TP；代表聲道的時(shí)變?yōu)V波器的系數(shù)aj及濾波器階數(shù)p；增益系數(shù)G；說明：根據(jù)語(yǔ)音信號(hào)慢變化的特點(diǎn)，可以每隔10-30ms左右預(yù)測(cè)一次上述各參數(shù)的值。即以每10-30ms為一幀傳送一次參數(shù)樣值的編碼，并不傳送話音樣值的編碼，因此比特速率低得多。二、語(yǔ)音信號(hào)的產(chǎn)生模型95清濁音判決濾波器參數(shù) 分析Ga1ap量化編碼器U/V解碼器Ga1apTPU/V激勵(lì) 信號(hào)產(chǎn)生合成濾波器信道基音周期提取TPs(n)預(yù)加重加窗s(n)LPC聲碼器的原理框圖三、LPCLPC聲碼器的工作原理96 對(duì)于加窗的語(yǔ)音信號(hào)sw(n

41、)，當(dāng)窗的起點(diǎn) n = 0 時(shí)，語(yǔ)音信號(hào)sw(n)的短時(shí)能量用E 表示，短時(shí)平均幅度用M 表示，計(jì)算公式如下：102)(NnwnsE10)(NnnsM三、LPCLPC聲碼器的工作原理 3、濁音、清音及無聲的判別根據(jù)語(yǔ)音信號(hào)的短時(shí)能量、短時(shí)平均幅度和短時(shí)過零率來判斷當(dāng)前幀的語(yǔ)音信號(hào)是濁音、清音，還是無聲。97 語(yǔ)音信號(hào)的過零率用Z 表示，它表示一幀語(yǔ)音信號(hào)中波形穿過橫軸（零電平）的次數(shù)。它可以用相鄰兩個(gè)取樣改變符號(hào)的次數(shù)來計(jì)算：10)1(sgn)(sgn21NnwwnsnsZ三、LPCLPC聲碼器的工作原理98 濁音（V）的M 最大而Z 最低，當(dāng)采樣率為8kHz，幀長(zhǎng)為 20ms 時(shí)， Z 的

42、平均值約為20；清音（U）的M 居中而Z 最高，當(dāng)采樣率為8kHz，幀長(zhǎng)為20ms時(shí)， Z 的平均值約為70；無聲（S）的M 最低而Z 居中。三、LPCLPC聲碼器的工作原理99三、LPCLPC聲碼器的工作原理在S、U、V三種情況下，短時(shí)平均幅度M 和短時(shí)過零率Z 的條件概率密度函數(shù)示意圖通道聲碼器通道聲碼器發(fā)送端通過若干個(gè)并聯(lián)的通道對(duì)語(yǔ)音信號(hào)進(jìn)行粗略的頻譜估計(jì)接收端產(chǎn)生的信號(hào)其頻譜與發(fā)送端所規(guī)定的頻譜相匹配。濾波器組隊(duì)頻帶的劃分不均勻，低頻帶的帶寬窄，高頻段的帶寬寬主要缺點(diǎn)：需要進(jìn)行基音檢查和清濁音的判決，精確性較差。通道數(shù)量有限，造成信號(hào)頻譜畸變共振峰聲碼器共振峰聲碼器對(duì)整體的語(yǔ)音信

43、號(hào)進(jìn)行分析，提取信號(hào)中的共振峰的位置、幅度、帶寬等參數(shù)，構(gòu)成對(duì)應(yīng)清音和濁音的兩個(gè)聲道濾波器。與通道聲碼器相比，共振峰聲碼器合成的語(yǔ)音質(zhì)量較好，而且比特率可以壓縮的更低104四、LPC10LPC10聲碼器清濁音判決濾波器參數(shù)分析Ga1ap量化編碼器U/V解碼器Ga1apTPU/V激勵(lì) 信號(hào)產(chǎn)生合成濾波器信道基音周期提取TPs(n)預(yù)加重加窗s(n)1051、LPC10聲碼器概況 LPC-10聲碼器采用10階線性預(yù)測(cè)分析濾波器，編碼速率為2.4kb/s，被美國(guó)在1981年作為聯(lián)邦標(biāo)準(zhǔn)FS-1015用于窄帶保密通信。其語(yǔ)音質(zhì)量清晰可懂，但抗噪聲的能力和自然度尚有欠缺。四、LPC10L

44、PC10聲碼器106四、LPC10LPC10聲碼器2、 LPC10編碼器低通濾波A/D變換預(yù)加重計(jì)算分析相位基音分析存儲(chǔ)器低通濾波器清/濁檢測(cè)基音及清/濁校正2階逆濾波AMDF基音提取V/UV數(shù)字語(yǔ)音出并變串及同步產(chǎn)生誤差校正的映射參數(shù)編碼基音周期預(yù)測(cè)器分析存儲(chǔ)器計(jì)算RMS計(jì)算預(yù)測(cè)參數(shù)2幀參數(shù)存儲(chǔ)器2幀參數(shù)存儲(chǔ)器RMSRC107 采樣率8kHz，每個(gè)樣本量化為12bit得到數(shù)字化語(yǔ)音，每180個(gè)樣點(diǎn)分為一幀（22.5ms ），以幀為處理單元。四、LPC10LPC10聲碼器預(yù)加重的目的是加強(qiáng)語(yǔ)音譜中的高頻共振峰，使語(yǔ)音短時(shí)譜以及線性預(yù)測(cè)分析中的余數(shù)（殘差）頻譜變得更為平坦，從而提高了譜參數(shù)估值的

45、精確性。19375. 01)(zzHpw 在提取聲道參數(shù)之前，先進(jìn)行預(yù)加重（高頻提升）處理，預(yù)加重濾波器的傳輸函數(shù)Hpw(z)為：108傳輸函數(shù)Hpw(z)的幅頻和相頻特性四、LPC10LPC10聲碼器010002000300040005000600070008000-100-50050100Frequency (Hertz)Phase (degrees)010002000300040005000600070008000-30-20-10010Frequency (Hertz)Magnitude Response (dB)109 該編碼方案中采用協(xié)方差法計(jì)算預(yù)測(cè)系數(shù)ai,i = 1, , P，

46、P=10。預(yù)測(cè)系數(shù)不適于直接量化，因?yàn)樗奈⑿∽兓瘯?huì)導(dǎo)致LP綜合濾波器極點(diǎn)位置很大的變化，很可能造成濾波器不穩(wěn)定，為了保證濾波器的穩(wěn)定性，要求有相當(dāng)高的量化精度（每個(gè)系數(shù)需要810bits ）。四、LPC10LPC10聲碼器110四、LPC10LPC10聲碼器為了降低量化比特?cái)?shù)，采用了在數(shù)學(xué)上完全等價(jià)的P個(gè)反射系數(shù)(RC：Reflection Coefficient) ki, i = 1, , P代替預(yù)測(cè)系數(shù)進(jìn)行量化編碼。濾波器穩(wěn)定的條件是參數(shù)ki滿足下式：1ik 此條件在量化時(shí)容易保證?？梢酝ㄟ^Levinson-Durbin算法求得部分相關(guān)系數(shù)（Partial Correlation)，

47、部分相關(guān)系數(shù)與RC在理論上是互為相反數(shù)。111 增益RMS由下式計(jì)算：21121NiiSNRMSSi是經(jīng)過預(yù)加重后的數(shù)字語(yǔ)音信號(hào)樣本，N是分析幀長(zhǎng)度。對(duì)于濁音幀，其分析幀長(zhǎng)取為130個(gè)樣本以內(nèi)的基音周期整數(shù)倍值；對(duì)于清音幀，其分析幀長(zhǎng)取為長(zhǎng)度為22.5ms的整個(gè)幀的中點(diǎn)為中心的130個(gè)樣點(diǎn)。四、LPC10LPC10聲碼器112 清/濁音判決是利用模式匹配技術(shù)，基于低帶能量、AMDF函數(shù)的最大值與最小值之比、過零率三個(gè)因素判別。最后對(duì)基音值、清濁音判決結(jié)果用動(dòng)態(tài)規(guī)劃算法，在三幀范圍內(nèi)進(jìn)行平滑和錯(cuò)誤校正，從而給出當(dāng)前幀的基音周期、清濁音判決參數(shù)V/U。采用基于短時(shí)平均幅度差函數(shù)(AMDF)法提

48、取基音周期。四、LPC10LPC10聲碼器113 對(duì)10個(gè)反射系數(shù)RC、增益RMS、基音周期、U/V判決標(biāo)志以及同步信號(hào)共編碼成每幀54bits，幀長(zhǎng)22.5ms，因此編碼速率為2.4kb/s。各比特分配如下表：四、LPC10LPC10聲碼器114四、LPC10LPC10聲碼器濁音清音濁音清音基音周期/清濁音77K(6)4RMS55K(7)4同步11K(8)4K(1)55K(9)3K(2)55K(10)2K(3)555433K(4)55誤差校正020K(5)4115四、LPC10LPC10聲碼器3、 LPC10譯碼器串/并變換同步檢測(cè)誤差檢測(cè)校正編碼參數(shù)解碼幀塊到基音塊轉(zhuǎn)換與插值輸出存儲(chǔ)器計(jì)算

49、增益綜合器清/濁音開關(guān)去加重D/A低通濾波合成語(yǔ)音出RMSRC基音周期V/UV反射系數(shù)轉(zhuǎn)換成預(yù)測(cè)系數(shù)基音產(chǎn)生噪音產(chǎn)生116（1）采用過分簡(jiǎn)化的二元激勵(lì)，合成的語(yǔ)音自然度較低；（2）穩(wěn)健性(Robustness)差。（3）LPC-10的語(yǔ)音譜共振峰的位置以及帶寬估值有時(shí)會(huì)產(chǎn)生很大的失真，從而影響語(yǔ)音的質(zhì)量。當(dāng)濁音的基音頻率接近譜包絡(luò)中的第一共振峰時(shí)，LPC譜估計(jì)在共振峰位置上出現(xiàn)極其尖銳的峰值（估計(jì)失真），使得相應(yīng)得在合成語(yǔ)音中會(huì)出現(xiàn)尖峰或較大的毛刺，影響語(yǔ)音質(zhì)量。四、LPC10LPC10聲碼器117 采用混合激勵(lì)代替簡(jiǎn)單的二元激勵(lì)，使合成語(yǔ)音的質(zhì)量得到改善。激勵(lì)脈沖加抖動(dòng)：對(duì)每個(gè)基音周期的長(zhǎng)度

50、乘上一個(gè)0.751.25之間均勻分布的隨機(jī)數(shù)以改善語(yǔ)音的自然度。4、 LPC-10e聲碼器 LPC-10e聲碼器采用針對(duì)LPC-10聲碼器的缺點(diǎn)加以改進(jìn)的算法，并能與LPC-10聲碼器兼容，用于美國(guó)第三代保密電話。四、LPC10LPC10聲碼器118LPC-10提取基音采用的是AMDF，它的顯著特點(diǎn)是不需要乘法，計(jì)算較小。 LPC-10e中采用LPC的殘差信號(hào)或語(yǔ)音信號(hào)的短時(shí)自相關(guān)函數(shù)，利用動(dòng)態(tài)規(guī)劃的平滑算法來更準(zhǔn)確地提取基音周期。四、LPC10LPC10聲碼器119 線譜頻率LSF(Line Spectrum Frequency)，或稱為線譜對(duì)(Line Spectrum Pair)是數(shù)學(xué)上

51、與線性預(yù)測(cè)系數(shù)ai(i = 1, , P)和反射系數(shù)ki(i = 1, , P)完全等價(jià)的另一種表示方式。LSF參數(shù)集i(i = 1, , P)都在單位圓上，它們?cè)陬l域描述全極點(diǎn)濾波器H(Z)。LSF在數(shù)學(xué)上有良好的量化特性。四、LPC10LPC10聲碼器120四、LPC10LPC10聲碼器在求取LSF參數(shù)及量化過程中，如果保持LSF參數(shù)的有序有界性質(zhì)，即:就可以保證全極點(diǎn)濾波器H(Z)是穩(wěn)定的。pp 1210a.LSF參數(shù)有序有界性121b. LSF誤差相對(duì)獨(dú)立性某個(gè)頻率點(diǎn)的LSF偏差只對(duì)該頻率附近的語(yǔ)音頻譜產(chǎn)生影響，而對(duì)其它LSF頻率上的語(yǔ)音頻譜影響不大，這有利于LSF的參數(shù)量化和插值。

52、四、LPC10LPC10聲碼器122c. LSF參數(shù)的量化在標(biāo)量量化時(shí)，通過設(shè)計(jì)最佳的LSF參數(shù)的非均勻標(biāo)量量化器，可以用較少的量化比特達(dá)到較高的量化精度。例如：對(duì)10個(gè)LSF參數(shù)，根據(jù)每個(gè)參數(shù)所起的作用，分配的量化比特?cái)?shù)為：3、4、4、4、4、3、3、3、3、3，共34bits。所得的合成語(yǔ)音質(zhì)量與用41bits對(duì)反射系數(shù)k參數(shù)量化得到的合成語(yǔ)音質(zhì)量相比較，在聽覺上沒有任何差別，兩者的波形完全吻合，計(jì)算量化畸變約為1dB。四、LPC10LPC10聲碼器123四、LPC10LPC10聲碼器c. LSF參數(shù)的量化(續(xù))在矢量量化時(shí)，將10個(gè)LSF合并成（4，6）兩個(gè)矢量，每個(gè)矢量量化為12bi

53、ts，共24bits,可以得到平均譜畸變?yōu)?dB的“透明”矢量量化。第三章第三章語(yǔ)言信號(hào)壓縮編碼語(yǔ)言信號(hào)壓縮編碼3.1 語(yǔ)言信號(hào)壓縮編碼的基本概念3.2 自適應(yīng)差值脈沖編碼調(diào)制3.3 參量編碼3.4 混合編碼3.5 低速率語(yǔ)言壓縮編碼的應(yīng)用3.4.1 3.4.1 混合編碼混合編碼結(jié)合了波形編碼和參量編碼的優(yōu)點(diǎn)，采用線性技術(shù)構(gòu)成聲道模型。不止傳輸預(yù)測(cè)參數(shù)和清濁音信息，而且也同時(shí)傳輸預(yù)測(cè)誤差信息。實(shí)現(xiàn)混合編碼基本方法是以參量編碼特別是線性預(yù)測(cè)編碼LPC為基礎(chǔ)的，（AbSAbS，Analysis-By-SynthesisAnalysis-By-Synthesis）的基本）的基本思想：用合成來指導(dǎo)

54、分析。思想：用合成來指導(dǎo)分析。將合成器引入編碼系統(tǒng)，使之與分析器相結(jié)合，在編碼將合成器引入編碼系統(tǒng)，使之與分析器相結(jié)合，在編碼器中產(chǎn)生與譯碼器完全一致的合成語(yǔ)音，將此合成語(yǔ)音與原器中產(chǎn)生與譯碼器完全一致的合成語(yǔ)音，將此合成語(yǔ)音與原始語(yǔ)音相比較，根據(jù)一定的誤差準(zhǔn)則調(diào)整計(jì)算分析器的各個(gè)始語(yǔ)音相比較，根據(jù)一定的誤差準(zhǔn)則調(diào)整計(jì)算分析器的各個(gè)參數(shù)，使兩者之間的誤差達(dá)到最小。然后將誤差最小時(shí)的語(yǔ)參數(shù)，使兩者之間的誤差達(dá)到最小。然后將誤差最小時(shí)的語(yǔ)音參數(shù)傳送到接收端，得到高質(zhì)量的合成語(yǔ)音。音參數(shù)傳送到接收端，得到高質(zhì)量的合成語(yǔ)音。合成分析法在在LPCLPC基礎(chǔ)上采用基礎(chǔ)上采用AbSAbS的編碼方法。的編碼

55、方法。AbS-LPCAbS-LPC編碼器包編碼器包括三個(gè)基本部分：括三個(gè)基本部分：時(shí)變?yōu)V波器（包括時(shí)變?yōu)V波器（包括LPCLPC和基音濾波器）和基音濾波器）基于感知的最小化處理；基于感知的最小化處理；激勵(lì)信號(hào)；激勵(lì)信號(hào)； AbS-LPCAbS-LPC編碼器AbS-LPC編碼器與譯碼器編碼器與譯碼器AbS-LPCAbS-LPC編碼器激勵(lì)信號(hào)激勵(lì)信號(hào)產(chǎn)生產(chǎn)生編碼端編碼端基音合成基音合成濾波器濾波器LPCLPC合成合成濾波器濾波器解碼端解碼端輸出輸出語(yǔ)音語(yǔ)音誤差最小誤差最小優(yōu)化的優(yōu)化的激勵(lì)激勵(lì)基音合成基音合成濾波器濾波器LPCLPC合成合成濾波器濾波器( )e n誤差誤差- -+ +原始原始語(yǔ)音

56、語(yǔ)音( )s n( )s n( )s nAbS-LPCAbS-LPC編碼器合成分析編碼方法的特點(diǎn)：合成分析編碼方法的特點(diǎn)：發(fā)端是一個(gè)閉環(huán)系統(tǒng)；發(fā)端是一個(gè)閉環(huán)系統(tǒng)；對(duì)激勵(lì)信號(hào)沒有明顯的分類，由閉環(huán)系統(tǒng)選擇與對(duì)激勵(lì)信號(hào)沒有明顯的分類，由閉環(huán)系統(tǒng)選擇與原始語(yǔ)音誤差最小的激勵(lì)信號(hào)，使得合成語(yǔ)音質(zhì)量原始語(yǔ)音誤差最小的激勵(lì)信號(hào)，使得合成語(yǔ)音質(zhì)量比傳統(tǒng)的比傳統(tǒng)的LPCLPC聲碼器好得多。聲碼器好得多。1 1、時(shí)變?yōu)V波器時(shí)變?yōu)V波器時(shí)變?yōu)V波器由時(shí)變?yōu)V波器由LPCLPC合成濾波器和基音合成濾波器合成濾波器和基音合成濾波器級(jí)連組成。級(jí)連組成。 LPCLPC合成濾波器實(shí)現(xiàn)語(yǔ)音的短時(shí)預(yù)測(cè)；合成濾波器實(shí)現(xiàn)語(yǔ)音的短時(shí)

57、預(yù)測(cè)；基音合成濾波器實(shí)現(xiàn)語(yǔ)音的長(zhǎng)時(shí)預(yù)測(cè)?；艉铣蔀V波器實(shí)現(xiàn)語(yǔ)音的長(zhǎng)時(shí)預(yù)測(cè)。AbS-LPCAbS-LPC編碼器在語(yǔ)音譜中，能量較高的頻段（如共振峰處）的噪聲相在語(yǔ)音譜中，能量較高的頻段（如共振峰處）的噪聲相對(duì)于能量較低頻段的噪聲不易被感知，在度量原始語(yǔ)音與合對(duì)于能量較低頻段的噪聲不易被感知，在度量原始語(yǔ)音與合成語(yǔ)音之間的誤差時(shí)可以計(jì)入這一因素，在語(yǔ)音能量高的頻成語(yǔ)音之間的誤差時(shí)可以計(jì)入這一因素，在語(yǔ)音能量高的頻段，允許二者的誤差大一些，反之則小一些，為此在計(jì)算二段，允許二者的誤差大一些，反之則小一些，為此在計(jì)算二者誤差時(shí)，引入頻域感覺加權(quán)濾波器者誤差時(shí)，引入頻域感覺加權(quán)濾波器W W(f)(f

58、)。 2 2、感覺加權(quán)濾波器、感覺加權(quán)濾波器是根據(jù)人的聽覺特性對(duì)預(yù)測(cè)殘差信是根據(jù)人的聽覺特性對(duì)預(yù)測(cè)殘差信號(hào)進(jìn)行處理，以產(chǎn)生較好的主觀聽覺效果。號(hào)進(jìn)行處理，以產(chǎn)生較好的主觀聽覺效果。AbS-LPCAbS-LPC編碼器3 3、激勵(lì)信號(hào)源、激勵(lì)信號(hào)源激勵(lì)信號(hào)是激勵(lì)信號(hào)是AbS-LPCAbS-LPC模型的輸入，包含不能由時(shí)變?yōu)V模型的輸入，包含不能由時(shí)變?yōu)V波器譜模型表征的殘差結(jié)構(gòu)，如超出長(zhǎng)時(shí)線性預(yù)測(cè)范圍波器譜模型表征的殘差結(jié)構(gòu)，如超出長(zhǎng)時(shí)線性預(yù)測(cè)范圍的相關(guān)性就不能由長(zhǎng)時(shí)線性預(yù)測(cè)包含，激勵(lì)信號(hào)還包括的相關(guān)性就不能由長(zhǎng)時(shí)線性預(yù)測(cè)包含，激勵(lì)信號(hào)還包括不能用確定方法有效表征的隨機(jī)結(jié)構(gòu)。采用不能用確定方法有效表

59、征的隨機(jī)結(jié)構(gòu)。采用AbSAbS方法的聲方法的聲碼器都用激勵(lì)信號(hào)源的種類命名。例如：碼器都用激勵(lì)信號(hào)源的種類命名。例如：（1 1）多脈沖線性預(yù)測(cè)編碼（）多脈沖線性預(yù)測(cè)編碼（MP-LPCMP-LPC）（2 2）規(guī)則脈沖激勵(lì)）規(guī)則脈沖激勵(lì)長(zhǎng)時(shí)預(yù)測(cè)編碼（長(zhǎng)時(shí)預(yù)測(cè)編碼（RPE-LTP-LPCRPE-LTP-LPC）（3 3）碼本激勵(lì)線性預(yù)測(cè)編碼（）碼本激勵(lì)線性預(yù)測(cè)編碼（CELPCELP） AbS-LPCAbS-LPC編碼器語(yǔ)音的合成分析編碼語(yǔ)音的合成分析編碼合成分析法（合成分析法（ABSABS）的基本思想是用合成來指導(dǎo)分）的基本思想是用合成來指導(dǎo)分析。析。將合成器引入編碼瑞，使之與分析器相結(jié)臺(tái)

60、，在編將合成器引入編碼瑞，使之與分析器相結(jié)臺(tái)，在編碼器中產(chǎn)生與譯碼器端完全一致的合成語(yǔ)音，將此碼器中產(chǎn)生與譯碼器端完全一致的合成語(yǔ)音，將此合成語(yǔ)音與原始語(yǔ)音相比較，根據(jù)一定的誤差準(zhǔn)則合成語(yǔ)音與原始語(yǔ)音相比較，根據(jù)一定的誤差準(zhǔn)則調(diào)整計(jì)算各個(gè)參數(shù)，使得二者之間的誤差達(dá)到最小。調(diào)整計(jì)算各個(gè)參數(shù)，使得二者之間的誤差達(dá)到最小。將誤差最小時(shí)的系統(tǒng)參數(shù)傳送到接收端，可以合成將誤差最小時(shí)的系統(tǒng)參數(shù)傳送到接收端，可以合成較高質(zhì)量的語(yǔ)音。較高質(zhì)量的語(yǔ)音。 AbSLPCAbSLPC編碼方法編碼方法(1)(1)緩存一幀語(yǔ)音采樣值通道緩存一幀語(yǔ)音采樣值通道LPCLPC分析得到一組分析得到一組LPCLPC系數(shù)。系數(shù)。(2

人人文庫(kù)> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

數(shù)字通信原理第3章

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

數(shù)字通信原理 第3章

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔

數(shù)字通信原理第3章