語(yǔ)音信號(hào)處理第10講課件

上傳人：6*** IP屬地：湖北上傳時(shí)間：2023-02-03 格式：PPT 頁(yè)數(shù)：50 大?。?.74MB 積分：28 舉報(bào) 版權(quán)申訴

已閱讀5頁(yè)，還剩45頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

9.1概述9.2語(yǔ)音信號(hào)壓縮編碼的原理和壓縮系統(tǒng)評(píng)價(jià)9.3語(yǔ)音信號(hào)的波形編碼9.4語(yǔ)音信號(hào)的參數(shù)編碼9.5語(yǔ)音信號(hào)的混合編碼第九章語(yǔ)音編碼語(yǔ)音編碼（SpeechCoding）在語(yǔ)音通信及人類信息交流中占有舉足輕重的地位。對(duì)語(yǔ)音信號(hào)的模擬傳輸持續(xù)了近一個(gè)世紀(jì)，目前，正逐漸被數(shù)字系統(tǒng)所取代。9.1概述信源信源編碼信道編碼調(diào)制傳輸通道解調(diào)信道解碼信源解碼信宿（用戶）噪聲本章研究的內(nèi)容數(shù)字傳輸系統(tǒng)模型數(shù)字傳輸?shù)膬?yōu)缺點(diǎn)：優(yōu)點(diǎn)：傳輸多樣化，低成本且保密性強(qiáng)，頻率利用更加有效缺點(diǎn)：直接采用A/D轉(zhuǎn)換技術(shù)進(jìn)行編碼會(huì)導(dǎo)致傳輸或存儲(chǔ)的語(yǔ)音數(shù)據(jù)量巨大，增加成本，必須對(duì)其進(jìn)行壓縮。編碼技術(shù)的目的：減少傳輸碼率或存儲(chǔ)量，提高傳輸或存儲(chǔ)的效率。碼率=取樣頻率x量化位數(shù)x通道數(shù)目

例:電話語(yǔ)音=8kx8bx1=64kbps=8kB/s=28MB/h9.1概述傳輸碼率：傳輸每秒鐘語(yǔ)音信號(hào)所需要的比特（bit：二進(jìn)位制信息單位）數(shù)，也成為數(shù)碼率降低數(shù)據(jù)量的編碼，稱之為壓縮編碼。同樣的信道容量能夠傳輸更多路的信號(hào)，如果存儲(chǔ)的話，只需要較小容量的存儲(chǔ)器。對(duì)數(shù)字語(yǔ)音進(jìn)行數(shù)據(jù)壓縮的目的:提高通信/存儲(chǔ)效率降低通信/存儲(chǔ)成本語(yǔ)音壓縮的原因：聲音信號(hào)中包含有大量的冗余信息鄰近樣本之間有很大的相關(guān)性周期之間的相關(guān)性基音之間的相關(guān)性長(zhǎng)時(shí)（幾十秒）自相關(guān)性話音間歇（靜音）壓縮編碼需要在保持可懂度和音質(zhì)、降低數(shù)碼率、降低編碼過(guò)程的計(jì)算代價(jià)這3方面進(jìn)行折衷。9.1概述信源信源編碼信道編碼調(diào)制傳輸通道解調(diào)信道解碼信源解碼信宿（用戶）噪聲本章研究的內(nèi)容數(shù)字傳輸系統(tǒng)模型信源編碼和信道編碼都是信息科學(xué)的重要分支。信息編碼：主要解決有效性問(wèn)題，通過(guò)對(duì)信源的壓縮、擾亂、加密等一系列處理，力求用最少的數(shù)碼率傳遞最大的信息量，使信號(hào)更適宜傳輸和存儲(chǔ)信道編碼：主要解決可靠性問(wèn)題，即盡量使處理過(guò)的信號(hào)在傳輸?shù)倪^(guò)程中不出錯(cuò)或者少出錯(cuò)，即使出了錯(cuò)也要能自動(dòng)檢錯(cuò)和盡量糾錯(cuò)信源編碼的分類：波形編碼參數(shù)編碼波形編碼力圖使重建后的語(yǔ)音時(shí)域信號(hào)的波形與原語(yǔ)音信號(hào)波形保持一致特點(diǎn)：適應(yīng)能力強(qiáng)、話音質(zhì)量好，但需要編碼速率高參數(shù)編碼又稱“聲碼器技術(shù)”，它根據(jù)對(duì)聲音形成機(jī)理的分析，在以重建語(yǔ)音信號(hào)具有足夠可懂性的原則上，通過(guò)建立語(yǔ)音信號(hào)的產(chǎn)生模型，提取代表語(yǔ)音信號(hào)特征的參數(shù)來(lái)編碼，波形上并不一定與原始信號(hào)匹配（共振峰聲碼器和線性預(yù)測(cè)聲碼器都是典型的參數(shù)聲碼器）特點(diǎn)：編碼速率低，但語(yǔ)音質(zhì)量差混合編碼：結(jié)合波形編碼和參數(shù)編碼的優(yōu)點(diǎn)而產(chǎn)生，突破了兩者的界限，應(yīng)用更廣區(qū)別在于重建的語(yǔ)音時(shí)域信號(hào)是否在波形上盡量與原始信號(hào)一致波形編碼器的話音質(zhì)量高，但數(shù)據(jù)率也很高。音源編碼器的數(shù)據(jù)率很低，產(chǎn)生的合成話音音質(zhì)有待提高。混合編碼器使用音源編碼器和波形編碼器技術(shù)，數(shù)據(jù)率和音質(zhì)介于二者之間。語(yǔ)音編碼性能指標(biāo)主要有比特速率、時(shí)延、復(fù)雜性和還原質(zhì)量。極低低中碼率(kb/s)1248163264優(yōu)良中差壞語(yǔ)音質(zhì)量模型編碼（源編碼）混合編碼波形編碼從信息論的角度看，信源編碼的一個(gè)主要目的就是解決數(shù)據(jù)壓縮問(wèn)題。（數(shù)據(jù)壓縮=信源編碼）語(yǔ)音壓縮的基本原理：語(yǔ)音信號(hào)編碼為二進(jìn)制數(shù)字序列，最簡(jiǎn)單的方法是對(duì)其直接進(jìn)行A/D變換。只要取樣足夠高，量化每個(gè)樣本的比特?cái)?shù)足夠多，就可以保證解碼恢復(fù)的語(yǔ)音信號(hào)有很好的音質(zhì)，不會(huì)丟失有用信息，但是直接數(shù)字化所需的數(shù)碼率太高，導(dǎo)致傳輸信道難以承受，必須對(duì)語(yǔ)音信號(hào)進(jìn)行壓縮編碼壓縮編碼的基本依據(jù)：語(yǔ)音信號(hào)的冗余度和人的聽(tīng)覺(jué)感知機(jī)理9.2語(yǔ)音信號(hào)壓縮編碼的原理及壓縮系統(tǒng)評(píng)價(jià)語(yǔ)音信號(hào)的冗余度：多種冗余度并存，可分別從時(shí)域或頻域來(lái)描述存在的時(shí)域冗余度：①幅度非均勻分布；②語(yǔ)音信號(hào)樣本間的相關(guān)性很強(qiáng)；③濁音語(yǔ)音段具有準(zhǔn)周期性；④聲道的形狀及其變化比較緩慢；⑤靜止系數(shù)（語(yǔ)音間隙，本身就是一種冗余）存在的頻域冗余度：①非均勻的長(zhǎng)時(shí)功率譜密度；②語(yǔ)音特有的短時(shí)功率譜密度；9.2語(yǔ)音信號(hào)壓縮編碼的原理及壓縮系統(tǒng)評(píng)價(jià)人的聽(tīng)覺(jué)感知機(jī)理：即利用人類聽(tīng)覺(jué)的某些特點(diǎn)，主要表現(xiàn)在：①人類聽(tīng)覺(jué)系統(tǒng)具有掩蔽效應(yīng)，一個(gè)單音的聲級(jí)越高，對(duì)其周?chē)l率聲音的掩蔽作用越強(qiáng)——可抑制與信號(hào)同時(shí)存在的量化噪聲；②人耳對(duì)不同頻段聲音的敏感程度不同，人的聽(tīng)覺(jué)對(duì)低頻段比較敏感（濁音的周期和共振峰集中在低頻端）——強(qiáng)的低頻音能妨礙同時(shí)存在的高頻音；③人耳對(duì)語(yǔ)音信號(hào)的相位變化不敏感；9.2語(yǔ)音信號(hào)壓縮編碼的原理及壓縮系統(tǒng)評(píng)價(jià)語(yǔ)音編碼的關(guān)鍵技術(shù)：線性預(yù)測(cè)法（常用技術(shù)）：基于全極點(diǎn)模型假設(shè)，采用時(shí)域均方差最小準(zhǔn)則來(lái)估計(jì)模型參數(shù)，其出發(fā)點(diǎn)在于跟蹤波形的產(chǎn)生過(guò)程，而不是波形本身，傳送的是反映整個(gè)過(guò)程變化的參數(shù)。合成分析法：將綜合器引入編碼器，使之與分析器相結(jié)合，在編碼器中生成和譯碼器端完全一致的語(yǔ)音。將合成語(yǔ)音與原始語(yǔ)音相比較，根據(jù)一定的誤差原則，來(lái)調(diào)整計(jì)算各個(gè)參數(shù)使得兩者之間的誤差最小。感覺(jué)加權(quán)濾波器：根據(jù)人耳的掩蔽效應(yīng)來(lái)設(shè)計(jì)的，采用最小均方誤差準(zhǔn)則來(lái)評(píng)定合成語(yǔ)音質(zhì)量是否為最優(yōu)。通過(guò)引入一個(gè)頻域的感覺(jué)加權(quán)濾波器W(z)來(lái)衡量語(yǔ)音之間的誤差：9.2語(yǔ)音信號(hào)壓縮編碼的原理及壓縮系統(tǒng)評(píng)價(jià)語(yǔ)音壓縮系統(tǒng)的性能指標(biāo)和評(píng)測(cè)方法：語(yǔ)音編碼研究的主要問(wèn)題是如何在給定的編碼速率下獲得盡可能好的高質(zhì)量語(yǔ)音，同時(shí)減小編碼的時(shí)延及算法的復(fù)雜度，衡量一種語(yǔ)音壓縮編碼算法的主要指標(biāo)包括：編碼速率、語(yǔ)音質(zhì)量、頑健性、計(jì)算復(fù)雜度和算法的可擴(kuò)展性等。編碼速率（又稱比特率）：指一個(gè)編碼器的信息速率。中碼率（8~16kbit/s）；低碼率（2.4~8kbit/s）；超低碼率（小于2.4kbit/s）；編碼器的頑健性：是通過(guò)取多種不同來(lái)源的語(yǔ)音信號(hào)進(jìn)行編碼解碼，并對(duì)輸出語(yǔ)音質(zhì)量比較測(cè)試得到的一種指標(biāo)編碼器時(shí)延：用單次編碼所需要的時(shí)間來(lái)表示（對(duì)系統(tǒng)通信質(zhì)量有很大的影響）誤碼容限：通常要求編碼器在1%的誤碼率下仍能提供可用的輸出語(yǔ)音。9.2語(yǔ)音信號(hào)壓縮編碼的原理及壓縮系統(tǒng)評(píng)價(jià)語(yǔ)音壓縮系統(tǒng)的性能指標(biāo)和評(píng)測(cè)方法：此外，語(yǔ)音質(zhì)量作為衡量語(yǔ)音編解碼技術(shù)的關(guān)鍵指標(biāo)，其質(zhì)量分為：廣播級(jí)：寬帶高音質(zhì)語(yǔ)音信號(hào)網(wǎng)絡(luò)或電話級(jí)：語(yǔ)音質(zhì)量與模擬語(yǔ)音信號(hào)相當(dāng)通信級(jí)：語(yǔ)音質(zhì)量有所下降，但有較高的自然度和話者識(shí)別度合成級(jí)：能保證一定的語(yǔ)音質(zhì)量，但自然度和話者識(shí)別度下降9.2語(yǔ)音信號(hào)壓縮編碼的原理及壓縮系統(tǒng)評(píng)價(jià)語(yǔ)音壓縮系統(tǒng)的性能指標(biāo)和評(píng)測(cè)方法：評(píng)價(jià)：主觀和客觀評(píng)價(jià)主觀評(píng)價(jià)：清晰度評(píng)價(jià)：測(cè)試中，針對(duì)音節(jié)以下語(yǔ)音測(cè)試單元，判斷正確的百分比可懂度評(píng)價(jià)：測(cè)試中，針對(duì)音節(jié)以上語(yǔ)音測(cè)試單元，評(píng)聽(tīng)人每次聽(tīng)-對(duì)韻字中的某個(gè)音，然后判斷所聽(tīng)到的音是哪個(gè)字，全部評(píng)聽(tīng)人判斷正確的百分比就是可懂度音質(zhì)評(píng)價(jià)：平均意見(jiàn)得分（MOS）從絕對(duì)等級(jí)評(píng)價(jià)法發(fā)展而來(lái)，用于對(duì)語(yǔ)音整體滿意度或語(yǔ)音通信系統(tǒng)質(zhì)量進(jìn)行評(píng)價(jià)9.2語(yǔ)音信號(hào)壓縮編碼的原理及壓縮系統(tǒng)評(píng)價(jià)得分質(zhì)量級(jí)別失真級(jí)別5優(yōu)（excellent）不察覺(jué)4良（good）剛有察覺(jué)3中（fair）有察覺(jué)且稍覺(jué)可厭2差（poor）明顯察覺(jué)且可厭但可忍受1劣（bad）不可忍受語(yǔ)音壓縮系統(tǒng)的性能指標(biāo)和評(píng)測(cè)方法：主觀評(píng)價(jià)注意事項(xiàng)：主觀測(cè)試，都需要遵循3個(gè)原則要保證足夠的說(shuō)話者，要求他們的聲音特征非常豐富，能夠代表實(shí)際用戶中的絕大部分要求有足夠多的數(shù)據(jù)，在理論上，人數(shù)和數(shù)據(jù)越多越好，可以用方差作為判斷樣本數(shù)的尺度對(duì)于大部分編碼器來(lái)說(shuō)，清晰度和品質(zhì)測(cè)試應(yīng)該都做，但很悅耳的質(zhì)量較好的語(yǔ)音可以不做清晰度測(cè)試9.2語(yǔ)音信號(hào)壓縮編碼的原理及壓縮系統(tǒng)評(píng)價(jià)客觀評(píng)價(jià)：（1）時(shí)域測(cè)度定義為被測(cè)系統(tǒng)的輸入語(yǔ)音與輸出語(yǔ)音在時(shí)域波形比較上的失真度（信噪比（SNR）是一種最簡(jiǎn)單的時(shí)域客觀評(píng)價(jià)失真測(cè)度，通常有合成語(yǔ)音信噪比、加權(quán)信噪比、平均分段信噪比等）瞬時(shí)性能的變化用短時(shí)信噪比（STSNR）（2）頻域測(cè)度就是譜失真測(cè)度，如對(duì)數(shù)譜距離測(cè)度、LPC倒譜距離測(cè)度、巴克譜測(cè)度等都是經(jīng)常用于語(yǔ)音質(zhì)量客觀評(píng)價(jià)。（測(cè)度計(jì)算結(jié)果越小，說(shuō)明語(yǔ)音質(zhì)量越好）波形編譯碼器算法比較簡(jiǎn)單，容易實(shí)現(xiàn)，低延遲，壓縮效率不高，數(shù)據(jù)速率在16kbps以上，聲音質(zhì)量相當(dāng)好，通用性好，適用于任意類型的數(shù)字聲音，很成熟，有一系列國(guó)際標(biāo)準(zhǔn)：CCITTG.711PCM64kb/sCCITTG.721ADPCM32Kb/sCCITTG.726ADPCM48,32,24,16Kb/s已廣泛應(yīng)用于電話語(yǔ)音的中繼線傳輸9.3語(yǔ)音信號(hào)的波形編碼波形編碼遵循時(shí)間量化和抽樣定理（1）對(duì)連續(xù)的語(yǔ)音信號(hào)在時(shí)間軸的離散間隔點(diǎn)上進(jìn)行波形抽樣，完成時(shí)間量化（2）抽樣信號(hào)在時(shí)間域上離散化后在有限時(shí)間段內(nèi)為有限個(gè)值，此時(shí)，其幅度仍為連續(xù)變量（3）時(shí)間量化是通過(guò)抽樣保持電路完成的1、脈沖編碼調(diào)制(PCM)編碼過(guò)程：對(duì)數(shù)變換(壓縮編碼)F(n)低通濾波

(LPF)Xa(t)x(n)A/D(13位)取樣(8kHz)X(n)碼率＝104kbps碼率＝8位x8k＝64kbps模擬聲音信號(hào)輸入防失真濾波器波形編碼器量化器PCM樣本1、脈沖編碼調(diào)制(PCM)采樣輸入樣本值采樣輸入樣本值量化器一旦確定后，量化間隔就固定下來(lái)，不隨輸入語(yǔ)音信號(hào)的幅度變化而變化對(duì)小信號(hào)采用小的量化間隔，對(duì)大信號(hào)采用大的量化間隔，這樣可以用較少的位數(shù)編碼對(duì)大信號(hào)來(lái)說(shuō)，雖然絕對(duì)量化誤差較大，但是（1）大信號(hào)出現(xiàn)的機(jī)會(huì)不多（2）信噪比（相對(duì)誤差）與小信號(hào)是一致的，對(duì)總的話音質(zhì)量影響不大對(duì)數(shù)變換F=ln(x)目的:適應(yīng)聽(tīng)覺(jué)的非線性特性；壓縮數(shù)據(jù)。采用的方法：對(duì)數(shù)PCM編碼北美和日本等地區(qū)（μ律壓擴(kuò)算法）G.711標(biāo)準(zhǔn)對(duì)數(shù)變換F=ln(x)目的:適應(yīng)聽(tīng)覺(jué)的非線性特性；壓縮數(shù)據(jù)。歐洲和中國(guó)大陸等地區(qū)（A律壓擴(kuò)算法）G.711規(guī)定的A律和m律脈沖編碼調(diào)制采用的是非線性量化，在64kbit/s速率話音質(zhì)量能夠達(dá)到網(wǎng)絡(luò)等級(jí)在脈沖編碼調(diào)制方法中，對(duì)樣值采用3~4位編碼就可以使對(duì)方能夠聽(tīng)懂，但是噪音比較大，在脈沖編碼調(diào)制通信中，通常采用8bit編碼補(bǔ)充說(shuō)明：

脈沖編碼調(diào)制的應(yīng)用應(yīng)用于數(shù)字聲音的編輯處理（多媒體計(jì)算機(jī)）應(yīng)用于聲音的傳輸（通信）:

長(zhǎng)途電話(8KHzx8bitx1),

時(shí)分多路復(fù)用TDM(time-divisionmultiplexing)

應(yīng)用于全頻帶數(shù)字聲音的表示/存儲(chǔ):

CD-DA（CD唱片），DAT(44.1KHzx16bitx2)G.721標(biāo)準(zhǔn)自適應(yīng)脈沖編碼調(diào)制（APCM）能隨信號(hào)幅度的大小自動(dòng)地改變量化階距的編碼制式。根據(jù)輸入樣本幅度的大小來(lái)改變量化階大小，使得量化前后的能量為恒定值（關(guān)鍵參數(shù)：量化間隔D(n)和量化增益G(n)）?？梢允撬矔r(shí)自適應(yīng)，即量化階的大小每隔幾個(gè)樣本就改變，也可以是音節(jié)自適應(yīng)，即量化階的大小在較長(zhǎng)時(shí)間周期里發(fā)生變化。改變量化階距的方法：前向自適應(yīng)APCM后向自適應(yīng)APCM量化器Q樣本值量化階適配器自適應(yīng)APCM編碼輸出自適應(yīng)脈沖編碼調(diào)制（APCM）能隨信號(hào)幅度的大小自動(dòng)地改變量化階距的編碼制式。改變量化階距的方法：前向自適應(yīng)APCM：根據(jù)未量化的樣本值得均方根值來(lái)估計(jì)輸入信號(hào)的電平，以此來(lái)確定量化階距的大小，并對(duì)其電平進(jìn)行編碼作為邊信息（SideInformation）傳送到接收端前向自適應(yīng)預(yù)測(cè)用于分幀處理的情況,一般采用全極點(diǎn)預(yù)測(cè)器，對(duì)語(yǔ)音信號(hào)逐幀提取LPC系數(shù)，作為線性預(yù)測(cè)系數(shù)特點(diǎn)：使用原始信號(hào)提取預(yù)測(cè)系數(shù)，精度較高，預(yù)測(cè)的效果好，但需要將預(yù)測(cè)系數(shù)用邊信息傳送到接收端的解碼器，用以減小差值信號(hào)量化的有效比特?cái)?shù)，延時(shí)較大自適應(yīng)脈沖編碼調(diào)制（APCM）后向自適應(yīng)APCM：根據(jù)從量化器剛輸出的過(guò)去樣本中提取量化階信息，這種自適應(yīng)能在收發(fā)兩端自動(dòng)生成量化階，不需要傳送邊信息后向自適應(yīng)預(yù)測(cè)利用量化后的信號(hào)提取預(yù)測(cè)信號(hào)，避免了前向自適應(yīng)預(yù)測(cè)的缺點(diǎn)，但由于存在量化噪聲，預(yù)測(cè)系數(shù)的提取精度受到一定的影響。前向和后向自適應(yīng)脈沖編碼調(diào)制的區(qū)別：前向自適應(yīng)的量化間隔和增益是通過(guò)對(duì)輸入信號(hào)估計(jì)而得到的后向是有估計(jì)編碼器或者量化器輸或者出來(lái)決定量化間隔自適應(yīng)預(yù)測(cè)編碼（APC）利用線性預(yù)測(cè)改進(jìn)編碼器中的量化器性能，即：在接收端，只要使用與發(fā)送端相同的預(yù)測(cè)器，就可以恢復(fù)原信號(hào)，基于這種原理的編碼稱為預(yù)測(cè)編碼，而當(dāng)預(yù)測(cè)系數(shù)是自適應(yīng)隨語(yǔ)音信號(hào)變化時(shí)，稱為自適應(yīng)預(yù)測(cè)編碼。優(yōu)點(diǎn)：能夠改善信噪比自適應(yīng)脈沖編碼調(diào)制（APCM）自適應(yīng)預(yù)測(cè)編碼（APC）語(yǔ)音數(shù)據(jù)流一般為10~20ms相繼的幀，而預(yù)測(cè)系數(shù)與預(yù)測(cè)誤差一起傳輸；接收端，預(yù)測(cè)器系數(shù)控制的逆濾波器再現(xiàn)語(yǔ)音(1)增量調(diào)制對(duì)語(yǔ)音信號(hào)的信息用最低限度的一位來(lái)表示的方法。1）判別下一個(gè)語(yǔ)音信號(hào)值與當(dāng)前的信號(hào)值相比是高還是低2）如果高則給定編碼“1”，如果低則給定編碼“0”3）在接收端，用接收的脈沖串控制，信號(hào)就可以用升降的階梯波形來(lái)逼近增量調(diào)制(DM)及自適應(yīng)增量調(diào)制(ADM）根據(jù)過(guò)去的樣本去估算下一個(gè)要量化編碼的樣本信號(hào)幅度有多大，這個(gè)值稱為預(yù)測(cè)值，編碼器僅對(duì)實(shí)際信號(hào)值與預(yù)測(cè)值的差進(jìn)行量化編碼差分脈沖編碼調(diào)制（DPCM）差分脈沖編碼調(diào)制的思想是，根據(jù)過(guò)去的樣本去估算下一個(gè)樣本信號(hào)的幅度大小，這個(gè)值稱為預(yù)測(cè)值，然后對(duì)實(shí)際信號(hào)值與預(yù)測(cè)值之差進(jìn)行量化編碼，從而就減少了表示每個(gè)樣本信號(hào)的位數(shù)效果：量化位數(shù)可以顯著減少，從而降低了總的碼率與PCM的區(qū)別：PCM是直接對(duì)采樣信號(hào)進(jìn)行量化編碼；DPCM是對(duì)實(shí)際信號(hào)值與預(yù)測(cè)值之差進(jìn)行量化編碼，存儲(chǔ)或者傳送的是差值而不是幅度絕對(duì)值，這就降低了傳送或存儲(chǔ)的數(shù)據(jù)量。此外，它還能適應(yīng)大范圍變化的輸入信號(hào)。自適應(yīng)差分脈沖編碼調(diào)制(ADPCM)PCM在量化間隔上的矛盾：為適應(yīng)大的幅值要用大的量化間隔，而提高信噪比要用小的間隔——自適應(yīng)差分脈沖編碼調(diào)制技術(shù)（是利用樣本與樣本之間存在的信息冗余度來(lái)進(jìn)行編碼的一種數(shù)據(jù)壓縮技術(shù)）原理：聲音信號(hào)具有很強(qiáng)的相關(guān)性，可從已知信號(hào)來(lái)預(yù)測(cè)未知信號(hào),即使用前面的樣本預(yù)測(cè)當(dāng)前的樣本，實(shí)際樣本值與預(yù)測(cè)值之間的誤差往往很小。利用自適應(yīng)的思想改變量化階的大小，即使用小的量化階(step-size)去編碼小的差值，使用大的量化階去編碼大的差值CCITTG.721ADPCM編碼器6階自適應(yīng)線性預(yù)測(cè)，

4位的自適應(yīng)量化器，輸出碼率：8kx4=32kbps量化器Q13位自然碼的數(shù)字語(yǔ)音樣本_線性預(yù)測(cè)器逆量化器Q-1+預(yù)測(cè)值差值重建信號(hào)ADPCM編碼輸出量化階適配器自適應(yīng)(4位)ADPCM小結(jié)PCM話音質(zhì)量4.5級(jí)ADPCM話音質(zhì)量4.34級(jí),碼率降低一倍(32kbps)。ADPCM應(yīng)用：數(shù)字語(yǔ)音通信多媒體應(yīng)用中的語(yǔ)音（解說(shuō)詞）Sub-bandcoding(子帶編碼)PCM，DPCM都是不對(duì)輸入信號(hào)頻帶做任何分割的前提下，在時(shí)域中進(jìn)行的處理，這種編碼方式稱為整帶時(shí)域編碼。SBC是將語(yǔ)音信號(hào)劃分為多個(gè)頻帶，然后對(duì)每個(gè)頻帶的參數(shù)進(jìn)行編碼基本原理：利用帶通濾波器(BPF)把聲音信號(hào)按頻率范圍劃分成幾個(gè)組成部分(子頻帶，子帶)低頻部分能量較集中，量化精度要高，取樣頻率可稍低高頻部分是摩擦音、噪音，量化精度可低些，但取樣頻率要稍高不同子頻帶作不同的ADPCM編碼處理，然后再?gòu)?fù)合在一起子帶編碼的特點(diǎn)：（1）分割的子帶信號(hào)分別進(jìn)行了頻譜平移（對(duì)頻譜平移后的子帶進(jìn)行量化、編碼這類編碼方式稱為頻譜編碼，頻譜編碼將信號(hào)分解成不同頻帶分量的過(guò)程去除了信號(hào)的多余度，得到一組不相關(guān)的信號(hào)）（2）對(duì)不同的子帶合理分配比特?cái)?shù)，能分別控制各子帶的量化電平數(shù)目以及相應(yīng)的重建信號(hào)的量化誤差，使誤差譜的形狀適應(yīng)人耳聽(tīng)覺(jué)特性，得到更好的主觀聽(tīng)覺(jué)質(zhì)量（3）由于語(yǔ)音的基音和共振峰主要集中在低頻段，所有對(duì)低頻段采用較多的比特?cái)?shù)來(lái)表示樣值，而高頻段則采用較少的比特?cái)?shù)（4）SBC的另一個(gè)優(yōu)點(diǎn)是各個(gè)子帶內(nèi)的量化噪聲相互獨(dú)立，避免輸入電平較低的子帶信號(hào)被其他子帶的量化噪聲所淹沒(méi)語(yǔ)音信號(hào)的參數(shù)編碼參數(shù)編碼(源編碼)的設(shè)計(jì)思想分析人的發(fā)聲器官的結(jié)構(gòu)及語(yǔ)音生成的原理，建立語(yǔ)音生成的物理(數(shù)學(xué))模型，編碼時(shí)：從話音波形信號(hào)中提取生成該話音的參數(shù)；解碼時(shí)：根據(jù)語(yǔ)音生成模型,使用這些參數(shù)合成原始話音。提取語(yǔ)音生成參數(shù)語(yǔ)音生成模型（編碼器）語(yǔ)音參數(shù)數(shù)字語(yǔ)音使用參數(shù)合成語(yǔ)音語(yǔ)音生成模型（解碼器）重建的語(yǔ)音聲碼器聲碼器聲碼器線性預(yù)測(cè)聲碼器LPC模型=(a1,a2,a3,a4,a5,a6,a7,a8,a9,a10,G,V/UV,T)脈沖序列發(fā)生器隨機(jī)噪聲發(fā)生器基音周期T(聲帶振動(dòng))(聲帶不振動(dòng))UV(清音)V(濁音)H(z)聲道參數(shù)a1a2a3a10...語(yǔ)音(聲道濾波器)s(n)增益Gu(n)激勵(lì)信號(hào)語(yǔ)音是一個(gè)近似的短時(shí)(10~30ms)平穩(wěn)隨機(jī)過(guò)程，LPC模型的參數(shù)A=(a1,a2,a3,a4,a5,a6,a7,a8,a9,a10,G,V/UV,T)變化比較慢,大約每20ms變化一次；假設(shè)語(yǔ)音信號(hào)的取樣頻率為8kHz，將每秒鐘分成50幀，每幀20ms(其中有20x8=160個(gè)樣本)，每一幀的所有信號(hào)近似地滿足同一模型，即每一幀語(yǔ)音可以使用同一組參數(shù)來(lái)表示:濁音還是清音（1位）濁音的基頻

人人文庫(kù)> 全部分類> 教育資料 > 輔導(dǎo)培訓(xùn)

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

語(yǔ)音信號(hào)處理第10講課件

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

語(yǔ)音信號(hào)處理第10講課件

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔