語(yǔ)音信號(hào)處理第五章課件

上傳人：0*** IP屬地：湖北上傳時(shí)間：2022-04-23 格式：PPT 頁(yè)數(shù)：127 大?。?.62MB 積分：30 舉報(bào) 版權(quán)申訴

已閱讀5頁(yè)，還剩122頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、1第5章語(yǔ)音編碼25.1 概述概述1 5.2 語(yǔ)音編碼的分類及特性語(yǔ)音編碼的分類及特性 5.3 語(yǔ)音編碼性能的評(píng)價(jià)指標(biāo)語(yǔ)音編碼性能的評(píng)價(jià)指標(biāo)35.4 語(yǔ)音信號(hào)波形編碼語(yǔ)音信號(hào)波形編碼4 5.5 語(yǔ)音信號(hào)參數(shù)編碼語(yǔ)音信號(hào)參數(shù)編碼52第5章語(yǔ)音編碼6 5.7 語(yǔ)音信號(hào)寬帶變速率編語(yǔ)音信號(hào)寬帶變速率編碼碼 7 5.6 語(yǔ)音信號(hào)混合編碼語(yǔ)音信號(hào)混合編碼35.1 概述語(yǔ)音數(shù)字通信的優(yōu)越性主要體現(xiàn)在語(yǔ)音數(shù)字通信的優(yōu)越性主要體現(xiàn)在：更好的話音質(zhì)量；更強(qiáng)的抗干擾性，易于進(jìn)行加更好的話音質(zhì)量；更強(qiáng)的抗干擾性，易于進(jìn)行加密；節(jié)省帶寬，更有效地利用網(wǎng)絡(luò)資源；更易于存儲(chǔ)密；節(jié)省帶寬，更有效地利用網(wǎng)絡(luò)資源；更易

2、于存儲(chǔ)和處理。和處理。最簡(jiǎn)單的數(shù)字化方法是直接對(duì)語(yǔ)音信號(hào)進(jìn)行模最簡(jiǎn)單的數(shù)字化方法是直接對(duì)語(yǔ)音信號(hào)進(jìn)行模/數(shù)數(shù)轉(zhuǎn)換，只要滿足一定的采樣率和量化要求，就能夠得轉(zhuǎn)換，只要滿足一定的采樣率和量化要求，就能夠得到高質(zhì)量的數(shù)字語(yǔ)音。但這時(shí)語(yǔ)音的數(shù)據(jù)量仍舊非常到高質(zhì)量的數(shù)字語(yǔ)音。但這時(shí)語(yǔ)音的數(shù)據(jù)量仍舊非常大，因此在進(jìn)行傳輸和存儲(chǔ)之前，往往要對(duì)其進(jìn)行進(jìn)大，因此在進(jìn)行傳輸和存儲(chǔ)之前，往往要對(duì)其進(jìn)行進(jìn)行壓縮編碼，以減少其傳輸碼率或存儲(chǔ)量。行壓縮編碼，以減少其傳輸碼率或存儲(chǔ)量。4 傳輸碼率也稱為數(shù)碼率或編碼速率，表示傳輸傳輸碼率也稱為數(shù)碼率或編碼速率，表示傳輸每秒鐘語(yǔ)音信號(hào)所需的比特?cái)?shù)。每秒鐘語(yǔ)音信號(hào)所需的比特?cái)?shù)

3、。語(yǔ)音編碼的目的：語(yǔ)音編碼的目的：在保證語(yǔ)音音質(zhì)和可懂度的條件下，采用盡可在保證語(yǔ)音音質(zhì)和可懂度的條件下，采用盡可能少的比特?cái)?shù)來表示語(yǔ)音。能少的比特?cái)?shù)來表示語(yǔ)音。通常所說的通常所說的“話音編碼話音編碼”，是特指通信傳輸系，是特指通信傳輸系統(tǒng)中代表口語(yǔ)發(fā)聲的統(tǒng)中代表口語(yǔ)發(fā)聲的300Hz3400Hz的信號(hào)。的信號(hào)。本章以前面學(xué)習(xí)過的語(yǔ)音信號(hào)處理技術(shù)和方法本章以前面學(xué)習(xí)過的語(yǔ)音信號(hào)處理技術(shù)和方法為基礎(chǔ)，介紹語(yǔ)音編碼基本原理和常用的編碼方法。為基礎(chǔ)，介紹語(yǔ)音編碼基本原理和常用的編碼方法。55.2 語(yǔ)音編碼的分類及特性n 按編碼方式語(yǔ)音編碼分為三種：按編碼方式語(yǔ)音編碼分為三種：n 波形編碼波形編

4、碼n 參數(shù)編碼參數(shù)編碼n 混合編碼混合編碼6n 波形編碼是將時(shí)間域或變換域信號(hào)直接變波形編碼是將時(shí)間域或變換域信號(hào)直接變換為數(shù)字信號(hào)，力求使重建語(yǔ)音波形保持原始換為數(shù)字信號(hào)，力求使重建語(yǔ)音波形保持原始語(yǔ)音信號(hào)的波形形狀。語(yǔ)音信號(hào)的波形形狀。n 要求重建語(yǔ)音信號(hào)要求重建語(yǔ)音信號(hào) 的各個(gè)樣本盡可能的各個(gè)樣本盡可能地接近原始語(yǔ)音信號(hào)地接近原始語(yǔ)音信號(hào)s(n)的樣本值，因此在波形的樣本值，因此在波形編碼中，信噪比總是一個(gè)有用的性能評(píng)定標(biāo)準(zhǔn)。編碼中，信噪比總是一個(gè)有用的性能評(píng)定標(biāo)準(zhǔn)。n 5.2.1 波形編碼波形編碼)( ns7 波形編碼優(yōu)點(diǎn)：波形編碼優(yōu)點(diǎn)：適應(yīng)能力強(qiáng)，算法簡(jiǎn)單，易于實(shí)現(xiàn)，語(yǔ)音質(zhì)量好。適

5、應(yīng)能力強(qiáng)，算法簡(jiǎn)單，易于實(shí)現(xiàn)，語(yǔ)音質(zhì)量好。波形編碼缺點(diǎn)：波形編碼缺點(diǎn)：編碼速率高，一般在編碼速率高，一般在16kbit/s64kbit/s之間。之間。傳統(tǒng)的波形編碼方法分類：傳統(tǒng)的波形編碼方法分類：脈沖編碼調(diào)制脈沖編碼調(diào)制(PCM) 自適應(yīng)增量調(diào)制自適應(yīng)增量調(diào)制(ADM) 自適應(yīng)差分脈沖編碼調(diào)制自適應(yīng)差分脈沖編碼調(diào)制(ADPCM) 8n脈沖編碼調(diào)制脈沖編碼調(diào)制PCM編碼速率編碼速率:64kbit/sn自適應(yīng)增量調(diào)制自適應(yīng)增量調(diào)制ADM編碼速率編碼速率:32kbit/s-16kbit/s n自適應(yīng)差分脈沖編碼調(diào)制自適應(yīng)差分脈沖編碼調(diào)制ADPCM編碼速編碼速率率:32kbit/s 9n5.

6、2.2 參數(shù)編碼參數(shù)編碼 n 參數(shù)編碼又稱聲碼器編碼，是將信源信參數(shù)編碼又稱聲碼器編碼，是將信源信號(hào)在頻域或其它變換域提取特征參數(shù)，然后對(duì)號(hào)在頻域或其它變換域提取特征參數(shù)，然后對(duì)這些特征參數(shù)進(jìn)行編碼和傳輸，在譯碼端再將這些特征參數(shù)進(jìn)行編碼和傳輸，在譯碼端再將接收到的數(shù)字信號(hào)譯成特征參數(shù)，根據(jù)這些特接收到的數(shù)字信號(hào)譯成特征參數(shù)，根據(jù)這些特征參數(shù)重建語(yǔ)音信號(hào)。征參數(shù)重建語(yǔ)音信號(hào)。n 這種編碼方法重建語(yǔ)音信號(hào)與原始語(yǔ)音這種編碼方法重建語(yǔ)音信號(hào)與原始語(yǔ)音信號(hào)樣本之間沒有一一對(duì)應(yīng)關(guān)系。信號(hào)樣本之間沒有一一對(duì)應(yīng)關(guān)系。n 合成語(yǔ)音的音質(zhì)好壞需要借助于主觀評(píng)合成語(yǔ)音的音質(zhì)好壞需要借助于主觀評(píng)定，缺少客觀的評(píng)定

7、標(biāo)準(zhǔn)。定，缺少客觀的評(píng)定標(biāo)準(zhǔn)。 n 10n 參數(shù)編碼優(yōu)點(diǎn)參數(shù)編碼優(yōu)點(diǎn):n 編碼速率低，且這類編碼器對(duì)講話環(huán)境編碼速率低，且這類編碼器對(duì)講話環(huán)境噪聲較敏感，需要安靜環(huán)境才能給出較高的可噪聲較敏感，需要安靜環(huán)境才能給出較高的可懂度。懂度。n 參數(shù)編碼器有：參數(shù)編碼器有：n 共振峰聲碼器共振峰聲碼器n 線性預(yù)測(cè)聲碼器線性預(yù)測(cè)聲碼器n 余弦聲碼器。余弦聲碼器。11n5.2.3 混合編碼混合編碼n 二十世紀(jì)二十世紀(jì)50年代產(chǎn)生混合編碼。年代產(chǎn)生混合編碼。n 優(yōu)點(diǎn)：保留參數(shù)編碼技術(shù)精華，并引用波優(yōu)點(diǎn)：保留參數(shù)編碼技術(shù)精華，并引用波形編碼準(zhǔn)則去優(yōu)化激勵(lì)源信號(hào)，克服了原有波形形編碼準(zhǔn)則去優(yōu)化激勵(lì)源信號(hào)，克服了

8、原有波形和參數(shù)編碼的弱點(diǎn)，而吸取了它們各自的長(zhǎng)處。和參數(shù)編碼的弱點(diǎn)，而吸取了它們各自的長(zhǎng)處。n 缺點(diǎn)：算法復(fù)雜、運(yùn)算量很大。缺點(diǎn)：算法復(fù)雜、運(yùn)算量很大。n 編碼速率：編碼速率：4kbit/s16kbit/sn 包括：多脈沖激勵(lì)線性預(yù)測(cè)編碼包括：多脈沖激勵(lì)線性預(yù)測(cè)編碼(MPELP)n 碼本激勵(lì)線性預(yù)測(cè)編碼碼本激勵(lì)線性預(yù)測(cè)編碼(CELP)125.2.4 語(yǔ)音壓縮編碼的依據(jù) n 語(yǔ)音編碼的目的：語(yǔ)音編碼的目的：n 在給定的編碼速率下，使編解碼后恢復(fù)在給定的編碼速率下，使編解碼后恢復(fù)出的重構(gòu)語(yǔ)音的質(zhì)量盡可能高。出的重構(gòu)語(yǔ)音的質(zhì)量盡可能高。n 提高語(yǔ)音編碼效率的基本途徑：提高語(yǔ)音編碼效率的基本途徑：n

9、充分利用語(yǔ)音信號(hào)冗余度和人耳的聽覺充分利用語(yǔ)音信號(hào)冗余度和人耳的聽覺特性。特性。n 語(yǔ)音的冗余度主要來源于兩個(gè)方面：語(yǔ)音的冗余度主要來源于兩個(gè)方面：n 語(yǔ)音信號(hào)幅度分布的非均勻性；語(yǔ)音信號(hào)幅度分布的非均勻性；n 語(yǔ)音樣點(diǎn)之間的相關(guān)性。語(yǔ)音樣點(diǎn)之間的相關(guān)性。13n 語(yǔ)音信號(hào)幅度統(tǒng)計(jì)特性：語(yǔ)音信號(hào)幅度統(tǒng)計(jì)特性：n 具有動(dòng)態(tài)的、時(shí)變的、多維的暫態(tài)概率密具有動(dòng)態(tài)的、時(shí)變的、多維的暫態(tài)概率密度分布的隨機(jī)過程。統(tǒng)計(jì)時(shí)間長(zhǎng)度不同，它表現(xiàn)度分布的隨機(jī)過程。統(tǒng)計(jì)時(shí)間長(zhǎng)度不同，它表現(xiàn)的概率密度分布形式不同。的概率密度分布形式不同。n 一般長(zhǎng)時(shí)一般長(zhǎng)時(shí)(幾十秒以上幾十秒以上)統(tǒng)計(jì)幅度特性接近統(tǒng)計(jì)幅度特性接近于于ga

10、mma分布分布，短時(shí)，短時(shí)(幾到幾十毫秒幾到幾十毫秒)統(tǒng)計(jì)幅度特統(tǒng)計(jì)幅度特性接近于性接近于高斯分布高斯分布。n 但無論哪種統(tǒng)計(jì)特性，語(yǔ)音信號(hào)總是小幅但無論哪種統(tǒng)計(jì)特性，語(yǔ)音信號(hào)總是小幅度出現(xiàn)概率大，大幅度出現(xiàn)概率小。度出現(xiàn)概率大，大幅度出現(xiàn)概率小。14n 語(yǔ)音信號(hào)具有冗余度的另一原因：語(yǔ)音語(yǔ)音信號(hào)具有冗余度的另一原因：語(yǔ)音樣點(diǎn)之間存在相關(guān)性。樣點(diǎn)之間存在相關(guān)性。n 利用語(yǔ)音信號(hào)的相關(guān)性，在時(shí)域上采用利用語(yǔ)音信號(hào)的相關(guān)性，在時(shí)域上采用短時(shí)和長(zhǎng)時(shí)預(yù)測(cè)，在頻域上采用譜平整方法，短時(shí)和長(zhǎng)時(shí)預(yù)測(cè)，在頻域上采用譜平整方法，可以達(dá)到壓縮編碼比特率的目的?？梢赃_(dá)到壓縮編碼比特率的目的。15n 語(yǔ)音壓縮編碼的第

11、二個(gè)途徑是利用人耳語(yǔ)音壓縮編碼的第二個(gè)途徑是利用人耳的聽覺特性。的聽覺特性。n 人類聽覺有一個(gè)特點(diǎn)：人類聽覺有一個(gè)特點(diǎn)： “聽覺掩蔽效聽覺掩蔽效應(yīng)應(yīng)”，是指一個(gè)強(qiáng)音能抑制一個(gè)同時(shí)存在的弱，是指一個(gè)強(qiáng)音能抑制一個(gè)同時(shí)存在的弱音的聽覺。音的聽覺。n 聽覺掩蔽效應(yīng)在語(yǔ)音壓縮編碼中有非常聽覺掩蔽效應(yīng)在語(yǔ)音壓縮編碼中有非常重要的作用。重要的作用。16n 5.3 語(yǔ)音編碼性能的評(píng)價(jià)指標(biāo)語(yǔ)音編碼性能的評(píng)價(jià)指標(biāo)n n 評(píng)價(jià)一個(gè)語(yǔ)音編碼算法性能的基本指標(biāo)包評(píng)價(jià)一個(gè)語(yǔ)音編碼算法性能的基本指標(biāo)包括：括：n 編碼速率、語(yǔ)音質(zhì)量評(píng)價(jià)、編解碼延時(shí)以編碼速率、語(yǔ)音質(zhì)量評(píng)價(jià)、編解碼延時(shí)以及算法復(fù)雜度。及算法復(fù)雜度。n 這四個(gè)

12、因素之間有著密切的聯(lián)系，在具體這四個(gè)因素之間有著密切的聯(lián)系，在具體評(píng)價(jià)一種語(yǔ)音編碼算法的優(yōu)劣時(shí)，需要根據(jù)具體評(píng)價(jià)一種語(yǔ)音編碼算法的優(yōu)劣時(shí)，需要根據(jù)具體的實(shí)際情況，綜合考慮四個(gè)因素進(jìn)行性能評(píng)價(jià)。的實(shí)際情況，綜合考慮四個(gè)因素進(jìn)行性能評(píng)價(jià)。 n 175.3.1 編碼速率 n 編碼速率直接反映了語(yǔ)音編碼對(duì)語(yǔ)音信編碼速率直接反映了語(yǔ)音編碼對(duì)語(yǔ)音信息的壓縮程度。度量方法有：息的壓縮程度。度量方法有：n “比特比特/秒秒”(bit/s) ：代表編碼的總速率，：代表編碼的總速率，一般用一般用I表示；表示；n “比特比特/樣點(diǎn)樣點(diǎn)”(bit/p)：代表平均每個(gè)語(yǔ)：代表平均每個(gè)語(yǔ)音樣點(diǎn)編碼時(shí)所用的比特?cái)?shù)，用音樣點(diǎn)

13、編碼時(shí)所用的比特?cái)?shù)，用R表示。表示。n 平均每樣點(diǎn)比特?cái)?shù)平均每樣點(diǎn)比特?cái)?shù)R越高，語(yǔ)音質(zhì)量越越高，語(yǔ)音質(zhì)量越容易提高，對(duì)傳輸帶寬或存儲(chǔ)容量要求也就越容易提高，對(duì)傳輸帶寬或存儲(chǔ)容量要求也就越高。高。 18n 降低編碼速率是語(yǔ)音編碼的首要目標(biāo)，根據(jù)編碼速降低編碼速率是語(yǔ)音編碼的首要目標(biāo)，根據(jù)編碼速率和輸入語(yǔ)音的關(guān)系可將編碼器分成兩類：固定速率編碼率和輸入語(yǔ)音的關(guān)系可將編碼器分成兩類：固定速率編碼器和可變速率編碼器。器和可變速率編碼器。 n 現(xiàn)在大部分編碼標(biāo)準(zhǔn)都是固定速率編碼，其范圍為現(xiàn)在大部分編碼標(biāo)準(zhǔn)都是固定速率編碼，其范圍為0.5kbit/s64kbit/s。其中：。其中：n 保密電話的編碼速率為

14、：保密電話的編碼速率為：0.5kbit/s4.5kbit/sn 數(shù)字蜂窩移動(dòng)電話和衛(wèi)星電話編碼器編碼速率為：數(shù)字蜂窩移動(dòng)電話和衛(wèi)星電話編碼器編碼速率為： 3kbit/s13kbit/sn 蜂窩系統(tǒng)總的編碼速率達(dá)到：蜂窩系統(tǒng)總的編碼速率達(dá)到：20kbit/s30kbit/sn 普通電話網(wǎng)的編碼速率為：普通電話網(wǎng)的編碼速率為：16kbit/s64kbit/sn 寬帶編碼器編碼速率為：寬帶編碼器編碼速率為：45/56/64kbit/s19n 可變速率編碼是近年來出現(xiàn)的新技術(shù)?？勺兯俾示幋a是近年來出現(xiàn)的新技術(shù)。根據(jù)統(tǒng)計(jì)，兩方通話大約只有根據(jù)統(tǒng)計(jì)，兩方通話大約只有40%的時(shí)間是真的時(shí)間是真正有聲音的，因

15、此一個(gè)自然的想法是采用通、正有聲音的，因此一個(gè)自然的想法是采用通、斷狀態(tài)編碼。通狀態(tài)對(duì)應(yīng)有聲期，采用固定編斷狀態(tài)編碼。通狀態(tài)對(duì)應(yīng)有聲期，采用固定編碼速率；斷狀態(tài)對(duì)應(yīng)無聲期，傳送極低速率信碼速率；斷狀態(tài)對(duì)應(yīng)無聲期，傳送極低速率信息（如背景噪聲特征等），甚至不傳送任何信息（如背景噪聲特征等），甚至不傳送任何信息。更復(fù)雜的多狀態(tài)編碼還可以根據(jù)網(wǎng)絡(luò)負(fù)荷、息。更復(fù)雜的多狀態(tài)編碼還可以根據(jù)網(wǎng)絡(luò)負(fù)荷、剩余存儲(chǔ)容量等外部因素調(diào)節(jié)其碼率。剩余存儲(chǔ)容量等外部因素調(diào)節(jié)其碼率。n 20n 可變速率編碼主要包括兩個(gè)算法：一是可變速率編碼主要包括兩個(gè)算法：一是話音激活檢測(cè)話音激活檢測(cè)(VAD)，主要用于確定輸入信號(hào)，主要

16、用于確定輸入信號(hào)是語(yǔ)音還是背景噪聲；二是是語(yǔ)音還是背景噪聲；二是舒適噪聲的生成舒適噪聲的生成(CNG)，主要用于接收端重建背景噪聲。，主要用于接收端重建背景噪聲。n 除以上兩種算法外，可變速率編碼還包除以上兩種算法外，可變速率編碼還包括以下兩個(gè) 關(guān) 鍵技術(shù) ：括以下兩個(gè) 關(guān) 鍵技術(shù) ：速率判決技術(shù)速率判決技術(shù)(RDA,Rate Decision Algorithm)以及以及差錯(cuò)隱藏。差錯(cuò)隱藏。215.3.2 編碼質(zhì)量 n 編碼質(zhì)量評(píng)價(jià)是語(yǔ)音編碼性能的最根本指標(biāo)，分為兩編碼質(zhì)量評(píng)價(jià)是語(yǔ)音編碼性能的最根本指標(biāo)，分為兩類：主觀評(píng)價(jià)方法和客觀評(píng)價(jià)方法。類：

17、主觀評(píng)價(jià)方法和客觀評(píng)價(jià)方法。n 1語(yǔ)音質(zhì)量主觀評(píng)價(jià)方法語(yǔ)音質(zhì)量主觀評(píng)價(jià)方法 n 方法實(shí)現(xiàn)：在一組測(cè)試者對(duì)原始語(yǔ)音和合成語(yǔ)音進(jìn)行方法實(shí)現(xiàn)：在一組測(cè)試者對(duì)原始語(yǔ)音和合成語(yǔ)音進(jìn)行對(duì)比試聽的基礎(chǔ)上，根據(jù)某種事先約定的尺度來對(duì)語(yǔ)音質(zhì)量劃對(duì)比試聽的基礎(chǔ)上，根據(jù)某種事先約定的尺度來對(duì)語(yǔ)音質(zhì)量劃分等級(jí)。分等級(jí)。常用的方法包括：常用的方法包括：n 平均意見得分平均意見得分MOS： Mean Opinion Score n 判斷韻字測(cè)試判斷韻字測(cè)試DRT：Diagnostic Rhyme Testn 判斷滿意度測(cè)量判斷滿意度測(cè)量DAM：Diagnostic Acceptabilityn Measure22n 主

18、觀評(píng)價(jià)方法符合人聽話時(shí)對(duì)語(yǔ)音質(zhì)量主觀評(píng)價(jià)方法符合人聽話時(shí)對(duì)語(yǔ)音質(zhì)量的感覺，目前得到了廣泛應(yīng)用。常用方法是平的感覺，目前得到了廣泛應(yīng)用。常用方法是平均意見得分均意見得分(Mean Opinion Score，簡(jiǎn)稱，簡(jiǎn)稱MOS得得分分)等。等。n MOS得分為五級(jí)評(píng)分標(biāo)準(zhǔn)，如表得分為五級(jí)評(píng)分標(biāo)準(zhǔn)，如表5.1所所示，多人收聽完測(cè)試語(yǔ)音后打分，求出平均值，示，多人收聽完測(cè)試語(yǔ)音后打分，求出平均值，為為MOS分。分。n 主觀評(píng)價(jià)方法一般都是由較大的通信組主觀評(píng)價(jià)方法一般都是由較大的通信組織來完成，個(gè)人很少采用?？梺硗瓿?，個(gè)人很少采用。 n 23 MOS分分質(zhì)量級(jí)別質(zhì)量級(jí)別失真級(jí)別失真級(jí)別 5 優(yōu)優(yōu)不

19、覺察不覺察 4 良良剛有覺察剛有覺察 3 中中有覺察且稍覺可厭有覺察且稍覺可厭 2 差差明顯覺察且可厭但可忍明顯覺察且可厭但可忍受受 1 壞壞不可忍受不可忍受 242語(yǔ)音質(zhì)量客觀評(píng)價(jià)方法 n 該方法建立在原始語(yǔ)音和合成語(yǔ)音的數(shù)學(xué)對(duì)比之上，分為時(shí)該方法建立在原始語(yǔ)音和合成語(yǔ)音的數(shù)學(xué)對(duì)比之上，分為時(shí)域客觀評(píng)價(jià)和頻域客觀評(píng)價(jià)兩類。域客觀評(píng)價(jià)和頻域客觀評(píng)價(jià)兩類。n 時(shí)域客觀評(píng)價(jià)方法有信噪比、加權(quán)信噪比、平均分段信噪比等。時(shí)域客觀評(píng)價(jià)方法有信噪比、加權(quán)信噪比、平均分段信噪比等。n 頻域客觀評(píng)價(jià)方法有巴克譜失真測(cè)度頻域客觀評(píng)價(jià)方法有巴克譜失真測(cè)度BSD和和MEL譜測(cè)度等。譜測(cè)度等。n 特點(diǎn)：特點(diǎn)：計(jì)算簡(jiǎn)單

20、、結(jié)果客觀、不受個(gè)人主觀因素的影響。計(jì)算簡(jiǎn)單、結(jié)果客觀、不受個(gè)人主觀因素的影響。n 缺陷：缺陷：不能完全反映人類對(duì)語(yǔ)音的聽覺效果。不能完全反映人類對(duì)語(yǔ)音的聽覺效果。 25 分段分段SNR(SNRseg)評(píng)價(jià)法：評(píng)價(jià)法：是把每隔是把每隔(10ms30ms)短時(shí)間所測(cè)定的短時(shí)間所測(cè)定的SNR的的dB值在長(zhǎng)時(shí)間聲音區(qū)間取平均而得到的值來表示的值在長(zhǎng)時(shí)間聲音區(qū)間取平均而得到的值來表示的方法，能夠反映出量化器對(duì)不同電平輸入段的量化方法，能夠反映出量化器對(duì)不同電平輸入段的量化質(zhì)量，具有與主觀值對(duì)應(yīng)比較好的特征。質(zhì)量，具有與主觀值對(duì)應(yīng)比較好的特征。 SNR是經(jīng)常采用的一種客觀評(píng)價(jià)方法。是經(jīng)常采用的一種客觀

21、評(píng)價(jià)方法。 265.45.4波形編碼波形編碼模擬信號(hào)數(shù)字化模擬信號(hào)數(shù)字化q 抽樣量化編碼抽樣量化編碼編碼方式編碼方式(1)波形編碼：時(shí)域波形變換為數(shù)字代碼序列。波形編碼：時(shí)域波形變換為數(shù)字代碼序列。n方法簡(jiǎn)單方法簡(jiǎn)單,重建信號(hào)的質(zhì)量好重建信號(hào)的質(zhì)量好,占用頻帶寬占用頻帶寬(2)參量編碼：參量編碼：-提取語(yǔ)音信號(hào)的特征參量提取語(yǔ)音信號(hào)的特征參量，再變，再變換為數(shù)字代碼。換為數(shù)字代碼。n方法復(fù)雜方法復(fù)雜,重建信號(hào)的質(zhì)量差重建信號(hào)的質(zhì)量差,占用頻帶窄占用頻帶窄27n數(shù)字化三步驟：抽樣、量化和編碼數(shù)字化三步驟：抽樣、量化和編碼抽樣信號(hào)抽樣信號(hào)量化信號(hào)t011011011100100100100編碼信

22、號(hào)28本節(jié)目錄n5.4.1 脈沖編碼調(diào)制脈沖編碼調(diào)制 (PCM)n5.4.2 差分脈碼調(diào)制差分脈碼調(diào)制 (DPCM)n5.4.3 增增量量調(diào)調(diào) 制制 ()295.4.1 脈沖編碼調(diào)制的基本原理nPCM是波形編碼中最重要的一種方式。是波形編碼中最重要的一種方式。q模擬信號(hào)為調(diào)制信號(hào)模擬信號(hào)為調(diào)制信號(hào)q二進(jìn)制脈沖序列為載波二進(jìn)制脈沖序列為載波q模擬信號(hào)的抽樣值改變脈沖序列的碼元取值，故模擬信號(hào)的抽樣值改變脈沖序列的碼元取值，故稱稱脈沖編碼調(diào)制（脈沖編碼調(diào)制（PCM）nPCM調(diào)制過程有抽樣、量化和編碼三個(gè)步驟。調(diào)制過程有抽樣、量化和編碼三個(gè)步驟。n電話語(yǔ)音信號(hào)的電話語(yǔ)音信號(hào)的PCM碼組由碼組由8

23、位二進(jìn)制碼組成。位二進(jìn)制碼組成。30 n脈沖編碼調(diào)制原理脈沖編碼調(diào)制原理q模擬信源模擬信源產(chǎn)生要傳輸?shù)哪．a(chǎn)生要傳輸?shù)哪M信號(hào)；擬信號(hào)；q預(yù)濾波器預(yù)濾波器為帶限濾波器；為帶限濾波器；q波形編碼器波形編碼器將模擬信號(hào)變將模擬信號(hào)變換成數(shù)字編碼信號(hào)；換成數(shù)字編碼信號(hào)；q信號(hào)經(jīng)傳輸?shù)竭_(dá)接收端，信號(hào)經(jīng)傳輸?shù)竭_(dá)接收端，在接收端再將數(shù)字編碼信在接收端再將數(shù)字編碼信號(hào)轉(zhuǎn)換成模擬信號(hào)。號(hào)轉(zhuǎn)換成模擬信號(hào)。31 1. 低通抽樣定理低通抽樣定理抽樣定理：抽樣定理：一個(gè)頻帶限制在（一個(gè)頻帶限制在（0，fH）內(nèi)的連續(xù)信號(hào)）內(nèi)的連續(xù)信號(hào)x(t)，如果抽樣頻率如果抽樣頻率fs大于或等于大于或等于2 fH ，則可以由樣值序列

24、，則可以由樣值序列x(nTs)無失真地重建原始信號(hào)無失真地重建原始信號(hào)x(n)。n通常進(jìn)行等間隔通常進(jìn)行等間隔T抽樣；抽樣；q理論上，抽樣過程理論上，抽樣過程周期單位沖激脈沖周期單位沖激脈沖模擬信號(hào)；模擬信號(hào)；q實(shí)際上，實(shí)際上，抽樣過程抽樣過程周期性單位窄脈沖周期性單位窄脈沖模擬信號(hào)；模擬信號(hào)； 5.4.2 抽樣32 n 時(shí)域中，抽樣信號(hào)可表示為：時(shí)域中，抽樣信號(hào)可表示為：單位沖擊函數(shù)可表示為：?jiǎn)挝粵_擊函數(shù)可表示為：故有：故有：n 頻域中，由于頻域中，由于所以，有：所以，有：)()()(ttxtxTs)()(snTttnTssss( )( )( )( )()() ()Tnnx t

25、x ttx ttnTx nTtnT)2ssnTnT()()()()()()(sss121nXTXXnT)(ss1nXTn33 n 抽樣信號(hào)的時(shí)域與頻域?qū)φ眨撼闃有盘?hào)的時(shí)域與頻域?qū)φ眨簳r(shí)域時(shí)域相乘相乘頻域頻域卷積卷積34 設(shè)理想低通傳遞函數(shù)為：設(shè)理想低通傳遞函數(shù)為：則濾波器輸出為：則濾波器輸出為：根據(jù)時(shí)域卷積定理，可獲得重建信號(hào)：根據(jù)時(shí)域卷積定理，可獲得重建信號(hào)：HH 0 1,)(HssHs1( )( )( )( ) rect(/2)( )XXHXXT)()()( thtxtxsnttTnTtnTxHHssssin1)()(nnTtnTtnTxT)()()(sHsHsssin1內(nèi)插公內(nèi)插公式

26、式35t恢復(fù)原信號(hào)的方法：恢復(fù)原信號(hào)的方法：頻域：頻域：當(dāng)當(dāng)fs 2fH時(shí)，用一個(gè)截止頻率為時(shí)，用一個(gè)截止頻率為fH的理想低通濾的理想低通濾波器就能夠從抽樣信號(hào)中分離出原信號(hào)。波器就能夠從抽樣信號(hào)中分離出原信號(hào)。時(shí)域：時(shí)域：當(dāng)用抽樣脈沖序列當(dāng)用抽樣脈沖序列通過通過此理想低通濾波器時(shí)，濾此理想低通濾波器時(shí)，濾波器的輸出就是一系列沖激響應(yīng)之和。這些沖激響應(yīng)之波器的輸出就是一系列沖激響應(yīng)之和。這些沖激響應(yīng)之和就構(gòu)成了原信號(hào)。和就構(gòu)成了原信號(hào)。n理想濾波器是不能實(shí)現(xiàn)的。實(shí)用濾波器的截止特性不可能理想濾波器是不能實(shí)現(xiàn)的。實(shí)用濾波器的截止特性不可能做到如此陡峭。所以，實(shí)用的抽樣頻率做到如此陡峭。所以，實(shí)用

27、的抽樣頻率fs必須比必須比2fH 大一些。大一些。q典型電話信號(hào)的最高頻率通常限制在典型電話信號(hào)的最高頻率通常限制在3400 Hz，而抽樣，而抽樣頻率通常采用頻率通常采用8000 Hz。365.4.3 量化n設(shè)模擬信號(hào)的抽樣值為設(shè)模擬信號(hào)的抽樣值為m(kT)，其中，其中T是抽樣周期，是抽樣周期，k是整是整數(shù)。數(shù)。q此抽樣值仍然是一個(gè)取值連續(xù)的變量，有無窮多種取值。此抽樣值仍然是一個(gè)取值連續(xù)的變量，有無窮多種取值。n編碼時(shí)只能用有限種碼元來代表抽樣值。編碼時(shí)只能用有限種碼元來代表抽樣值。q若僅用若僅用N個(gè)不同的二進(jìn)制數(shù)字碼元來代表此抽樣值的大小，則個(gè)不同的二進(jìn)制數(shù)字碼元來代表此抽樣值的大小，則N

28、個(gè)個(gè)不同的二進(jìn)制碼元只能代表不同的二進(jìn)制碼元只能代表M = 2N個(gè)不同的抽樣值。個(gè)不同的抽樣值。n樣值無窮多種樣值無窮多種-編碼有限編碼有限-限制樣值的取值種類限制樣值的取值種類q必須將抽樣值的范圍劃分成必須將抽樣值的范圍劃分成M個(gè)區(qū)間，每個(gè)區(qū)間用一個(gè)電平表示。個(gè)區(qū)間，每個(gè)區(qū)間用一個(gè)電平表示。n共有共有M個(gè)離散電平，它們稱為個(gè)離散電平，它們稱為量化電平量化電平。n用這用這M個(gè)量化電平表示連續(xù)抽樣值的方法稱為個(gè)量化電平表示連續(xù)抽樣值的方法稱為量化量化。37 n用有限位數(shù)字表示抽樣值的過程即為量化。用有限位數(shù)字表示抽樣值的過程即為量化。q量化器的輸入輸出關(guān)系可表示為：量化器的輸入輸出關(guān)系可表示為：

29、為量化電平，為量化電平，為分層電平，為分層電平，為量化間隔為量化間隔。1 , 1 2,kkkyQ xxxkL ，kykxkkkxx138 量化特性曲量化特性曲線線n圖圖a為均勻?yàn)榫鶆蛑猩?；中升型；n圖圖b為非均為非均勻中升型；勻中升型；n圖圖c為均勻?yàn)榫鶆蛑衅叫?；中平型；n圖圖d為非均為非均勻中平型。勻中平型。39 均勻量化特性和量化誤差均勻量化特性和量化誤差量化前的量化前的模擬信號(hào)模擬信號(hào)量化后的信量化后的信號(hào)：階梯波號(hào)：階梯波量化誤差：模擬量化誤差：模擬信號(hào)和量化信號(hào)信號(hào)和量化信號(hào)的差別的差別 40均勻量化的討論 n均勻量化器的應(yīng)用：均勻量化器的應(yīng)用：qA/D變換；變換；q遙控遙測(cè)

30、系統(tǒng)、儀表、圖像信號(hào)的數(shù)字化接口等；遙控遙測(cè)系統(tǒng)、儀表、圖像信號(hào)的數(shù)字化接口等；n均勻量化的不足：不適于數(shù)字電話的通信均勻量化的不足：不適于數(shù)字電話的通信q電話信號(hào)動(dòng)態(tài)范圍大，采用均勻量化容易過載；電話信號(hào)動(dòng)態(tài)范圍大，采用均勻量化容易過載；q動(dòng)態(tài)范圍：滿足一定信噪比要求的信號(hào)取值范圍動(dòng)態(tài)范圍：滿足一定信噪比要求的信號(hào)取值范圍q電話信號(hào)的信噪比要求要大于電話信號(hào)的信噪比要求要大于25dB，則需要，則需要12位編碼，位編碼，所需傳輸帶寬大；所需傳輸帶寬大；q語(yǔ)音信號(hào)取小信號(hào)的概率大，而均勻量化時(shí)信號(hào)幅度越語(yǔ)音信號(hào)取小信號(hào)的概率大，而均勻量化時(shí)信號(hào)幅度越小，小，SNR越低，通信質(zhì)量越差。越低，通信質(zhì)

31、量越差。n非均勻量化：小信號(hào)小階距量化，大信號(hào)大階距量化非均勻量化：小信號(hào)小階距量化，大信號(hào)大階距量化minmaxdBlg20R 保證通信質(zhì)量，減少編碼位數(shù)，提高小信號(hào)的信噪比41例例5-1 5-1 正弦信號(hào)正弦信號(hào) ，抽樣頻率，抽樣頻率，限定，限定抽樣時(shí)刻通過正弦波的零點(diǎn)。抽樣時(shí)刻通過正弦波的零點(diǎn)。 (1)(1)列出在正弦信號(hào)一個(gè)周期內(nèi)樣值序列列出在正弦信號(hào)一個(gè)周期內(nèi)樣值序列的取值，畫出樣的取值，畫出樣值序列的時(shí)間波形圖；值序列的時(shí)間波形圖；(2)(2)樣值序列輸入如圖樣值序列輸入如圖5-13(b)5-13(b)所示的量化器，列出量化后所示的量化器，列出量化后樣值序列，畫出量化后的樣值

32、序列的時(shí)間波形圖。樣值序列，畫出量化后的樣值序列的時(shí)間波形圖。解解 (1)(1)正弦信號(hào)的頻率正弦信號(hào)的頻率，抽樣頻率，抽樣頻率，在，在正弦信號(hào)的一個(gè)周期內(nèi)抽樣次數(shù)為正弦信號(hào)的一個(gè)周期內(nèi)抽樣次數(shù)為m，即，即抽樣的時(shí)間間隔為抽樣的時(shí)間間隔為，即，即相鄰樣值之間的相位間隔為相鄰樣值之間的相位間隔為，即，即 (36(36) ) ( )3.25sin(1600 )x tts8kHzf ( )x nq( )x n800Hzf s8kHzf 3s28 10108 10fmfcT)s(125108113scfT2 . 0101251600-642限定抽樣時(shí)刻通過正弦波的零點(diǎn)，所以在正弦信號(hào)一個(gè)周期限

33、定抽樣時(shí)刻通過正弦波的零點(diǎn)，所以在正弦信號(hào)一個(gè)周期內(nèi)內(nèi)x(n)的樣值序列可表示為的樣值序列可表示為V)(00sin25. 3)5()0( xxV)(88. 1)2 . 0sin(25. 3)4() 1 ( xxV)(08. 3)4 . 0sin(25. 3)3()2( xxV)(88. 1)2 . 1sin(25. 3)9()6( xxV)(08. 3)4 . 1sin(25. 3)8()7( xx樣值序列樣值序列x(n)的時(shí)間波形圖如圖的時(shí)間波形圖如圖5-17(a)5-17(a)所示。所示。(2)(2)量化器對(duì)樣值序列量化器對(duì)樣值序列x(n)進(jìn)行量化，量化后的樣值序列進(jìn)行量化，量化后的樣值序

34、列xq(n)為為V)(5 . 0)5()0(qq xxV)(5 . 1)4() 1 (qq xxV)(5 . 3)3()2(qq xxV)(5 . 3)8()7(qq xxV)(5 . 1)9()6(qq xx量化后的樣值序列的時(shí)間波形圖如圖量化后的樣值序列的時(shí)間波形圖如圖5-17(b)5-17(b)所示。所示?？紤]到編碼的規(guī)則，在抽樣值的計(jì)算中均不進(jìn)行四舍五入的考慮到編碼的規(guī)則，在抽樣值的計(jì)算中均不進(jìn)行四舍五入的近似處理，直接將尾數(shù)舍去。近似處理，直接將尾數(shù)舍去。43圖圖5-17 例例5-1中的時(shí)間波形圖中的時(shí)間波形圖 (a) 樣值序列的時(shí)間波形圖樣值序列的時(shí)間波形圖 (b)量化后的樣值序列

35、的時(shí)間波形圖量化后的樣值序列的時(shí)間波形圖44 例例5-2 對(duì)頻率范圍為對(duì)頻率范圍為30 Hz 300 Hz的模擬信號(hào)進(jìn)行線性的模擬信號(hào)進(jìn)行線性PCM編碼。編碼。(1) 求最低抽樣頻率求最低抽樣頻率；(2) 若量化電平數(shù)若量化電平數(shù) L = 64，求，求PCM信號(hào)的信息速率信號(hào)的信息速率。解：解：(1) 由模擬信號(hào)的頻率范圍可知，該信號(hào)應(yīng)作為低通信號(hào)由模擬信號(hào)的頻率范圍可知，該信號(hào)應(yīng)作為低通信號(hào)處理。最低抽樣頻率為處理。最低抽樣頻率為(2) 由量化電平由量化電平L可求出編碼位數(shù)可求出編碼位數(shù)n，即，即 PCM信號(hào)的信息速率為信號(hào)的信息速率為sfbR(Hz) 60030022Hsff664lo

36、glog22Lnbs60063 600 (bit/s)Rf n45 5.4.5 非均勻量化非均勻量化為保證信號(hào)的為保證信號(hào)的SNR要求，又不能使編碼位數(shù)太要求，又不能使編碼位數(shù)太多。采用先壓縮后擴(kuò)張的非均勻量化方案，以減多。采用先壓縮后擴(kuò)張的非均勻量化方案，以減少編碼位數(shù)。少編碼位數(shù)。非線性變換，對(duì)信號(hào)非線性變換，對(duì)信號(hào)幅度范圍進(jìn)行壓縮幅度范圍進(jìn)行壓縮46非均勻量化的關(guān)鍵是非線性壓縮 n問題：非線性壓縮特性如何選擇？問題：非線性壓縮特性如何選擇？q目標(biāo)：目標(biāo)：獲得最佳壓縮特性獲得最佳壓縮特性n量化噪聲的平均功率最小量化噪聲的平均功率最小q量化噪聲的平均功率的基本公式量化噪聲的平均功率的基本公

37、式n對(duì)數(shù)壓縮特性對(duì)數(shù)壓縮特性q對(duì)數(shù)壓縮均勻量化對(duì)數(shù)量化對(duì)數(shù)壓縮均勻量化對(duì)數(shù)量化xxpyxxkxxLkkkd )()(212q147 5.4.6 對(duì)數(shù)量化及其折線近似對(duì)數(shù)量化及其折線近似nCCITT建議建議q對(duì)數(shù)壓縮特性：對(duì)數(shù)壓縮特性：A律；律；律律1. A律對(duì)數(shù)壓縮特性律對(duì)數(shù)壓縮特性 ( A law )q設(shè)量化器滿載電壓值為設(shè)量化器滿載電壓值為V，信號(hào)幅度的歸一化信號(hào)幅度的歸一化值為值為qA律對(duì)數(shù)壓縮特性律對(duì)數(shù)壓縮特性nA為壓縮系數(shù)，為壓縮系數(shù)，A=1 時(shí)無壓縮，時(shí)無壓縮，A愈大壓縮效果愈明愈大壓縮效果愈明顯；顯；n0=x=1/A，是線性函數(shù)，特性曲線是一段直線是線性函數(shù)，特性曲線是一段直

38、線n1/A=xf(it_)時(shí)，上升一個(gè)時(shí)，上升一個(gè)，發(fā)，發(fā)“1”碼；碼；n 當(dāng)當(dāng)f(it)0，則，則Po(0)=1nt=t時(shí)，時(shí)， e(t)=f(t)-f(t_)0，則，則Po(t)=1nt=2t時(shí)，時(shí)，e(2t)=f(2t)-f(2t_)0，則，則Po(3t)=1;nt=4t時(shí)，時(shí)，e(4t)=f(4t)-f(4t_)0，則，則Po(5t)=1;nt=6t時(shí)，時(shí)，e(6t)=f(6t)-f(6t_)0，則，則Po(6t)=1;81 圖42 增量調(diào)制原理框圖f (t)抽樣判決積分器f (t)T(t)e(t)Po(t)RC(a) 增量調(diào) 制器 (編碼器 )框圖(b) RC積

39、分器82n 以此類推，即可得到如圖以此類推，即可得到如圖43所示所示的波形。細(xì)心的讀者會(huì)發(fā)現(xiàn)圖的波形。細(xì)心的讀者會(huì)發(fā)現(xiàn)圖43中的中的f(t)和圖和圖41的波形不一樣。其實(shí)，圖的波形不一樣。其實(shí)，圖41的的階梯波只是為了形象地說明增量調(diào)制原理，階梯波只是為了形象地說明增量調(diào)制原理，而實(shí)際積分器的輸出波形如圖而實(shí)際積分器的輸出波形如圖43（d）所）所示。示。83圖43 增量調(diào)制過程示意圖 tt02t 3t 4t 5t 6t 7t 8t 9t10t11t12t13t14tT(t)(a) 抽樣脈沖(b) 樣值信號(hào)tt02t3t4t5t 6t 7t 8t 9t10t11t12t13t14

40、tf (t)f (t)84(d) 積分器輸出信號(hào)t110101111110000t02t 3t 4t 5t 6t 7t 8t 9t10t11t12t13t14tPo(t)t0f (t)圖43 增量調(diào)制過程示意圖 85n 4.1.3 M的解調(diào)原理的解調(diào)原理n 為了完成整個(gè)通信過程，發(fā)送端調(diào)為了完成整個(gè)通信過程，發(fā)送端調(diào)制出的信號(hào)必須在接收端通過解調(diào)恢復(fù)出制出的信號(hào)必須在接收端通過解調(diào)恢復(fù)出原始模擬信號(hào)。原始模擬信號(hào)。M信號(hào)的解調(diào)比較簡(jiǎn)單，信號(hào)的解調(diào)比較簡(jiǎn)單，用一個(gè)和本地解碼器一樣的積分器即可。用一個(gè)和本地解碼器一樣的積分器即可。在接收端和發(fā)送端的在接收端和發(fā)送端的積分器積分器一般都是一個(gè)一般都是

41、一個(gè)RC積分器。解調(diào)過程就是圖積分器。解調(diào)過程就是圖43中的積分中的積分過程。當(dāng)積分器輸入過程。當(dāng)積分器輸入“1”碼時(shí)，積分器輸碼時(shí)，積分器輸出產(chǎn)生一個(gè)正斜變的電壓并上升一個(gè)量化出產(chǎn)生一個(gè)正斜變的電壓并上升一個(gè)量化臺(tái)階臺(tái)階；而當(dāng)輸入；而當(dāng)輸入“0”碼時(shí)，積分器輸出電碼時(shí)，積分器輸出電壓就下降一個(gè)量化臺(tái)階壓就下降一個(gè)量化臺(tái)階。86n 為了保證解調(diào)質(zhì)量，對(duì)解碼器有兩個(gè)為了保證解調(diào)質(zhì)量，對(duì)解碼器有兩個(gè)要求：要求：n （1）每次上升或下降的大小要一致，）每次上升或下降的大小要一致，即正負(fù)斜率大小一樣。即正負(fù)斜率大小一樣。n （2）解碼器應(yīng)具有）解碼器應(yīng)具有“記憶記憶”功能，即功能，即輸入為連續(xù)輸入為連

42、續(xù)“1”或或“0”碼時(shí)，輸出能連續(xù)碼時(shí)，輸出能連續(xù)上升或下降。上升或下降。n 對(duì)積分器的輸出信號(hào)進(jìn)行低通濾波，對(duì)積分器的輸出信號(hào)進(jìn)行低通濾波，濾除波形中的高頻成分，即可得到與原始濾除波形中的高頻成分，即可得到與原始模擬信號(hào)十分近似的解調(diào)信號(hào)，如圖模擬信號(hào)十分近似的解調(diào)信號(hào)，如圖44所示。所示。87圖44 增量調(diào)制譯碼(解調(diào))示意圖積分器低通濾波Po(t)f (t)fo(t)(a) 增量解調(diào)器(譯碼器)框圖t0f (t)(b) 各點(diǎn)波形fo(t)88n 4.1.4 M調(diào)制存在的問題調(diào)制存在的問題n 增量調(diào)制盡管有前面所述的不少優(yōu)點(diǎn)，但它增量調(diào)制盡管有前面所述的不少優(yōu)點(diǎn)，但它也有兩個(gè)不足：一個(gè)是一

43、般量化噪聲問題也有兩個(gè)不足：一個(gè)是一般量化噪聲問題;另一個(gè)是過另一個(gè)是過載噪聲問題。兩者可統(tǒng)一稱為量化噪聲。載噪聲問題。兩者可統(tǒng)一稱為量化噪聲。n 觀察圖觀察圖41可以發(fā)現(xiàn)，階梯曲線（調(diào)制曲線）可以發(fā)現(xiàn)，階梯曲線（調(diào)制曲線）的最大上升和下降斜率是一個(gè)定值，只要增量的最大上升和下降斜率是一個(gè)定值，只要增量和時(shí)間和時(shí)間間隔間隔t給定，它們就不變。那么，如果原始模擬信號(hào)給定，它們就不變。那么，如果原始模擬信號(hào)的變化率超過調(diào)制曲線的最大斜率，則調(diào)制曲線就跟的變化率超過調(diào)制曲線的最大斜率，則調(diào)制曲線就跟不上原始信號(hào)的變化，從而造成誤差。我們把這種因不上原始信號(hào)的變化，從而造成誤差。我們把這種因調(diào)制曲線跟

44、不上原始信號(hào)變化的現(xiàn)象叫做過載現(xiàn)象，調(diào)制曲線跟不上原始信號(hào)變化的現(xiàn)象叫做過載現(xiàn)象，由此產(chǎn)生的波形失真或者信號(hào)誤差叫做過載噪聲。由此產(chǎn)生的波形失真或者信號(hào)誤差叫做過載噪聲。 89n 另外，由于增量調(diào)制是利用調(diào)制曲另外，由于增量調(diào)制是利用調(diào)制曲線和原始信號(hào)的差值進(jìn)行編碼，也就是利線和原始信號(hào)的差值進(jìn)行編碼，也就是利用增量進(jìn)行量化，因此在調(diào)制曲線和原始用增量進(jìn)行量化，因此在調(diào)制曲線和原始信號(hào)之間存在誤差，這種誤差稱為一般量信號(hào)之間存在誤差，這種誤差稱為一般量化誤差或一般量化噪聲。兩種噪聲示意圖化誤差或一般量化噪聲。兩種噪聲示意圖如圖如圖45所示。所示。90圖45 兩種量化噪聲示意圖 ttf (t)f

45、 (t)n(t)n(t)f (t)f (t)91n 仔細(xì)分析兩種噪聲波形我們發(fā)現(xiàn)，仔細(xì)分析兩種噪聲波形我們發(fā)現(xiàn)，兩種噪聲的大小與階梯波的抽樣間隔兩種噪聲的大小與階梯波的抽樣間隔t和增和增量量有關(guān)。我們定義有關(guān)。我們定義K為階梯波一個(gè)臺(tái)階的為階梯波一個(gè)臺(tái)階的斜率斜率sKft 式中,fs是抽樣頻率。該斜率被稱為最大跟蹤斜率。當(dāng)信號(hào)斜率大于跟蹤斜率時(shí)，稱為過載條件，此時(shí)就會(huì)出現(xiàn)過載現(xiàn)象；當(dāng)信號(hào)斜率等于跟蹤斜率時(shí)，稱為臨界條件；當(dāng)信號(hào)斜率小于跟蹤斜率時(shí)，稱為不過載條件。92n 可見，通過增大量化臺(tái)階（增量）可見，通過增大量化臺(tái)階（增量）進(jìn)而提高階梯波形的最大跟蹤斜率，就可進(jìn)而提高階梯波形的最大跟蹤斜率

46、，就可以減小過載噪聲；而降低以減小過載噪聲；而降低則可減小一般量則可減小一般量化噪聲。顯然，通過改變量化臺(tái)階進(jìn)行降化噪聲。顯然，通過改變量化臺(tái)階進(jìn)行降噪出現(xiàn)了矛盾，因此，噪出現(xiàn)了矛盾，因此，值必須兩頭兼顧，值必須兩頭兼顧，適當(dāng)選取。不過，利用增大抽樣頻率（即適當(dāng)選取。不過，利用增大抽樣頻率（即減小抽樣時(shí)間間隔減小抽樣時(shí)間間隔t），卻可以），卻可以“左右逢左右逢源源”，既能減小過載噪聲，又可降低一般，既能減小過載噪聲，又可降低一般量化噪聲。因此，實(shí)際應(yīng)用中，量化噪聲。因此，實(shí)際應(yīng)用中，M系統(tǒng)的系統(tǒng)的抽樣頻率要比抽樣頻率要比PCM系統(tǒng)高得多（一般在兩系統(tǒng)高得多（一般在兩倍以上，對(duì)于話音信號(hào)典型值為

47、倍以上，對(duì)于話音信號(hào)典型值為16kHz和和32kHz）。）。93n 【例題【例題41】已知一個(gè)話音信號(hào)的已知一個(gè)話音信號(hào)的最高頻率分量最高頻率分量fH=3.4kHz，幅度為，幅度為A=1V。若。若抽樣頻率抽樣頻率fs=32kHz，求增量調(diào)制臺(tái)階，求增量調(diào)制臺(tái)階=？n 解解首先要找出話音信號(hào)的最大斜率。首先要找出話音信號(hào)的最大斜率。若信號(hào)為單頻正弦型信號(hào)若信號(hào)為單頻正弦型信號(hào)f(t)=Asint，則其，則其斜率就是它的導(dǎo)數(shù)，斜率就是它的導(dǎo)數(shù)， n n ，最大，最大斜率為斜率為K=A。把話音信號(hào)的最高頻率分量。把話音信號(hào)的最高頻率分量看成是一個(gè)正弦型信號(hào)，看成是一個(gè)正弦型信號(hào)， ( )

48、( )cosdf tk tAtdt94n 由式（由式（41）可知當(dāng)）可知當(dāng)A2fHfs時(shí)，時(shí)，系統(tǒng)不過載。所以系統(tǒng)不過載。所以223.40.668( )32HsAfVf增量調(diào)制臺(tái)階為0.668V。 95n 另外，如果模擬信號(hào)為交流信號(hào)，另外，如果模擬信號(hào)為交流信號(hào)，且信號(hào)峰且信號(hào)峰-峰值小于峰值小于時(shí)，增量調(diào)制器的輸出時(shí)，增量調(diào)制器的輸出將不隨信號(hào)的變化而變化，只輸出將不隨信號(hào)的變化而變化，只輸出“1”和和“0”交替出現(xiàn)的數(shù)字序列。只有當(dāng)信號(hào)峰交替出現(xiàn)的數(shù)字序列。只有當(dāng)信號(hào)峰值大于值大于/2時(shí)，調(diào)制器才輸出隨交流信號(hào)的時(shí)，調(diào)制器才輸出隨交流信號(hào)的變化而變化的數(shù)字序列變化而變化的數(shù)字序列,因此，

49、把因此，把/2電平稱電平稱為增量調(diào)制器的起始編碼電平。為增量調(diào)制器的起始編碼電平。96n 5.7 語(yǔ)音信號(hào)參數(shù)編碼語(yǔ)音信號(hào)參數(shù)編碼 n 基于參數(shù)編碼理論的編碼器由于其數(shù)碼率比較低，基于參數(shù)編碼理論的編碼器由于其數(shù)碼率比較低，通常稱為聲碼器。通常稱為聲碼器。n 根據(jù)語(yǔ)音信號(hào)的共振峰模型提出了共振峰聲碼器，根據(jù)語(yǔ)音信號(hào)的共振峰模型提出了共振峰聲碼器，該聲碼器通過對(duì)語(yǔ)音信號(hào)整體進(jìn)行分析，提取共振峰的位該聲碼器通過對(duì)語(yǔ)音信號(hào)整體進(jìn)行分析，提取共振峰的位置、幅度、帶寬等參數(shù)，構(gòu)成濁音和清音兩個(gè)聲道濾波器。置、幅度、帶寬等參數(shù)，構(gòu)成濁音和清音兩個(gè)聲道濾波器。濁音濾波器采用全極點(diǎn)濾波器，由多個(gè)二階濾波器級(jí)聯(lián)

50、而濁音濾波器采用全極點(diǎn)濾波器，由多個(gè)二階濾波器級(jí)聯(lián)而成；清音濾波器一般采用一個(gè)極點(diǎn)和一個(gè)零點(diǎn)的數(shù)字濾波成；清音濾波器一般采用一個(gè)極點(diǎn)和一個(gè)零點(diǎn)的數(shù)字濾波器。這些濾波器的參數(shù)都是時(shí)變的。器。這些濾波器的參數(shù)都是時(shí)變的。97n 5.6.1 LPC聲碼器原理聲碼器原理n 在聲碼器中最具有代表性的是線性預(yù)測(cè)在聲碼器中最具有代表性的是線性預(yù)測(cè)(LPC)聲碼器及其改進(jìn)型。聲碼器及其改進(jìn)型。n LPC聲碼器是低速率語(yǔ)音編碼器，可以得聲碼器是低速率語(yǔ)音編碼器，可以得到很低的比特率到很低的比特率(2.4kbit/s以下以下)；基于全極點(diǎn)聲；基于全極點(diǎn)聲道模型的假定，采用線性預(yù)測(cè)分析合成原理，對(duì)道模型的假定，采用

51、線性預(yù)測(cè)分析合成原理，對(duì)模型參數(shù)和激勵(lì)參數(shù)進(jìn)行編碼傳輸。模型參數(shù)和激勵(lì)參數(shù)進(jìn)行編碼傳輸。LPC聲碼器聲碼器遵循二元激勵(lì)假設(shè)，聲碼器只需對(duì)遵循二元激勵(lì)假設(shè)，聲碼器只需對(duì)LPC參數(shù)、基參數(shù)、基音周期、增益和清濁音信息進(jìn)行編碼。音周期、增益和清濁音信息進(jìn)行編碼。98LPC聲碼器工作原理如下圖所示n5.6 LPC聲碼器原理圖聲碼器原理圖 99n 雖然雖然LPC聲碼器與聲碼器與ADPCM一樣，都是一樣，都是基于線性預(yù)測(cè)分析來實(shí)現(xiàn)對(duì)語(yǔ)音信號(hào)的編碼壓基于線性預(yù)測(cè)分析來實(shí)現(xiàn)對(duì)語(yǔ)音信號(hào)的編碼壓縮，但是它們之間有著本質(zhì)的區(qū)別，縮，但是它們之間有著本質(zhì)的區(qū)別，LPC聲碼聲碼器不考慮重建信號(hào)波形是否與原來信號(hào)的波形器

52、不考慮重建信號(hào)波形是否與原來信號(hào)的波形相同，而努力使重建信號(hào)具有盡可能高的可懂相同，而努力使重建信號(hào)具有盡可能高的可懂度和清晰度，所以不必量化和傳輸預(yù)測(cè)殘差，度和清晰度，所以不必量化和傳輸預(yù)測(cè)殘差，只需傳輸只需傳輸LPC參數(shù)和重構(gòu)激勵(lì)信號(hào)的基音周期參數(shù)和重構(gòu)激勵(lì)信號(hào)的基音周期和清濁音信息。和清濁音信息。100n LPC聲碼器的缺點(diǎn)聲碼器的缺點(diǎn)n （1）損失了語(yǔ)音自然度。主要是由于過）損失了語(yǔ)音自然度。主要是由于過分簡(jiǎn)單的二元激勵(lì)模型，不能完全代表豐富的語(yǔ)分簡(jiǎn)單的二元激勵(lì)模型，不能完全代表豐富的語(yǔ)音信息。音信息。n （2）降低了方案的魯棒性。二元的清濁音）降低了方案的魯棒性。二元的清濁音判決及語(yǔ)

53、音譜中共振峰的作用使清濁音判決及基判決及語(yǔ)音譜中共振峰的作用使清濁音判決及基音提取方案變得很不準(zhǔn)確并易受噪聲的影響。音提取方案變得很不準(zhǔn)確并易受噪聲的影響。n （3）在）在LPC中，譜包絡(luò)中的共振峰位置及中，譜包絡(luò)中的共振峰位置及帶寬估計(jì)有時(shí)會(huì)產(chǎn)生很大的失真。帶寬估計(jì)有時(shí)會(huì)產(chǎn)生很大的失真。1015.6.2 LPC-10編碼器n LPC聲碼器在通信領(lǐng)域，尤其是軍事通聲碼器在通信領(lǐng)域，尤其是軍事通信領(lǐng)域得到了廣泛的應(yīng)用，利用信領(lǐng)域得到了廣泛的應(yīng)用，利用LPC聲碼器可聲碼器可以合成清晰、可懂的語(yǔ)音，但是抗噪聲能力和以合成清晰、可懂的語(yǔ)音，但是抗噪聲能力和自然度比較差。自自然度比較差。自1986年以來

54、，美國(guó)第三代保年以來，美國(guó)第三代保密電話裝置采用了速率為密電話裝置采用了速率為2.4kbit/s的的LPC-10e（LPC-10的增強(qiáng)型）作為語(yǔ)音處理手段。的增強(qiáng)型）作為語(yǔ)音處理手段。102圖圖8.9 LPC-10的編碼器框圖的編碼器框圖103 1. 編碼器n (1) 編碼器基本原理編碼器基本原理n 原始語(yǔ)音以原始語(yǔ)音以8kHz采樣率采樣率12bit量化得到量化得到數(shù)字化語(yǔ)音，然后每數(shù)字化語(yǔ)音，然后每180個(gè)采樣點(diǎn)個(gè)采樣點(diǎn)(22.5ms)為一為一幀，以幀為處理單元。編碼器分兩個(gè)支路同時(shí)幀，以幀為處理單元。編碼器分兩個(gè)支路同時(shí)進(jìn)行，其中一個(gè)支路用于提取基音周期進(jìn)行，其中一個(gè)支路用于提取基音周期T

55、和清濁和清濁音音U/V判決信息；另一支路用于提取聲道濾波器判決信息；另一支路用于提取聲道濾波器參數(shù)參數(shù)RC和增益因子和增益因子RMS。104n (2) 計(jì)算聲道濾波器參數(shù)計(jì)算聲道濾波器參數(shù)n 利用協(xié)方差法對(duì)利用協(xié)方差法對(duì)LPC分析濾波器計(jì)算分析濾波器計(jì)算l0階階LPC分析預(yù)測(cè)系數(shù)，并轉(zhuǎn)換成反射系數(shù)分析預(yù)測(cè)系數(shù)，并轉(zhuǎn)換成反射系數(shù)RC，或者部分相關(guān)系數(shù)或者部分相關(guān)系數(shù)PARCOR來代替預(yù)測(cè)系數(shù)來代替預(yù)測(cè)系數(shù)進(jìn)行量化編碼。理論上進(jìn)行量化編碼。理論上RC參數(shù)和參數(shù)和PARCOR參參數(shù)互為相反數(shù)，數(shù)互為相反數(shù)，105n (3) 增益因子增益因子RMS的計(jì)算的計(jì)算n 用如下公式計(jì)算用如下公式計(jì)算RMS：n

56、式中式中x(i)是經(jīng)過預(yù)加重的數(shù)字語(yǔ)音；是經(jīng)過預(yù)加重的數(shù)字語(yǔ)音；N是分是分析幀的長(zhǎng)度。析幀的長(zhǎng)度。 )(N1RMS12ixNi106n (4) 基音周期提取和清基音周期提取和清/濁音檢測(cè)濁音檢測(cè)n 輸入數(shù)字語(yǔ)音經(jīng)低通濾波器濾波，再輸入數(shù)字語(yǔ)音經(jīng)低通濾波器濾波，再經(jīng)過二階逆濾波經(jīng)過二階逆濾波(逆濾波器的系數(shù)為前面逆濾波器的系數(shù)為前面LPC分析得到的短時(shí)譜參數(shù)分析得到的短時(shí)譜參數(shù))。把取樣頻率降低至。把取樣頻率降低至原來的原來的1/4，再計(jì)算延遲時(shí)間為，再計(jì)算延遲時(shí)間為20256個(gè)樣點(diǎn)個(gè)樣點(diǎn)的平均幅度差函數(shù)的平均幅度差函數(shù)AMDF，由，由AMDF的最小值的最小值確定基音周期。計(jì)算確定基音周期。計(jì)

57、算AMDF的公式為的公式為1301)()()(AMDFmkmxmxk107n (5) 參數(shù)編碼與解碼參數(shù)編碼與解碼n 在傳輸數(shù)據(jù)流中，將在傳輸數(shù)據(jù)流中，將10個(gè)反射系數(shù)、增個(gè)反射系數(shù)、增益因子益因子(RMS)、基音周期、基音周期T、清、清/濁音濁音U /V、同、同步信號(hào)步信號(hào)Sync編碼成每幀編碼成每幀54bit。由于傳輸速率。由于傳輸速率為為44.4幀幀/s ，因此，碼率為，因此，碼率為2.4kbit/s。同步信。同步信號(hào)采用相鄰幀號(hào)采用相鄰幀1、0碼交替的模式。表碼交替的模式。表8.5是濁是濁音幀和清音幀的比特?cái)?shù)分配。音幀和清音幀的比特?cái)?shù)分配。108表表5.5 LPC-10的比特?cái)?shù)分配的比

58、特?cái)?shù)分配(bit)清音清音濁音濁音T/Voicing77RMS55Sync11k155k255k355k455k54k64k74k84k93k102誤差校誤差校正正020總計(jì)總計(jì)54531092解碼器圖圖5.10 LPC-10解碼器框圖解碼器框圖110n 接收到的語(yǔ)音信號(hào)經(jīng)串接收到的語(yǔ)音信號(hào)經(jīng)串/并變換及同步后，并變換及同步后，利用查表法對(duì)數(shù)碼流進(jìn)行檢錯(cuò)、糾錯(cuò)。糾錯(cuò)譯利用查表法對(duì)數(shù)碼流進(jìn)行檢錯(cuò)、糾錯(cuò)。糾錯(cuò)譯碼后的數(shù)據(jù)經(jīng)參數(shù)解碼得到基音周期、清碼后的數(shù)據(jù)經(jīng)參數(shù)解碼得到基音周期、清/濁音濁音標(biāo)志、增益以及反射系數(shù)的數(shù)值，解碼結(jié)果延標(biāo)志、增益以及反射系數(shù)的數(shù)值，解碼結(jié)果延時(shí)一幀輸出。輸出數(shù)據(jù)在過去的

59、一幀、當(dāng)前幀時(shí)一幀輸出。輸出數(shù)據(jù)在過去的一幀、當(dāng)前幀和將來的一幀共和將來的一幀共3幀內(nèi)進(jìn)行平滑。由于每幀語(yǔ)幀內(nèi)進(jìn)行平滑。由于每幀語(yǔ)音只傳輸一組參數(shù)，但一幀之內(nèi)可能有不止一音只傳輸一組參數(shù)，但一幀之內(nèi)可能有不止一個(gè)基音周期，因此要對(duì)接收數(shù)值進(jìn)行由幀塊到個(gè)基音周期，因此要對(duì)接收數(shù)值進(jìn)行由幀塊到基音塊的轉(zhuǎn)換和插值?；魤K的轉(zhuǎn)換和插值。 111n (1) 參數(shù)插值原則參數(shù)插值原則 n 對(duì)數(shù)面積比參數(shù)值每幀插值兩次；對(duì)數(shù)面積比參數(shù)值每幀插值兩次；RMS參數(shù)值在對(duì)數(shù)域進(jìn)行基音同步插值；基參數(shù)值在對(duì)數(shù)域進(jìn)行基音同步插值；基音參數(shù)值用基音同步的線性插值；在濁音向清音參數(shù)值用基音同步的線性插值；在濁音向清音過渡

60、時(shí)對(duì)數(shù)面積比不插值。每個(gè)基音周期更音過渡時(shí)對(duì)數(shù)面積比不插值。每個(gè)基音周期更新一次預(yù)測(cè)系數(shù)、增益、基音周期、清新一次預(yù)測(cè)系數(shù)、增益、基音周期、清/濁音濁音等參數(shù)，這個(gè)過程在幀塊到基音塊的轉(zhuǎn)換和插等參數(shù)，這個(gè)過程在幀塊到基音塊的轉(zhuǎn)換和插值中完成。值中完成。 112n (2) 激勵(lì)源激勵(lì)源 n 清音幀用隨機(jī)數(shù)作為激勵(lì)源；濁音幀用周期性沖激序清音幀用隨機(jī)數(shù)作為激勵(lì)源；濁音幀用周期性沖激序列通過一個(gè)全通濾波器來生成激勵(lì)源，改善了合成語(yǔ)音的尖列通過一個(gè)全通濾波器來生成激勵(lì)源，改善了合成語(yǔ)音的尖峰性質(zhì)。語(yǔ)音合成濾波器輸入激勵(lì)的幅度保持恒定不變，輸峰性質(zhì)。語(yǔ)音合成濾波器輸入激勵(lì)的幅度保持恒定不變，輸出幅度受出

人人文庫(kù)> 全部分類> 教育資料 > 備課教案

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

語(yǔ)音信號(hào)處理第五章課件

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

語(yǔ)音信號(hào)處理第五章課件

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔