




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、7.17.1概述概述7.27.2語音信號(hào)壓語音信號(hào)壓縮編碼原理縮編碼原理& &系統(tǒng)壓縮評(píng)價(jià)系統(tǒng)壓縮評(píng)價(jià)7.37.3語音信號(hào)的語音信號(hào)的波形編碼波形編碼7.47.4語音信號(hào)的語音信號(hào)的參數(shù)編碼參數(shù)編碼7.57.5語音信號(hào)的混合編碼語音信號(hào)的混合編碼7.67.6現(xiàn)代通信中的語音信號(hào)編碼現(xiàn)代通信中的語音信號(hào)編碼7.1 7.1 概述概述v語音編碼(語音編碼(Speech CodingSpeech Coding) 從信息論角度看,信源編碼從信息論角度看,信源編碼是要以最少的數(shù)碼表示信源所發(fā)的信號(hào),語音編碼屬于信源是要以最少的數(shù)碼表示信源所發(fā)的信號(hào),語音編碼屬于信源編碼的范疇。語音編碼通過減少傳輸碼率(或
2、存儲(chǔ)量),來編碼的范疇。語音編碼通過減少傳輸碼率(或存儲(chǔ)量),來達(dá)到提高傳輸(或存儲(chǔ))效率的目的。作為傳輸語音的壓縮達(dá)到提高傳輸(或存儲(chǔ))效率的目的。作為傳輸語音的壓縮技術(shù),語音編碼在通信史上一直都扮演著極為重要的角色。技術(shù),語音編碼在通信史上一直都扮演著極為重要的角色。v語音編碼分為三類:語音編碼分為三類: * * 波形編碼:重建后的語音時(shí)域信號(hào)的波形與原語音信號(hào)保波形編碼:重建后的語音時(shí)域信號(hào)的波形與原語音信號(hào)保持一致。持一致。 * * 參數(shù)編碼:通過建立語音信號(hào)的產(chǎn)生模型,提取其特征參參數(shù)編碼:通過建立語音信號(hào)的產(chǎn)生模型,提取其特征參數(shù)來編碼,波形上不要求與原信號(hào)匹配,又稱聲碼器技術(shù)。數(shù)
3、來編碼,波形上不要求與原信號(hào)匹配,又稱聲碼器技術(shù)。 * * 混合編碼混合編碼:有機(jī)結(jié)合以上兩種編碼方式,基于語音產(chǎn)生模:有機(jī)結(jié)合以上兩種編碼方式,基于語音產(chǎn)生模型的假定并采用分析合并技術(shù)。型的假定并采用分析合并技術(shù)。三種編碼方式的比較三種編碼方式的比較波形編碼參數(shù)編碼混合編碼編碼信息波形模型參數(shù)綜合比特率9.664Kbps2.49.6Kbps1624Kbps優(yōu)點(diǎn)適應(yīng)能力強(qiáng),語音質(zhì)量好有效降低了編碼比特率語音質(zhì)量明顯提高缺點(diǎn)隨著量化粗糙語音質(zhì)量下降合成語音質(zhì)量低,處理復(fù)雜度高編碼速率明顯上升典型代表自適應(yīng)差分編碼調(diào)制(ADPCM)LPC- 10、LPC- 10E 多脈沖激勵(lì)線性預(yù)測編碼(MPLP
4、C)規(guī)則脈沖激勵(lì)線性預(yù)測編碼(RPE-LPC)不同編碼方式的位速率及其質(zhì)量不同編碼方式的位速率及其質(zhì)量語音編碼發(fā)展史語音編碼發(fā)展史v自從自從2020世紀(jì)世紀(jì)3030年代年代脈沖編碼調(diào)制脈沖編碼調(diào)制(PCMPCM)被提)被提出起,語音編碼在出起,語音編碼在6060多年的時(shí)間里得到了迅多年的時(shí)間里得到了迅速的發(fā)展。速的發(fā)展。v早期的聲碼器基于對(duì)語音信號(hào)基音周期與頻早期的聲碼器基于對(duì)語音信號(hào)基音周期與頻譜的分析,主要包括通道聲碼器,共振峰聲譜的分析,主要包括通道聲碼器,共振峰聲碼器與模式匹配聲碼器。碼器與模式匹配聲碼器。2020世紀(jì)世紀(jì)5050年代后期,年代后期,著重于線性語音源系統(tǒng)生成模型,包括線
5、性著重于線性語音源系統(tǒng)生成模型,包括線性慢時(shí)變系統(tǒng),周期脈沖激勵(lì)序列與隨機(jī)激勵(lì)。慢時(shí)變系統(tǒng),周期脈沖激勵(lì)序列與隨機(jī)激勵(lì)。v2020世紀(jì)六七十年代,世紀(jì)六七十年代,VLSIVLSI技術(shù)與數(shù)字信號(hào)處理理論技術(shù)與數(shù)字信號(hào)處理理論的發(fā)展為語音編碼技術(shù)開辟了新的道路,語音分析的發(fā)展為語音編碼技術(shù)開辟了新的道路,語音分析合成采用了短時(shí)傅立葉變換,變換編碼與子帶編碼,合成采用了短時(shí)傅立葉變換,變換編碼與子帶編碼,基于線性預(yù)測的編碼技術(shù)進(jìn)一步得到發(fā)展。新的編基于線性預(yù)測的編碼技術(shù)進(jìn)一步得到發(fā)展。新的編碼技術(shù)紛紛產(chǎn)生,如余弦分析合成技術(shù),多帶激勵(lì)碼技術(shù)紛紛產(chǎn)生,如余弦分析合成技術(shù),多帶激勵(lì)聲碼器,聲碼器,LPC
6、LPC中的多脈沖與矢量激勵(lì),中的多脈沖與矢量激勵(lì),矢量量化矢量量化。到到2020世紀(jì)世紀(jì)9090年代中期,速率為年代中期,速率為4 48Kbps8Kbps的波形與混的波形與混合編碼器,在語音質(zhì)量上,與早期速率為合編碼器,在語音質(zhì)量上,與早期速率為64Kbps64Kbps的的PCMPCM波形編碼器已十分接近。波形編碼器已十分接近。7.2 7.2 語音信號(hào)壓縮編碼原理語音信號(hào)壓縮編碼原理& &系統(tǒng)系統(tǒng)壓縮評(píng)價(jià)壓縮評(píng)價(jià) 語音信號(hào)中存在著語音信號(hào)中存在著冗余度冗余度(包括(包括時(shí)域與頻域),人的聽覺感知機(jī)理時(shí)域與頻域),人的聽覺感知機(jī)理也有很多可以利用的特點(diǎn)。語音信也有很多可以利用的特點(diǎn)。語音信號(hào)壓縮
7、編碼之所以可行,正是因?yàn)樘?hào)壓縮編碼之所以可行,正是因?yàn)檫@兩種情況的存在。這兩種情況的存在。 語音編碼依據(jù)之一:語音信號(hào)冗余度語音編碼依據(jù)之一:語音信號(hào)冗余度 基本基本時(shí)域時(shí)域冗余:冗余:u語音信號(hào)幅度非均勻分布性語音信號(hào)幅度非均勻分布性u(píng)語音信號(hào)樣本間的強(qiáng)相關(guān)性語音信號(hào)樣本間的強(qiáng)相關(guān)性u(píng)濁音語音段具有的準(zhǔn)周期性濁音語音段具有的準(zhǔn)周期性u(píng)聲道形狀及其變化的緩慢性聲道形狀及其變化的緩慢性u(píng)靜止系數(shù)靜止系數(shù) (即語音間隙性)(即語音間隙性) 基本基本頻域頻域冗余:冗余:u從長時(shí)間的功率譜密度來看,語音信號(hào)具有從長時(shí)間的功率譜密度來看,語音信號(hào)具有強(qiáng)烈的非平坦型,存在著固定的冗余度。而強(qiáng)烈的非平坦型,
8、存在著固定的冗余度。而且高頻能量通常較低,恰好對(duì)應(yīng)于時(shí)域上的且高頻能量通常較低,恰好對(duì)應(yīng)于時(shí)域上的相鄰樣本相關(guān)性。相鄰樣本相關(guān)性。u從短時(shí)功率譜密度來看,語音信號(hào)在不同頻從短時(shí)功率譜密度來看,語音信號(hào)在不同頻率交替出現(xiàn)峰值(共振峰)與谷值。整個(gè)功率交替出現(xiàn)峰值(共振峰)與谷值。整個(gè)功率譜的細(xì)節(jié)基于基音頻率形成高次諧波結(jié)構(gòu)。率譜的細(xì)節(jié)基于基音頻率形成高次諧波結(jié)構(gòu)。連續(xù)語音信號(hào)的功率譜連續(xù)語音信號(hào)的功率譜 語音編碼依據(jù)之二:人的聽覺特點(diǎn)語音編碼依據(jù)之二:人的聽覺特點(diǎn)n人類聽覺系統(tǒng)存在著掩蔽系統(tǒng),即高聲級(jí)單人類聽覺系統(tǒng)存在著掩蔽系統(tǒng),即高聲級(jí)單音會(huì)明顯掩蔽臨近頻率聲音。音會(huì)明顯掩蔽臨近頻率聲音。n對(duì)
9、于不同頻段的聲音,人耳的敏感程度不盡對(duì)于不同頻段的聲音,人耳的敏感程度不盡相同。相同。n人類對(duì)于語音信號(hào)的周期性(即音調(diào))極為人類對(duì)于語音信號(hào)的周期性(即音調(diào))極為敏感,但對(duì)信號(hào)的相位卻充耳不聞,這與理敏感,但對(duì)信號(hào)的相位卻充耳不聞,這與理論分類存在差異。論分類存在差異。語音編碼中的幾項(xiàng)關(guān)鍵技術(shù)語音編碼中的幾項(xiàng)關(guān)鍵技術(shù)線性預(yù)測線性預(yù)測 線性預(yù)測傳送整個(gè)反應(yīng)過程變化的參數(shù),其出發(fā)點(diǎn)線性預(yù)測傳送整個(gè)反應(yīng)過程變化的參數(shù),其出發(fā)點(diǎn)在于跟蹤波形的產(chǎn)生過程而非波形本身。基于全極在于跟蹤波形的產(chǎn)生過程而非波形本身?;谌珮O點(diǎn)模型假設(shè),使得語音信號(hào)編碼的比特率得到有效點(diǎn)模型假設(shè),使得語音信號(hào)編碼的比特率得到有
10、效的降低。的降低。語音信號(hào)中存在的兩點(diǎn)相關(guān)性語音信號(hào)中存在的兩點(diǎn)相關(guān)性l樣點(diǎn)間的短時(shí)相關(guān)性樣點(diǎn)間的短時(shí)相關(guān)性l相鄰基音周期之間的長時(shí)相關(guān)性相鄰基音周期之間的長時(shí)相關(guān)性 激勵(lì)發(fā)生器 1 P(z) 1 A(z)合成語音合成語音 語音信號(hào)合成模型圖示語音信號(hào)合成模型圖示其中信號(hào)源為預(yù)測余量信號(hào),其中信號(hào)源為預(yù)測余量信號(hào),1/P(z)為長時(shí)預(yù)測濾波器,為長時(shí)預(yù)測濾波器, 1/A(z)為短時(shí)預(yù)測濾波器。為短時(shí)預(yù)測濾波器。 語音信號(hào)的短時(shí)相關(guān)性可用一個(gè)全極語音信號(hào)的短時(shí)相關(guān)性可用一個(gè)全極點(diǎn)模型來描述,其傳輸函數(shù)點(diǎn)模型來描述,其傳輸函數(shù)H H(z z)為:)為:PiiiZazAzH111)(1)(短時(shí)預(yù)測系
11、數(shù)短時(shí)預(yù)測系數(shù) 濾波器階數(shù)濾波器階數(shù)而濾波器而濾波器)(/1zP是語音信號(hào)長時(shí)相關(guān)性的模型,是語音信號(hào)長時(shí)相關(guān)性的模型,其一般形式為:其一般形式為:rqiiDiZbzP)(11)(1延時(shí)參數(shù)(基音周期)延時(shí)參數(shù)(基音周期)長時(shí)預(yù)測系數(shù)長時(shí)預(yù)測系數(shù)合成分析合成分析合成分析原理合成分析原理 合成分析在編碼器中加入綜合器,并將其與分析合成分析在編碼器中加入綜合器,并將其與分析器結(jié)合從而產(chǎn)生與譯碼器端相同的語音,而后根據(jù)器結(jié)合從而產(chǎn)生與譯碼器端相同的語音,而后根據(jù)誤差原理調(diào)整使得誤差最小化。誤差原理調(diào)整使得誤差最小化。合成分析背景合成分析背景 16Kbps16Kbps以下的高質(zhì)量語音編碼在當(dāng)今得到的極
12、大以下的高質(zhì)量語音編碼在當(dāng)今得到的極大關(guān)注,使得傳統(tǒng)的量化方法對(duì)誤差最小化已無能為關(guān)注,使得傳統(tǒng)的量化方法對(duì)誤差最小化已無能為力。因此,合成分析的方法被引入。力。因此,合成分析的方法被引入。感覺加權(quán)濾波器感覺加權(quán)濾波器產(chǎn)生背景:理論與現(xiàn)實(shí)的出入產(chǎn)生背景:理論與現(xiàn)實(shí)的出入 對(duì)于低碼率(對(duì)于低碼率(4 416Kbps)的語音編碼,理論上的的語音編碼,理論上的最小均方誤差(最小均方誤差(MMSEMMSE)在實(shí)際應(yīng)用時(shí)卻因?yàn)槿说穆牐┰趯?shí)際應(yīng)用時(shí)卻因?yàn)槿说穆犛X特點(diǎn)而障礙重重。在這種背景下,根據(jù)人耳上網(wǎng)覺特點(diǎn)而障礙重重。在這種背景下,根據(jù)人耳上網(wǎng)掩蔽效應(yīng)設(shè)計(jì)的感覺加權(quán)濾波器得到了廣泛的應(yīng)用。掩蔽效應(yīng)設(shè)計(jì)的
13、感覺加權(quán)濾波器得到了廣泛的應(yīng)用。 在實(shí)際應(yīng)用中,共振峰處的噪聲相對(duì)于能量較低在實(shí)際應(yīng)用中,共振峰處的噪聲相對(duì)于能量較低處的頻段更加不易被察覺,故高能量段處的誤差要處的頻段更加不易被察覺,故高能量段處的誤差要求不高。因此,感覺加權(quán)濾波器求不高。因此,感覺加權(quán)濾波器 被提出,用被提出,用以衡量語音間的誤差。以衡量語音間的誤差。 )(zW 此時(shí),只需此時(shí),只需 在高頻段處較小,低頻段處較大,在高頻段處較小,低頻段處較大,就可以升高不敏感的高頻段處誤差同時(shí)降低較敏感就可以升高不敏感的高頻段處誤差同時(shí)降低較敏感的低頻段處誤差,從而達(dá)到目的。的低頻段處誤差,從而達(dá)到目的。sfdffWfSfSe02)(|
14、)()(|抽樣頻率抽樣頻率重建語音傅立葉變換重建語音傅立葉變換原始語音傅立葉變換原始語音傅立葉變換誤差表示誤差表示 )( fW其傳遞函數(shù)為:其傳遞函數(shù)為: 的作用就是使實(shí)際信號(hào)誤差的譜呈現(xiàn)與語音信的作用就是使實(shí)際信號(hào)誤差的譜呈現(xiàn)與語音信號(hào)類似的包絡(luò)形狀,從而在掩蔽效應(yīng)的作用下在主號(hào)類似的包絡(luò)形狀,從而在掩蔽效應(yīng)的作用下在主觀聽覺上產(chǎn)生較好的效果。觀聽覺上產(chǎn)生較好的效果。piiiipiiizazazAzAzW1111)/()()(加權(quán)因子加權(quán)因子 預(yù)測系數(shù)預(yù)測系數(shù) )(zW語音壓縮系統(tǒng)的性能評(píng)判指標(biāo)語音壓縮系統(tǒng)的性能評(píng)判指標(biāo)較為重要的性能評(píng)價(jià)準(zhǔn)則較為重要的性能評(píng)價(jià)準(zhǔn)則l編碼速率(比特率),決定了
15、編碼器工作時(shí)占用的信道編碼速率(比特率),決定了編碼器工作時(shí)占用的信道帶寬,要求盡可能降低。帶寬,要求盡可能降低。l編碼器的穩(wěn)健性,要求良好。編碼器的穩(wěn)健性,要求良好。l編碼器的時(shí)延,要求最小化。編碼器的時(shí)延,要求最小化。l誤碼容限,要求保持較高值。誤碼容限,要求保持較高值。l算法復(fù)雜度(包括運(yùn)算復(fù)雜度與內(nèi)存要求),影響硬件算法復(fù)雜度(包括運(yùn)算復(fù)雜度與內(nèi)存要求),影響硬件成本,盡可能降低。成本,盡可能降低。l算法可擴(kuò)展性,越高越好。算法可擴(kuò)展性,越高越好。評(píng)測方法評(píng)測方法主觀評(píng)價(jià)主觀評(píng)價(jià) 可懂度評(píng)價(jià)可懂度評(píng)價(jià)(DRT得分)得分)音質(zhì)評(píng)價(jià)音質(zhì)評(píng)價(jià)平均意見得分平均意見得分(MOS)判斷滿意度測量判
16、斷滿意度測量(DAM)客觀評(píng)價(jià)客觀評(píng)價(jià)適用于低適用于低比特率語比特率語音編碼質(zhì)音編碼質(zhì)量的評(píng)價(jià)量的評(píng)價(jià) 計(jì)算較簡單,但沒有計(jì)算較簡單,但沒有 考慮實(shí)際情況,故考慮實(shí)際情況,故 適用于高比特率適用于高比特率語音編碼質(zhì)量的語音編碼質(zhì)量的評(píng)價(jià)評(píng)價(jià) 7.3 7.3 語音信號(hào)的波形編碼語音信號(hào)的波形編碼v波形編碼波形編碼 波形編碼是語音編碼系統(tǒng)在早期所廣泛采用的方波形編碼是語音編碼系統(tǒng)在早期所廣泛采用的方法,它把語音信號(hào)當(dāng)成普通的波形信號(hào)來處理從而保持原波法,它把語音信號(hào)當(dāng)成普通的波形信號(hào)來處理從而保持原波形形狀。形形狀。 波形編碼適應(yīng)能力強(qiáng),合成語音質(zhì)量好,但比特率過高,波形編碼適應(yīng)能力強(qiáng),合成語音質(zhì)
17、量好,但比特率過高,編碼的效率也不盡如人意。編碼的效率也不盡如人意。v幾種典型的波形編碼:幾種典型的波形編碼:l脈沖編碼調(diào)制(脈沖編碼調(diào)制(PCMPCM)l自適應(yīng)預(yù)測編碼自適應(yīng)預(yù)測編碼l自適應(yīng)增量調(diào)制(自適應(yīng)增量調(diào)制(ADMADM)l自適應(yīng)差分脈沖編碼調(diào)制(自適應(yīng)差分脈沖編碼調(diào)制(ADPCMADPCM)l子帶編碼(子帶編碼(SBCSBC)脈沖編碼調(diào)制脈沖編碼調(diào)制有有2 2種形式:種形式:均勻均勻PCMPCM 、非均勻非均勻PCMPCM形式一:均勻形式一:均勻PCMPCM 最簡單最原始的波形編碼方式,沒有運(yùn)用壓縮技術(shù),產(chǎn)生最簡單最原始的波形編碼方式,沒有運(yùn)用壓縮技術(shù),產(chǎn)生的比特率也極高,故在當(dāng)今
18、運(yùn)用極少。的比特率也極高,故在當(dāng)今運(yùn)用極少。形式二:非均勻形式二:非均勻PCMPCM 將信號(hào)進(jìn)行非線性變換后再均勻量化,變將信號(hào)進(jìn)行非線性變換后再均勻量化,變換后信號(hào)換后信號(hào)幅度具有均勻概率密度分布幅度具有均勻概率密度分布。編碼。編碼時(shí)常采用對(duì)數(shù)變換壓縮(譯碼時(shí)指數(shù)擴(kuò)展)。時(shí)常采用對(duì)數(shù)變換壓縮(譯碼時(shí)指數(shù)擴(kuò)展)。xzbyy非線性非線性壓縮壓縮均勻量化均勻量化編碼編碼解碼解碼 非線性非線性擴(kuò)張擴(kuò)張qx非線性壓縮擴(kuò)張的非均勻量化器非線性壓縮擴(kuò)張的非均勻量化器)(xC)(1xCvA A律壓縮擴(kuò)張技術(shù)(中國標(biāo)準(zhǔn))律壓縮擴(kuò)張技術(shù)(中國標(biāo)準(zhǔn)) v 律壓縮擴(kuò)張技術(shù)(北美及日本標(biāo)準(zhǔn))律壓縮擴(kuò)張技術(shù)(北美及日本
19、標(biāo)準(zhǔn)) )(sgnln1/ | )(|)(sgnln1/ | )(|ln1maxmaxmax)(nxAXnxAnxAXnxAXnxF)1)|(|1(maxXnxA)1)|(|0(maxAXnx)(sgn)1ln(| )(|1ln)(maxmaxnxXnxXnxF形式三:自適應(yīng)形式三:自適應(yīng)PCM 無論是均勻或是非均勻無論是均勻或是非均勻PCMPCM,量化間隔總是隨著量化器的確,量化間隔總是隨著量化器的確定而固定。而自適應(yīng)定而固定。而自適應(yīng)PCMPCM引入的自適應(yīng)幅值變化概念使得量化誤引入的自適應(yīng)幅值變化概念使得量化誤差可以匹配于輸入信號(hào)方差,或是量化器增益差可以匹配于輸入信號(hào)方差,或是量化器增
20、益G G可以隨著幅值而可以隨著幅值而變化,從而使信號(hào)能量在量化前恒定。變化,從而使信號(hào)能量在量化前恒定。Q【】編碼器)(nx)(nx)(nc)(n解碼器)(nc)(nx)(n匹配自適應(yīng)匹配自適應(yīng)編碼器Q【】X)(nx)(ny)( ny)(nc)(nG解碼器)(nc)( ny+)( nx)(nG匹配自適應(yīng)匹配自適應(yīng)G兩種自適應(yīng)方法的原理兩種自適應(yīng)方法的原理 按照自適應(yīng)參數(shù)劃分按照自適應(yīng)參數(shù)劃分Q【】編碼器)(nx)(nx)(nc解碼器)(nc)(nx)(n自適應(yīng)系統(tǒng)Q【】編碼器)(nx)(nx)(nc自適應(yīng)系統(tǒng))(n解碼器)(nc)(nx自適應(yīng)系統(tǒng))(n后饋?zhàn)赃m應(yīng)后饋?zhàn)赃m應(yīng) 前饋?zhàn)赃m應(yīng)前饋?zhàn)赃m應(yīng)
21、 其中,其中,)(*)()(*)(00nGnGnn或或mmnhmxn)()()(22mmnhmcn)()()(22自適應(yīng)預(yù)測編碼自適應(yīng)預(yù)測編碼LPC計(jì)算)(zX)(zC)(zP)(zE-預(yù)測器系數(shù)預(yù)測器系數(shù)發(fā)端發(fā)端)(zE)(zP收端收端 自適應(yīng)預(yù)測編碼器(自適應(yīng)預(yù)測編碼器(APCAPC)利用線性預(yù)測)利用線性預(yù)測來改進(jìn)編碼中的量化器性能,根據(jù)信號(hào)量來改進(jìn)編碼中的量化器性能,根據(jù)信號(hào)量化噪聲比的定義:化噪聲比的定義:(n)Eq(n)Ee*(n)Ee(n)Es(n)Eq(n)EsSNR222222信號(hào)平均能量信號(hào)平均能量預(yù)測誤差平均能量預(yù)測誤差平均能量 量化噪聲平均能量量化噪聲平均能量 由此可知
22、引用線性預(yù)測后,由此可知引用線性預(yù)測后,SNR可得到成功的改善??傻玫匠晒Φ母纳?。自適應(yīng)增量調(diào)制(自適應(yīng)增量調(diào)制(ADMADM) 增量調(diào)制的基本方案:增量調(diào)制的基本方案: 增量調(diào)制方式將下一個(gè)語音信號(hào)與當(dāng)前語音信號(hào)增量調(diào)制方式將下一個(gè)語音信號(hào)與當(dāng)前語音信號(hào)比較,如果高于當(dāng)前值則系統(tǒng)則編碼比較,如果高于當(dāng)前值則系統(tǒng)則編碼1 1,否則系統(tǒng)編,否則系統(tǒng)編碼碼0.0. 自適應(yīng)增量調(diào)制的工作方式:自適應(yīng)增量調(diào)制的工作方式: 自適應(yīng)增量調(diào)制隨輸入波形自適應(yīng)的改變量化自適應(yīng)增量調(diào)制隨輸入波形自適應(yīng)的改變量化階梯的大小,在信號(hào)平均斜率大時(shí)自動(dòng)增大量化階梯,階梯的大小,在信號(hào)平均斜率大時(shí)自動(dòng)增大量化階梯,反之減
23、小。反之減小。 自適應(yīng)差分脈沖編碼調(diào)制(自適應(yīng)差分脈沖編碼調(diào)制(ADPCMADPCM) 差分脈沖編碼調(diào)制(差分脈沖編碼調(diào)制(DPCMDPCM):): 不同于不同于DMDM的一位編碼,的一位編碼,DPCMDPCM多位量化對(duì)兩個(gè)采樣多位量化對(duì)兩個(gè)采樣之間的差分信號(hào)利用多位量化進(jìn)行編碼,使信息量得之間的差分信號(hào)利用多位量化進(jìn)行編碼,使信息量得到壓縮的同時(shí)降低了信道負(fù)載。到壓縮的同時(shí)降低了信道負(fù)載。 +量量 化化+預(yù)測預(yù)測 發(fā)送端發(fā)送端)(nx)(ndq)(ndq)(nxp)(nxr+預(yù)預(yù) 測測)(nxp)(nxr接收端接收端+ 但采用固定的高階預(yù)測,改善效果并不明顯,于是,高階自但采用固定的高階預(yù)測
24、,改善效果并不明顯,于是,高階自適應(yīng)預(yù)測作為相應(yīng)的解決方式被提出,自適應(yīng)預(yù)測器隨著語音適應(yīng)預(yù)測作為相應(yīng)的解決方式被提出,自適應(yīng)預(yù)測器隨著語音特征變化不斷更新預(yù)測系數(shù),從而獲得更高的預(yù)測增益。特征變化不斷更新預(yù)測系數(shù),從而獲得更高的預(yù)測增益。)(nx-量化量化預(yù)測系數(shù)預(yù)測系數(shù)自適應(yīng)自適應(yīng)+預(yù)測預(yù)測 )(nxr)(nxq)(ne)(neq后向自適應(yīng)預(yù)測編碼結(jié)構(gòu)框圖:后向自適應(yīng)預(yù)測編碼結(jié)構(gòu)框圖: 后向自適應(yīng)預(yù)測作為后向自適應(yīng)預(yù)測作為ADPCM的常用編碼方的常用編碼方式,所采用的是序貫隨機(jī)梯度算法,其預(yù)測系式,所采用的是序貫隨機(jī)梯度算法,其預(yù)測系數(shù)滿足:數(shù)滿足:Niinxnennanarqiii.,2
25、 , 1),()()()() 1(其中其中N為預(yù)測器階數(shù)。為預(yù)測器階數(shù)。 為較少傳輸誤碼的影響,可加入衰減因子,并為較少傳輸誤碼的影響,可加入衰減因子,并采用符號(hào)梯度法簡化硬件,于是又有:采用符號(hào)梯度法簡化硬件,于是又有:Niinxnenanarqiiii.,2 , 1),(sgn)(sgn)() 1(子帶編碼(子帶編碼(SBCSBC)子帶編碼原理:子帶編碼原理: 子帶編碼屬于頻域編碼,它首先將語音信號(hào)通過帶通子帶編碼屬于頻域編碼,它首先將語音信號(hào)通過帶通濾波器分割為若干頻帶(子帶),而后對(duì)子帶信號(hào)進(jìn)行濾波器分割為若干頻帶(子帶),而后對(duì)子帶信號(hào)進(jìn)行頻譜平移變?yōu)榛鶐盘?hào),再利用奈奎斯特速率抽樣
26、,最頻譜平移變?yōu)榛鶐盘?hào),再利用奈奎斯特速率抽樣,最后進(jìn)行編碼處理后進(jìn)行編碼處理。 子帶編碼優(yōu)點(diǎn):子帶編碼優(yōu)點(diǎn):l分帶后可去除信號(hào)相關(guān)性,獲得與時(shí)域一樣的效果。分帶后可去除信號(hào)相關(guān)性,獲得與時(shí)域一樣的效果。l不同子帶擁有不同比特?cái)?shù),可獲得更佳主觀聽音質(zhì)量。不同子帶擁有不同比特?cái)?shù),可獲得更佳主觀聽音質(zhì)量。l各子帶間量化噪音相互獨(dú)立互不干擾。各子帶間量化噪音相互獨(dú)立互不干擾。 而而SBCSBC在應(yīng)用中一般采用整數(shù)帶方法,即:在應(yīng)用中一般采用整數(shù)帶方法,即: MknWnfklk,.2 , 1,.,2 , 1,由帶通信號(hào)采樣定理可知,在由帶通信號(hào)采樣定理可知,在 時(shí),子時(shí),子帶信號(hào)不會(huì)發(fā)生混疊,可以直
27、接進(jìn)行對(duì)其采樣帶信號(hào)不會(huì)發(fā)生混疊,可以直接進(jìn)行對(duì)其采樣。kskWf 2 子帶分帶數(shù)目越大,編碼增益也會(huì)越大,實(shí)際子帶分帶數(shù)目越大,編碼增益也會(huì)越大,實(shí)際 應(yīng)用中應(yīng)用中SBC一般采用一般采用48個(gè)子帶。個(gè)子帶。 對(duì)已經(jīng)采樣的輸入信號(hào),抽取可實(shí)現(xiàn)頻譜搬移,對(duì)已經(jīng)采樣的輸入信號(hào),抽取可實(shí)現(xiàn)頻譜搬移, 合成時(shí)通過插值恢復(fù)。合成時(shí)通過插值恢復(fù)。帶通帶通抽取抽取編譯碼編譯碼插值插值帶通帶通)(nx)(nxk)( nlxkk)( nlykk)(nyck )(nyk第第k個(gè)通道工作原理個(gè)通道工作原理 為減少混疊造成的失真,需要極高階的濾波器,而此為減少混疊造成的失真,需要極高階的濾波器,而此時(shí)采用正交鏡像濾波
28、器組時(shí)采用正交鏡像濾波器組(QMFB)既可解決失真問題,既可解決失真問題,階數(shù)要求也可得到降低。階數(shù)要求也可得到降低。 )(nx)(0nh)(1nh22)(0mx)(1mx+)(1mx)(0mx)(0ng)(1ng22其輸入輸出關(guān)系為:其輸入輸出關(guān)系為:其中,其中, 理論上需滿足:理論上需滿足:我們一般希望其滿足理想條件:我們一般希望其滿足理想條件:)()()()()(22jwwjjwjweXeHeHeX)(jweH1| )()(|)(22wjjweHeH20, 12, 0)(wwjweH自適應(yīng)變換編碼(自適應(yīng)變換編碼(ATCATC) 編碼原理:編碼原理: 自適應(yīng)變換編碼利用正交變換將信號(hào)由時(shí)
29、域變換到另外一個(gè)自適應(yīng)變換編碼利用正交變換將信號(hào)由時(shí)域變換到另外一個(gè)域,使變換域系數(shù)密集化,從而使信號(hào)相鄰樣本間冗余度得域,使變換域系數(shù)密集化,從而使信號(hào)相鄰樣本間冗余度得到降低。到降低。 正交變換正交變換DCTDCT的優(yōu)點(diǎn):的優(yōu)點(diǎn):l頻域變換明顯,較易控制量化噪聲頻率范圍。頻域變換明顯,較易控制量化噪聲頻率范圍。l兼顧性能與計(jì)算量,不需要傳輸特征矢量。兼顧性能與計(jì)算量,不需要傳輸特征矢量。l變換效率高于變換效率高于DFTDFT,且在頻域區(qū)的畸變更小。,且在頻域區(qū)的畸變更小。 基于基于DCTDCT的種種優(yōu)勢,當(dāng)今自適應(yīng)變換編碼的正交變換普遍的種種優(yōu)勢,當(dāng)今自適應(yīng)變換編碼的正交變換普遍 采用采用
30、DCTDCT。 N N點(diǎn)點(diǎn)DCTDCT的正變換為:的正變換為:令令 為為X X的填充率,最終可得的填充率,最終可得X X的的DCTDCT為:為:其中,其中, 為為DFTDFT變換,變換, 滿足滿足: :) 10(2) 12(cos)()()(10NkNknkcnxkXNnc)(ny)(Re)()(2/kYWkckXkc)(ky)(kc)0(1)11(2)(kNkkc 7.4 7.4 語音信號(hào)的參數(shù)編碼語音信號(hào)的參數(shù)編碼v參數(shù)編碼針對(duì)語音信號(hào)的特征參數(shù)來編碼,只適用于語音信參數(shù)編碼針對(duì)語音信號(hào)的特征參數(shù)來編碼,只適用于語音信號(hào)。實(shí)際應(yīng)用中一般采用的實(shí)現(xiàn)設(shè)備是號(hào)。實(shí)際應(yīng)用中一般采用的實(shí)現(xiàn)設(shè)備是線性
31、預(yù)測聲碼器線性預(yù)測聲碼器。線性預(yù)測線性預(yù)測分析器分析器編碼器編碼器音調(diào)音調(diào)檢測器檢測器線性預(yù)測線性預(yù)測合成器合成器解碼器解碼器)(ns)(ns信道LPC聲碼器框圖LPCLPC參數(shù)的變換與量化參數(shù)的變換與量化 反射系數(shù)反射系數(shù) : 對(duì)反射系數(shù)的值在對(duì)反射系數(shù)的值在【-1-1,1 1】區(qū)間一般進(jìn)行非線性量化,另外比特?cái)?shù)區(qū)間一般進(jìn)行非線性量化,另外比特?cái)?shù)分配應(yīng)遞減。分配應(yīng)遞減。 對(duì)數(shù)面積比:對(duì)數(shù)面積比: 針對(duì)對(duì)數(shù)面積比的方式是最為有效的編碼方式,很適合數(shù)字編碼與針對(duì)對(duì)數(shù)面積比的方式是最為有效的編碼方式,很適合數(shù)字編碼與傳輸:傳輸: 其中其中Ai為面積函數(shù),通過上式可知為面積函數(shù),通過上式可知 幅度均
32、勻分布,可以采用均勻幅度均勻分布,可以采用均勻量化。量化。 ik)1 (ln11ln1piAAkkgiiiiiig當(dāng)代參數(shù)編碼技術(shù)簡介當(dāng)代參數(shù)編碼技術(shù)簡介變幀率變幀率LPCLPC聲碼器聲碼器 為降低為降低LPCLPC聲碼器的速率,應(yīng)用了變幀速率編碼聲碼器的速率,應(yīng)用了變幀速率編碼(VFRVFR)技術(shù)的變幀率)技術(shù)的變幀率LPCLPC聲碼器應(yīng)運(yùn)產(chǎn)生。通過付聲碼器應(yīng)運(yùn)產(chǎn)生。通過付出編碼解碼復(fù)雜化與時(shí)延出現(xiàn)的代價(jià),變幀率出編碼解碼復(fù)雜化與時(shí)延出現(xiàn)的代價(jià),變幀率LPCLPC聲碼器可明顯降低傳輸數(shù)碼率同時(shí)保持音質(zhì)。聲碼器可明顯降低傳輸數(shù)碼率同時(shí)保持音質(zhì)。LPCLPC-10-10編碼器編碼器 LPC-10
33、LPC-10利用簡單的二元激勵(lì)取代余量信號(hào),在利用簡單的二元激勵(lì)取代余量信號(hào),在2.4kbps2.4kbps的速率上得到了清晰的合成語音,在當(dāng)代的速率上得到了清晰的合成語音,在當(dāng)代長期被作為標(biāo)準(zhǔn)算法使用。但因?yàn)榧?lì)信號(hào)選取的長期被作為標(biāo)準(zhǔn)算法使用。但因?yàn)榧?lì)信號(hào)選取的影響,抗噪能力與自然度仍不盡如人意。影響,抗噪能力與自然度仍不盡如人意。 7.5 7.5 語音信號(hào)的混合編碼語音信號(hào)的混合編碼v 20 20世紀(jì)世紀(jì)8080年代后期,綜合了參數(shù)編碼低比特率與波形編碼高語音質(zhì)量年代后期,綜合了參數(shù)編碼低比特率與波形編碼高語音質(zhì)量優(yōu)點(diǎn)的混合編碼得到廣泛的使用。它在假定語音產(chǎn)生模型的同時(shí)將模型優(yōu)點(diǎn)的混合編碼得到廣泛的使用。它在假定語音產(chǎn)生模型的同時(shí)將模型參數(shù)編碼,吸收了兩者的優(yōu)點(diǎn)。參數(shù)編碼,吸收了兩者的優(yōu)點(diǎn)。 合成編碼方法(合成編碼方法(LPASLPAS)是目前得到最廣泛研究的語音編碼算法,它通)是目前得到最廣泛研究的語音編碼算法,它通過線性預(yù)測確定系統(tǒng)參數(shù),并通過閉環(huán)或分析過線性預(yù)測確定系統(tǒng)參數(shù),并通過閉環(huán)或分析- -合成方法確定激勵(lì)序列。合成方法確定激勵(lì)序列。激勵(lì)選擇g感知加權(quán)MSE)(zA)(zAL)(zw)(ns)(
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 賣場承包經(jīng)營合同
- 企業(yè)公司房屋租賃合同
- 公廁給排水施工方案
- bef增光膜施工方案
- 實(shí)驗(yàn)室咨詢服務(wù)合同
- TACCEM 135-2024 雙組份聚氨酯導(dǎo)熱結(jié)構(gòu)膠
- 與石油管道交叉施工方案
- 建筑工程機(jī)械租賃合同范文
- 昌河中學(xué)高一數(shù)學(xué)試卷
- 水泥樓梯改造施工方案
- 23J916-1:住宅排氣道(一)
- 制藥工程GMP(設(shè)備驗(yàn)證)
- 亞洲的人文環(huán)境
- 初中物理之魔術(shù)物理課件
- 投用前安全檢查表
- “三備兩研”集體備課實(shí)施方案
- 醫(yī)療質(zhì)量管理制度相關(guān)知識(shí)考試試題
- 醫(yī)院病歷體格檢查表范本
- 二次供水設(shè)備保養(yǎng)維修方案(完整)
- 【直播帶貨的模式研究國內(nèi)外文獻(xiàn)綜述4300字(論文)】
- 高中英語-40篇英語短文搞定高中英語3500個(gè)單詞
評(píng)論
0/150
提交評(píng)論