語(yǔ)音編碼基礎(chǔ)知識(shí)

上傳人：0*** IP屬地：湖北上傳時(shí)間：2023-02-02 格式：PPT 頁(yè)數(shù)：120 大?。?.35MB 積分：28 舉報(bào) 版權(quán)申訴

已閱讀5頁(yè)，還剩115頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

語(yǔ)音編碼（speechcoding）√概述√語(yǔ)音信號(hào)壓縮編碼的原理及其評(píng)價(jià)系統(tǒng)√語(yǔ)音信號(hào)的波形編碼√語(yǔ)音信號(hào)的參數(shù)編碼√語(yǔ)音信號(hào)的混合編碼√概述一、編碼（壓縮）的重要性二、編碼速率（信息容量）三、編碼的分類四、已經(jīng)標(biāo)準(zhǔn)化的語(yǔ)音編碼

編碼、傳輸、存儲(chǔ)和譯碼是語(yǔ)音數(shù)字傳輸和數(shù)字存儲(chǔ)的必要過(guò)程。隨著語(yǔ)音通信技術(shù)的發(fā)展，壓縮語(yǔ)音信號(hào)的傳輸帶寬，降低信道的傳輸速率，一直是人們追求的目標(biāo)。語(yǔ)音編碼在實(shí)現(xiàn)這一目標(biāo)的過(guò)程中擔(dān)當(dāng)重要的角色。語(yǔ)音編碼就是使表達(dá)語(yǔ)音信號(hào)的比特?cái)?shù)目最小。一、編碼（壓縮）的重要性數(shù)字傳輸系統(tǒng)模型信源信源編碼信道編碼調(diào)制傳輸通道用戶信源解碼信道解碼解調(diào)噪聲語(yǔ)音編碼應(yīng)用實(shí)例（IP電話）接收器模數(shù)轉(zhuǎn)換壓縮編碼IP封裝網(wǎng)絡(luò)IP解包解碼數(shù)模轉(zhuǎn)換播放器二、編碼速率（信息容量）

用比特/秒（b/s或bps）來(lái)度量，用I表示，有：I=R?fs,R代表每個(gè)語(yǔ)音采樣值編碼所需的比特?cái)?shù)；fs是采樣頻率。當(dāng)fs=8kHz，每個(gè)采樣值用8比特位來(lái)編碼，則編碼速率為64kb/s。三、編碼的分類1.波形編碼(waveformcoding)：基本原理是在時(shí)間軸上對(duì)模擬話音信號(hào)按照一定的速率來(lái)抽樣，然后將幅度樣本分層量化，并使用代碼來(lái)表示。在接收端將收到的數(shù)字序列經(jīng)過(guò)解碼恢復(fù)到原模擬信號(hào)，保持原始語(yǔ)音的波形形狀。話音質(zhì)量高，編碼速率高。如PCM編碼類（a率或u率PCM、ADPCM、ADM)，編碼速率為64－16kb/s，語(yǔ)音質(zhì)量好。2.參數(shù)編碼（聲源編碼parametriccoding）：

根據(jù)語(yǔ)音信號(hào)產(chǎn)生的數(shù)學(xué)模型，通過(guò)對(duì)語(yǔ)音信號(hào)特征參數(shù)的提取后進(jìn)行編碼（將特征參數(shù)變換成數(shù)字代碼進(jìn)行傳輸）。在接收端將特征參數(shù)，結(jié)合數(shù)學(xué)模型，恢復(fù)語(yǔ)音，力圖使重建語(yǔ)音保持盡可能高的可懂度，重建語(yǔ)音信號(hào)的波形同原始語(yǔ)音信號(hào)的波形可能會(huì)有相當(dāng)大的區(qū)別。如線性預(yù)測(cè)（LPC）編碼類。編碼速率低，2.4-1.2kb/s，自然度低，對(duì)環(huán)境噪聲敏感。3.混合編碼(Hybridcoding)：

將波形編碼與參數(shù)編碼相結(jié)合，在2.4-1.2kb/s速率上能夠得到高質(zhì)量的合成語(yǔ)音。規(guī)則碼激勵(lì)長(zhǎng)時(shí)預(yù)測(cè)編碼RPE—LPT即為混合編碼技術(shù)?；旌暇幋a包括若干語(yǔ)音特征參量又包括部分波形編碼信息，以達(dá)到波形編碼的高質(zhì)量和參量編碼的低速率的優(yōu)點(diǎn)。四、已經(jīng)標(biāo)準(zhǔn)化的語(yǔ)音編碼

指定組織：國(guó)際電信聯(lián)盟ITU-T，

標(biāo)準(zhǔn)編碼速率(kb/s)算法MOS得分應(yīng)用G.71164u律或a律PCM4.3公用網(wǎng)G.72132ADPCM4.1公用網(wǎng)G.723.15.3ACELP3.2無(wú)線網(wǎng)G.7298CS-ACELP3.8無(wú)線網(wǎng)GSM13RPE-LTP3.9無(wú)線網(wǎng)(5)RPE-LTP：長(zhǎng)時(shí)預(yù)測(cè)的規(guī)則脈沖激勵(lì)的線性預(yù)測(cè)Regular-PulseExcitedLPCwithaLong-TermPredictor(1)ADPCM：自適應(yīng)差分脈沖編碼adaptivedifferencepulsecodemodulation(2)CELP：碼本激勵(lì)線性預(yù)測(cè)（codeexcitedlinearprediction）(3)ACELP：代數(shù)碼本激勵(lì)線性預(yù)測(cè)Algebraic-Code-ExcitedLinear-Prediction(4)CS-ACELP：共軛結(jié)構(gòu)的代數(shù)碼本激勵(lì)線性預(yù)測(cè)ConjugateStructureAlgebraic-Code-ExcitedLinear-Prediction√語(yǔ)音信號(hào)壓縮編碼的原理及其評(píng)價(jià)系統(tǒng)一、語(yǔ)音壓縮的基本依據(jù)二、語(yǔ)音編碼的關(guān)鍵技術(shù)三、語(yǔ)音壓縮系統(tǒng)的性能指標(biāo)和評(píng)測(cè)方法一、語(yǔ)音壓縮的基本依據(jù)

是語(yǔ)音信號(hào)的冗余度和人的聽(tīng)覺(jué)感知機(jī)理。1.存在的時(shí)域冗余度：（1）幅度非均勻分布（2）語(yǔ)音信號(hào)樣本間的相關(guān)性很強(qiáng)（3）濁音具有準(zhǔn)周期（4）聲道的形狀及其變化緩慢（5）語(yǔ)音間隙（靜止系數(shù)）2.存在的頻域冗余度：（1）非均勻的長(zhǎng)時(shí)功率譜密度（2）短時(shí)功率譜密度女聲英文a的功率譜3.人的聽(tīng)覺(jué)感知機(jī)理（1）人類的聽(tīng)覺(jué)特性具有掩蔽效應(yīng)（2）人耳對(duì)不同頻段聲音的敏感程度不同（3）人耳對(duì)語(yǔ)音相位不敏感4.語(yǔ)音編碼的極限速率語(yǔ)音中最基本的元素是音素，大約有128～256個(gè)，如果按通常的說(shuō)話速度，每秒平均發(fā)出10個(gè)音素，則信息率為：I=[log2(256)10]bps=80bps把發(fā)音看成是以語(yǔ)音速率來(lái)傳送，則語(yǔ)音編碼的極限速率為80bps,從數(shù)字化標(biāo)準(zhǔn)的編碼速率64kbps，到極限速率80bps，之間的距離，對(duì)于理論研究和實(shí)踐有著極大的吸引力。二、語(yǔ)音編碼的關(guān)鍵技術(shù)語(yǔ)音信號(hào)中存在兩種類型的相關(guān)性：（1）樣點(diǎn)間的短時(shí)相關(guān)性（2）相鄰基音周期之間的長(zhǎng)時(shí)相關(guān)性e(n)x(n)短時(shí)預(yù)測(cè)濾波器語(yǔ)音信號(hào)的短時(shí)預(yù)測(cè)模型

D為基音周期，長(zhǎng)時(shí)預(yù)測(cè)系數(shù){bi}的個(gè)數(shù)取1（q=r=0）或3(q=r=1)。D、{bi}從語(yǔ)音信號(hào)中直接提取。語(yǔ)音信號(hào)通過(guò)長(zhǎng)時(shí)預(yù)測(cè)，得出基音周期、增益（振幅大小）。2.語(yǔ)音信號(hào)的長(zhǎng)時(shí)預(yù)測(cè)

長(zhǎng)時(shí)線性預(yù)測(cè)x(n-p),x(n-p+1),….x(n-1)x(n)長(zhǎng)時(shí)預(yù)測(cè)濾波器x(n)e(n)激勵(lì)發(fā)生器完整的語(yǔ)音信號(hào)的預(yù)測(cè)模型3.感覺(jué)加權(quán)濾波器

由于掩蔽效應(yīng)，在語(yǔ)音頻譜中，能量較高的頻段（共振峰處）的噪聲相對(duì)于能量較低的頻段的噪聲不易被感覺(jué)。在度量原始語(yǔ)音和合成語(yǔ)音之間的誤差時(shí)，在高能量段允許誤差大，因此引入一個(gè)頻域的感覺(jué)加權(quán)濾波器W(z)來(lái)衡量語(yǔ)音之間的誤差。加權(quán)因子在0～1之間,控制共振峰區(qū)域的誤差增加。輸入語(yǔ)音x(n)線性預(yù)測(cè)分析感覺(jué)加權(quán)濾波器后繼處理三、語(yǔ)音壓縮系統(tǒng)的性能指標(biāo)和評(píng)測(cè)方法1.語(yǔ)音壓縮系統(tǒng)的性能指標(biāo)（1）編碼速率（2）編碼器的頑健性（3）編碼器的時(shí)延（4）算法的復(fù)雜度和可擴(kuò)展性編碼延時(shí)

一般地，編解碼算法越復(fù)雜，延時(shí)越大，會(huì)明顯感覺(jué)到通話對(duì)方反映“遲鈍”，甚至造成正常通信困難。另外一方面，延時(shí)造成回聲，傳統(tǒng)的電話系統(tǒng)中，在2-4線的轉(zhuǎn)換處（混合線圈）因阻抗不匹配，導(dǎo)致接收者的收話音信號(hào)泄露到其發(fā)送路徑上，返回給發(fā)送者，形成了回聲。當(dāng)延時(shí)小時(shí)，回聲同房間交混，因此感覺(jué)不到；當(dāng)延遲超過(guò)了25ms，能明顯感覺(jué)到，從而嚴(yán)重影響通信。一般地，要求編解碼延時(shí)不超過(guò)5－10ms。A端的信號(hào)＋B端經(jīng)混合線圈的回傳信號(hào)B端的信號(hào)＋A端經(jīng)混合線圈的回傳信號(hào)A端B端2.語(yǔ)音壓縮系統(tǒng)的性能指標(biāo)和評(píng)測(cè)方法

語(yǔ)音質(zhì)量是衡量語(yǔ)音編碼算法優(yōu)劣的關(guān)鍵性能之一。語(yǔ)音質(zhì)量通常分為四類：（1）廣播級(jí)（2）網(wǎng)絡(luò)或電話級(jí)（3）通信級(jí)（4）合成級(jí)

語(yǔ)音質(zhì)量有主觀和客觀兩種評(píng)價(jià)方法。

評(píng)價(jià)指標(biāo)：清晰度或可懂度、音質(zhì)。前者是指語(yǔ)音是否容易聽(tīng)清楚；后者指語(yǔ)音聽(tīng)起來(lái)有多自然。（1）可懂度評(píng)價(jià)DRT：DiagnosticRhymerTest（2）音質(zhì)評(píng)價(jià)：MOS：MeanOpinionScore平均意見(jiàn)得分和DAM：DiagnosticAcceptabilityMeasure判斷滿意度得分。主觀評(píng)價(jià)方法

MOS得分為五級(jí):優(yōu)、良、可、差和壞。滿分為5分，相當(dāng)調(diào)頻廣播質(zhì)量；4分以上是長(zhǎng)途電話網(wǎng)標(biāo)準(zhǔn)；3.5分為通信標(biāo)準(zhǔn)；3.0分仍有較好的可懂度，保持自然度；2.5分只維持可懂度，是戰(zhàn)術(shù)通信標(biāo)準(zhǔn)。（1）波形失真度，用信噪比來(lái)度量（2）頻譜失真測(cè)量（3）譜包絡(luò)失真測(cè)量客觀評(píng)價(jià)方法語(yǔ)音信號(hào)的波形編碼一、非均勻量化的PCM編碼二、增量調(diào)制編碼三、自適應(yīng)增量調(diào)制編碼四、自適應(yīng)差分脈沖編碼ADPCM五、自適應(yīng)預(yù)測(cè)器六、自適應(yīng)量化器七、ADPCM的總結(jié)

均勻量化時(shí)，無(wú)論大的輸入信號(hào)還是小的輸入信號(hào)一律采用相同的量化間隔，為了適應(yīng)大的輸入信號(hào)，同時(shí)又要滿足精度要求，就需要增加樣本的位數(shù)。=2V/L=2V/2R，但是對(duì)話音信號(hào)來(lái)說(shuō)，大信號(hào)出現(xiàn)的機(jī)會(huì)并不多，增加的樣本數(shù)就沒(méi)有充分利用。因此采用非均勻量化。一、非均勻量化的PCM編碼其基本思想是：大的輸入信號(hào)采用大的量化間隔，小的輸入信號(hào)采用小的量化間隔。在滿足精度要求的情況下用較少的位數(shù)來(lái)表示。譯碼時(shí)，采用相同的規(guī)則。也可視為將信號(hào)進(jìn)行非線性變換后再作均勻量化，如對(duì)信號(hào)進(jìn)行對(duì)數(shù)壓縮，微弱的信號(hào)被放大，強(qiáng)的信號(hào)被壓縮。譯碼時(shí)，指數(shù)擴(kuò)張。非線性壓縮均勻量化編碼xa(nT)解碼非線性擴(kuò)張x'(nT)

現(xiàn)在的非均勻量化中，一般采用兩種壓縮擴(kuò)張非均勻量化方法。采樣后信號(hào)幅度和量化數(shù)據(jù)之間有兩種對(duì)應(yīng)關(guān)系，一種稱為u律壓擴(kuò)（companding）算法，另一種稱為A律壓擴(kuò)算法。u律壓擴(kuò)主要用于北美和日本等地區(qū)的電話通信中。A律壓擴(kuò)主要用在歐洲和中國(guó)的地區(qū)的電話通信中。u律壓擴(kuò)（1）輸入xa(nT)的范圍歸一化為（－1～＋1）;（2）輸出FA(x(n))的范圍為（－1～＋1）；（3）A為壓擴(kuò)參數(shù)，它反映最大量化間隔和最小量化間隔的比值。A=87.56A律壓擴(kuò)我國(guó)的PCM30/32路基群也采用A律13折線壓縮特性。μ律15折線主要用于美國(guó)、加拿大和日本等國(guó)的PCM24路基群中。CCITT建議G.711規(guī)定上述兩種折線近似壓縮律為國(guó)際標(biāo)準(zhǔn)，且在國(guó)際間數(shù)字系統(tǒng)相互連接時(shí)，要以A律為標(biāo)準(zhǔn)。因此這里重點(diǎn)介紹A律13折線。

FA(x)01116181321412164112817/86/85/84/83/82/81/8xa(nT)A律壓擴(kuò)編碼采用8位二進(jìn)制編碼：C7C6C5C4C3C2C1C0C7：表示信號(hào)的極性，稱為極性碼。0為正，1為負(fù)。C3C2C1C0：表示每一段落的16個(gè)均勻劃分的量化級(jí)，稱為段內(nèi)碼。

0000000100100011010001010110011110001001101010111100110111101111C6C5C4：表示段落序號(hào)，稱為段落碼。

000001010011100101110111對(duì)輸入動(dòng)態(tài)范圍為（-5v,+5v），用A律壓擴(kuò)編碼，有：1/1280.0390625v7654321015v1/22.5v1/41.25v1/80.625v1/160.3125v1/320.15625v1/640.078125v00v輸入信號(hào)為1.05v，則編碼為：極性碼：0段落碼：101段內(nèi)碼：=(1.25-0.625)/16=0.0390625(1.05-0.625)/=10.88取整數(shù)10，對(duì)應(yīng)第10量化間隔，編碼為1010最后完整的碼字為：01011010

I=8kHz*8bit=64kbit/s實(shí)際中，麥克風(fēng)采集信號(hào)，量化為12/13/14/15/16位的輸入信號(hào)，使用A律壓擴(kuò)編碼，每個(gè)樣本的量化位為8。

A律壓擴(kuò)編碼的速率：對(duì)輸入信號(hào)范圍（-1,1）：A律壓擴(kuò)編碼的最小量階為

min=(1/128)/16=1/2048;在同樣的輸入信號(hào)范圍，均勻量化的線性PCM以A律壓擴(kuò)編碼的最小量階為量階進(jìn)行量化，得到線性PCM需要12比特編碼；

=2V/L=2V/2R＝2/2R=1/20482R＝2*2048R=12

A律壓擴(kuò)編碼則只需要8個(gè)比特位。A律壓擴(kuò)編碼與線性PCM編碼的對(duì)比A律壓擴(kuò)編碼與其他線性PCM編碼的快速轉(zhuǎn)換線性PCM(13bits,b12為符號(hào)位)b12b11b10b9b8b7b6b5b4b3b2b1b0A律壓擴(kuò)編碼M7=b12M7M6M5M4M3M2M1M0

0000000

abcd1

000

abcd

000000

1abcd100

1abcd

00000

1abcd1×0

10abcd

0000

1abcd1××

11abcd

000

1abcd1×××

100abcd

1abcd1××××101abcd

1abcd1×××××110abcd1abcd1××××××111abcd時(shí)分復(fù)用TimeDivisionMultiplexing原理：把時(shí)間分割成小的時(shí)間片，每個(gè)時(shí)間片分為若干個(gè)通道（時(shí)隙），每個(gè)用戶占用一個(gè)通道傳輸數(shù)據(jù)。

A2A1A3原始信號(hào)D2D1D3數(shù)字化信號(hào)MUX復(fù)用后數(shù)據(jù)時(shí)隙1234D3D2D1適用于數(shù)字信號(hào)傳輸

時(shí)間片復(fù)用概念：利用不同時(shí)隙在同一信道上同時(shí)傳輸各路不同信號(hào)，且互不干擾，這就是時(shí)分復(fù)用（TDM）。(a)第1路；(b)第2路；(c)第3路；(d)3路合成的波形PCM30/32路介紹

1.基本特性話路數(shù)目：30抽樣頻率：8kHz壓擴(kuò)特性：A=87.6/13折線壓擴(kuò)律，編碼位數(shù)為8每幀時(shí)隙數(shù)：32總數(shù)碼率：8×32×8000=2048kb/s

2時(shí)隙分配：在PCM30/32路的制式中，抽樣周期為1/8000=125μs，它被稱為一個(gè)幀周期，即125μs為一幀。一幀內(nèi)要時(shí)分復(fù)用32路，每路占用的時(shí)隙為125/32=3.9μs，稱為一個(gè)時(shí)隙。因此一幀有32個(gè)時(shí)隙，按順序編號(hào)為TS0、TS1、……、TS31。時(shí)隙的使用分配為：①TS1～TS15,TS17～

TS31為30個(gè)話路時(shí)隙；②TS0為幀同步碼，監(jiān)視碼時(shí)隙；③TS16為信令(振鈴、占線、摘機(jī)……等各種標(biāo)志信號(hào))時(shí)隙。E1-幀格式0121631125ms=32時(shí)隙=2.048Mbps幀同步信令信道30路話音數(shù)據(jù)信道+2路控制信道

話路比特的安排：每個(gè)話路時(shí)隙內(nèi)要將樣值編為8位二元碼，每個(gè)碼元占3.9μs/8=488ns復(fù)接等級(jí)和速率系列

二、增量調(diào)制編碼

1.增量調(diào)制的定義：

增量調(diào)制（DM）也稱為調(diào)制，是對(duì)輸入樣本s(k)和預(yù)測(cè)樣本值se(k)的差值d(k)量化的最簡(jiǎn)單的一種情況，只有兩種編碼輸出：0或1。一般情況下，如果差值大于0，則編碼為“0”，若差值小于0，則編碼為“1”。由于增量編碼只須用1位對(duì)語(yǔ)音信號(hào)進(jìn)行編碼，所以對(duì)增量調(diào)制編碼系統(tǒng)稱為“1位系統(tǒng)”。

2.增量調(diào)制(DM)的結(jié)構(gòu)se(k)-DM發(fā)送端s(k)+量化器預(yù)測(cè)器I(k)sr(k)++編碼Δd(k)s(k)輸入樣本se(k)預(yù)測(cè)樣本值d(k)差值sr(k)重建樣本值I(k)已量化的差值3.增量調(diào)制(DM)的編碼預(yù)測(cè)器采取簡(jiǎn)單的一階固定預(yù)測(cè)器。se(k)=asr(k-1)a為一個(gè)常數(shù)，一般情況下取，即a=1。用重建信號(hào)的前一時(shí)刻來(lái)預(yù)測(cè)當(dāng)前時(shí)刻的預(yù)測(cè)樣本值。se(k)=sr(k-1)sr(k)=se(k)+I(k)=sr(k-1)+I(k)d(k)=s(k)-se(k)I(k)=Q[d(k)]=±Δd(k)I(k)Δ-Δ01se(k)=sr(k-1)se(k)=sr(k-1)d(k)=s(k)-se(k)>0d(k)=s(k)-se(k)<0I(k)=Q[d(k)]=+ΔI(k)=Q[d(k)]=-Δsr(k)=se(k)+I(k)sr(k)=se(k)+I(k)碼字為0碼字為1s(k)Δsr(0)se(1)sr(1)se(2)00sr(2)0001111011010104.增量調(diào)制(DM)的譯碼預(yù)測(cè)器I(k)sr(k)++譯碼Δse(k)se(k)=sr(k-1)sr(k)=se(k)+I(k)I(k)=±Δ5.量階固定的增量調(diào)制（線性增量調(diào)制LDM）的缺點(diǎn)（1）當(dāng)輸入信號(hào)變化快，用固定的量階量化，可能造成量化波形跟不上實(shí)際波形，這種現(xiàn)象稱為“斜率過(guò)載”。0000（2）當(dāng)輸入信號(hào)波形較平坦時(shí)，編碼為0和1的交替序列，類似隨機(jī)噪聲的特性，這種現(xiàn)象稱為“顆粒噪聲”。101010三、自適應(yīng)增量調(diào)制編碼

采用自適應(yīng)的方法使量階的大小隨輸入信號(hào)的統(tǒng)計(jì)特性變化。一般都采用后向量化，由量化器輸出來(lái)自適應(yīng)地調(diào)整量階。通過(guò)推導(dǎo)有：

I(k)=Δ(k)=MΔ(k-1)M是關(guān)于碼字c(n)的函數(shù)，有如下表達(dá)式：M=P>1若c(n)=c(n-1)M=Q<1若c(n)≠c(n-1)P=2若c(n)=c(n-1)Q=1/2若c(n)≠c(n-1)s(k)sr(0)se(1)sr(1)se(2)00sr(2)001101100110100Δ(k)=MΔ(k-1)

另一種調(diào)整量階方法是：如果碼字中連續(xù)出現(xiàn)三個(gè)相同的值，量階就加上一個(gè)大的增量，反之，就加一個(gè)小的增量。這種方法稱為連續(xù)可變斜率增量調(diào)制（CVSD）。Motorola公司的集成電路芯片，如MC3417/MC3517、MC3418/MC3518，采用了CVSD，前者檢測(cè)3位，后者檢測(cè)4位連續(xù)的編碼。

在PCM中，每個(gè)波形樣值都獨(dú)立編碼，與其他樣值無(wú)關(guān)，這樣，樣值的整個(gè)幅值編碼需要較多位數(shù)，比特率較高，造成數(shù)字化的信號(hào)帶寬大大增加。

然而，大多數(shù)以奈奎斯特或更高速率抽樣的信源信號(hào)在相鄰抽樣間表現(xiàn)出很強(qiáng)的相關(guān)性，有很大的冗余度。利用信源的這種相關(guān)性，一種比較簡(jiǎn)單的解決方法是對(duì)相鄰樣值的差值而不是樣值本身進(jìn)行編碼。編碼位數(shù)顯著減少，信號(hào)帶寬大大壓縮。這種利用差值的PCM編碼稱為差分PCM（DPCM）。如果將樣值之差仍用N位編碼傳送，則DPCM的量化信噪比顯然優(yōu)于PCM系統(tǒng)。四、自適應(yīng)差分脈沖編碼ADPCM

對(duì)于長(zhǎng)途傳輸系統(tǒng)，64kb/s的速率占用的頻帶太寬，通信的費(fèi)用昂貴，因此人們尋找能夠在更低的速率上獲得高質(zhì)量語(yǔ)音編碼的方法，由此提出了G.72132kb/sADPCMAdaptiveDifferencePulseCodeModulation編碼標(biāo)準(zhǔn)，利用語(yǔ)音信號(hào)樣點(diǎn)的相關(guān)性和非平穩(wěn)特點(diǎn)，使用了自適應(yīng)預(yù)測(cè)和自適應(yīng)量化。1.ADPCM的基本思想

利用樣本（采樣值）與樣本之間的冗余信息進(jìn)行編碼。對(duì)實(shí)際樣本值與預(yù)測(cè)樣本值之差進(jìn)行量化編碼，從而減少了每個(gè)樣本信號(hào)的位數(shù)。ADPCM包括兩部分的功能：APCM和DPCM。APCM主要改變量化間隔；DPCM主要得到預(yù)測(cè)樣本和差值。

運(yùn)用自適應(yīng)的思想,用過(guò)去的樣本值估算下一個(gè)輸入樣本的值，使實(shí)際樣本值和預(yù)測(cè)值之間的差值總是最小。這部分功能稱為DPCM。2.DPCM量化器自適應(yīng)預(yù)測(cè)器逆量化器s(k)+se(k)-d(k)I(k)sr(k)+dq(k)+編碼DPCM發(fā)送端s(k)輸入樣本se(k)預(yù)測(cè)樣本值d(k)差值sr(k)重建樣本值dq(k)重建差值I(k)已量化的差值產(chǎn)生誤差產(chǎn)生誤差

e1(n)和e2(n)是量化器和逆量化器的量化噪聲。一般情況下，e1(n)和e2(n)的瞬時(shí)值不等，在忽略量化噪聲的情況下，d(k)=I(k)-e1(n)dq(k)=I(k)-e2(n)dq(k)≈d(k)d(k)=s(k)-se(k)sr(k)=se(k)+dq(k)≈se(k)+d(k)=se(k)+s(k)-se(k)=s(k)逆量化器自適應(yīng)預(yù)測(cè)器I(k)dq(k)sr(k)DPCM接收端+se(k)

發(fā)送端和接收端采用相同的預(yù)測(cè)器，進(jìn)行信號(hào)的重建。發(fā)送端和接收端中除了I(k)是數(shù)字信號(hào)，其余信號(hào)均為時(shí)間離散，幅度未量化的物理量。sr(k)=se(k)+dq(k)差值量化系統(tǒng)的信噪比為：

要使SNR增大，可用增大SNRQ和

GP來(lái)達(dá)到。

（1）SNRQ為量化器的信噪比，取決于量化器的性質(zhì)，一般采用自適應(yīng)量化和非均勻量化可使其增大。（2）GP為差值結(jié)構(gòu)產(chǎn)生的增益，對(duì)于給定的語(yǔ)音信號(hào)，δs2是固定的，只有減小δd2，DPCM采用自適應(yīng)預(yù)測(cè)的思想使δd2最小的方法增大SNR。3.APCM

利用自適應(yīng)的思想改變量化間隔（量階）的大小，即用小的量化間隔去編碼小的差值，使用大的的量化間隔去編碼大的差值，這部分功能稱為APCM。量化器量階自適應(yīng)d(k)I(k)量階Δ(k)APCM發(fā)送端逆量化器量階自適應(yīng)I(k)dq(k)Δ(k)APCM接收端4.ADPCM的簡(jiǎn)單框圖

ADPCM編碼結(jié)合了APCM和DPCM兩者的特性，量化器和預(yù)測(cè)器均是自適應(yīng)。將I(k)，已量化的樣值編碼為4個(gè)比特，編碼速率為32kb/s。s(k)+d(k)量化器自適應(yīng)預(yù)測(cè)器逆量化器se(k)-

I(k)sr(k)+

dq(k)+編碼發(fā)送端量階自適應(yīng)Δ(k)ADPCM接收端逆量化器自適應(yīng)預(yù)測(cè)器I(k)dq(k)sr(k)++se(k)量階自適應(yīng)發(fā)送端輸入樣本：s(k)=se(k)+d(k)接收端輸出重建樣本值：sr(k)=se(k)+dq(k)歸一化輸入差值dln(k)=log2|d(k)|-log2(k)量化電平(I(k)對(duì)應(yīng)的碼字)歸一化量化輸出In(k)=log2|I(k)|-log2(k)[3.16+∞]73.34[2.783.16]62.95[2.422.78]52.59[2.042.42]42.23[1.582.04]31.81[0.961.58]21.29[-0.050.96]10.53[-∞-0.05]0-1.05ADPCM的總結(jié)1.編碼方式

當(dāng)d(k)的符號(hào)為正，則編碼的碼字最高位b3為0；當(dāng)d(k)的符號(hào)為負(fù)，則編碼的碼字最高位b3為1。碼字的b2b1b0由表中碼字決定。例如：一個(gè)負(fù)的d(k)值，歸一化后落在[3.16+∞]，則編碼為1111，歸一化量化輸出為－3.34；若一個(gè)正的d(k)值，歸一化后落在[3.16,+∞]，則編碼為0111，歸一化量化輸出為3.34。量化器逆量化器s(k)+-se(k)d(k)I(k)dq(k)++編碼sr(k)量階自適應(yīng)++Δ(k)ADPCM發(fā)送端2.ADPCM發(fā)送端工作過(guò)程：

輸入樣本s(k)，與預(yù)測(cè)樣本值se(k)相減后產(chǎn)生差值d(k)，對(duì)d(k)進(jìn)行自適應(yīng)量化，對(duì)量化器輸出I(k)進(jìn)行4個(gè)比特位的編碼。（1）碼字送給接收端的解碼器；（2）對(duì)其進(jìn)行本地解碼，進(jìn)行逆量化，得到差值信號(hào)dq(k)，與預(yù)測(cè)信號(hào)se(k)相加得到本地重建信號(hào)sr(k)，利用sr(k)、dq(k)，對(duì)下一時(shí)刻輸入的s(k＋1)進(jìn)行自適應(yīng)預(yù)測(cè)，得到se(k＋1)。自適應(yīng)預(yù)測(cè)器采用六階零點(diǎn)和二階極點(diǎn)。逆量化器I(k)dq(k)sr(k)+se(k)+++量階自適應(yīng)Δ(k)ADPCM接收端3.ADPCM接收端工作過(guò)程：

將接收的碼字進(jìn)行解碼，進(jìn)行逆量化，得到重建差值信號(hào)dq(k)，與預(yù)測(cè)信號(hào)se(k)相加得到重建信號(hào)sr(k)，利用sr(k)、dq(k)進(jìn)行自適應(yīng)預(yù)測(cè)，得到se(k＋1)。自適應(yīng)預(yù)測(cè)器和自適應(yīng)量化器采用發(fā)送端的同樣的對(duì)應(yīng)結(jié)構(gòu)和算法。根據(jù)碼字，查表得到編碼所對(duì)應(yīng)的In(k)，一般地，In(k)≈dlqn(k)（歸一化重建差值）利用：dlqn(k)=In(k)=log2|dq(k)|-log2(k)log2|dq(k)|＝In(k)+log2(k)

log2|dq(k)|的反對(duì)數(shù)變換就是dq(k),其符號(hào)由d(k)與一致。由接收的碼字決定。

逆量化過(guò)程：子帶－自適應(yīng)差分脈沖編碼調(diào)制

語(yǔ)音信號(hào)的參數(shù)編碼一、參數(shù)編碼的特點(diǎn)二、LPC-10編碼器低速率語(yǔ)音編碼的應(yīng)用：蜂窩移動(dòng)電臺(tái)網(wǎng)；衛(wèi)星通訊；短波保密通信；

ISDN（IntegratedServiceDigitalNetwork）；“語(yǔ)音郵件”、“語(yǔ)音存儲(chǔ)”等新型通信業(yè)務(wù)。一、參數(shù)編碼的特點(diǎn)

由于參數(shù)編碼是針對(duì)語(yǔ)音信號(hào)的特征參數(shù)，所以與波形編碼不同，只是適用于語(yǔ)音信號(hào)。

常用的編碼器為線性預(yù)測(cè)編碼器。時(shí)間（樣點(diǎn)）x(n)x(n-1)x(n-p)p個(gè)點(diǎn)線性預(yù)測(cè)：LPC語(yǔ)音合成圖清/濁開(kāi)關(guān)聲道模擬濾波器基音周期脈沖序列發(fā)生器隨機(jī)噪聲發(fā)生器LPC系數(shù)增益Gu(n)輸出語(yǔ)音s(n)清音/濁音示意圖：a1語(yǔ)音輸出x’(n)線性預(yù)測(cè)分析基音頻率清/濁音判別參數(shù)合成a2ap基音頻率輸入語(yǔ)音x(n)清/濁音標(biāo)志G二、LPC-10編碼器

美國(guó)確定LPC-10作為2.4kb/s速率上的推薦編碼形式，用于第三代保密電話中。在其發(fā)送端，原始語(yǔ)音信號(hào)采用8kHz采樣，然后每180個(gè)采樣值分為一幀（22.5ms），提取語(yǔ)音特征參數(shù)并加以編碼傳送。每幀總共編碼為54bits，每秒傳輸44.4幀，因此總傳輸速率為2.4kb/s。s(n)采樣(8kHz)基音檢測(cè)（AMDF）清/濁音檢測(cè)預(yù)加重線性預(yù)測(cè)分析反射系數(shù)增益G參數(shù)編碼c(n)LPC-10編碼器發(fā)送端預(yù)加重：提高語(yǔ)音譜中的高頻共振峰，使得語(yǔ)音的頻譜較為平滑。短時(shí)平均幅度差函數(shù)（AMDF）c(n)解碼清/濁音開(kāi)關(guān)反射系數(shù)轉(zhuǎn)換為預(yù)測(cè)系數(shù)基音增益G合成器去加重噪聲產(chǎn)生s'(n)

LPC-10編碼器接收端語(yǔ)音信號(hào)的混合編碼一、混合編碼的特點(diǎn)二、CELP的編碼原理三、RPE-LPT編碼原理一、混合編碼的特點(diǎn)

混合編碼同參數(shù)編碼一樣，依據(jù)語(yǔ)音的線性預(yù)測(cè)模型，使用了與波形編碼相匹配的技術(shù)，達(dá)到低速率上的高質(zhì)量的語(yǔ)音編碼。目前以CELP為基礎(chǔ)的多種算法已經(jīng)成為國(guó)際標(biāo)準(zhǔn)。二、CELP(CodeExcitedLinearPrediction)編碼原理

采用矢量量化技術(shù)，對(duì)激勵(lì)信號(hào)進(jìn)行訓(xùn)練得到一個(gè)碼本，每幀語(yǔ)音信號(hào)從碼本中選出一個(gè)在感覺(jué)加權(quán)誤差最小意義上的最佳碼矢量作為激勵(lì)源。Hl(z)e(n)x(n)

CELP是近10年來(lái)最成功的語(yǔ)音編碼算法。CELP語(yǔ)音編碼算法用線性預(yù)測(cè)提取聲道參數(shù)，用一個(gè)包含許多典型的激勵(lì)矢量的碼本作為激勵(lì)參數(shù)，每次編碼時(shí)都在這個(gè)碼本中搜索一個(gè)最佳的激勵(lì)矢量，這個(gè)激勵(lì)矢量的編碼值就是這個(gè)序列的碼本中的序號(hào)。CELP已經(jīng)被許多語(yǔ)音編碼標(biāo)準(zhǔn)所采用，美國(guó)聯(lián)邦標(biāo)準(zhǔn)FS1016就是采用CELP的編碼方法，主要用于高質(zhì)量的窄帶語(yǔ)音保密通信。

其基本原理是用一個(gè)自適應(yīng)碼本中的碼字來(lái)逼近語(yǔ)音的長(zhǎng)時(shí)周期性結(jié)構(gòu)，用一個(gè)固定隨機(jī)碼本中的碼字來(lái)逼近語(yǔ)音經(jīng)過(guò)短時(shí)和長(zhǎng)時(shí)預(yù)測(cè)后的余量信號(hào)，從兩個(gè)碼本中搜索出來(lái)的最佳矢量乘以各自的最佳增益后相加，其和即為CELP激勵(lì)信號(hào)源。

將激勵(lì)信號(hào)輸入P階LP綜合濾波器1/A(Z)，得到合成語(yǔ)音信號(hào)，它與原始語(yǔ)音信號(hào)s(n)的誤差經(jīng)過(guò)感覺(jué)加權(quán)濾波器W(z)，得到感覺(jué)加權(quán)誤差es(n)。CELP就是利用es(n)的最小平方預(yù)測(cè)誤差作為搜索最佳碼矢量及其增益的度量準(zhǔn)則。由于這種算法能最好地逼近原始語(yǔ)音，語(yǔ)音質(zhì)量較好，所以它優(yōu)于脈沖激勵(lì)線性預(yù)測(cè)。CELP語(yǔ)音編碼示意圖s(n)es(n)2550隨機(jī)碼本W(wǎng)(z)誤差最小化原始語(yǔ)音s(n)+-5110自適應(yīng)碼本線性預(yù)測(cè)濾波器g1ga++感覺(jué)加權(quán)濾波器感覺(jué)加權(quán)濾波器

CELP有參數(shù)編碼的特征，另一方面在感覺(jué)加權(quán)均方誤差最小時(shí)，實(shí)際上是做了波形的最佳匹配，有波形編碼的特征，所以CELP又被稱為混合編碼。CELP語(yǔ)音編碼的特點(diǎn)

以碼本激勵(lì)線性預(yù)測(cè)（CELP）原理為基礎(chǔ)的G.729、G.723（G.723.1）話音壓縮編碼技術(shù),是IP電話技術(shù)的一個(gè)重要組成部分。以G.729為例，它可將經(jīng)過(guò)采樣的64kb/s話音以幾乎不失真的質(zhì)量壓縮至8kb/s。CELP語(yǔ)音編碼的應(yīng)用CELP

原始語(yǔ)音ComparisonAlgorithmBitRateComplexityDelayMeanOpinionScorePCM64Kb/s>1Mips.25ms4.4G.7298Kb/s20Mips10ms4.2ITU-TG.7298kb/sCS—ACELP簡(jiǎn)介

G.729是由美國(guó)、法國(guó)、日本和加拿大的幾家著名國(guó)際電信實(shí)體聯(lián)合開(kāi)發(fā)的。它需要符合一些嚴(yán)格的要求，比如在良好的信道條件下要達(dá)到長(zhǎng)話質(zhì)量，在有隨機(jī)比特誤碼、發(fā)生幀丟失和多次轉(zhuǎn)接等情況下要有很好的穩(wěn)健性等。這種語(yǔ)音壓縮算法可以應(yīng)用在很廣泛的領(lǐng)域中，包括IＰ電話、無(wú)線通信、數(shù)字衛(wèi)星系統(tǒng)和數(shù)字專用線路。

G.729算法采用“共軛結(jié)構(gòu)代數(shù)碼本激勵(lì)線性預(yù)測(cè)編碼方案”（CS-ACELP）算法。這種算法綜合了波形編碼和參數(shù)編碼的優(yōu)點(diǎn)，以自適應(yīng)預(yù)測(cè)編

人人文庫(kù)> 全部分類> 教育資料 > 輔導(dǎo)培訓(xùn)

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

語(yǔ)音編碼基礎(chǔ)知識(shí)

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

語(yǔ)音編碼基礎(chǔ)知識(shí)

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔