版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
語音編碼(speechcoding)√概述√語音信號壓縮編碼的原理及其評價系統(tǒng)√語音信號的波形編碼√語音信號的參數(shù)編碼√語音信號的混合編碼√概述一、編碼(壓縮)的重要性二、編碼速率(信息容量)三、編碼的分類四、已經(jīng)標(biāo)準(zhǔn)化的語音編碼
編碼、傳輸、存儲和譯碼是語音數(shù)字傳輸和數(shù)字存儲的必要過程。隨著語音通信技術(shù)的發(fā)展,壓縮語音信號的傳輸帶寬,降低信道的傳輸速率,一直是人們追求的目標(biāo)。語音編碼在實現(xiàn)這一目標(biāo)的過程中擔(dān)當(dāng)重要的角色。語音編碼就是使表達(dá)語音信號的比特數(shù)目最小。一、編碼(壓縮)的重要性數(shù)字傳輸系統(tǒng)模型信源信源編碼信道編碼調(diào)制傳輸通道用戶信源解碼信道解碼解調(diào)噪聲語音編碼應(yīng)用實例(IP電話)接收器模數(shù)轉(zhuǎn)換壓縮編碼IP封裝網(wǎng)絡(luò)IP解包解碼數(shù)模轉(zhuǎn)換播放器二、編碼速率(信息容量)
用比特/秒(b/s或bps)來度量,用I表示,有:I=R?fs,R代表每個語音采樣值編碼所需的比特數(shù);fs是采樣頻率。當(dāng)fs=8kHz,每個采樣值用8比特位來編碼,則編碼速率為64kb/s。三、編碼的分類1.波形編碼(waveformcoding):基本原理是在時間軸上對模擬話音信號按照一定的速率來抽樣,然后將幅度樣本分層量化,并使用代碼來表示。在接收端將收到的數(shù)字序列經(jīng)過解碼恢復(fù)到原模擬信號,保持原始語音的波形形狀。話音質(zhì)量高,編碼速率高。如PCM編碼類(a率或u率PCM、ADPCM、ADM),編碼速率為64-16kb/s,語音質(zhì)量好。2.參數(shù)編碼(聲源編碼parametriccoding):
根據(jù)語音信號產(chǎn)生的數(shù)學(xué)模型,通過對語音信號特征參數(shù)的提取后進行編碼(將特征參數(shù)變換成數(shù)字代碼進行傳輸)。在接收端將特征參數(shù),結(jié)合數(shù)學(xué)模型,恢復(fù)語音,力圖使重建語音保持盡可能高的可懂度,重建語音信號的波形同原始語音信號的波形可能會有相當(dāng)大的區(qū)別。如線性預(yù)測(LPC)編碼類。編碼速率低,2.4-1.2kb/s,自然度低,對環(huán)境噪聲敏感。3.混合編碼(Hybridcoding):
將波形編碼與參數(shù)編碼相結(jié)合,在2.4-1.2kb/s速率上能夠得到高質(zhì)量的合成語音。規(guī)則碼激勵長時預(yù)測編碼RPE—LPT即為混合編碼技術(shù)?;旌暇幋a包括若干語音特征參量又包括部分波形編碼信息,以達(dá)到波形編碼的高質(zhì)量和參量編碼的低速率的優(yōu)點。四、已經(jīng)標(biāo)準(zhǔn)化的語音編碼
指定組織:國際電信聯(lián)盟ITU-T,
標(biāo)準(zhǔn)編碼速率(kb/s)算法MOS得分應(yīng)用G.71164u律或a律PCM4.3公用網(wǎng)G.72132ADPCM4.1公用網(wǎng)G.723.15.3ACELP3.2無線網(wǎng)G.7298CS-ACELP3.8無線網(wǎng)GSM13RPE-LTP3.9無線網(wǎng)(5)RPE-LTP:長時預(yù)測的規(guī)則脈沖激勵的線性預(yù)測Regular-PulseExcitedLPCwithaLong-TermPredictor(1)ADPCM:自適應(yīng)差分脈沖編碼adaptivedifferencepulsecodemodulation(2)CELP:碼本激勵線性預(yù)測(codeexcitedlinearprediction)(3)ACELP:代數(shù)碼本激勵線性預(yù)測Algebraic-Code-ExcitedLinear-Prediction(4)CS-ACELP:共軛結(jié)構(gòu)的代數(shù)碼本激勵線性預(yù)測ConjugateStructureAlgebraic-Code-ExcitedLinear-Prediction√語音信號壓縮編碼的原理及其評價系統(tǒng)一、語音壓縮的基本依據(jù)二、語音編碼的關(guān)鍵技術(shù)三、語音壓縮系統(tǒng)的性能指標(biāo)和評測方法一、語音壓縮的基本依據(jù)
是語音信號的冗余度和人的聽覺感知機理。1.存在的時域冗余度:(1)幅度非均勻分布(2)語音信號樣本間的相關(guān)性很強(3)濁音具有準(zhǔn)周期(4)聲道的形狀及其變化緩慢(5)語音間隙(靜止系數(shù))2.存在的頻域冗余度:(1)非均勻的長時功率譜密度(2)短時功率譜密度女聲英文a的功率譜3.人的聽覺感知機理(1)人類的聽覺特性具有掩蔽效應(yīng)(2)人耳對不同頻段聲音的敏感程度不同(3)人耳對語音相位不敏感4.語音編碼的極限速率語音中最基本的元素是音素,大約有128~256個,如果按通常的說話速度,每秒平均發(fā)出10個音素,則信息率為:I=[log2(256)10]bps=80bps把發(fā)音看成是以語音速率來傳送,則語音編碼的極限速率為80bps,從數(shù)字化標(biāo)準(zhǔn)的編碼速率64kbps,到極限速率80bps,之間的距離,對于理論研究和實踐有著極大的吸引力。二、語音編碼的關(guān)鍵技術(shù)語音信號中存在兩種類型的相關(guān)性:(1)樣點間的短時相關(guān)性(2)相鄰基音周期之間的長時相關(guān)性e(n)x(n)短時預(yù)測濾波器語音信號的短時預(yù)測模型
D為基音周期,長時預(yù)測系數(shù){bi}的個數(shù)取1(q=r=0)或3(q=r=1)。D、{bi}從語音信號中直接提取。語音信號通過長時預(yù)測,得出基音周期、增益(振幅大小)。2.語音信號的長時預(yù)測
長時線性預(yù)測x(n-p),x(n-p+1),….x(n-1)x(n)長時預(yù)測濾波器x(n)e(n)激勵發(fā)生器完整的語音信號的預(yù)測模型3.感覺加權(quán)濾波器
由于掩蔽效應(yīng),在語音頻譜中,能量較高的頻段(共振峰處)的噪聲相對于能量較低的頻段的噪聲不易被感覺。在度量原始語音和合成語音之間的誤差時,在高能量段允許誤差大,因此引入一個頻域的感覺加權(quán)濾波器W(z)來衡量語音之間的誤差。加權(quán)因子在0~1之間,控制共振峰區(qū)域的誤差增加。輸入語音x(n)線性預(yù)測分析感覺加權(quán)濾波器后繼處理三、語音壓縮系統(tǒng)的性能指標(biāo)和評測方法1.語音壓縮系統(tǒng)的性能指標(biāo)(1)編碼速率(2)編碼器的頑健性(3)編碼器的時延(4)算法的復(fù)雜度和可擴展性編碼延時
一般地,編解碼算法越復(fù)雜,延時越大,會明顯感覺到通話對方反映“遲鈍”,甚至造成正常通信困難。另外一方面,延時造成回聲,傳統(tǒng)的電話系統(tǒng)中,在2-4線的轉(zhuǎn)換處(混合線圈)因阻抗不匹配,導(dǎo)致接收者的收話音信號泄露到其發(fā)送路徑上,返回給發(fā)送者,形成了回聲。當(dāng)延時小時,回聲同房間交混,因此感覺不到;當(dāng)延遲超過了25ms,能明顯感覺到,從而嚴(yán)重影響通信。一般地,要求編解碼延時不超過5-10ms。A端的信號+B端經(jīng)混合線圈的回傳信號B端的信號+A端經(jīng)混合線圈的回傳信號A端B端2.語音壓縮系統(tǒng)的性能指標(biāo)和評測方法
語音質(zhì)量是衡量語音編碼算法優(yōu)劣的關(guān)鍵性能之一。語音質(zhì)量通常分為四類:(1)廣播級(2)網(wǎng)絡(luò)或電話級(3)通信級(4)合成級
語音質(zhì)量有主觀和客觀兩種評價方法。
評價指標(biāo):清晰度或可懂度、音質(zhì)。前者是指語音是否容易聽清楚;后者指語音聽起來有多自然。(1)可懂度評價DRT:DiagnosticRhymerTest(2)音質(zhì)評價:MOS:MeanOpinionScore平均意見得分和DAM:DiagnosticAcceptabilityMeasure判斷滿意度得分。主觀評價方法
MOS得分為五級:優(yōu)、良、可、差和壞。滿分為5分,相當(dāng)調(diào)頻廣播質(zhì)量;4分以上是長途電話網(wǎng)標(biāo)準(zhǔn);3.5分為通信標(biāo)準(zhǔn);3.0分仍有較好的可懂度,保持自然度;2.5分只維持可懂度,是戰(zhàn)術(shù)通信標(biāo)準(zhǔn)。(1)波形失真度,用信噪比來度量(2)頻譜失真測量(3)譜包絡(luò)失真測量客觀評價方法語音信號的波形編碼一、非均勻量化的PCM編碼二、增量調(diào)制編碼三、自適應(yīng)增量調(diào)制編碼四、自適應(yīng)差分脈沖編碼ADPCM五、自適應(yīng)預(yù)測器六、自適應(yīng)量化器七、ADPCM的總結(jié)
均勻量化時,無論大的輸入信號還是小的輸入信號一律采用相同的量化間隔,為了適應(yīng)大的輸入信號,同時又要滿足精度要求,就需要增加樣本的位數(shù)。=2V/L=2V/2R,但是對話音信號來說,大信號出現(xiàn)的機會并不多,增加的樣本數(shù)就沒有充分利用。因此采用非均勻量化。一、非均勻量化的PCM編碼其基本思想是:大的輸入信號采用大的量化間隔,小的輸入信號采用小的量化間隔。在滿足精度要求的情況下用較少的位數(shù)來表示。譯碼時,采用相同的規(guī)則。也可視為將信號進行非線性變換后再作均勻量化,如對信號進行對數(shù)壓縮,微弱的信號被放大,強的信號被壓縮。譯碼時,指數(shù)擴張。非線性壓縮均勻量化編碼xa(nT)解碼非線性擴張x'(nT)
現(xiàn)在的非均勻量化中,一般采用兩種壓縮擴張非均勻量化方法。采樣后信號幅度和量化數(shù)據(jù)之間有兩種對應(yīng)關(guān)系,一種稱為u律壓擴(companding)算法,另一種稱為A律壓擴算法。u律壓擴主要用于北美和日本等地區(qū)的電話通信中。A律壓擴主要用在歐洲和中國的地區(qū)的電話通信中。u律壓擴(1)輸入xa(nT)的范圍歸一化為(-1~+1);(2)輸出FA(x(n))的范圍為(-1~+1);(3)A為壓擴參數(shù),它反映最大量化間隔和最小量化間隔的比值。A=87.56A律壓擴我國的PCM30/32路基群也采用A律13折線壓縮特性。μ律15折線主要用于美國、加拿大和日本等國的PCM24路基群中。CCITT建議G.711規(guī)定上述兩種折線近似壓縮律為國際標(biāo)準(zhǔn),且在國際間數(shù)字系統(tǒng)相互連接時,要以A律為標(biāo)準(zhǔn)。因此這里重點介紹A律13折線。
FA(x)01116181321412164112817/86/85/84/83/82/81/8xa(nT)A律壓擴編碼采用8位二進制編碼:C7C6C5C4C3C2C1C0C7:表示信號的極性,稱為極性碼。0為正,1為負(fù)。C3C2C1C0:表示每一段落的16個均勻劃分的量化級,稱為段內(nèi)碼。
0000000100100011010001010110011110001001101010111100110111101111C6C5C4:表示段落序號,稱為段落碼。
000001010011100101110111對輸入動態(tài)范圍為(-5v,+5v),用A律壓擴編碼,有:1/1280.0390625v7654321015v1/22.5v1/41.25v1/80.625v1/160.3125v1/320.15625v1/640.078125v00v輸入信號為1.05v,則編碼為:極性碼:0段落碼:101段內(nèi)碼:=(1.25-0.625)/16=0.0390625(1.05-0.625)/=10.88取整數(shù)10,對應(yīng)第10量化間隔,編碼為1010最后完整的碼字為:01011010
I=8kHz*8bit=64kbit/s實際中,麥克風(fēng)采集信號,量化為12/13/14/15/16位的輸入信號,使用A律壓擴編碼,每個樣本的量化位為8。
A律壓擴編碼的速率:對輸入信號范圍(-1,1):A律壓擴編碼的最小量階為
min=(1/128)/16=1/2048;在同樣的輸入信號范圍,均勻量化的線性PCM以A律壓擴編碼的最小量階為量階進行量化,得到線性PCM需要12比特編碼;
=2V/L=2V/2R=2/2R=1/20482R=2*2048R=12
A律壓擴編碼則只需要8個比特位。A律壓擴編碼與線性PCM編碼的對比A律壓擴編碼與其他線性PCM編碼的快速轉(zhuǎn)換線性PCM(13bits,b12為符號位)b12b11b10b9b8b7b6b5b4b3b2b1b0A律壓擴編碼M7=b12M7M6M5M4M3M2M1M0
0000000
abcd1
000
abcd
000000
1abcd100
1abcd
00000
1abcd1×0
10abcd
0000
1abcd1××
0
11abcd
000
1abcd1×××
100abcd
00
1abcd1××××101abcd
0
1abcd1×××××110abcd1abcd1××××××111abcd時分復(fù)用TimeDivisionMultiplexing原理:把時間分割成小的時間片,每個時間片分為若干個通道(時隙),每個用戶占用一個通道傳輸數(shù)據(jù)。
A2A1A3原始信號D2D1D3數(shù)字化信號MUX復(fù)用后數(shù)據(jù)時隙1234D3D2D1適用于數(shù)字信號傳輸
時間片復(fù)用概念:利用不同時隙在同一信道上同時傳輸各路不同信號,且互不干擾,這就是時分復(fù)用(TDM)。(a)第1路;(b)第2路;(c)第3路;(d)3路合成的波形PCM30/32路介紹
1.基本特性話路數(shù)目:30抽樣頻率:8kHz壓擴特性:A=87.6/13折線壓擴律,編碼位數(shù)為8每幀時隙數(shù):32總數(shù)碼率:8×32×8000=2048kb/s
2時隙分配:在PCM30/32路的制式中,抽樣周期為1/8000=125μs,它被稱為一個幀周期,即125μs為一幀。一幀內(nèi)要時分復(fù)用32路,每路占用的時隙為125/32=3.9μs,稱為一個時隙。因此一幀有32個時隙,按順序編號為TS0、TS1、……、TS31。時隙的使用分配為:①TS1~TS15,TS17~
TS31為30個話路時隙;②TS0為幀同步碼,監(jiān)視碼時隙;③TS16為信令(振鈴、占線、摘機……等各種標(biāo)志信號)時隙。E1-幀格式0121631125ms=32時隙=2.048Mbps幀同步信令信道30路話音數(shù)據(jù)信道+2路控制信道
話路比特的安排:每個話路時隙內(nèi)要將樣值編為8位二元碼,每個碼元占3.9μs/8=488ns復(fù)接等級和速率系列
二、增量調(diào)制編碼
1.增量調(diào)制的定義:
增量調(diào)制(DM)也稱為調(diào)制,是對輸入樣本s(k)和預(yù)測樣本值se(k)的差值d(k)量化的最簡單的一種情況,只有兩種編碼輸出:0或1。一般情況下,如果差值大于0,則編碼為“0”,若差值小于0,則編碼為“1”。由于增量編碼只須用1位對語音信號進行編碼,所以對增量調(diào)制編碼系統(tǒng)稱為“1位系統(tǒng)”。
2.增量調(diào)制(DM)的結(jié)構(gòu)se(k)-DM發(fā)送端s(k)+量化器預(yù)測器I(k)sr(k)++編碼Δd(k)s(k)輸入樣本se(k)預(yù)測樣本值d(k)差值sr(k)重建樣本值I(k)已量化的差值3.增量調(diào)制(DM)的編碼預(yù)測器采取簡單的一階固定預(yù)測器。se(k)=asr(k-1)a為一個常數(shù),一般情況下取,即a=1。用重建信號的前一時刻來預(yù)測當(dāng)前時刻的預(yù)測樣本值。se(k)=sr(k-1)sr(k)=se(k)+I(k)=sr(k-1)+I(k)d(k)=s(k)-se(k)I(k)=Q[d(k)]=±Δd(k)I(k)Δ-Δ01se(k)=sr(k-1)se(k)=sr(k-1)d(k)=s(k)-se(k)>0d(k)=s(k)-se(k)<0I(k)=Q[d(k)]=+ΔI(k)=Q[d(k)]=-Δsr(k)=se(k)+I(k)sr(k)=se(k)+I(k)碼字為0碼字為1s(k)Δsr(0)se(1)sr(1)se(2)00sr(2)0001111011010104.增量調(diào)制(DM)的譯碼預(yù)測器I(k)sr(k)++譯碼Δse(k)se(k)=sr(k-1)sr(k)=se(k)+I(k)I(k)=±Δ5.量階固定的增量調(diào)制(線性增量調(diào)制LDM)的缺點(1)當(dāng)輸入信號變化快,用固定的量階量化,可能造成量化波形跟不上實際波形,這種現(xiàn)象稱為“斜率過載”。0000(2)當(dāng)輸入信號波形較平坦時,編碼為0和1的交替序列,類似隨機噪聲的特性,這種現(xiàn)象稱為“顆粒噪聲”。101010三、自適應(yīng)增量調(diào)制編碼
采用自適應(yīng)的方法使量階的大小隨輸入信號的統(tǒng)計特性變化。一般都采用后向量化,由量化器輸出來自適應(yīng)地調(diào)整量階。通過推導(dǎo)有:
I(k)=Δ(k)=MΔ(k-1)M是關(guān)于碼字c(n)的函數(shù),有如下表達(dá)式:M=P>1若c(n)=c(n-1)M=Q<1若c(n)≠c(n-1)P=2若c(n)=c(n-1)Q=1/2若c(n)≠c(n-1)s(k)sr(0)se(1)sr(1)se(2)00sr(2)001101100110100Δ(k)=MΔ(k-1)
另一種調(diào)整量階方法是:如果碼字中連續(xù)出現(xiàn)三個相同的值,量階就加上一個大的增量,反之,就加一個小的增量。這種方法稱為連續(xù)可變斜率增量調(diào)制(CVSD)。Motorola公司的集成電路芯片,如MC3417/MC3517、MC3418/MC3518,采用了CVSD,前者檢測3位,后者檢測4位連續(xù)的編碼。
在PCM中,每個波形樣值都獨立編碼,與其他樣值無關(guān),這樣,樣值的整個幅值編碼需要較多位數(shù),比特率較高,造成數(shù)字化的信號帶寬大大增加。
然而,大多數(shù)以奈奎斯特或更高速率抽樣的信源信號在相鄰抽樣間表現(xiàn)出很強的相關(guān)性,有很大的冗余度。利用信源的這種相關(guān)性,一種比較簡單的解決方法是對相鄰樣值的差值而不是樣值本身進行編碼。編碼位數(shù)顯著減少,信號帶寬大大壓縮。這種利用差值的PCM編碼稱為差分PCM(DPCM)。如果將樣值之差仍用N位編碼傳送,則DPCM的量化信噪比顯然優(yōu)于PCM系統(tǒng)。四、自適應(yīng)差分脈沖編碼ADPCM
對于長途傳輸系統(tǒng),64kb/s的速率占用的頻帶太寬,通信的費用昂貴,因此人們尋找能夠在更低的速率上獲得高質(zhì)量語音編碼的方法,由此提出了G.72132kb/sADPCMAdaptiveDifferencePulseCodeModulation編碼標(biāo)準(zhǔn),利用語音信號樣點的相關(guān)性和非平穩(wěn)特點,使用了自適應(yīng)預(yù)測和自適應(yīng)量化。1.ADPCM的基本思想
利用樣本(采樣值)與樣本之間的冗余信息進行編碼。對實際樣本值與預(yù)測樣本值之差進行量化編碼,從而減少了每個樣本信號的位數(shù)。ADPCM包括兩部分的功能:APCM和DPCM。APCM主要改變量化間隔;DPCM主要得到預(yù)測樣本和差值。
運用自適應(yīng)的思想,用過去的樣本值估算下一個輸入樣本的值,使實際樣本值和預(yù)測值之間的差值總是最小。這部分功能稱為DPCM。2.DPCM量化器自適應(yīng)預(yù)測器逆量化器s(k)+se(k)-d(k)I(k)sr(k)+dq(k)+編碼DPCM發(fā)送端s(k)輸入樣本se(k)預(yù)測樣本值d(k)差值sr(k)重建樣本值dq(k)重建差值I(k)已量化的差值產(chǎn)生誤差產(chǎn)生誤差
e1(n)和e2(n)是量化器和逆量化器的量化噪聲。一般情況下,e1(n)和e2(n)的瞬時值不等,在忽略量化噪聲的情況下,d(k)=I(k)-e1(n)dq(k)=I(k)-e2(n)dq(k)≈d(k)d(k)=s(k)-se(k)sr(k)=se(k)+dq(k)≈se(k)+d(k)=se(k)+s(k)-se(k)=s(k)逆量化器自適應(yīng)預(yù)測器I(k)dq(k)sr(k)DPCM接收端+se(k)
+
發(fā)送端和接收端采用相同的預(yù)測器,進行信號的重建。發(fā)送端和接收端中除了I(k)是數(shù)字信號,其余信號均為時間離散,幅度未量化的物理量。sr(k)=se(k)+dq(k)差值量化系統(tǒng)的信噪比為:
要使SNR增大,可用增大SNRQ和
GP來達(dá)到。
(1)SNRQ為量化器的信噪比,取決于量化器的性質(zhì),一般采用自適應(yīng)量化和非均勻量化可使其增大。(2)GP為差值結(jié)構(gòu)產(chǎn)生的增益,對于給定的語音信號,δs2是固定的,只有減小δd2,DPCM采用自適應(yīng)預(yù)測的思想使δd2最小的方法增大SNR。3.APCM
利用自適應(yīng)的思想改變量化間隔(量階)的大小,即用小的量化間隔去編碼小的差值,使用大的的量化間隔去編碼大的差值,這部分功能稱為APCM。量化器量階自適應(yīng)d(k)I(k)量階Δ(k)APCM發(fā)送端逆量化器量階自適應(yīng)I(k)dq(k)Δ(k)APCM接收端4.ADPCM的簡單框圖
ADPCM編碼結(jié)合了APCM和DPCM兩者的特性,量化器和預(yù)測器均是自適應(yīng)。將I(k),已量化的樣值編碼為4個比特,編碼速率為32kb/s。s(k)+d(k)量化器自適應(yīng)預(yù)測器逆量化器se(k)-
I(k)sr(k)+
dq(k)+編碼發(fā)送端量階自適應(yīng)Δ(k)ADPCM接收端逆量化器自適應(yīng)預(yù)測器I(k)dq(k)sr(k)++se(k)量階自適應(yīng)發(fā)送端輸入樣本:s(k)=se(k)+d(k)接收端輸出重建樣本值:sr(k)=se(k)+dq(k)歸一化輸入差值dln(k)=log2|d(k)|-log2(k)量化電平(I(k)對應(yīng)的碼字)歸一化量化輸出In(k)=log2|I(k)|-log2(k)[3.16+∞]73.34[2.783.16]62.95[2.422.78]52.59[2.042.42]42.23[1.582.04]31.81[0.961.58]21.29[-0.050.96]10.53[-∞-0.05]0-1.05ADPCM的總結(jié)1.編碼方式
當(dāng)d(k)的符號為正,則編碼的碼字最高位b3為0;當(dāng)d(k)的符號為負(fù),則編碼的碼字最高位b3為1。碼字的b2b1b0由表中碼字決定。例如:一個負(fù)的d(k)值,歸一化后落在[3.16+∞],則編碼為1111,歸一化量化輸出為-3.34;若一個正的d(k)值,歸一化后落在[3.16,+∞],則編碼為0111,歸一化量化輸出為3.34。量化器逆量化器s(k)+-se(k)d(k)I(k)dq(k)++編碼sr(k)量階自適應(yīng)++Δ(k)ADPCM發(fā)送端2.ADPCM發(fā)送端工作過程:
輸入樣本s(k),與預(yù)測樣本值se(k)相減后產(chǎn)生差值d(k),對d(k)進行自適應(yīng)量化,對量化器輸出I(k)進行4個比特位的編碼。(1)碼字送給接收端的解碼器;(2)對其進行本地解碼,進行逆量化,得到差值信號dq(k),與預(yù)測信號se(k)相加得到本地重建信號sr(k),利用sr(k)、dq(k),對下一時刻輸入的s(k+1)進行自適應(yīng)預(yù)測,得到se(k+1)。自適應(yīng)預(yù)測器采用六階零點和二階極點。逆量化器I(k)dq(k)sr(k)+se(k)+++量階自適應(yīng)Δ(k)ADPCM接收端3.ADPCM接收端工作過程:
將接收的碼字進行解碼,進行逆量化,得到重建差值信號dq(k),與預(yù)測信號se(k)相加得到重建信號sr(k),利用sr(k)、dq(k)進行自適應(yīng)預(yù)測,得到se(k+1)。自適應(yīng)預(yù)測器和自適應(yīng)量化器采用發(fā)送端的同樣的對應(yīng)結(jié)構(gòu)和算法。根據(jù)碼字,查表得到編碼所對應(yīng)的In(k),一般地,In(k)≈dlqn(k)(歸一化重建差值)利用:dlqn(k)=In(k)=log2|dq(k)|-log2(k)log2|dq(k)|=In(k)+log2(k)
log2|dq(k)|的反對數(shù)變換就是dq(k),其符號由d(k)與一致。由接收的碼字決定。
逆量化過程:子帶-自適應(yīng)差分脈沖編碼調(diào)制
語音信號的參數(shù)編碼一、參數(shù)編碼的特點二、LPC-10編碼器低速率語音編碼的應(yīng)用:蜂窩移動電臺網(wǎng);衛(wèi)星通訊;短波保密通信;
ISDN(IntegratedServiceDigitalNetwork);“語音郵件”、“語音存儲”等新型通信業(yè)務(wù)。一、參數(shù)編碼的特點
由于參數(shù)編碼是針對語音信號的特征參數(shù),所以與波形編碼不同,只是適用于語音信號。
常用的編碼器為線性預(yù)測編碼器。時間(樣點)x(n)x(n-1)x(n-p)p個點線性預(yù)測:LPC語音合成圖清/濁開關(guān)聲道模擬濾波器基音周期脈沖序列發(fā)生器隨機噪聲發(fā)生器LPC系數(shù)增益Gu(n)輸出語音s(n)清音/濁音示意圖:a1語音輸出x’(n)線性預(yù)測分析基音頻率清/濁音判別參數(shù)合成a2ap基音頻率輸入語音x(n)清/濁音標(biāo)志G二、LPC-10編碼器
美國確定LPC-10作為2.4kb/s速率上的推薦編碼形式,用于第三代保密電話中。在其發(fā)送端,原始語音信號采用8kHz采樣,然后每180個采樣值分為一幀(22.5ms),提取語音特征參數(shù)并加以編碼傳送。每幀總共編碼為54bits,每秒傳輸44.4幀,因此總傳輸速率為2.4kb/s。s(n)采樣(8kHz)基音檢測(AMDF)清/濁音檢測預(yù)加重線性預(yù)測分析反射系數(shù)增益G參數(shù)編碼c(n)LPC-10編碼器發(fā)送端預(yù)加重:提高語音譜中的高頻共振峰,使得語音的頻譜較為平滑。短時平均幅度差函數(shù)(AMDF)c(n)解碼清/濁音開關(guān)反射系數(shù)轉(zhuǎn)換為預(yù)測系數(shù)基音增益G合成器去加重噪聲產(chǎn)生s'(n)
LPC-10編碼器接收端語音信號的混合編碼一、混合編碼的特點二、CELP的編碼原理三、RPE-LPT編碼原理一、混合編碼的特點
混合編碼同參數(shù)編碼一樣,依據(jù)語音的線性預(yù)測模型,使用了與波形編碼相匹配的技術(shù),達(dá)到低速率上的高質(zhì)量的語音編碼。目前以CELP為基礎(chǔ)的多種算法已經(jīng)成為國際標(biāo)準(zhǔn)。二、CELP(CodeExcitedLinearPrediction)編碼原理
采用矢量量化技術(shù),對激勵信號進行訓(xùn)練得到一個碼本,每幀語音信號從碼本中選出一個在感覺加權(quán)誤差最小意義上的最佳碼矢量作為激勵源。Hl(z)e(n)x(n)
CELP是近10年來最成功的語音編碼算法。CELP語音編碼算法用線性預(yù)測提取聲道參數(shù),用一個包含許多典型的激勵矢量的碼本作為激勵參數(shù),每次編碼時都在這個碼本中搜索一個最佳的激勵矢量,這個激勵矢量的編碼值就是這個序列的碼本中的序號。CELP已經(jīng)被許多語音編碼標(biāo)準(zhǔn)所采用,美國聯(lián)邦標(biāo)準(zhǔn)FS1016就是采用CELP的編碼方法,主要用于高質(zhì)量的窄帶語音保密通信。
其基本原理是用一個自適應(yīng)碼本中的碼字來逼近語音的長時周期性結(jié)構(gòu),用一個固定隨機碼本中的碼字來逼近語音經(jīng)過短時和長時預(yù)測后的余量信號,從兩個碼本中搜索出來的最佳矢量乘以各自的最佳增益后相加,其和即為CELP激勵信號源。
將激勵信號輸入P階LP綜合濾波器1/A(Z),得到合成語音信號,它與原始語音信號s(n)的誤差經(jīng)過感覺加權(quán)濾波器W(z),得到感覺加權(quán)誤差es(n)。CELP就是利用es(n)的最小平方預(yù)測誤差作為搜索最佳碼矢量及其增益的度量準(zhǔn)則。由于這種算法能最好地逼近原始語音,語音質(zhì)量較好,所以它優(yōu)于脈沖激勵線性預(yù)測。CELP語音編碼示意圖s(n)es(n)2550隨機碼本W(wǎng)(z)誤差最小化原始語音s(n)+-5110自適應(yīng)碼本線性預(yù)測濾波器g1ga++感覺加權(quán)濾波器感覺加權(quán)濾波器
由于掩蔽效應(yīng),在語音頻譜中,能量較高的頻段(共振峰處)的噪聲相對于能量較低的頻段的噪聲不易被感覺。在度量原始語音和合成語音之間的誤差時,在高能量段允許誤差大,因此引入一個頻域的感覺加權(quán)濾波器W(z)來衡量語音之間的誤差。加權(quán)因子在0~1之間,控制共振峰區(qū)域的誤差增加。
CELP有參數(shù)編碼的特征,另一方面在感覺加權(quán)均方誤差最小時,實際上是做了波形的最佳匹配,有波形編碼的特征,所以CELP又被稱為混合編碼。CELP語音編碼的特點
以碼本激勵線性預(yù)測(CELP)原理為基礎(chǔ)的G.729、G.723(G.723.1)話音壓縮編碼技術(shù),是IP電話技術(shù)的一個重要組成部分。以G.729為例,它可將經(jīng)過采樣的64kb/s話音以幾乎不失真的質(zhì)量壓縮至8kb/s。CELP語音編碼的應(yīng)用CELP
原始語音ComparisonAlgorithmBitRateComplexityDelayMeanOpinionScorePCM64Kb/s>1Mips.25ms4.4G.7298Kb/s20Mips10ms4.2ITU-TG.7298kb/sCS—ACELP簡介
G.729是由美國、法國、日本和加拿大的幾家著名國際電信實體聯(lián)合開發(fā)的。它需要符合一些嚴(yán)格的要求,比如在良好的信道條件下要達(dá)到長話質(zhì)量,在有隨機比特誤碼、發(fā)生幀丟失和多次轉(zhuǎn)接等情況下要有很好的穩(wěn)健性等。這種語音壓縮算法可以應(yīng)用在很廣泛的領(lǐng)域中,包括IP電話、無線通信、數(shù)字衛(wèi)星系統(tǒng)和數(shù)字專用線路。
G.729算法采用“共軛結(jié)構(gòu)代數(shù)碼本激勵線性預(yù)測編碼方案”(CS-ACELP)算法。這種算法綜合了波形編碼和參數(shù)編碼的優(yōu)點,以自適應(yīng)預(yù)測編
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 福建師范大學(xué)《外國民族音樂》2021-2022學(xué)年第一學(xué)期期末試卷
- 福建師范大學(xué)《健美操》2022-2023學(xué)年第一學(xué)期期末試卷
- 福建師范大學(xué)《服裝3D設(shè)計與展示》2022-2023學(xué)年第一學(xué)期期末試卷
- 第二章 異常行為的理論模型和治療課件
- 天津市2021年中考化學(xué)真題(含答案)
- 專題05 受力分析和共點力的平衡(一)(含答案)-十年(2014-2023)高考物理真題分項匯編(全國用)
- 2024年煤炭生產(chǎn)經(jīng)營單位(安全生產(chǎn)管理人員)證考試題庫(含答案)
- 其它人員安全記分標(biāo)準(zhǔn)表
- 幼兒園教研課超級擂臺賽教案與反思
- 飛機的結(jié)構(gòu)課件
- 部編人教版三年級下冊語文 中國古代寓言
- 天津的文化創(chuàng)意產(chǎn)業(yè)園區(qū)
- 煤礦土地復(fù)墾與生態(tài)恢復(fù)
- 小學(xué)四年級牛津4AM4U2
- SB/T 10851-2012會議中心運營服務(wù)規(guī)范
- GB/T 20948-2007農(nóng)林拖拉機后視鏡技術(shù)要求
- 綜合驗光儀教學(xué)
- 貧血的診療與護理考核試題及答案
- 前置胎盤詳解課件
- 浙教版勞動五年級上冊項目三 任務(wù)一《探索生活中的LED燈》課件
- 南京市小學(xué)一年級語文上學(xué)期期中試卷
評論
0/150
提交評論