版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、語音編碼總結(jié)一、歷史與概念1、模擬的聲音信號話音信號:(口語發(fā)聲的)200Hz3400Hz調(diào)幅廣播信號:(無線廣播)50Hz到7000Hz調(diào)頻廣播信號:(無線廣播)20Hz到16000Hz激光唱機信號(CD):10Hz20000Hz2、話音編碼技術(shù)的歷史回顧 話音編碼研究的歷史表明,這一領(lǐng)域的研究成果直接為通信產(chǎn)業(yè)發(fā)展提供了源動力。目前IP電話所用的編碼的標準有G.723.1, G.728, G.729。具有低延遲、低碼率、低復雜性、高音質(zhì)的話音編碼算法將是未來IP電話網(wǎng)絡的奠基石。 3、若干概念術(shù)語(1)數(shù)字信號:標稱的不連續(xù)信號。它可以用離散的步差從一個狀態(tài)轉(zhuǎn)變到另一個狀態(tài)。(2)采樣:按
2、周期T對模擬信號進行測量,稱為采樣。采樣頻率Fs=1/T.在滿足奈奎斯特定理時,從采樣值可準確的恢復原信號。(3)量化用數(shù)字信號表示話音的過程稱為量化。(4)非均勻量化 非均勻量化可以兼顧動態(tài)范圍和小信號的系統(tǒng)精度。Reeves提出概念。即對大信號取較大的量化步長。對小信號取較小的量化步長。二、矢量量化 將k個樣點構(gòu)成的有序集(信源矢量集合)映射為M個恢復失量構(gòu)成的有限集A(碼書,碼本)中的某個矢量Yi(碼字,碼元)的映射,稱為矢量量化,它是對標量量化在K維空間的一個推廣。標量量化 矢量量化 量化對象 單個采樣點 K個采樣點 集合劃分
3、;在一維幅度軸上劃分有限個區(qū)間 1=a0 a1)Dn=an-1 an)在k維空間里,劃分成有限個子空間S=Si|i=1,2,M 量化過程 在每個區(qū)間里,選一個代表值 fiÎDi I=1,2,n在每個子空間里,選一個代表矢量Yi=Yi1,Yi2,Yii Yi ÎSi i=1,2,M量化方法 對任一模擬信號,當其標稱 值 屬于區(qū)間Di時,就用數(shù)字信號fi代表值 對任一k維模擬信號的矢量。 當其標
4、稱值屬于子區(qū)間Si時,就用代表矢量Yi去量化之。 1、 碼本設計的LBG方法(1)在矢量空間X中,進行最佳劃分,即,把X劃分成M個子空間Si i=,1.2.m 使平均失真最小。(2)對劃分后的子空間Si求出其形心作為新的最佳代表矢量Yi,從而構(gòu)成新的碼本。將上述步驟反復迭代,最終求出最佳碼本和量化器。(3)初始碼本的選擇:A、隨機選取,迭代時間較長B、分裂法(4)LBG方法不是最優(yōu)化方法,即迭代過程不能保證收斂到全局最小值。 后來有人提出模擬退火法,將LBG方法收斂到局部最小值時,采用某種擾動將迭代過程繼續(xù)進行下去。 2、空間分布對矢量量化的影響LBG算法把問題簡化為:在矢量空間中,
5、樣點的分布是均勻的。但實際的應用場合往往不滿足這個前提。因此應考慮空間分布,空間分布對量化值的選擇有很重要的影響。對矢量的情況,影響依然存在。3、語音編碼方案的三種類型 語音編碼的主要任務:對量化的話音信號施加某種數(shù)字變化,使其具有適于數(shù)字信道傳輸?shù)男问?,同時盡可能多信號所承載的信息。話音信號的剩余度主要表現(xiàn)在三個方面:(1)相鄰樣點存在較強的相關(guān)性(2)對濁音信號存在周期(準周期)性(3) 信號短時平穩(wěn),時不變性 此外,人類聽覺對話音有選擇效應,即當一個強音與一個弱音同時存在時,人類聽覺能夠自動抑制弱音的效果,稱為人耳的“掩蔽效應”。這些是話音壓縮編碼的出發(fā)點。3.1 波型編碼:對話音信號的
6、每一個樣點進行量化、編碼和傳輸。 因此,波型編碼是沒有延遲的話音編碼方案。3.1.1 差值脈碼調(diào)制(DPCM和-調(diào)制) 一位的DPCM系統(tǒng)成為-調(diào)制或增量調(diào)制DM。流程圖如下: 這里,表示對應的量化值,上標 表示對應的預測值,用 ei 表示差值di的量化誤差。收端恢復的量化信號只與差值信號的量化誤差有關(guān),而與預測器性質(zhì)無關(guān)。(1)當信號變化快時,恢復波形跟不上信號的變化,稱為”斜率過載“(2)對于零信號,DM方法交替輸出一串0和1,這種隨機交變電平成為“顆粒噪聲”。解決辦法是在量化器引入自適應階矩調(diào)整機制(ADM)。如果自適應調(diào)整依據(jù)輸入信號,稱為前向自適應。如果自適應調(diào)整依據(jù)是量化器輸,稱為
7、后向自適應。前向自適應將導致延遲的產(chǎn)生,后向自適應有可能不穩(wěn)定。 3.1.2 連續(xù)可變斜率增量調(diào)制(CVSD)其原理可用下圖說明: 當反饋回路中,出現(xiàn)連續(xù)四個“1”或連續(xù)四個“0”時,表明系統(tǒng)出現(xiàn)斜率過載的情況,此時或門輸出一個高電平,驅(qū)動觸發(fā)器改變量化的階矩的大小,以便適應輸入信號的變化。3.1.3 自適應差值脈碼調(diào)制(ADPCM)PCM:非均勻量化。D:調(diào)制。差值調(diào)制。CVSD:自適應概念 將脈碼調(diào)制、差值調(diào)制和自適應技術(shù)三者結(jié)合起來。使編碼算法不僅適用于幅值起伏較大的話音信號,而且能很好的適合于平穩(wěn)信號(如話帶數(shù)據(jù))。3.1.4信息壓縮的基本思路1、信息與消息(1)消息是由符號、數(shù)字、文
8、字或語言組成的序列。(2)信息是消息中不確定的內(nèi)容。消息是信息的載體,信息是消息的內(nèi)含。由于信息是消息中承載的不確定性因素(差別、變化、區(qū)別等),因此必然與通信雙方的知識(約定)有關(guān)。越少見的事件,其出現(xiàn)帶來的信息越多2、信息壓縮的主要手段(1)減少不確定性差值編碼:相當于用前一個值來預測當前值,引出線性預測的概念(2)通信雙方建立某種知識約定,如碼書或算法(3)對變化的規(guī)律、不確定性因素建立描述機制或?qū)W習機制 3.2 參數(shù)編碼就是對每幀語音信號,將濾波器系數(shù)和殘差e(n)分別進行量化編碼。由于e(n)的平均能量和幅度變化范圍遠遠小于信號s(n),因此在信噪比相同的條件下,可以用較少的比特對其
9、編碼。參數(shù)編碼時,將激勵按清音、濁音分成高斯隨機白噪聲或準周期信號。倒譜參數(shù)C(n)構(gòu)成的同態(tài)聲碼器,用共振峰參數(shù)構(gòu)成的共振峰聲碼器,都是參數(shù)編碼方法。1、基音提?。翰⒙?lián)基音提取方法。(1)短時平均幅度差函數(shù)AMDF(2)中心削波法是對信號的一個非線性變換:式中,Cl稱為削波電平,它取信號最大值Smax的一個百分比(3080)(3)三電平中心削波函數(shù)用YS(n)表示三電平中心削波器的輸出,在自相關(guān)函數(shù)中有用三電平中心削波信號計算自相關(guān)函數(shù),找到自相關(guān)函數(shù)最大值,并將峰值與一個固定門限例如Rn(0)的1/3比較,如果低于門限判為清音,如果高于門限則最大峰位置判為基音周期。2、并聯(lián)基音提取基本方法
10、原理:(1)先對信號進行處理產(chǎn)生若干沖激串,沖激串只保留原始信號的周期性而去除了與基音檢測無關(guān)的信息。(2)估計每個沖激串的周期。(3)對這些周期進行邏輯判斷,最后確定語音信號的周期,將進過低通濾波的信號按如下原則求出六個沖激串3.3 混合編碼 波形編碼音質(zhì)好但碼率高,參數(shù)編碼可以獲得很低的碼率但音質(zhì)不好,為了兼顧二者的長處和不足,提出了殘差激勵模型,多脈沖激勵模型和碼激勵模型。此外,對LPC參數(shù)模型也提出了噪聲加權(quán)整形技術(shù)和長時預測濾波器等方法。1、混合編碼中的新技術(shù)(1)長時預測濾波器濁音信號存在準周期性,當用濾波器描述語音信號時,殘差序列e(n) 保留著中準周期性。為此,用一個稱為長時預
11、測濾波器的B(z)來去除這種準周期性。式中M是對應于基音周期的樣點數(shù)。I根據(jù)濾波器階數(shù)一般取0或1。殘差e(n)經(jīng)B(z)濾波器濾波后將得到更加白化的噪聲譜。 2、噪聲整形 信號經(jīng)短時長時濾波后,噪聲譜一般是平坦的。由于在兩個共振峰之間,信號譜低于噪聲譜,因此盡管總的信噪比是高的,但在陰影區(qū)域?qū)念l率上,噪聲能明顯被人耳感覺到。采用噪聲譜變形后,總的信噪比有所降低,但在所有頻率上信號的能量大于噪聲的能量,由于人耳的選擇性,可以形成對噪聲的聽覺屏蔽效應,所以采用噪聲整形。3、合成分析法(Analasys By Sythesis A-B-S) 波形編碼器內(nèi)一般要嵌入一個解碼器,使得解碼信號與原始
12、信號作差,提供一個比較信息或形成后向自適應。在參數(shù)編碼時也用這一類方法,將合成信號與原始信號作差(加權(quán))并比較,以次為依據(jù)進行參數(shù)修正或選擇激勵,這種方法稱為A-B-S。LPC編碼方法的二元激勵模型過于簡化。(1)多脈沖激勵線性預測編碼器 MPLPC的關(guān)鍵問題是,如果一幀中允許用M個激勵脈沖,如何求出這M個脈沖的位置和幅度,使得合成語音與原始語音的感覺加權(quán)均方誤差最小。用自相關(guān)法求出短時濾波器A(z)后經(jīng)聽覺加權(quán)處理,其沖擊響應為:它們激勵綜合濾波器合成語音信號為: (2) 規(guī)則脈沖激勵線性預測編碼器(RPE-LPC)規(guī)則脈沖是多脈沖的一種,即脈沖間隔固定的多脈沖激勵。對于規(guī)則脈沖激
13、勵,算法可以簡化。其結(jié)構(gòu)圖如下:規(guī)則脈沖是讓原始語音經(jīng)短時濾波后的信號r(n)與激勵信號作差,然后對感覺加權(quán)后的差值信號求均方誤差最小來確定最佳激勵。 規(guī)則脈沖激勵的問題是A、確定規(guī)則脈沖最佳的相位 B、為每個非零脈沖確定一個幅度。(4)碼激勵 CELP通過LPC分析去除信號的短時相關(guān)性,再用長時基音分析去除基音周期性,得到的是信號具有高斯白噪聲特性。(5)G.728 低延遲碼激勵話音編碼算法(LD-CELP)A、特點 a、每5個樣點為一幀,延遲為0.625msb、采用50階LPC濾波器,不用長時預測和基音檢測c、50階LPC濾波器參數(shù)每4幀(20個樣點,2.5ms)更新一次,具有時變參數(shù)特性
14、d、3位增益碼書,7位波形碼書的結(jié)構(gòu),增益碼書與波形碼書分別有0.5位冗余e、采用后向濾波技術(shù),因此不傳遞參數(shù)信息,只傳遞激勵信息f、采用對數(shù)增益濾波技術(shù),有效地降低碼書尺寸B、G.728原理可歸納為一個判據(jù) ,三個模塊。1) 判據(jù)2) LPC分析模塊:3) 包括四個濾波器:a. 50階綜合濾波器 b. 10階感覺加權(quán)濾波器 c. 10階對數(shù)增益濾波器 d. 10階后濾波器(6)G.729:共軛結(jié)構(gòu)的代數(shù)碼激勵 CS-ACELP G.729編碼器屬于CELP型編碼器,幀長為10ms,采樣率為8kHz。通過對輸入語音信號進行分析,提取出CELP模型參數(shù),包括線性預測濾波器系數(shù)、自適應碼書和代數(shù)碼
15、書的標號和增益,將這些參數(shù)編碼后發(fā)往解碼器。 A、編碼器原理框圖 B、解碼器原理 解碼器對接收到的碼流進行解碼,得到對應的編碼器參數(shù),利用這些參數(shù),構(gòu)成重建語音,再將重建語音送給后處理級,后處理級包括基于長時和短時合成濾波器的后濾波器,后面跟有一個高通濾波器和幅度調(diào)節(jié)單元。 C、加窗LP分析窗由兩部分組成:第一部分是半個哈明窗,第二部分是四分之一個余弦函數(shù)窗D、感覺加權(quán)濾波器濾波器系數(shù)ai是通過對輸入語音進行LP分析而得到的,ai值每幀更新一次,以達到加權(quán)的作用。E、開環(huán)基音分析為降低搜索閉環(huán)基音的復雜性,可以先把搜索范圍限制在開環(huán)基音Top附近。開環(huán)基音延遲是對加權(quán)輸入語音信號sw(n)進行分析得到的,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 燙傷的防治和護理
- 成都職業(yè)技術(shù)學院《公文寫作》2023-2024學年第一學期期末試卷
- 2024年生物質(zhì)能項目融資借款合同范本3篇
- 二零二五年度企業(yè)文化墻設計施工合同2篇
- 疫情施工方案
- 2024年版高級家政人員聘用合同
- 二零二五年度一致行動人新能源技術(shù)研發(fā)與產(chǎn)業(yè)化合作協(xié)議2篇
- 二零二五年度倉儲租賃與跨境電商平臺合作服務協(xié)議3篇
- 二零二五年婚姻財產(chǎn)分割專項補充協(xié)議2篇
- 青石板鋪設施工方案
- 四川省普通高中2024屆高三上學期學業(yè)水平考試數(shù)學試題(解析版)
- 石油鉆井機械設備故障預防與維護保養(yǎng)范本
- 浙江省溫州市2023-2024學年七年級上學期期末數(shù)學試卷(含答案)
- 【全國最火爆的團建項目】旱地冰壺(拓展訓練服務綜合供應平臺)
- 北京市西城區(qū)2023-2024學年五年級上學期期末數(shù)學試卷
- 工程結(jié)算課件
- CNAS-CL02-A001:2023 醫(yī)學實驗室質(zhì)量和能力認可準則的應用要求
- 海康威視槍機攝像機檢測報告.文檔
- 部編小語一下三單元(《小公雞和小鴨子》《樹和喜鵲》《怎么都快樂》)大單元學習任務群教學設計
- 體檢中心組織架構(gòu)
- 森林撫育投標方案
評論
0/150
提交評論