數(shù)字通信原理 第3章_第1頁
數(shù)字通信原理 第3章_第2頁
數(shù)字通信原理 第3章_第3頁
數(shù)字通信原理 第3章_第4頁
數(shù)字通信原理 第3章_第5頁
已閱讀5頁,還剩169頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第三章語言信號(hào)壓縮編碼3.1語言信號(hào)壓縮編碼的基本概念3.2自適應(yīng)差值脈沖編碼調(diào)制3.3參量編碼3.4混合編碼3.5低速率語言壓縮編碼的應(yīng)用一.壓縮編碼原因語音信號(hào)的壓縮編碼是研究如何降低語音信號(hào)編碼速率的問題。以語音信號(hào)為例,模擬形式下帶寬一般不到4KHz,經(jīng)過調(diào)制后,所需傳輸帶寬不會(huì)超過8KHz。

但是以8KHz抽樣,并且每個(gè)樣值用8位二進(jìn)制代碼表示時(shí),即采用A率13折線PCM數(shù)字語音信號(hào)時(shí),信息速率為64Kbit/s。利用二進(jìn)制理想基帶傳輸系統(tǒng)傳輸一路這樣的數(shù)字語音信號(hào)。所占系統(tǒng)的最小頻帶寬度為32KHz。頻帶利用率=傳輸速率/帶寬二.什么是語音壓縮編碼?

把數(shù)碼率低于64Kbit/s的語音編碼方法稱為語音壓縮編碼技術(shù)三.語音編碼分類根據(jù)編碼器的實(shí)現(xiàn)機(jī)理,分成三大類波形編碼參數(shù)編碼混合編碼了解語音信號(hào)數(shù)字化的目的和要求;理解語音信號(hào)的波形編碼、參數(shù)編碼、混合編碼的定義;掌握對(duì)語音編碼信號(hào)性能的評(píng)價(jià)方法。理解標(biāo)量量化和矢量量化的原理及異同點(diǎn)。了解語音信號(hào)的參數(shù)模型;掌握線性預(yù)測的概念、線性預(yù)測聲碼器的工作原理。掌握參數(shù)編碼中合成分析算法的基本原理和優(yōu)缺點(diǎn);了解常用的語音信號(hào)的混合編碼方法。要求語音編碼方法的分類:波形編碼參數(shù)編碼混合編碼一、語音編碼的方法1.語音信號(hào)的波形編碼原理:從語音信號(hào)波形的特點(diǎn)出發(fā),在時(shí)間軸上對(duì)模擬語音按一定的速率抽樣,對(duì)波形的采樣值,或其預(yù)測值,或其預(yù)測的誤差值進(jìn)行量化并編碼,編碼后的信號(hào)為二進(jìn)制數(shù)字序列。解碼是其反過程,將收到的數(shù)字序列經(jīng)過解碼和濾波恢復(fù)成模擬信號(hào)。一、語音編碼的方法特點(diǎn):以重構(gòu)語音波形為目的,力圖使重建語音波形保持原語音信號(hào)的波形形狀。適應(yīng)能力強(qiáng)、語音質(zhì)量好。編碼速率高。在16至64kbit/s的速率上獲得較高的編碼質(zhì)量,當(dāng)速率進(jìn)一步下降時(shí),其性能會(huì)下降較快。一、語音編碼的方法常見的波形編碼方式:脈沖編碼調(diào)制(PCM)、增量調(diào)制(△M)自適應(yīng)增量調(diào)制(ADM)、自適應(yīng)預(yù)測編碼(APC)、自適應(yīng)差分編碼(ADPCM)子帶編碼(SBC)

一、語音編碼的方法2.語音信號(hào)的參量編碼原理:

從語音信號(hào)的產(chǎn)生機(jī)理出發(fā),構(gòu)造語音信號(hào)的模型,提取描述語音信號(hào)的特征參數(shù),對(duì)模型參數(shù)或其預(yù)測值進(jìn)行編碼。在收端,根據(jù)特征參數(shù)通過模型重構(gòu)語音信號(hào)。

一、語音編碼的方法特點(diǎn):編碼速率低,可壓縮到2kbit/s-800bit/s;合成的話音質(zhì)量差,只能達(dá)到中等,自然度較低;不以重構(gòu)語音波形為目的,在解碼端重構(gòu)一個(gè)新的有相似聲音但波形不盡相同的語音信號(hào)。常見的方式:線性預(yù)測編碼(LPC),及其各種改進(jìn)型,如MBE等。一、語音編碼的方法3.語音信號(hào)的混合編碼原理:

混合編碼將波形編碼和參量編碼組合起來,克服了原有波形編碼和參量編碼的弱點(diǎn),結(jié)合各自的長處,力圖保持波形編碼的高質(zhì)量和參量編碼的低速率,目前在1.2-16Kbit/s速率上能夠得到高質(zhì)量的合成語音。特點(diǎn):

低速率、高質(zhì)量一、語音編碼的方法常見混合編碼方式:多脈沖激勵(lì)線性預(yù)測編碼(MPLPC)規(guī)則脈沖激勵(lì)線性預(yù)測編碼(RPELPC)碼本激勵(lì)線性預(yù)測編碼(CELP)矢量和激勵(lì)線性預(yù)測編碼(VSELP)多帶激勵(lì)(MBE)及改進(jìn)型IMBE(ImprovedMBE)和AMBE(AdvancedMBE)混合激勵(lì)線性預(yù)測(MELP)一、語音編碼的方法說明上述語音編碼器的分類方法只是一種較通用的方法,并非十分嚴(yán)格。除了傳統(tǒng)的波形編碼器和參數(shù)編碼器以外,許多新型的語音編碼技術(shù)都比較復(fù)雜,很難嚴(yán)格分類。基于分析合成技術(shù)的線性預(yù)測編碼器則既可以視為參量編碼,也可以視為混合編碼。一、語音編碼的方法語音編碼性能評(píng)價(jià)的參量:

1、語音編碼質(zhì)量

2、編碼速率

3、編解碼的復(fù)雜度

4、編解碼延時(shí)語音編碼的基本目標(biāo):在給定編碼速率的條件下,用盡量小的編解碼延時(shí)和復(fù)雜度,得到盡量好的重建語音質(zhì)量。二、語音編碼性能的評(píng)價(jià)1、語音編碼質(zhì)量

語音編碼質(zhì)量是衡量語音編碼算法優(yōu)劣的關(guān)鍵性能之一,在數(shù)字通信中常把語音質(zhì)量分為四級(jí):廣播級(jí)質(zhì)量長途電話質(zhì)量通信質(zhì)量合成語音質(zhì)量二、語音編碼性能的評(píng)價(jià)

語音編碼質(zhì)量用質(zhì)量評(píng)估指標(biāo)衡量,分為以客觀評(píng)定方法和主觀評(píng)定方法兩大類。

主觀評(píng)定方法是以人類聽話時(shí)對(duì)語音質(zhì)量的感覺來評(píng)定。國際上常用的主觀評(píng)定標(biāo)準(zhǔn)主要有:

平均意見得分MOS(MeanOpinionScore)判斷韻字測試DRT(DiagnosticRhymeTest)判斷滿意度測量DAM(DiagnosticAcceptabilityMeasure)可懂度指數(shù)AI(ArticulationIndex)二、語音編碼性能的評(píng)價(jià)MOS評(píng)定方法

由于語音質(zhì)量高低的直接感受者是聽眾的主觀感覺,因此目前廣泛采用的評(píng)定方法是MOS。獲取MOS的方法是,由數(shù)十名試聽者在不同的信道環(huán)境中試聽并給予評(píng)分,然后求出統(tǒng)計(jì)平均分。

分?jǐn)?shù)等級(jí)采用5級(jí)分制:5分為優(yōu),4分為良,3分為中,2分為差,1分為不可接受。4分以及4分以上為高質(zhì)量語音編碼,達(dá)到長途電話質(zhì)量,3.5分左右為通信級(jí)質(zhì)量,3分以及3分以下為合成語音質(zhì)量。二、語音編碼性能的評(píng)價(jià)

對(duì)應(yīng)于主觀評(píng)定等級(jí),還有一個(gè)收聽注意力等級(jí)(ListeningEffortScale)。表2.1給出了主觀評(píng)定等級(jí)制的質(zhì)量等級(jí)、分?jǐn)?shù)和相應(yīng)的收聽注意力等級(jí)。二、語音編碼性能的評(píng)價(jià)客觀評(píng)價(jià)的方法:

時(shí)域:信噪比、加權(quán)信噪比、平均分段信噪比等 頻域:譜失真測度、LPC倒譜距離測度等說明:以上方法都建立在度量均方誤差的基礎(chǔ)上,其特點(diǎn)是計(jì)算簡單,但不能完全反映人對(duì)語音質(zhì)量的感覺,對(duì)于速率為16kb/s以下的中低速率語音編碼尤為突出。主要適用于速率較高的波形編碼的質(zhì)量測量。二、語音編碼性能的評(píng)價(jià)2.編碼速率語言編碼后的速率用“比特/秒”度量或用“比特/樣點(diǎn)”度量。后者表示平均每個(gè)樣點(diǎn)所需的編碼比特?cái)?shù)。通常編碼速率高,則編碼后的語音質(zhì)量高,但所需的傳輸帶寬就寬。

二、語音編碼性能的評(píng)價(jià)

好的語音編碼方法,是在保持語音質(zhì)量的前提下降低速率。3.編解碼的復(fù)雜程度編解碼的復(fù)雜度與算法有關(guān)。

通常算法復(fù)雜,則話音質(zhì)量好,編碼速率低,但實(shí)現(xiàn)復(fù)雜,且體積大、功耗高、成本高,甚至編解碼延時(shí)大。二、語音編碼性能的評(píng)價(jià)二、語音編碼性能的評(píng)價(jià)4.編解碼延時(shí)編解碼延時(shí)也與算法有關(guān)。

通常算法復(fù)雜,則編解碼延時(shí)大。也有專為減小延時(shí)的短延時(shí)算法。不過,質(zhì)量好、延時(shí)短的算法,相應(yīng)的編碼速率也高。5.對(duì)語音編碼的要求在滿足用戶對(duì)語音質(zhì)量要求的前提下,編碼速率 盡可能低。在強(qiáng)噪聲環(huán)境中,算法應(yīng)有較好的抗誤碼性 能,也就是說,當(dāng)誤碼率較低時(shí)(例如為10-2) 仍能保持良好的話音質(zhì)量。編、解碼延遲應(yīng)控制在幾十毫秒之內(nèi),越短越 好。復(fù)雜性要適度,以便于使用大規(guī)模集成器件。二、語音編碼性能的評(píng)價(jià)二、語音編碼性能的評(píng)價(jià)6.幾種語音編碼的質(zhì)量比較LD-CELP:低時(shí)延-碼激勵(lì)線性預(yù)測MP-MLQ:多脈沖最大似然量化ACELP:代數(shù)碼激勵(lì)線性預(yù)測CS-ACELP:共軛結(jié)構(gòu)-代數(shù)碼激勵(lì)線性預(yù)測三、語音編碼的標(biāo)準(zhǔn)ETSI:歐洲電信標(biāo)準(zhǔn)協(xié)會(huì)TIA:(北美)電信工業(yè)協(xié)會(huì)RCR:(日本)無線通信系統(tǒng)研究發(fā)展中心DVSI:數(shù)字聲音系統(tǒng)公司三、語音編碼的標(biāo)準(zhǔn)保密電話語音編碼標(biāo)準(zhǔn)三、語音編碼的標(biāo)準(zhǔn)

窄帶保密電話應(yīng)用于帶寬受限信道,目前只有美國公布了所用保密電話的標(biāo)準(zhǔn)。

FS-1015標(biāo)準(zhǔn):2.4kb/s的LPC聲碼器,DRT為90%FS-1016標(biāo)準(zhǔn):4.8kb/s的CELP聲碼器,比FS-1015具 有好得多的自然度及環(huán)境噪聲能力?;旌霞?lì)線性預(yù)測(MELP)標(biāo)準(zhǔn):編碼速率為 2.4kb/s,語音質(zhì)量優(yōu)于FS-1016。各種語音編碼標(biāo)準(zhǔn)的相對(duì)效果三、語音編碼的標(biāo)準(zhǔn)第三章語言信號(hào)壓縮編碼3.1語言信號(hào)壓縮編碼的基本概念3.2自適應(yīng)差值脈沖編碼調(diào)制3.3參量編碼3.4混合編碼3.5低速率語言壓縮編碼的應(yīng)用自適應(yīng)差值脈沖編碼調(diào)制原理(ADPCM)3.1.1差值脈沖編碼(DPCM)1.編碼思想提高通信質(zhì)量必須減小量化誤差減小量化級(jí)當(dāng)抽樣值范圍確定時(shí)增加編碼位數(shù)N增加編碼位數(shù)可獲得大的信噪比在編碼位數(shù)固定時(shí),減小抽樣值的變化范圍,也同樣可以提高信噪比即:若縮小抽樣值(被編碼信號(hào))的變化范圍,就可以在保證信噪比不變的情況下,減小編碼的位數(shù)。這就是差值編碼的中心思想

二、差值編碼模型圖在原來的抽樣值中減去某一個(gè)值,然后對(duì)兩者之差進(jìn)行編碼。在接收端將解碼值再加上發(fā)送端所減去的值便可恢復(fù)出原始值。

x(n)

+

d(n)

c(n)

d(n)

x(n)

-

x(n)

x(n)

差值編碼模型譯碼+編碼+圖中:x(n)是原始樣值(n時(shí)刻的抽樣值)x(n)為減去量d(n)=x(n)-x(n)為差值可以看出:(1)、d(n)越小,在相同的編碼位數(shù)時(shí)信噪比越大(2)、收發(fā)端必須有相同的減去量x(n)根據(jù)前些時(shí)刻的樣值來預(yù)測現(xiàn)時(shí)刻的樣值,只要傳遞預(yù)測值和實(shí)際值之差,而不需要每個(gè)樣值的編碼都傳。這種方法就稱為DPCM編碼。三、DPCM系統(tǒng)1、DPCM系統(tǒng)的概念:舉例來說,設(shè)以1/Ts的速率對(duì)信號(hào)S(t)抽樣,在時(shí)刻前可得到,,

等一組樣值.以前面N個(gè)樣值作為基礎(chǔ)對(duì)的預(yù)測值是不同時(shí)刻樣值的加權(quán)系數(shù):根據(jù)相關(guān)性情況,可設(shè)為常量或變量2、實(shí)現(xiàn)預(yù)測的橫向?yàn)V波器(N階預(yù)測器)在每個(gè)抽樣時(shí)刻到來時(shí),濾波器輸出將會(huì)給出下一個(gè)樣值的預(yù)測值。一般來說,在抽樣時(shí)刻t=nTs時(shí)所得的預(yù)測值與真正的樣值并不相同。N階預(yù)測器輸出:差值脈沖編碼就是對(duì)真正的樣值與過去的樣值為基礎(chǔ)得到的估值

之間的差值進(jìn)行量化和編碼。3、DPCM系統(tǒng)模型框圖量化器預(yù)測器預(yù)測器下張22圖中:x(n)為抽樣信號(hào)的實(shí)際值d(n)=x(n)-x(n)圖x(n)=x(n)+d(n)該系統(tǒng)的量化誤差可以表示為:e(n)=x(n)-x(n)

=[d(n)+x(n)]-[x(n)+d(n)]

=d(n)-d(n)上式表明:DPCM系統(tǒng)的傳輸誤差就是差值d(n)的量化誤差.4、DPCM系統(tǒng)的抗噪聲性能分析系統(tǒng)信噪比定義為:SNR===預(yù)測器增益量化器的量化信噪比GP<1GP>1預(yù)測器有增益加預(yù)測器后反而不利GP:DPCM系統(tǒng)相對(duì)于PCM系統(tǒng)而言的信噪比增益。量化器產(chǎn)生的信噪比即非預(yù)測的PCM系統(tǒng)的量化信噪比提高系統(tǒng)信噪比采取的措施SNR=減小x(n)精確d(n)d(n)=x(n)-x(n)最佳預(yù)測量化誤差最佳量化小結(jié)一.壓縮編碼的原因二.什么是語音壓縮編碼三.語音編碼分類3.1ADPCM系統(tǒng)3.3.1DPCM一.差值編碼思想二.差值編碼系統(tǒng)模型圖三.DPCM系統(tǒng)1.概念2.預(yù)測器模型圖3.DPCM系統(tǒng)模型4.DPCM系統(tǒng)的抗噪聲性能分析自適應(yīng)差值脈沖編碼調(diào)制(ADPCM)1、實(shí)質(zhì):DPCM+自適應(yīng)量化和自適應(yīng)預(yù)測固定預(yù)測固定量化2、定義能夠?qū)崿F(xiàn)自適應(yīng)預(yù)測功能,或者自適應(yīng)量化功能或者同時(shí)實(shí)現(xiàn)兩種自適應(yīng)功能的DPCM系統(tǒng)稱為ADPCM系統(tǒng)。3.設(shè)計(jì)的目的

ADPCM充分利用了語音波形的統(tǒng)計(jì)特征和人耳聽覺特性,其設(shè)計(jì)思路主要瞄準(zhǔn)了兩個(gè)目標(biāo):a:盡可能去掉語音信號(hào)中的冗余信號(hào)b:以有效的方式將可用比特分配給語音信號(hào)對(duì)消除冗余后的信號(hào),從自適應(yīng)角度進(jìn)行最佳編碼1.1預(yù)測的自適應(yīng)(1).極點(diǎn)預(yù)測器1.預(yù)測器的結(jié)構(gòu)(用重建信號(hào)x(n)進(jìn)行的預(yù)測)+量化器預(yù)測器+X(n)X(n)d(n)d(n)編碼X(n)P(Z)X(n)a:極點(diǎn)預(yù)測器的DPCM方框圖b:預(yù)測器傳遞函數(shù)P(z)

N階預(yù)測器公式:X(n)=進(jìn)行Z變換后得:則預(yù)測器的傳遞函數(shù)為:為預(yù)測系數(shù)c:重建濾波器+預(yù)測器x(n)x(n)X(n)d(n)H(Z)重建濾波器==E[x(n)]+E[x(n-1)]-2E[x(n)x(n-1)]22=2E[x(n)]-2E[x(n)x(n-1)]2分析:==(2)一階最佳線性預(yù)測求最佳預(yù)測系數(shù)h1N=1時(shí);X(n)=h1x(n-1)則差值信號(hào)為:d(n)=x(n)-h1x(n-1)+E[d(n)]=2=E{[x(n)-h1x(n-1)]}2=E[x(n)]+h1E[x(n-1)]-2h1E[x(n)x(n-1)]22=2-=2求使最小的h1的值2令得最佳預(yù)測系數(shù)h1opt=p1當(dāng)N=1時(shí)的最大預(yù)測增益為:b.二階線性預(yù)測(N=2)d(n)=x(n)-h1x(n-1)-h2x(n-2)=E[d(n)]2=E{[x(n)-h1x(n-1)-h2(n-2)]}2令得最佳h1,h2大于或者等于零故二階預(yù)測器總是優(yōu)于一階預(yù)測器第三章語言信號(hào)壓縮編碼3.1語言信號(hào)壓縮編碼的基本概念3.2自適應(yīng)差值脈沖編碼調(diào)制3.3參量編碼3.4混合編碼3.5低速率語言壓縮編碼的應(yīng)用波形編碼的語音質(zhì)量較高,實(shí)現(xiàn)簡單,但速率較高占頻帶較寬,因而將影響通信系統(tǒng)的容量。尋求低速高質(zhì)的語音編碼方法一直是數(shù)字通信領(lǐng)域的一個(gè)重要研究課題。一個(gè)重要概念:對(duì)反映語音信號(hào)特征的參量進(jìn)行編碼與傳輸而不是對(duì)信號(hào)的時(shí)域波形本身,即所謂參量編碼??纱蟠蠼档途幋a信號(hào)的速率。參量編碼的基礎(chǔ)是語音信號(hào)特征參數(shù)的提取與語音信號(hào)的恢復(fù),這將涉及到語音產(chǎn)生的物理模型。一、語音信號(hào)產(chǎn)生模型及其特征參數(shù)

人的發(fā)音系統(tǒng)由聲帶、聲道及次聲門系統(tǒng)構(gòu)成。聲道從聲帶的開口即聲門處開始,直至嘴唇,包括咽喉、口、舌等。聲道的截面積是可變化的,它取決于舌、唇等器官的位置。次聲門系統(tǒng)由肺、氣管等級(jí)聯(lián),是產(chǎn)生語音的能量來源。簡化的發(fā)音系統(tǒng)如圖所示。

濁音與清音濁音又稱為有聲音:氣流通過聲門時(shí),如果聲帶振動(dòng)并產(chǎn)生一個(gè)準(zhǔn)周期的空氣脈沖激勵(lì)聲道,就得到濁音。典型的濁音波形如圖所示,其中(a)為聲門處的氣流速度,(b)為通過聲道后在唇口處形成的聲壓波形,濁音波形具有明顯準(zhǔn)周期性。聲帶振動(dòng)的頻率稱為基音頻率fb,周期為基音周期Tp,基音頻率fb一般在70~300Hz的范圍內(nèi),相當(dāng)于Tp為3~15ms。基音周期Tp是語音信號(hào)的主要特征之一。清音又稱無聲音:聲道在某處發(fā)生收縮,同時(shí)迫使空氣以高速?zèng)_過一收縮部位而產(chǎn)生湍流,就得到清音。發(fā)清音時(shí)聲帶不振動(dòng),此時(shí)是由湍流建立的寬帶噪聲源激勵(lì)著聲道。清音波形類似于噪聲,如圖(c)所示。聲道的無損聲管模型聲道包括口腔和鼻腔,相當(dāng)于一個(gè)非均勻截面的管道。當(dāng)產(chǎn)生聲音的氣流順著這個(gè)管道傳播時(shí),其頻譜特征就由管道的選擇性所改變聲道的諧振頻率稱為共振峰頻率,簡稱共振峰,其中第一共振峰就是上面提到的基音頻率fb。聲道截面面積與聲道長度方向之間的依賴關(guān)系稱為聲道的面積函數(shù),聲道諧振特性主要取決于其面積函數(shù)。實(shí)際聲道可以用一個(gè)級(jí)聯(lián)的無損聲管來表示。當(dāng)選用較多數(shù)量的短管級(jí)聯(lián),使得各管的截面積逼近聲道的面積函數(shù)時(shí),就可以期望級(jí)聯(lián)聲管的諧振頻率接近于聲道的諧振頻率。

由N個(gè)等長無損聲管級(jí)聯(lián)的系統(tǒng)的傳遞函數(shù)為:70一、語音信號(hào)的基本特性語音信號(hào)的基本特性語音信號(hào)是非穩(wěn)態(tài)信號(hào),特征隨時(shí)間變化;但在一個(gè)很短的時(shí)間段內(nèi)(約5ms--50ms)具有相對(duì)穩(wěn)定的特征,稱為準(zhǔn)平穩(wěn)信號(hào)。語音信號(hào)通??梢苑譃闈嵋簟⑶逡艉突旌弦?。濁音在時(shí)域上具有準(zhǔn)周期性,在頻域上,精細(xì)譜具有周期性起伏的諧波特性,譜包絡(luò)具有共振峰結(jié)構(gòu)。清音類似于隨機(jī)噪聲,其頻帶較寬。濁音段的信號(hào)能量要比清音段的能量高,這一特點(diǎn)可用于判斷區(qū)分清、濁音。語音產(chǎn)生模型無損聲管模型等效為時(shí)變線性數(shù)字濾波器,濾波器極點(diǎn)對(duì)應(yīng)聲道振峰頻率,增益參數(shù)G和濾波器系數(shù)都隨時(shí)間而變化,且依賴于面積函數(shù)。終端等效的概念:當(dāng)線性系統(tǒng)的一組參數(shù)被控制之后其輸出就具有所希望的語音特征,而這組參量是和實(shí)際語音產(chǎn)生過程有關(guān)的。語音信號(hào)具有慢變化特征:其激勵(lì)和聲道的特征在10~20ms時(shí)間內(nèi)保持不變。語音產(chǎn)生模型包括激勵(lì)源、聲道和反映嘴唇處聲輻射影響的部分,如圖所示。

語音特征參數(shù)激勵(lì)源分為濁音激勵(lì)和清音激勵(lì),用濁音/清音開關(guān)進(jìn)行控制。在濁音段,激勵(lì)由沖激序列發(fā)生器和聲門脈沖模型G(z)級(jí)聯(lián)構(gòu)成,前者產(chǎn)生周期為Tp的單位沖激響應(yīng),后者為波形成形系統(tǒng)。在清音段,激勵(lì)模型為一個(gè)隨機(jī)噪聲源及控制清音激勵(lì)強(qiáng)度的增益參數(shù)。聲道模型為一個(gè)時(shí)變線性系統(tǒng),輻射模型為R(z)。語音特征參數(shù)有:基音周期、共振峰頻率、語音強(qiáng)度、清音/濁音判決及時(shí)變?yōu)V波器參數(shù)等。

特征參量的提取提取方法是基于數(shù)字信號(hào)處理的理論和技術(shù)。語音信號(hào)的準(zhǔn)平穩(wěn)特性,即在10~20ms的短時(shí)間內(nèi)認(rèn)為語音的特征參數(shù)不變。這樣,可將實(shí)際語音信號(hào)分成短的時(shí)間段,在各個(gè)段內(nèi)分別進(jìn)行參量提取。簡單介紹一下基音提取問題:包括兩個(gè)方面:首先進(jìn)行濁音/清音判決,然后再確定濁音段語音波形的周期Tp。濁音/清音判決或稱基音檢測,就是判決一個(gè)時(shí)間段是濁音段還是清音段,這就要利用濁音和清音在時(shí)域和頻域上的差別。濁音信號(hào)具有準(zhǔn)周期性,頻譜有峰值,即基音及其諧波。濁音信號(hào)有較強(qiáng)的相關(guān)性。清音信號(hào)的波形近似于噪聲,沒有準(zhǔn)周期性,其頻譜沒有明顯的峰值,時(shí)域中也不存在相關(guān)性。基音提取的方法很多,可分為三類。

利用語音信號(hào)的時(shí)域特征,如自相關(guān)函數(shù)法;

利用語音信號(hào)的頻域特征,主要是利用濁音頻譜的峰值特征;

綜合利用語音信號(hào)頻域與時(shí)域特征,如線性預(yù)測技術(shù)等。

76一、語音信號(hào)的基本特性語音信號(hào)的基本特性語音信號(hào)是非穩(wěn)態(tài)信號(hào),特征隨時(shí)間變化;但在一個(gè)很短的時(shí)間段內(nèi)(約5ms--50ms)具有相對(duì)穩(wěn)定的特征,稱為準(zhǔn)平穩(wěn)信號(hào)。語音信號(hào)通??梢苑譃闈嵋簟⑶逡艉突旌弦?。濁音在時(shí)域上具有準(zhǔn)周期性,在頻域上,精細(xì)譜具有周期性起伏的諧波特性,譜包絡(luò)具有共振峰結(jié)構(gòu)。清音類似于隨機(jī)噪聲,其頻帶較寬。濁音段的信號(hào)能量要比清音段的能量高,這一特點(diǎn)可用于判斷區(qū)分清、濁音。77全極點(diǎn)數(shù)字濾波器時(shí)變數(shù)字濾波器---線性預(yù)測(LP)綜合濾波器全極點(diǎn)數(shù)字濾波器的輸出(LPC差分方程)

輸出值s(n)可以用當(dāng)前的輸入值Gx(n)和過去輸出樣值的加權(quán)和來表示二、語音信號(hào)的產(chǎn)生模型78產(chǎn)生語音信號(hào)s(n)的參量

清/濁音類型;基音周期TP;代表聲道的時(shí)變?yōu)V波器的系數(shù){aj}及濾波器階數(shù)p;增益系數(shù)G;說明:根據(jù)語音信號(hào)慢變化的特點(diǎn),可以每隔10-30ms左右預(yù)測一次上述各參數(shù)的值。即以每10-30ms為一幀傳送一次參數(shù)樣值的編碼,并不傳送話音樣值的編碼,因此比特速率低得多。二、語音信號(hào)的產(chǎn)生模型79清濁音判決濾波器參數(shù)分析Ga1ap量化編碼器U/V解碼器Ga1apTPU/V激勵(lì)信號(hào)產(chǎn)生合成濾波器信道基音周期提取TPs(n)預(yù)加重加窗s(n)LPC聲碼器的原理框圖三、LPC聲碼器的工作原理801、全極點(diǎn)數(shù)字濾波器參數(shù)的確定階數(shù)P

模型階數(shù)P的選擇,應(yīng)該從頻譜估計(jì)精度、計(jì)算量、存 儲(chǔ)量等多方面綜合進(jìn)行考慮。

P取很大值時(shí),可以獲得很好的信號(hào)譜估計(jì),但增加 的計(jì)算量和存儲(chǔ)量代價(jià)太大。語音譜估計(jì)時(shí)主要關(guān)心 的是聲道的諧振特性,P值過大,估計(jì)的譜中保留許 多信號(hào)譜細(xì)節(jié),反而使共振峰分析效果變壞。階數(shù)P的經(jīng)驗(yàn)值在8--12之間。通常采用10個(gè)極點(diǎn)的濾 波器,模型就能正確描述共振峰特性和譜的基本形狀。三、LPC聲碼器的工作原理81濾波器系數(shù){aj}三、LPC聲碼器的工作原理

設(shè)計(jì)的濾波器系數(shù){aj}就是使得誤差e(n)在某個(gè)預(yù)定的準(zhǔn)則下最小,通常是根據(jù)最小均方誤差準(zhǔn)則求解{aj}在LPC模型中,信號(hào)s(n)的估計(jì)誤差e(n)為:82三、LPC聲碼器的工作原理

在語音信號(hào)保持平穩(wěn)的短時(shí)段內(nèi),令E對(duì)aj的偏導(dǎo)數(shù)為零,得到:即:其中:根據(jù)最小均方誤差準(zhǔn)則通過求解P個(gè)方程來得到P個(gè)未知數(shù)aj83三、LPC聲碼器的工作原理2、基音檢測 根據(jù)語音信號(hào)的特性檢測基音周期的方法有:利用時(shí)域特性檢測;利用頻域特性檢測;同時(shí)利用時(shí)域和頻域特性檢測;這里只介紹利用時(shí)域特性檢測84

基本原理:利用語音信號(hào)的時(shí)域波形的相似性,通過比較原始信號(hào)和它的移位信號(hào)的相似程度來尋找基音周期。如果移位的距離等于基音周期,則兩個(gè)信號(hào)之間將具有最大的相似性。常用方法:短時(shí)自相關(guān)函數(shù)和短時(shí)平均幅度差函數(shù)AMDF。利用時(shí)域特性檢測三、LPC聲碼器的工作原理85

設(shè)sw(n)是一段加窗的語音信號(hào),它的非零區(qū)域?yàn)椋簄=0N-1。

s(n)語音輸入信號(hào),w(n)是加權(quán)窗,一般取矩形窗或哈明窗。三、LPC聲碼器的工作原理基于求短時(shí)自相關(guān)函數(shù)的基音周期估計(jì)86三、LPC聲碼器的工作原理

sw(n)的自相關(guān)函數(shù)稱為語音信號(hào)s(n)的短時(shí)自相關(guān)函數(shù),用Rw(l)表示。

如果s(n)是濁音,其短時(shí)自相關(guān)函數(shù)Rw(l)呈現(xiàn)出明顯的周期性,其周期等于s(n)的基音周期。基音周期就是第一個(gè)峰值點(diǎn)到零點(diǎn)之間的距離。87三、LPC聲碼器的工作原理88設(shè)sw(n)是一段加窗的語音信號(hào),它的非零區(qū)域?yàn)椋簄=0N-1。

sw(n)的短時(shí)平均幅度差函數(shù)rw(l)定義為:三、LPC聲碼器的工作原理基于短時(shí)平均幅度差函數(shù)(AMDF)的基音周期估計(jì)89三、LPC聲碼器的工作原理 如果s(n)是濁音,其AMDF也呈現(xiàn)出明顯的周期性,其周期等于s(n)的基音周期。 與Rw(l)不同的是在基音周期的各個(gè)整數(shù)倍點(diǎn)上,rw(l)具有谷值而非峰值,要通過尋找最深谷值點(diǎn)的位置來確定基音周期。90周期性語音信號(hào)短時(shí)自相關(guān)函數(shù)和AMDF示例三、LPC聲碼器的工作原理91兩種基音周期估計(jì)方法比較AMDF方法計(jì)算簡單,只需減法和取幅度運(yùn)算,不需要乘法運(yùn)算。AMDF的動(dòng)態(tài)范圍較小,易于算法的定點(diǎn)實(shí)現(xiàn)。AMDF在基音周期點(diǎn)上,它的谷點(diǎn)銳度較之短時(shí)自相關(guān)函數(shù)的峰點(diǎn)銳度更尖銳,估值精度更高、更穩(wěn)健。但信號(hào)不夠平穩(wěn)時(shí),這個(gè)特點(diǎn)不明顯。短時(shí)自相關(guān)函數(shù)法的特點(diǎn)是對(duì)相位不敏感,在信號(hào)有相位失真時(shí)能較好地檢測基音。三、LPC聲碼器的工作原理92

窗長

為了使較好地反映sw(n)的周期性,窗長N至少應(yīng)大 于兩個(gè)基音周期,一般取長度為10-30ms。

克服共振峰特性造成的干擾

由于共振峰的干擾,會(huì)出現(xiàn)Rw(l)的第一最大峰值點(diǎn)或 rw(l)的第一最深谷值點(diǎn)與基音周期不一致的情況,當(dāng) 基音周期性和共振峰周期性混在一起時(shí),檢測出來的 周期可能是NpNf(Np是基音周期,Nf是第一共振峰的 周期)。三、LPC聲碼器的工作原理討論93克服上述干擾有兩種方法:用低通濾波器(60Hz900Hz)對(duì)語音信號(hào)進(jìn)行濾波,去除大部分共振峰的影響,基音頻率最高約450Hz,濾波后可以保留其一、二次諧波。先對(duì)語音信號(hào)進(jìn)行非線性變換(例如“中心削波”),然后再求Rw(l)或rw(l),這樣可以明顯地改善基音估計(jì)的效果,基音周期點(diǎn)上,峰值點(diǎn)或深谷值點(diǎn)比削波前得到的要尖銳、突出。三、LPC聲碼器的工作原理94產(chǎn)生語音信號(hào)s(n)的參量

清/濁音類型;基音周期TP;代表聲道的時(shí)變?yōu)V波器的系數(shù){aj}及濾波器階數(shù)p;增益系數(shù)G;說明:根據(jù)語音信號(hào)慢變化的特點(diǎn),可以每隔10-30ms左右預(yù)測一次上述各參數(shù)的值。即以每10-30ms為一幀傳送一次參數(shù)樣值的編碼,并不傳送話音樣值的編碼,因此比特速率低得多。二、語音信號(hào)的產(chǎn)生模型95清濁音判決濾波器參數(shù)分析Ga1ap量化編碼器U/V解碼器Ga1apTPU/V激勵(lì)信號(hào)產(chǎn)生合成濾波器信道基音周期提取TPs(n)預(yù)加重加窗s(n)LPC聲碼器的原理框圖三、LPC聲碼器的工作原理96

對(duì)于加窗的語音信號(hào)sw(n),當(dāng)窗的起點(diǎn)n=0時(shí),語音信號(hào)sw(n)的短時(shí)能量用E

表示,短時(shí)平均幅度用M

表示,計(jì)算公式如下:三、LPC聲碼器的工作原理3、濁音、清音及無聲的判別

根據(jù)語音信號(hào)的短時(shí)能量、短時(shí)平均幅度和短時(shí)過零率來判斷當(dāng)前幀的語音信號(hào)是濁音、清音,還是無聲。97

語音信號(hào)的過零率用Z

表示,它表示一幀語音信號(hào)中波形穿過橫軸(零電平)的次數(shù)。它可以用相鄰兩個(gè)取樣改變符號(hào)的次數(shù)來計(jì)算:三、LPC聲碼器的工作原理98

濁音(V)的M最大而Z

最低,當(dāng)采樣率為8kHz,幀長為20ms時(shí),Z

的平均值約為20;清音(U)的M

居中而Z

最高,當(dāng)采樣率為8kHz,幀長為20ms時(shí),Z

的平均值約為70;無聲(S)的M

最低而Z

居中。判斷當(dāng)前幀是濁音、清音、無聲的依據(jù)如下:三、LPC聲碼器的工作原理99三、LPC聲碼器的工作原理

在S、U、V三種情況下,短時(shí)平均幅度M和短時(shí)過零率Z的條件概率密度函數(shù)示意圖通道聲碼器通道聲碼器發(fā)送端通過若干個(gè)并聯(lián)的通道對(duì)語音信號(hào)進(jìn)行粗略的頻譜估計(jì)接收端產(chǎn)生的信號(hào)其頻譜與發(fā)送端所規(guī)定的頻譜相匹配。濾波器組隊(duì)頻帶的劃分不均勻,低頻帶的帶寬窄,高頻段的帶寬寬主要缺點(diǎn):需要進(jìn)行基音檢查和清濁音的判決,精確性較差。通道數(shù)量有限,造成信號(hào)頻譜畸變共振峰聲碼器共振峰聲碼器對(duì)整體的語音信號(hào)進(jìn)行分析,提取信號(hào)中的共振峰的位置、幅度、帶寬等參數(shù),構(gòu)成對(duì)應(yīng)清音和濁音的兩個(gè)聲道濾波器。與通道聲碼器相比,共振峰聲碼器合成的語音質(zhì)量較好,而且比特率可以壓縮的更低104四、LPC10聲碼器復(fù)習(xí):LPC聲碼器的工作原理清濁音判決濾波器參數(shù)分析Ga1ap量化編碼器U/V解碼器Ga1apTPU/V激勵(lì)信號(hào)產(chǎn)生合成濾波器信道基音周期提取TPs(n)預(yù)加重加窗s(n)1051、LPC10聲碼器概況

LPC-10聲碼器采用10階線性預(yù)測分析濾波器,編碼速率為2.4kb/s,被美國在1981年作為聯(lián)邦標(biāo)準(zhǔn)FS-1015用于窄帶保密通信。其語音質(zhì)量清晰可懂,但抗噪聲的能力和自然度尚有欠缺。四、LPC10聲碼器106四、LPC10聲碼器2、LPC10編碼器低通濾波A/D變換預(yù)加重計(jì)算分析相位基音分析存儲(chǔ)器低通濾波器清/濁檢測基音及清/濁校正2階逆濾波AMDF基音提取V/UV數(shù)字語音出并變串及同步產(chǎn)生誤差校正的映射參數(shù)編碼基音周期預(yù)測器分析存儲(chǔ)器計(jì)算RMS計(jì)算預(yù)測參數(shù)2幀參數(shù)存儲(chǔ)器2幀參數(shù)存儲(chǔ)器RMSRC107LPC-10編碼器的特點(diǎn)(1)采樣采樣率8kHz,每個(gè)樣本量化為12bit得到數(shù)字化語音,每180個(gè)樣點(diǎn)分為一幀(22.5ms),以幀為處理單元。四、LPC10聲碼器 預(yù)加重的目的是加強(qiáng)語音譜中的高頻共振峰,使語音短時(shí)譜以及線性預(yù)測分析中的余數(shù)(殘差)頻譜變得更為平坦,從而提高了譜參數(shù)估值的精確性。(2)預(yù)加重在提取聲道參數(shù)之前,先進(jìn)行預(yù)加重(高頻提升)處理,預(yù)加重濾波器的傳輸函數(shù)Hpw(z)為:108傳輸函數(shù)Hpw(z)的幅頻和相頻特性四、LPC10聲碼器010002000300040005000600070008000-100-50050100Frequency(Hertz)Phase(degrees)010002000300040005000600070008000-30-20-10010Frequency(Hertz)MagnitudeResponse(dB)109

(3)聲道濾濾器參數(shù)RC

該編碼方案中采用協(xié)方差法計(jì)算預(yù)測系數(shù){ai},i=1,,P,P=10。預(yù)測系數(shù)不適于直接量化,因?yàn)樗奈⑿∽兓瘯?huì)導(dǎo)致LP綜合濾波器極點(diǎn)位置很大的變化,很可能造成濾波器不穩(wěn)定,為了保證濾波器的穩(wěn)定性,要求有相當(dāng)高的量化精度(每個(gè)系數(shù)需要8—10bits)。

四、LPC10聲碼器110四、LPC10聲碼器

為了降低量化比特?cái)?shù),采用了在數(shù)學(xué)上完全等價(jià)的P個(gè)反射系數(shù)(RC:ReflectionCoefficient){ki},i=1,,P代替預(yù)測系數(shù)進(jìn)行量化編碼。濾波器穩(wěn)定的條件是參數(shù)ki滿足下式:

此條件在量化時(shí)容易保證。可以通過Levinson-Durbin算法求得部分相關(guān)系數(shù)(PartialCorrelation),部分相關(guān)系數(shù)與RC在理論上是互為相反數(shù)。111

(4)增益RMS

增益RMS由下式計(jì)算:Si是經(jīng)過預(yù)加重后的數(shù)字語音信號(hào)樣本,N是分析幀長度。對(duì)于濁音幀,其分析幀長取為130個(gè)樣本以內(nèi)的基音周期整數(shù)倍值;對(duì)于清音幀,其分析幀長取為長度為22.5ms的整個(gè)幀的中點(diǎn)為中心的130個(gè)樣點(diǎn)。四、LPC10聲碼器112清/濁音判決是利用模式匹配技術(shù),基于低帶能量、AMDF函數(shù)的最大值與最小值之比、過零率三個(gè)因素判別。最后對(duì)基音值、清濁音判決結(jié)果用動(dòng)態(tài)規(guī)劃算法,在三幀范圍內(nèi)進(jìn)行平滑和錯(cuò)誤校正,從而給出當(dāng)前幀的基音周期、清濁音判決參數(shù)V/U。(5)提取基音周期和檢測清/濁音采用基于短時(shí)平均幅度差函數(shù)(AMDF)法提取基音周期。四、LPC10聲碼器113

(6)參數(shù)編碼

對(duì)10個(gè)反射系數(shù)RC、增益RMS、基音周期、U/V判決標(biāo)志以及同步信號(hào)共編碼成每幀54bits,幀長22.5ms,因此編碼速率為2.4kb/s。各比特分配如下表:四、LPC10聲碼器114四、LPC10聲碼器濁音清音濁音清音基音周期/清濁音77K(6)4RMS55K(7)4同步11K(8)4K(1)55K(9)3K(2)55K(10)2K(3)555433K(4)55誤差校正020K(5)4115四、LPC10聲碼器3、LPC10譯碼器串/并變換同步檢測誤差檢測校正編碼參數(shù)解碼幀塊到基音塊轉(zhuǎn)換與插值輸出存儲(chǔ)器計(jì)算增益綜合器清/濁音開關(guān)去加重D/A低通濾波合成語音出RMSRC基音周期V/UV反射系數(shù)轉(zhuǎn)換成預(yù)測系數(shù)基音產(chǎn)生噪音產(chǎn)生116LPC-10聲碼器的缺點(diǎn)(1)采用過分簡化的二元激勵(lì),合成的語音自然度較低;(2)穩(wěn)健性(Robustness)差。(3)LPC-10的語音譜共振峰的位置以及帶寬估值有時(shí)會(huì)產(chǎn)生很大的失真,從而影響語音的質(zhì)量。當(dāng)濁音的基音頻率接近譜包絡(luò)中的第一共振峰時(shí),LPC譜估計(jì)在共振峰位置上出現(xiàn)極其尖銳的峰值(估計(jì)失真),使得相應(yīng)得在合成語音中會(huì)出現(xiàn)尖峰或較大的毛刺,影響語音質(zhì)量。四、LPC10聲碼器117

采用混合激勵(lì)代替簡單的二元激勵(lì),使合成語音的質(zhì)量得到改善。激勵(lì)脈沖加抖動(dòng):對(duì)每個(gè)基音周期的長度乘上一個(gè)0.75~1.25之間均勻分布的隨機(jī)數(shù)以改善語音的自然度。4、LPC-10e聲碼器

LPC-10e聲碼器采用針對(duì)LPC-10聲碼器的缺點(diǎn)加以改進(jìn)的算法,并能與LPC-10聲碼器兼容,用于美國第三代保密電話。四、LPC10聲碼器(1)激勵(lì)源的改善118(2)基音提取方法的改進(jìn)

LPC-10提取基音采用的是AMDF,它的顯著特點(diǎn)是不需要乘法,計(jì)算較小。

LPC-10e中采用LPC的殘差信號(hào)或語音信號(hào)的短時(shí)自相關(guān)函數(shù),利用動(dòng)態(tài)規(guī)劃的平滑算法來更準(zhǔn)確地提取基音周期。四、LPC10聲碼器119(3)聲道濾波器參數(shù)量化的改進(jìn)

線譜頻率LSF(LineSpectrumFrequency),或稱為線譜對(duì)(LineSpectrumPair)是數(shù)學(xué)上與線性預(yù)測系數(shù){ai}(i=1,,P)和反射系數(shù){ki}(i=1,,P)完全等價(jià)的另一種表示方式。LSF參數(shù)集{i}(i=1,,P)都在單位圓上,它們?cè)陬l域描述全極點(diǎn)濾波器H(Z)。LSF在數(shù)學(xué)上有良好的量化特性。

四、LPC10聲碼器120四、LPC10聲碼器在求取LSF參數(shù)及量化過程中,如果保持LSF參數(shù)的有序有界性質(zhì),即:就可以保證全極點(diǎn)濾波器H(Z)是穩(wěn)定的。LSF參數(shù)有序有界性121

LSF誤差相對(duì)獨(dú)立性 某個(gè)頻率點(diǎn)的LSF偏差只對(duì)該頻率附近的語音頻譜產(chǎn)生影響,而對(duì)其它LSF頻率上的語音頻譜影響不大,這有利于LSF的參數(shù)量化和插值。四、LPC10聲碼器122LSF參數(shù)的量化在標(biāo)量量化時(shí),通過設(shè)計(jì)最佳的LSF參數(shù)的非均勻標(biāo)量量化器,可以用較少的量化比特達(dá)到較高的量化精度。例如:對(duì)10個(gè)LSF參數(shù),根據(jù)每個(gè)參數(shù)所起的作用,分配的量化比特?cái)?shù)為:3、4、4、4、4、3、3、3、3、3,共34bits。所得的合成語音質(zhì)量與用41bits對(duì)反射系數(shù)k參數(shù)量化得到的合成語音質(zhì)量相比較,在聽覺上沒有任何差別,兩者的波形完全吻合,計(jì)算量化畸變約為1dB。四、LPC10聲碼器123四、LPC10聲碼器LSF參數(shù)的量化(續(xù))

在矢量量化時(shí),將10個(gè)LSF合并成(4,6)兩個(gè)矢量,每個(gè)矢量量化為12bits,共24bits,可以得到平均譜畸變?yōu)?dB的“透明”矢量量化。第三章語言信號(hào)壓縮編碼3.1語言信號(hào)壓縮編碼的基本概念3.2自適應(yīng)差值脈沖編碼調(diào)制3.3參量編碼3.4混合編碼3.5低速率語言壓縮編碼的應(yīng)用3.4.1混合編碼混合編碼結(jié)合了波形編碼和參量編碼的優(yōu)點(diǎn),采用線性技術(shù)構(gòu)成聲道模型。不止傳輸預(yù)測參數(shù)和清濁音信息,而且也同時(shí)傳輸預(yù)測誤差信息。實(shí)現(xiàn)混合編碼基本方法是以參量編碼特別是線性預(yù)測編碼LPC為基礎(chǔ)的,

合成分析法(AbS,Analysis-By-Synthesis)的基本思想:用合成來指導(dǎo)分析。

將合成器引入編碼系統(tǒng),使之與分析器相結(jié)合,在編碼器中產(chǎn)生與譯碼器完全一致的合成語音,將此合成語音與原始語音相比較,根據(jù)一定的誤差準(zhǔn)則調(diào)整計(jì)算分析器的各個(gè)參數(shù),使兩者之間的誤差達(dá)到最小。然后將誤差最小時(shí)的語音參數(shù)傳送到接收端,得到高質(zhì)量的合成語音。合成分析法在LPC基礎(chǔ)上采用AbS的編碼方法。AbS-LPC編碼器包括三個(gè)基本部分:

時(shí)變?yōu)V波器(包括LPC和基音濾波器)

基于感知的最小化處理;

激勵(lì)信號(hào);

AbS-LPC編碼器AbS-LPC編碼器與譯碼器AbS-LPC編碼器激勵(lì)信號(hào)產(chǎn)生編碼端基音合成濾波器LPC合成濾波器解碼端輸出語音誤差最小優(yōu)化的激勵(lì)基音合成濾波器LPC合成濾波器+誤差-+原始語音AbS-LPC編碼器合成分析編碼方法的特點(diǎn):

發(fā)端是一個(gè)閉環(huán)系統(tǒng);

對(duì)激勵(lì)信號(hào)沒有明顯的分類,由閉環(huán)系統(tǒng)選擇與 原始語音誤差最小的激勵(lì)信號(hào),使得合成語音質(zhì)量 比傳統(tǒng)的LPC聲碼器好得多。1、時(shí)變?yōu)V波器 時(shí)變?yōu)V波器由LPC合成濾波器和基音合成濾波器級(jí)連組成。

LPC合成濾波器實(shí)現(xiàn)語音的短時(shí)預(yù)測;基音合成濾波器實(shí)現(xiàn)語音的長時(shí)預(yù)測。AbS-LPC編碼器

在語音譜中,能量較高的頻段(如共振峰處)的噪聲相對(duì)于能量較低頻段的噪聲不易被感知,在度量原始語音與合成語音之間的誤差時(shí)可以計(jì)入這一因素,在語音能量高的頻段,允許二者的誤差大一些,反之則小一些,為此在計(jì)算二者誤差時(shí),引入頻域感覺加權(quán)濾波器W(f)。

2、感覺加權(quán)濾波器

感覺加權(quán)濾波器:是根據(jù)人的聽覺特性對(duì)預(yù)測殘差信號(hào)進(jìn)行處理,以產(chǎn)生較好的主觀聽覺效果。AbS-LPC編碼器3、激勵(lì)信號(hào)源

激勵(lì)信號(hào)是AbS-LPC模型的輸入,包含不能由時(shí)變?yōu)V波器譜模型表征的殘差結(jié)構(gòu),如超出長時(shí)線性預(yù)測范圍的相關(guān)性就不能由長時(shí)線性預(yù)測包含,激勵(lì)信號(hào)還包括不能用確定方法有效表征的隨機(jī)結(jié)構(gòu)。采用AbS方法的聲碼器都用激勵(lì)信號(hào)源的種類命名。例如:(1)多脈沖線性預(yù)測編碼(MP-LPC)(2)規(guī)則脈沖激勵(lì)—長時(shí)預(yù)測編碼(RPE-LTP-LPC)(3)碼本激勵(lì)線性預(yù)測編碼(CELP)

AbS-LPC編碼器語音的合成分析編碼合成分析法(ABS)的基本思想是用合成來指導(dǎo)分析。將合成器引入編碼瑞,使之與分析器相結(jié)臺(tái),在編碼器中產(chǎn)生與譯碼器端完全一致的合成語音,將此合成語音與原始語音相比較,根據(jù)一定的誤差準(zhǔn)則調(diào)整計(jì)算各個(gè)參數(shù),使得二者之間的誤差達(dá)到最小。將誤差最小時(shí)的系統(tǒng)參數(shù)傳送到接收端,可以合成較高質(zhì)量的語音?!?/p>

AbS—LPC編碼方法(1)緩存一幀語音采樣值.通道LPC分析得到一組LPC系數(shù)。(2)通過LPC逆濾波計(jì)算不量化的殘差信號(hào)。(3)由于LPC分析幀通常較長,確定激勵(lì)信號(hào)時(shí)需要把一幀分成幾個(gè)子幀。(4)對(duì)每個(gè)子幀計(jì)算基音濾波器(長時(shí)預(yù)測器)參數(shù)。(5)將基音和LPC合成濾波器級(jí)聯(lián)起來,選擇最佳激勵(lì)信號(hào)。(6)接收端根據(jù)收到的碼字或數(shù)據(jù)求得最佳激勵(lì)信號(hào),通過級(jí)聯(lián)濾波器產(chǎn)生與原始語音誤差最小的合成語音。

多帶激勵(lì)(MBE)和混合激勵(lì)線性預(yù)測(MELP)編碼多帶激勵(lì)(MBE)語音編碼

混合激勵(lì)線性預(yù)測(MELP)編碼

★多帶激勵(lì)(MBE)語音編碼MBE編碼算法首先由美國的MIT大學(xué)林肯實(shí)驗(yàn)室的P.W.Griffin和J.S.Lim于1984年提出的。算法的關(guān)鍵是提出了一種基于頻域的、新的語音信號(hào)產(chǎn)生模型——多帶激勵(lì)模型,進(jìn)而提高了合成語音的自然度?!?/p>

MBE語音模型

MBE模型與傳統(tǒng)的聲碼器模型的突出區(qū)別在激勵(lì)模型的表示上。傳統(tǒng)的聲碼器模型.整個(gè)頻帶不是清音就是濁音.激勵(lì)譜由全頻帶的清濁音判決并由基音周期表示。這種描述方法不能反映語音的復(fù)雜構(gòu)成,合成語音自然度差。MBE模型,將整個(gè)頻帶以基音諧波為中心.以基音頻率為帶寬劃分為若干頻帶,在每個(gè)頻帶根據(jù)頻譜特征進(jìn)行清濁音判決,形成多帶激勵(lì)譜。整個(gè)激勵(lì)譜由基音頻率和它的諧波以及一組清濁音判決參數(shù)表示,能較好地反映語音特征。★混合激勵(lì)線性預(yù)測(MELP)編碼MELP算法的基本特點(diǎn):采用了混合激勵(lì)的形式代替基本LPC模型的二元激勵(lì)形式.將周期脈沖激勵(lì)源和白噪聲源混合作為激勵(lì)信號(hào)解決了二元激勵(lì)模式不能準(zhǔn)確描述過渡幀和弱濁音幀的問題使合成激勵(lì)信號(hào)譜與殘差信號(hào)譜更加匹配吸取MBE模型的思想,對(duì)激勵(lì)信號(hào)進(jìn)行分帶處理MELP聲碼器的質(zhì)量大大超過LPC—10聲碼器,是一種較理想的低速率語音編碼算法

MELP簡要框圖1.分析部分●基音提取分為幾個(gè)步驟:首先是用自相關(guān)法進(jìn)行整數(shù)基音初估,得到整數(shù)基音初值;然后利用內(nèi)插公式提高輸入基音值的準(zhǔn)確度。●分帶話音分析首先將輸入語音信號(hào)濾成5個(gè)子頻帶的信號(hào),計(jì)算5個(gè)子帶的分帶話音強(qiáng)度井以此為依據(jù)進(jìn)行分帶清/濁音判決。●線性預(yù)測分析用L—D算法進(jìn)行自相關(guān)分析。對(duì)線性預(yù)測系數(shù)的量化使用多級(jí)矢量量化技術(shù)?!裼?jì)算殘差諧波譜時(shí),首先使用量化后的LSF參數(shù)計(jì)算線性預(yù)測系數(shù),并用它產(chǎn)生殘差信號(hào),對(duì)其進(jìn)行FFT變換。利用頻譜峰點(diǎn)檢測算法找到與前10次諧波對(duì)應(yīng)的傅里葉系數(shù)輸出。2.合成部分●合成部分仍然采取LPC合成的形式,不同的是激勵(lì)信號(hào)的合成方式和后處理?!馦ELP算法中,混合激勵(lì)為合成分帶濾波后的脈沖與噪聲激勵(lì)之和。●脈沖激勵(lì)是用長度為—個(gè)基音周期的殘差譜博里葉系數(shù)的離散博里葉反變換計(jì)算出來?!裨肼暭?lì)是首先產(chǎn)[0,1]間均勻分布的白噪聲源,再對(duì)其進(jìn)行電平調(diào)整和限幅?!衩}沖和噪聲源各自濾波后加在一起合成混合激勵(lì)。●混合激勵(lì)信號(hào)合成后經(jīng)自適應(yīng)譜增強(qiáng)濾波器處理,用于改善共振峰的形狀?!耠S后,激勵(lì)信號(hào)進(jìn)行LPC合成得到合成語音。3.參數(shù)量化編碼部分MELP算法的參數(shù)包括LPC參數(shù)、基音周期、模式分類參數(shù)、分帶混合比例、殘差諧波譜參數(shù)和增益。MPLPCRPELPCCELP★數(shù)字音頻編碼標(biāo)準(zhǔn)★話音音頻編碼標(biāo)準(zhǔn)

1.G.711標(biāo)準(zhǔn)

CCITT(國際電報(bào)電話咨詢委員會(huì))于1972年對(duì)話音頻譜的模擬信號(hào)用脈沖編碼調(diào)制(PCM)編碼時(shí)的特性進(jìn)行了規(guī)范●速率為64kb/s●適合于電話質(zhì)量的語言信號(hào)編碼(頻率范圍300Hz~3.4kHz)2.G.721標(biāo)準(zhǔn)●

G.721標(biāo)準(zhǔn)是CCITT1988年制訂的●速率為32kb/s●采用自適應(yīng)差分脈碼調(diào)制(ADPCM)算法●適合于中等質(zhì)量音頻信號(hào)編碼,同時(shí)也應(yīng)用于調(diào)幅廣播質(zhì)量的音頻信號(hào)編碼3.G.722標(biāo)準(zhǔn)

●G.722標(biāo)準(zhǔn)是CCITT1988年制訂的,●該標(biāo)準(zhǔn)規(guī)范了一種音頻(50~7000Hz)編碼系統(tǒng)的特性●速率為64kb/s●采用子帶自適應(yīng)差分脈碼制(SB-ADPCM)算法●具有數(shù)據(jù)插入的功能●適合于調(diào)幅廣播質(zhì)量的音頻信號(hào)編碼,也適合于需要存儲(chǔ)大量高質(zhì)量音頻信號(hào)的多媒體系統(tǒng)●例如視聽多媒體、會(huì)議電視等具有調(diào)幅廣播質(zhì)量的音頻G.722編/解碼器原理框圖(a)發(fā)端編碼器;(b)收端解碼器4.G.728標(biāo)準(zhǔn)

●速率為16kb/s●采用短時(shí)碼本激勵(lì)線性預(yù)測編碼(LD-CELP)算法●適合于高質(zhì)量的語音信號(hào)編碼5.G.729標(biāo)準(zhǔn)

●G.729標(biāo)準(zhǔn)提出了一種采用共軛結(jié)構(gòu)代數(shù)碼激勵(lì)線性預(yù)測(CS―ACELP)方法●是以8kb/s速率對(duì)語音信號(hào)編碼的算法●它是由ITU―T于1995年制訂的●該算法應(yīng)用在多媒體通信和IP電話等領(lǐng)域

CS―ACELP編碼器原理★

GSM標(biāo)準(zhǔn)由歐洲數(shù)字移動(dòng)特別工作組制訂速率為13kb/s采用長時(shí)線性預(yù)測規(guī)則碼本激勵(lì)(RPE-LTP)算法適合于移動(dòng)通信的低速語音編碼編碼凈比特率為13Kb/s,加上信道抗干擾編碼后為22.8Kb/s,再加上管理信息等,信道傳送速率為24.7Kb/sRPE-LTP方案由預(yù)處理、LPC分析、短時(shí)分析濾波、長時(shí)預(yù)測和規(guī)則激勵(lì)碼編碼五大部分構(gòu)成GSM標(biāo)準(zhǔn)的長時(shí)線性預(yù)測規(guī)則碼本激勵(lì)(RPE-LTP)編碼原理圖●

方案由預(yù)處理、LPC分析、短時(shí)分析濾波、長時(shí)預(yù)測和規(guī)則激勵(lì)碼編碼五大部分構(gòu)成GSM的RPE-LTP方案的一幀中各參數(shù)編碼比特分配如表,每幀20ms,共260bit量化編碼,所以凈編碼速率為13kb/s★

CTIA標(biāo)準(zhǔn)●美國數(shù)字移動(dòng)通信標(biāo)準(zhǔn)●速率為8kb/s●

采用矢量和激勵(lì)線性預(yù)測(VSELP)算法,壓縮率大,計(jì)算量適中●同GSM的13kb/s標(biāo)準(zhǔn)一樣,應(yīng)用在低速語音編碼領(lǐng)域★

NSA標(biāo)準(zhǔn)●美國國家安全局標(biāo)準(zhǔn)●速率為4.8kb/s和2.4kb/s●分別采用碼本激勵(lì)(CELP)和線性預(yù)測(LPC)編碼方案?!锔弑U媪Ⅲw聲音頻編碼標(biāo)準(zhǔn)

1.MPEG―1音頻編碼標(biāo)準(zhǔn)●是國際上第一個(gè)高保真立體聲音頻編碼標(biāo)準(zhǔn)●以MUSICAM(MaskingPatternUniversalSubbandIntegratedCodingAndMultiplexing)為基礎(chǔ)的三層編碼結(jié)構(gòu)●根據(jù)不同的應(yīng)用要求,使用不同的層來構(gòu)成其音頻編碼器2.MPEG―2音頻編碼標(biāo)準(zhǔn)●在MPEG―1音頻編碼方案,MUSICAM只能傳送左、右兩個(gè)聲道●MP

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論