第四章小波變換_第1頁(yè)
第四章小波變換_第2頁(yè)
第四章小波變換_第3頁(yè)
第四章小波變換_第4頁(yè)
第四章小波變換_第5頁(yè)
已閱讀5頁(yè),還剩19頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、.語(yǔ)音增強(qiáng)算法研究 p584.1 小波理論 4.1.1小波變換的定義4.1. 2 小波去噪原理 .4.2 小波包變換語(yǔ)音增強(qiáng)方法4.2.1 小波包變換語(yǔ)音增強(qiáng)方法原理4 2. 2 Bark 尺度小波包分解4.2.3閩值函數(shù)4.2.4 實(shí)驗(yàn)仿真4.3 小波包變換和聽(tīng)覺(jué)掩蔽效應(yīng)的語(yǔ)音增強(qiáng)方法4.3. 1小波包變換和聽(tīng)覺(jué)掩蔽效應(yīng)的語(yǔ)音增強(qiáng)方法原理4.3. 2實(shí)驗(yàn)仿真 第四章 小波包語(yǔ)音增強(qiáng)算法小波(Wavelets分析的起源可以追溯到20世紀(jì)初,在20世紀(jì)80年代后期開(kāi) 始形成一個(gè)新興的數(shù)學(xué)分支。 小波變換是調(diào)和分析這一數(shù)學(xué)領(lǐng)域半個(gè)世紀(jì)以來(lái)的 工作結(jié)晶, 是傅里葉變換發(fā)展史上的里程碑式的進(jìn)展, 近些

2、年來(lái)成為國(guó)外眾多學(xué) 者共同關(guān)注的熱點(diǎn)。 它在傅里葉變換的基礎(chǔ)上發(fā)展而來(lái), 但又有極大不同。 傳統(tǒng) 的信號(hào)處理方法是建立在傅立葉變換的基礎(chǔ)上, 而傅立葉分析使用的是一種全局 的變換,要么完全在時(shí)域, 要么完全在頻域, 因此無(wú)法表達(dá)信號(hào)的時(shí)頻局域性質(zhì), 而這種性質(zhì)恰恰是非平穩(wěn)信號(hào) (如語(yǔ)音信號(hào) )最根本和最關(guān)鍵的性質(zhì)。小波分析是 建立在泛函分析、 傅立葉分析、樣條分析及調(diào)和分析基礎(chǔ)上的新的分析處理工具 它又稱為多分辨分析, 在時(shí)域和頻域同時(shí)具有良好配局部化特性, 常被譽(yù)為信號(hào) 分析的“數(shù)學(xué)顯微鏡” 。小波變換在時(shí)頻兩域都具有表征信號(hào)局部特征的能力, 它克服了短時(shí)傅立葉變換固定分辨率的缺點(diǎn), 在信號(hào)

3、的高頻部分, 可以獲得較好 的時(shí)間分辨率, 在信號(hào)的低頻部分可以獲得較高的頻率分辨率, 這就使指小波變 換具有對(duì)信號(hào)的自適應(yīng)性。 它能有效地從信號(hào)中提取信息, 通過(guò)伸縮和平移等運(yùn) 算功能對(duì)信號(hào)進(jìn)行多尺度細(xì)化分析。 小波分析是目前國(guó)際上公認(rèn)的信號(hào)信息獲取 與處班領(lǐng)域的高新技術(shù), 是信號(hào)處理的前沿課題, 其中小波去噪也是小波分析的 主要應(yīng)用之一,對(duì)語(yǔ)音增強(qiáng)的研究不可避免的要利用小波這一有效工具。小波包變換理論是 20世紀(jì) 80年代中后期逐漸成熟并發(fā)展起來(lái)的, 由于可同 時(shí)進(jìn)行時(shí)域和頻域分析, 具有時(shí)頻局部化和變分辨特征, 而且小波函數(shù)的選取也 很靈活,因此在語(yǔ)音增強(qiáng)中得到了廣泛的應(yīng)用。 這就使得小

4、波包變換在信號(hào)處理方面有許多獨(dú)到的優(yōu)點(diǎn),特別適用于像信號(hào)處理,圖象處理,量子場(chǎng)論,地震探 測(cè),話音識(shí)別與增強(qiáng),雷達(dá),機(jī)器視覺(jué)以及數(shù)字電視等科技領(lǐng)域31-354.1小波理論4.1.1小波變換的定義“Fl其中,甲(5-1)為給定的一個(gè)基本函數(shù),式中 a,b均為常數(shù),且a>0。給定平方可積的信號(hào)x(t,義為:工I®" 冋,則日門(mén)的小波變換(wavelet transform,WT) 定(吶=十卜(心=) 'f/(5-23 Y Af式中,a, b和t均是連續(xù)變量。因此此式又稱為連續(xù)小波變換(CWT)o信號(hào)皆(f)(a,b)是a和b的函數(shù),b是時(shí)移,a是尺度因子。十&#

5、39; 丿 又稱為基本小波,或母小波。W亦U數(shù),稱之為小波基函數(shù),或簡(jiǎn)稱小波基。母小波可以是實(shí)函數(shù),也可以是復(fù)函數(shù)。的小波變換是母小波經(jīng)移位和伸縮所產(chǎn)生的一組函丸是實(shí)信號(hào),也是實(shí)信號(hào),則憶(")也是實(shí)函數(shù),反之,為復(fù)函數(shù)。在(5-1)式中,時(shí)移b的作用是確定對(duì)兀(0作伸縮。析的時(shí)間位置,也即時(shí)間中心。尺度因子a的作用是把基本小波習(xí)")£¥,當(dāng) a>1時(shí),a越大,則 Z丿的時(shí)域支撐范圍(即川)變成時(shí)域?qū)挾?較之川)變得越大;反之,當(dāng)a<1時(shí),a越小,則越窄。這樣,a和b聯(lián)合起來(lái)確定了對(duì)兀(')這樣,(5-2)式的小波變換可以理解為用一組

6、分析寬度不斷變化的基函數(shù)對(duì) 兀()作分析,這一變化正好適應(yīng)了對(duì)信號(hào)分析時(shí)在不同頻率范圍需要不同的1石分析的中心位置及分析的時(shí)間寬度。分辨率這一基本要求。(5-2)式中的因子始終能和母函數(shù)是為了保證在不同的尺度a時(shí),肖有蓍相同的能量,即:(5-3)0,則dt=adt',這樣,上式右邊的積分即等于的傅里葉變換為里葉變換的性質(zhì):。令X(Q),肖的傅里葉變換為的傅里葉變換為:ft-b(5=4)(5-4)由Parseval定理,(5-2)式可重新表達(dá)為:(5 5)昭;(mr工(昭皐此式即為小波變換的頻域表達(dá)式36。5.1.2小波去噪原理假設(shè)觀察信號(hào)(5 5)”是噪聲序列。假定M(f是零均值且服從

7、式中,"(')是純凈語(yǔ)音信號(hào),高斯分布的隨機(jī)序列,對(duì)(5-5)式兩邊做小波變換,根據(jù)小波變換的性質(zhì),有(5-6)閃2)=附7;(依)+爐7;(仏耐即兩個(gè)信號(hào)和的小波變換等于各個(gè)信號(hào)小波變換的和。再令u (t)是零均值、獨(dú)r立同分布的平穩(wěn)隨機(jī)信號(hào),記然:山M。顯(5=6)是"的協(xié)方差矩陣。0是小波變換矩陣,對(duì)于正交小波變換,它是正交陣。分別令 x和s是對(duì)應(yīng)令s(t)和u(t)的向量,向量X, S和U分別是x(t) , s(t)和u(t)的小波變換,即:xn, S二必,U二呼甘(5-7)由于X =S+U令P是U的協(xié)方差矩陣,由于:£0二耐必 = "7

8、?町二 0所以:P 二 euU =(5-8)(5-9)因?yàn)閃是正交陣,且0";/,所以 P "/由此,可得到一個(gè)重要的結(jié)論:平穩(wěn)白噪聲的正交小波變換仍然是平穩(wěn)的白噪聲。由此結(jié)論可知,對(duì)于加法性噪聲模型,經(jīng)正交小波變換后,最大程度地去 除了 *(r)(5-10)X(r)是含有噪聲的語(yǔ)音信號(hào),的高斯白噪聲。St是沒(méi)有疊加噪聲的語(yǔ)音信號(hào),其中,N是方差為X")進(jìn)行N層離散小波包分解,得到一組小波包分解系數(shù)由兩部分組成:一部分是S對(duì)應(yīng)的小波包系數(shù),記為對(duì)信號(hào),另一部分是的相關(guān)性,其能量將集中在少數(shù)的小波系數(shù)上,這些系數(shù)即是信號(hào)經(jīng)小波變換后在各個(gè)尺度下的模極大值。 但是,噪

9、聲經(jīng)正交小波變換后仍然 是白噪聲,因此,其小波系數(shù)仍然是不相關(guān)的,它們將分布在各個(gè)尺度下的所有 時(shí)間軸上。這一結(jié)論即為抑制噪聲提供了理論依據(jù),即在小波變換的各個(gè)尺度下 保留那些模極大值點(diǎn),而將其他點(diǎn)置零,或是最大程度地減小,然后利用處理后 的小波系數(shù)做小波反變換,即可達(dá)到抑制噪聲的目的。5.2小波包變換語(yǔ)音增強(qiáng)方法 521小波包變換語(yǔ)音增強(qiáng)方法原理在小波變換中,由于多分辨分析只是對(duì)低頻部分作進(jìn)一步分解,高頻部分則 不再分解。小波包分析能將頻帶進(jìn)行多層次劃分,對(duì)多分辨分析沒(méi)有細(xì)分的高頻 部分進(jìn)一步分解,并能夠根據(jù)被分析信號(hào)的特征,自適應(yīng)地選擇相應(yīng)頻帶,使之 與信號(hào)頻譜相匹配,從而提高了時(shí)一頻分辨

10、率 37。假設(shè)帶噪語(yǔ)音信號(hào)可以表示為:N()對(duì)應(yīng)的小波包系數(shù),記為"幾N對(duì)于每一個(gè)小波包分解系數(shù),選擇一個(gè)當(dāng)T的閾值,并對(duì)系數(shù)進(jìn)行閾值量化,得出估計(jì)小波系數(shù)人A,使得盡量小。5.2.2 Bark尺度小波包分解Barkhausen等學(xué)者依據(jù)人耳的掩蔽效應(yīng)的實(shí)驗(yàn)結(jié)果,提出了頻率群的概念。即將基底膜分解為許多的小段,每一小段稱為一個(gè)頻率群。在20-16000HZ范圍內(nèi)共有24個(gè)頻率群。同一頻率群的聲音在大腦中是疊加在一起進(jìn)行評(píng)價(jià)的,具 有一致的心理聲學(xué)特征。按頻率由低到高,將頻率群順序編號(hào),將編號(hào)定義為 32新的頻率單位Bark。若記Bark域的頻率變量為z,赫茲(Hertz)域頻率變量為

11、/,則有:(5-11)*2_0.53/ + 1960Bark域的頻率描述充分反映了人耳的聽(tīng)覺(jué)特性,因此在語(yǔ)音處理方面得到 了大量應(yīng)用。根據(jù)小波包的函數(shù)空間正交剖分理論,可以構(gòu)造與人耳Bark域頻解,使每個(gè)子帶的中心頻率相差減至 致,也不會(huì)導(dǎo)致較大的計(jì)算量。因此,所示,共68個(gè)子頻帶38-41。率描述相似的小波包分解結(jié)構(gòu),稱之為“ Bark尺度小波包分解”。常規(guī)方法是模 擬人耳的24個(gè)頻率群,對(duì)于8kHz采樣的語(yǔ)音信號(hào),選取1至17個(gè)頻率群,得 到的每個(gè)子帶的中心頻率相差 IBark。試驗(yàn)證實(shí),如果對(duì) Bark域進(jìn)行進(jìn)一步分 1 / 4 Bark,對(duì)語(yǔ)音的描述會(huì)更加細(xì)本論文采用的小波包分解樹(shù)結(jié)構(gòu)

12、如圖5-1to,P)ft*)fl.l)«C|IXDIJ/I1U|M)().»)(1.61 iinHI14.31士叫 C5.1)421 低 3J圖N1 Kuk尺度小注包分解示令國(guó)Fig.5-1 principle diugriim uf Bitrk-eule wjvdlt:! pack說(shuō) decurtipusitiim523閾值函數(shù)在小波閾值去噪理論中42-44,閾值函數(shù)的選取和閾值的確定是兩個(gè)最基 本的問(wèn)題。目前存在的閾值函數(shù)主要是硬閾值函數(shù)和軟閾值函數(shù)。但由于硬閾值 函數(shù)整體不連續(xù),直接導(dǎo)致了會(huì)在去噪后的信號(hào)中出現(xiàn)突變的震蕩點(diǎn),當(dāng)噪聲水平較高時(shí),這種現(xiàn)象尤為明顯。軟閾值函

13、數(shù)雖然整體連續(xù)性好, 但是由于當(dāng)小波 系數(shù)較大時(shí),處理過(guò)的系數(shù)與原系數(shù)之間總存在恒定的偏差,這將直接影響重構(gòu)信號(hào)與真實(shí)信號(hào)的逼近程度,給重構(gòu)信號(hào)帶來(lái)不可避免的誤差??紤]到軟、硬閾 值函數(shù)存在的缺陷,人們提出了各種基于這兩種基本閾值函數(shù)的改進(jìn)的閾值函數(shù)。在去噪過(guò)程中起到了決定性的作用。如果 兄太小,那么,施加小波閾值幾閾值以后的小波系數(shù)中將包含過(guò)多的噪聲分量,達(dá)不到去噪的目的;反之,如果>太大,那么將去除一部分信號(hào)的分量,從而使由小波系數(shù)重將后的信號(hào)產(chǎn)生 過(guò)大的失真。因此,在實(shí)際工作中,估計(jì)閾值的大小尤為關(guān)鍵。常用的估計(jì)閥值I幾的閥值函數(shù)為硬閾值函數(shù)45和軟閾值函數(shù)46:(5-12)(5-

14、13)但是,由于硬閾值函數(shù)整體不連續(xù),直接導(dǎo)致了會(huì)在去噪后的信號(hào)中出現(xiàn)突 變的震蕩點(diǎn),當(dāng)噪聲水平較高時(shí)尤為明顯。軟閾值函數(shù)雖然整體連續(xù)性好,但是 由于當(dāng)小波系數(shù)較大時(shí),處理過(guò)的系數(shù)與原系數(shù)之間總存在恒定的偏差,這將直 接影響重構(gòu)信號(hào)與真實(shí)信號(hào)的逼近程度。文獻(xiàn)36提出了一種改進(jìn)的閥值函數(shù)能夠有效減少失真,其閥值函數(shù):爐呼,> 久空 n (匕 J 屮V 乂(5-14)一種改進(jìn)的閥值函數(shù)公式為:(5-15)小波包變換語(yǔ)音增強(qiáng)方法原理圖:純冷涪冷圖5-2小股也菱嶽語(yǔ)咅曽強(qiáng)育去原理閨Fig.5-2 piinciplc diagriim of wavelet packet小波包變換的語(yǔ)音增強(qiáng)算法的具

15、體步驟為: /分幀。步驟1:對(duì)帶噪語(yǔ)音 步驟2:采用5階Daubechies小波進(jìn)行Bark尺度小波包分解,得到每一級(jí)的小 波包分解系數(shù)5。步驟3:用小波系數(shù)在各尺度下絕對(duì)值的中值估算噪聲方差 。丿。(5T6;medlan W.丄)0.6745步驟4:利用通用閥值 図計(jì)算每一級(jí)的節(jié)點(diǎn)閥值,并對(duì)該節(jié)點(diǎn)的小波包分解 系數(shù)進(jìn)行采用公式(5-15)的處理,更新小波包系數(shù)。(5-17)無(wú)呷二 5 V21n?V步驟5:進(jìn)行小波包重建,重疊相加恢復(fù)原始數(shù)據(jù)幀長(zhǎng)度的增強(qiáng)語(yǔ)音。524實(shí)驗(yàn)仿真用MATLA對(duì)Bark尺度小波包變換語(yǔ)音增強(qiáng)方法進(jìn)行實(shí)驗(yàn)仿真1. 實(shí)驗(yàn)所用數(shù)據(jù):語(yǔ)音取自863語(yǔ)音庫(kù),噪聲為NOISEX.

16、 92數(shù)據(jù)庫(kù)的高斯白噪聲和火車噪聲, 語(yǔ)音信號(hào)的采樣率為8kHz,幀長(zhǎng)K為256個(gè)采樣點(diǎn),幀疊為50%2. 仿真所選標(biāo)準(zhǔn):波形圖,語(yǔ)譜圖。3. 仿真結(jié)果如下:0.2-0朋喻卩眥瞅洲I艸艸4快刪川刪1恤卅恤伽卅淌-0.2-020- *j0225X 10*0.51152(b)帶噪語(yǔ)咅(SdBfl噪聲)(采樣點(diǎn)數(shù))2.5X 10°0.51152(c)小波包變換講音増強(qiáng)方法(來(lái)樣點(diǎn)數(shù))圖5-3波形圖比較Fig.5-3 wavck)mi comparison- 4r.J* 二-2000 - -2000-1152帶噪語(yǔ)fl-fOdBl l 曲)能0.52000-氏屋宰;二七7=苛-哥 二孑

17、9;T' . S 亠苦T 丄;,4000-I g 二 士A r 孟:二 1 r .F 3:一 x 二上00 511.522.5"卜te包變換i卄咅堀強(qiáng)方法強(qiáng)硏咅Us圖5-4語(yǔ)譜a圖比較Fig,5-4 spcclTogram comparison5.3小波包變換和聽(tīng)覺(jué)掩蔽效應(yīng)的語(yǔ)音增強(qiáng)方法 531小波包變換和聽(tīng)覺(jué)掩蔽效應(yīng)的語(yǔ)音增強(qiáng)方法原理小波包變換理論是20世紀(jì)80年代中后期逐漸成熟并發(fā)展起來(lái)的,由于可同 時(shí)進(jìn)行時(shí)域和頻域分析,具有時(shí)頻局部化和變分辨特征,而且小波函數(shù)的選取也 很靈活,因此在語(yǔ)音增強(qiáng)中得到了廣泛的應(yīng)用。 但是,增強(qiáng)后不可避免地伴有一 定程度的音樂(lè)噪聲,影響了增強(qiáng)

18、效果。掩蔽效應(yīng)通過(guò)模擬人耳的感知,能夠掩蔽 同時(shí)進(jìn)入聽(tīng)覺(jué)系統(tǒng)的較小噪聲信號(hào)。優(yōu)點(diǎn)是可以有效地抑制音樂(lè)噪聲,缺點(diǎn)是性 能受限于對(duì)背景噪聲功率譜估計(jì)的準(zhǔn)確性, 且計(jì)算量較大,運(yùn)行速度較慢。為了 抑制音樂(lè)噪聲和提高運(yùn)算速度,本文提出一種基于小波包變換和聽(tīng)覺(jué)掩蔽效應(yīng)的 語(yǔ)音增強(qiáng)算法,同時(shí)具備了小波包變換和掩蔽效應(yīng)兩種方法的優(yōu)點(diǎn)。仿真結(jié)果表明,該算法在信噪比和聽(tīng)覺(jué)舒適度上都取得了較好的效果。小波包變換和聽(tīng)覺(jué)掩蔽效應(yīng)的語(yǔ)音增強(qiáng)方法原理圖 :感知濾波器的作用是在信號(hào)頻譜失真最小的情況下使殘差噪聲的頻譜能量小于掩蔽閾值。感知濾波器應(yīng)滿足:/(e) *73廠 < T(co)<l(5-lS)其中,Na

19、)為背景噪聲功率譜密度,廠(")為噪聲掩蔽閾值。的具體形式為:(5-19)&仙廠)基于小波包變換和聽(tīng)覺(jué)掩蔽效應(yīng)的語(yǔ)音增強(qiáng)算法的步驟為 步驟1:對(duì)帶噪語(yǔ)音信號(hào)用小波包分解的方法進(jìn)行去噪處理,得到增強(qiáng)后的語(yǔ)音A信號(hào)1,并進(jìn)行分幀得到S 2。步驟2:用Johnston掩蔽模型計(jì)算掩蔽閥值T。A6步驟3:使增強(qiáng)語(yǔ)音和掩蔽閥值T經(jīng)過(guò)感知濾波器日(1°)A進(jìn)行濾波,得到S 2(5-20)步驟4:經(jīng)過(guò)幀重疊相加得到增強(qiáng)語(yǔ)音S。A八 St(69)- Hd532實(shí)驗(yàn)仿真用MATLAB對(duì)小波包變換和聽(tīng)覺(jué)掩蔽效應(yīng)的語(yǔ)音增強(qiáng)方法進(jìn)行實(shí)驗(yàn)仿真1. 實(shí)驗(yàn)所用數(shù)據(jù): 語(yǔ)音取自863語(yǔ)音庫(kù),噪聲為

20、NOISEX. 92數(shù)據(jù)庫(kù)的高斯白噪聲和火車噪聲, 語(yǔ)音信號(hào)的采樣率為8kHz,幀長(zhǎng)K為256個(gè)采樣點(diǎn),幀疊為50%2. 仿真所選標(biāo)準(zhǔn):波形圖,語(yǔ)譜圖,信噪比,PESQ值,坂倉(cāng)距離。3. 仿真結(jié)果如下:首先,在純凈語(yǔ)音中加入5dB高斯白噪聲作為帶噪語(yǔ)音,采用基于小波包變換 和聽(tīng)覺(jué)掩蔽效應(yīng)的語(yǔ)音增強(qiáng)算法(本文算法),比較傳統(tǒng)的小波包變換增強(qiáng)算 法,增強(qiáng)后仿真結(jié)果如下:621C,1 ; 1 1 1| - -J_ 'II ,| RL i0- -hIl-0.20.511,5但應(yīng)始出音(采樣點(diǎn)數(shù))2.54X 100,2-0|r I42 =Ih I 嚴(yán)卄叮J; II M仆0.2-0,201, 1J

21、 ' II1*計(jì)M卩11L1'-T0.511.52帯噪倍育(射B白嗥用)(采樣點(diǎn)敵0.511.52(C)小玻包變換悟音増®方法爲(wèi)樣山數(shù))2.5X 10*2.5X 10*0.2 rI0 - ,-02I00.511.522.5(小波包變換利攤蔽效應(yīng)需咅增強(qiáng)力法采樣點(diǎn)教)乂 ifFig 5-6 wavcfbnii comparisonis(a)Jv kt H C t/s)0心NHJ 妍®2000-4000 二00.511.52(b),ir噪講咅(d目白噪聲)t対、2.52000- N ;天嚴(yán) . y"I-> - _ -KF 筆4000100.511

22、.52©小波包斐換語(yǔ)音増強(qiáng)方?jīng)Q(Vs)2000-伍Rd W JBL400010gw -10.511 522.5(日)小波包斐換和掩蔽效應(yīng)沿汗增強(qiáng)方法 t/s)圖5-7語(yǔ)譜圖®比較Fig.57 ipecirogram comparison4. 結(jié)果分析音。曰。圖5-6和圖5-7分別為增強(qiáng)后的波形圖和語(yǔ)譜圖。其中,(a)為純凈語(yǔ)音; (b)為添加5dB白噪聲后的帶噪語(yǔ)音;(C)為采用小波包變換語(yǔ)音增強(qiáng)方法后的增 強(qiáng)語(yǔ)音。(d)為采用小波包變換和掩蔽效應(yīng)語(yǔ)音增強(qiáng)方法后的增強(qiáng)語(yǔ)音。從時(shí)域 波形圖及頻域語(yǔ)譜圖的比較結(jié)果可以發(fā)現(xiàn), 帶噪語(yǔ)音采用本文算法增強(qiáng)后,增強(qiáng) 語(yǔ)音和原始語(yǔ)音在波形

23、圖和語(yǔ)譜圖上非常接近,噪聲得到了明顯的抑制,增強(qiáng)效果明顯優(yōu)于傳統(tǒng)小波包變換的增強(qiáng)算法。其次,采用在純凈語(yǔ)音中分別加入高斯白噪聲,全局信噪比為OdB,5dB,10dB的帶噪語(yǔ)音作為測(cè)試對(duì)象。比較小波包變換和聽(tīng)覺(jué)掩蔽效應(yīng)的語(yǔ)音增強(qiáng)方法和傳 統(tǒng)小波包變換的增強(qiáng)算法,增強(qiáng)后語(yǔ)音質(zhì)量性能的評(píng)估采用信噪比 SNF和語(yǔ)音質(zhì) 量感知評(píng)估PESQ PESQ是 ITU-T的P.862標(biāo)準(zhǔn),用來(lái)評(píng)價(jià)增強(qiáng)后語(yǔ)音的試聽(tīng)效 果。PESQ尋分在4.5到-0.5之間,得分越高表示語(yǔ)音質(zhì)量越好。實(shí)驗(yàn)結(jié)果如表 5-1 示:3fZ5-r1.5* -=小波包變換和聽(tīng)愛(ài)掩蔽效應(yīng)語(yǔ)音増強(qiáng)方沈 h 小波包變換語(yǔ)音1ft強(qiáng)方法2345678

24、910輸入佶哋比(dBK白噪聲圖5-8感知:1昏音質(zhì)量評(píng)價(jià)(.白噪聲)比較Fig.5-K 卩ESQ(while noise) cumprtriMn從實(shí)驗(yàn)結(jié)果可以看出,在各種信噪比下采用小波包變換和聽(tīng)覺(jué)掩蔽效應(yīng)的語(yǔ) 音增強(qiáng)方法比傳統(tǒng)小波包方法,在信噪比和P ESQh都有很大提高,并且在信噪比較小的情況下,增強(qiáng)效果更加明顯。通過(guò)主觀聽(tīng)測(cè)表明:采用傳統(tǒng)小波包方法增強(qiáng)后伴有明顯的音樂(lè)噪聲,而采用該方法增強(qiáng)后音樂(lè)噪聲得到了明顯地抑制, 取得了較好的增強(qiáng)效果。養(yǎng)5-1信嗥比比較 labile 5-1 compare the SN R唏聲種蹇輸入信噪比UlB)小波包變換方?jīng)QWB)小波包變換和掩蔽效應(yīng)方迦曲口

25、噪川04.229358 4»219.f)26KW12,509412.91745.4子空間和小波包變換的語(yǔ)音增強(qiáng)方法541子空間與小波包變換的語(yǔ)音增強(qiáng)方法原理子空間與小波包變換的語(yǔ)音增強(qiáng)方法原理圖為IK1逆變換佔(zhàn)訃噪 聲特征 值圖5-9子空間與小波包埜換的語(yǔ)音增強(qiáng)方法理圖Fig.5-9 Prmciph di;igr4m of subspace 肋(J wEivki packel子空間與小波包變換的語(yǔ)音增強(qiáng)方法具體步驟為:步驟1:帶噪語(yǔ)音進(jìn)行KL,變換,得到子空間域中的帶噪語(yǔ)音的特征向量U和特征值"步驟2:采用最小值跟蹤算法更新帶噪語(yǔ)音特征值A(chǔ)y,得到估計(jì)噪聲特征值入。步驟3:

26、采用小波包變換方法更新帶噪語(yǔ)音特征值A(chǔ)r得到八。步驟4:帶噪語(yǔ)音特征值A(chǔ)Af減去噪聲特征值,得到純凈語(yǔ)音特征值估計(jì)值S,可以得到時(shí)域約束估計(jì)器(TDC)增益G步驟5:由KL逆變換可得最優(yōu)估計(jì)器彳-% - V式可得純凈語(yǔ)音的估計(jì)5.4.2實(shí)驗(yàn)仿真用MATLA對(duì)子空間與小波包變換的語(yǔ)音增強(qiáng)方法進(jìn)行實(shí)驗(yàn)仿真1.實(shí)驗(yàn)所用數(shù)據(jù): 語(yǔ)音取自863語(yǔ)音庫(kù),噪聲為NOISEX. 92數(shù)據(jù)庫(kù)的高斯白噪聲和火車噪聲, 語(yǔ)音信號(hào)的采樣率為8kHz,幀長(zhǎng)K為256個(gè)采樣點(diǎn),幀疊為50%2.仿真所選標(biāo)準(zhǔn):波形圖,語(yǔ)譜圖,信噪比,PESQ值,GUI語(yǔ)音增強(qiáng)性能測(cè)試界面03.仿真結(jié)果如下:首先在純凈語(yǔ)音中加入SdB高斯白噪

27、聲作為帶噪語(yǔ)音,采用子空間與小波包變 換的語(yǔ)音增強(qiáng)方法得到增強(qiáng)后仿真結(jié)果如下:0.2-£-0.2-0-0.2-_ -0.2-0.2-II-01.511.5a)K始誥音(采ff點(diǎn)救),T-b' N,2.5 X 1(?0-0.2 L00.2 =0*511.52(b)帶噪譏汗(5dB估哋幣(采樣貞數(shù))Z5X 10*0.511522)小波包變換S音増強(qiáng)方法t采樣點(diǎn)數(shù))2.54X 1002 = =00152.59)子空問(wèn)和小波包變換的諂rt-増強(qiáng)"法采樣點(diǎn)數(shù)斗ffl 5-10波形圖比較Fig-5-lO waveform coinparisim2000>_ -40002000-4000 L上二七0.5152.50.5(a)ffi 始 1 啓 t/s2.5WHIP 峰 雷 E l (5dBA 噪聲 Hf9-=2000-:-一 =4000-0,51,S2.520004000何小液包變換誥音增強(qiáng)方袪t/5T0.51.522,5(l)r-空間和小波包變換的i普宵增強(qiáng)方法t/s圖5=11語(yǔ)講®圖比較FigJ-l 1 spectrogram com parisonK 5-2信嗥比比較table 5-2 Coinpaie l lie SNR輸人信噪比何日)(151015小波也變換方法6J411畑3()12”£

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論