第四章小波變換

上傳人：鼠*** IP屬地：上海上傳時間：2022-02-13 格式：DOCX 頁數(shù)：8 大小：109.22KB 積分：20 舉報 版權(quán)申訴

已閱讀5頁，還剩3頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進行舉報或認領(lǐng)

文檔簡介

1、.語音增強算法研究p584.1小波理論小波變換的定義4.1. 2小波去噪原理.4.2小波包變換語音增強方法小波包變換語音增強方法原理4 2. 2 Bark尺度小波包分解閩值函數(shù) 實驗仿真4.3小波包變換和聽覺掩蔽效應的語音增強方法4.3. 1小波包變換和聽覺掩蔽效應的語音增強方法原理4.3. 2實驗仿真第四章小波包語音增強算法小波(Wavelets)分析的起源可以追溯到20世紀初，在20世紀80年代后期開始形成一個新興的數(shù)學分支。小波變換是調(diào)和分析這一數(shù)學領(lǐng)域半個世紀以來的工作結(jié)晶，是傅里葉變換發(fā)展史上的里程碑式的進展，近些年來成為國外眾多學者共同關(guān)注的熱點。它在傅里葉變換的基礎(chǔ)上發(fā)展而

2、來，但又有極大不同。傳統(tǒng)的信號處理方法是建立在傅立葉變換的基礎(chǔ)上，而傅立葉分析使用的是一種全局的變換，要么完全在時域，要么完全在頻域，因此無法表達信號的時頻局域性質(zhì)，而這種性質(zhì)恰恰是非平穩(wěn)信號(如語音信號)最根本和最關(guān)鍵的性質(zhì)。小波分析是建立在泛函分析、傅立葉分析、樣條分析及調(diào)和分析基礎(chǔ)上的新的分析處理工具它又稱為多分辨分析，在時域和頻域同時具有良好配局部化特性，常被譽為信號分析的“數(shù)學顯微鏡”。小波變換在時頻兩域都具有表征信號局部特征的能力，它克服了短時傅立葉變換固定分辨率的缺點，在信號的高頻部分，可以獲得較好的時間分辨率，在信號的低頻部分可以獲得較高的頻率分辨率，這就使指小波變換具有對信號

3、的自適應性。它能有效地從信號中提取信息，通過伸縮和平移等運算功能對信號進行多尺度細化分析。小波分析是目前國際上公認的信號信息獲取與處班領(lǐng)域的高新技術(shù)，是信號處理的前沿課題，其中小波去噪也是小波分析的主要應用之一，對語音增強的研究不可避免的要利用小波這一有效工具。小波包變換理論是20世紀80年代中后期逐漸成熟并發(fā)展起來的，由于可同時進行時域和頻域分析，具有時頻局部化和變分辨特征，而且小波函數(shù)的選取也很靈活，因此在語音增強中得到了廣泛的應用。這就使得小波包變換在信號處理方面有許多獨到的優(yōu)點，特別適用于像信號處理，圖象處理，量子場論，地震探測，話音識別與增強，雷達，機器視覺以及數(shù)字電視等科技領(lǐng)域3

4、1-354.1小波理論4.1.1小波變換的定義其中，為給定的一個基本函數(shù)，式中a，b均為常數(shù)，且a>0。給定平方可積的信號x(t , ，則的小波變換(wavelet transform,WT)定義為:式中，a，b和t均是連續(xù)變量。因此此式又稱為連續(xù)小波變換(CWT)。信號的小波變換 (a，b)是a和b的函數(shù)，b是時移，a是尺度因子。又稱為基本小波，或母小波。是母小波經(jīng)移位和伸縮所產(chǎn)生的一組函數(shù)，稱之為小波基函數(shù)，或簡稱小波基。母小波可以是實函數(shù)，也可以是復函數(shù)。若是實信號，也是實信號，則也是實函數(shù)，反之，為復函數(shù)。在(5-l)式中，時移b的作用是確定對分析的時間位置，也即時間中心。尺度因

5、子a的作用是把基本小波作伸縮。由變成，當a>1時，a越大，則的時域支撐范圍(即時域?qū)挾?較之變得越大;反之，當a<1時，a越小，則的寬度越窄。這樣，a和b聯(lián)合起來確定了對分析的中心位置及分析的時間寬度。這樣，(5-2)式的小波變換可以理解為用一組分析寬度不斷變化的基函數(shù)對作分析，這一變化正好適應了對信號分析時在不同頻率范圍需要不同的分辨率這一基本要求。(5-2)式中的因子是為了保證在不同的尺度a時，始終能和母函數(shù)有蓍相同的能量，即:令，則dt=adt'，這樣，上式右邊的積分即等于。令的傅里葉變換為 , 的傅里葉變換為，由傅里葉變換的性質(zhì):的傅里葉變換為:由Parseval定

6、理，(5-2)式可重新表達為:此式即為小波變換的頻域表達式36。小波去噪原理假設(shè)觀察信號式中，是純凈語音信號，是噪聲序列。假定是零均值且服從高斯分布的隨機序列，對(5-5)式兩邊做小波變換，根據(jù)小波變換的性質(zhì)，有:即兩個信號和的小波變換等于各個信號小波變換的和。再令u (t)是零均值、獨立同分布的平穩(wěn)隨機信號，記。顯然:是的協(xié)方差矩陣。令是小波變換矩陣，對于正交小波變換，它是正交陣。分別令x和s是對應s(t)和u(t)的向量，向量X, S和U分別是x(t) , s(t)和u(t)的小波變換，即:由于X =S+U。令P是U的協(xié)方差矩陣，由于:所以：因為W是正交陣，且。由此，可得到一個重要的結(jié)論

7、:平穩(wěn)白噪聲的正交小波變換仍然是平穩(wěn)的白噪聲。由此結(jié)論可知，對于加法性噪聲模型，經(jīng)正交小波變換后，最大程度地去除了的相關(guān)性，其能量將集中在少數(shù)的小波系數(shù)上，這些系數(shù)即是信號經(jīng)小波變換后在各個尺度下的模極大值。但是，噪聲經(jīng)正交小波變換后仍然是白噪聲，因此，其小波系數(shù)仍然是不相關(guān)的，它們將分布在各個尺度下的所有時間軸上。這一結(jié)論即為抑制噪聲提供了理論依據(jù)，即在小波變換的各個尺度下保留那些模極大值點，而將其他點置零，或是最大程度地減小，然后利用處理后的小波系數(shù)做小波反變換，即可達到抑制噪聲的目的。5.2小波包變換語音增強方法5.2.1小波包變換語音增強方法原理在小波變換中，由于多分辨分析只是對低頻

8、部分作進一步分解，高頻部分則不再分解。小波包分析能將頻帶進行多層次劃分，對多分辨分析沒有細分的高頻部分進一步分解，并能夠根據(jù)被分析信號的特征，自適應地選擇相應頻帶，使之與信號頻譜相匹配，從而提高了時一頻分辨率37。假設(shè)帶噪語音信號可以表示為:其中，是含有噪聲的語音信號，是沒有疊加噪聲的語音信號，是方差為的高斯白噪聲。對信號進行N層離散小波包分解，得到一組小波包分解系數(shù)，由兩部分組成:一部分是對應的小波包系數(shù)，記為，另一部分是對應的小波包系數(shù)，記為對于每一個小波包分解系數(shù)，選擇一個當?shù)拈撝担ο禂?shù)進行閾值量化，得出估計小波系數(shù)，使得盡量小。5.2.2 Bark尺度小波包分解Barkhause

9、n等學者依據(jù)人耳的掩蔽效應的實驗結(jié)果，提出了頻率群的概念。即將基底膜分解為許多的小段，每一小段稱為一個頻率群。在20-16000Hz范圍內(nèi)共有24個頻率群。同一頻率群的聲音在大腦中是疊加在一起進行評價的，具有一致的心理聲學特征。按頻率由低到高，將頻率群順序編號，將編號定義為32新的頻率單位Bark。若記Bark域的頻率變量為z，赫茲(Hertz)域頻率變量為，則有:Bark域的頻率描述充分反映了人耳的聽覺特性，因此在語音處理方面得到了大量應用。根據(jù)小波包的函數(shù)空間正交剖分理論，可以構(gòu)造與人耳Bark域頻率描述相似的小波包分解結(jié)構(gòu)，稱之為“Bark尺度小波包分解”。常規(guī)方法是模擬人耳的24個頻率

10、群，對于8kHz采樣的語音信號，選取1至17個頻率群，得到的每個子帶的中心頻率相差1Bark。試驗證實，如果對Bark域進行進一步分解，使每個子帶的中心頻率相差減至,對語音的描述會更加細致，也不會導致較大的計算量。因此，本論文采用的小波包分解樹結(jié)構(gòu)如圖5-1所示，共68個子頻帶38-41。5.2.3閾值函數(shù) 在小波閾值去噪理論中42-44，閾值函數(shù)的選取和閾值的確定是兩個最基本的問題。目前存在的閾值函數(shù)主要是硬閾值函數(shù)和軟閾值函數(shù)。但由于硬閾值函數(shù)整體不連續(xù)，直接導致了會在去噪后的信號中出現(xiàn)突變的震蕩點，當噪聲水平較高時，這種現(xiàn)象尤為明顯。軟閾值函數(shù)雖然整體連續(xù)性好，但是由于當小波系數(shù)較大時，

11、處理過的系數(shù)與原系數(shù)之間總存在恒定的偏差，這將直接影響重構(gòu)信號與真實信號的逼近程度，給重構(gòu)信號帶來不可避免的誤差?？紤]到軟、硬閾值函數(shù)存在的缺陷，人們提出了各種基于這兩種基本閾值函數(shù)的改進的閾值函數(shù)。小波閾值在去噪過程中起到了決定性的作用。如果太小，那么，施加閾值以后的小波系數(shù)中將包含過多的噪聲分量，達不到去噪的目的;反之，如果太大，那么將去除一部分信號的分量，從而使由小波系數(shù)重將后的信號產(chǎn)生過大的失真。因此，在實際工作中，估計閾值的大小尤為關(guān)鍵。常用的估計閥值的閥值函數(shù)為硬閾值函數(shù)45和軟閾值函數(shù)46：但是，由于硬閾值函數(shù)整體不連續(xù)，直接導致了會在去噪后的信號中出現(xiàn)突變的震蕩點，當噪聲水

12、平較高時尤為明顯。軟閾值函數(shù)雖然整體連續(xù)性好，但是由于當小波系數(shù)較大時，處理過的系數(shù)與原系數(shù)之間總存在恒定的偏差，這將直接影響重構(gòu)信號與真實信號的逼近程度。文獻36提出了一種改進的閥值函數(shù)能夠有效減少失真，其閥值函數(shù):一種改進的閥值函數(shù)公式為:小波包變換語音增強方法原理圖:小波包變換的語音增強算法的具體步驟為:步驟1:對帶噪語音分幀。步驟2:采用5階Daubechies小波進行Bark尺度小波包分解，得到每一級的小波包分解系數(shù)。步驟3:用小波系數(shù)在各尺度下絕對值的中值估算噪聲方差。步驟4:利用通用閥值計算每一級的節(jié)點閥值，并對該節(jié)點的小波包分解系數(shù)進行采用公式(5-15)的處理，更新小波包系數(shù)

13、。步驟5:進行小波包重建，重疊相加恢復原始數(shù)據(jù)幀長度的增強語音。5.2.4實驗仿真用MATLAB對Bark尺度小波包變換語音增強方法進行實驗仿真:1. 實驗所用數(shù)據(jù):語音取自863語音庫，噪聲為NOISEX. 92數(shù)據(jù)庫的高斯白噪聲和火車噪聲，語音信號的采樣率為8kHz，幀長K為256個采樣點，幀疊為50%。2.仿真所選標準:波形圖，語譜圖。3.仿真結(jié)果如下:5.3小波包變換和聽覺掩蔽效應的語音增強方法5.3.1小波包變換和聽覺掩蔽效應的語音增強方法原理小波包變換理論是20世紀80年代中后期逐漸成熟并發(fā)展起來的，由于可同時進行時域和頻域分析，具有時頻局部化和變分辨特征，而且小波函數(shù)的選取也很

14、靈活，因此在語音增強中得到了廣泛的應用。但是，增強后不可避免地伴有一定程度的音樂噪聲，影響了增強效果。掩蔽效應通過模擬人耳的感知，能夠掩蔽同時進入聽覺系統(tǒng)的較小噪聲信號。優(yōu)點是可以有效地抑制音樂噪聲，缺點是性能受限于對背景噪聲功率譜估計的準確性，且計算量較大，運行速度較慢。為了抑制音樂噪聲和提高運算速度，本文提出一種基于小波包變換和聽覺掩蔽效應的語音增強算法，同時具備了小波包變換和掩蔽效應兩種方法的優(yōu)點。仿真結(jié)果表明，該算法在信噪比和聽覺舒適度上都取得了較好的效果。小波包變換和聽覺掩蔽效應的語音增強方法原理圖:感知濾波器的作用是在信號頻譜失真最小的情況下使殘差噪聲的頻譜能量小于掩蔽閾值。感知濾

15、波器應滿足:其中，為背景噪聲功率譜密度，為噪聲掩蔽閾值。的具體形式為:基于小波包變換和聽覺掩蔽效應的語音增強算法的步驟為:步驟1:對帶噪語音信號用小波包分解的方法進行去噪處理，得到增強后的語音信號，并進行分幀得到。步驟2:用Johnston掩蔽模型計算掩蔽閥值T。步驟3:使增強語音和掩蔽閥值T經(jīng)過感知濾波器進行濾波，得到步驟4:經(jīng)過幀重疊相加得到增強語音。5.3.2實驗仿真用MATLAB對小波包變換和聽覺掩蔽效應的語音增強方法進行實驗仿真:1.實驗所用數(shù)據(jù): 語音取自863語音庫，噪聲為NOISEX. 92數(shù)據(jù)庫的高斯白噪聲和火車噪聲，語音信號的采樣率為8kHz，幀長K為256個采樣點，幀疊

16、為50%。2.仿真所選標準:波形圖，語譜圖，信噪比，PESQ值，坂倉距離。3.仿真結(jié)果如下: 首先，在純凈語音中加入5dB高斯白噪聲作為帶噪語音，采用基于小波包變換和聽覺掩蔽效應的語音增強算法(本文算法)，比較傳統(tǒng)的小波包變換增強算法，增強后仿真結(jié)果如下:4.結(jié)果分析圖5-6和圖5-7分別為增強后的波形圖和語譜圖。其中，(a)為純凈語音；(b)為添加5dB白噪聲后的帶噪語音；(c)為采用小波包變換語音增強方法后的增強語音。(d)為采用小波包變換和掩蔽效應語音增強方法后的增強語音。從時域波形圖及頻域語譜圖的比較結(jié)果可以發(fā)現(xiàn)，帶噪語音采用本文算法增強后，增強語音和原始語音在波形圖和語譜圖上非常接

17、近，噪聲得到了明顯的抑制，增強效果明顯優(yōu)于傳統(tǒng)小波包變換的增強算法。其次，采用在純凈語音中分別加入高斯白噪聲，全局信噪比為OdB,5dB,10dB的帶噪語音作為測試對象。比較小波包變換和聽覺掩蔽效應的語音增強方法和傳統(tǒng)小波包變換的增強算法，增強后語音質(zhì)量性能的評估采用信噪比SNR和語音質(zhì)量感知評估PESQ，PESQ是ITU-T的P.862標準，用來評價增強后語音的試聽效果。PESQ得分在4.5到-0.5之間，得分越高表示語音質(zhì)量越好。實驗結(jié)果如表5-1示:從實驗結(jié)果可以看出，在各種信噪比下采用小波包變換和聽覺掩蔽效應的語音增強方法比傳統(tǒng)小波包方法，在信噪比和PESQ上都有很大提高，并且在信噪比

18、較小的情況下，增強效果更加明顯。通過主觀聽測表明:采用傳統(tǒng)小波包方法增強后伴有明顯的音樂噪聲，而采用該方法增強后音樂噪聲得到了明顯地抑制，取得了較好的增強效果。5.4子空間和小波包變換的語音增強方法5.4.1子空間與小波包變換的語音增強方法原理子空間與小波包變換的語音增強方法原理圖為:子空間與小波包變換的語音增強方法具體步驟為:步驟1:帶噪語音進行KL,變換，得到子空間域中的帶噪語音的特征向量U和特征值。步驟2:采用最小值跟蹤算法更新帶噪語音特征值，得到估計噪聲特征值。步驟3:采用小波包變換方法更新帶噪語音特征值得到。步驟4:帶噪語音特征值減去噪聲特征值，得到純凈語音特征值估計值，可以得到時域約束估計器(TDC)增益G。步驟5:由KL逆變換可得最優(yōu)估計器。由式可得純凈語音的估計。實驗仿真用MATLAB對子空間與小波包變換的語音增強方法進行實驗仿真:1.實驗所用數(shù)據(jù): 語音取自863語音庫，噪聲為NOISEX. 92數(shù)據(jù)庫的高斯白噪聲和火車噪聲，語音信號的采樣率為8kHz，幀長K為256個采樣點，幀疊為50%。2.仿真所選標準:波形圖，語譜圖，信噪比，PESQ值，GUI語音增強性能測試界面。3.仿真結(jié)果如下: 首先在純凈語音中加入SdB高斯白噪聲作為帶噪語音，采用子空間與小波包變換的語音增強方法

人人文庫> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預覽，若沒有圖紙預覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負責。
6. 下載文件中如有侵權(quán)或不適當內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

第四章小波變換

文檔簡介

溫馨提示

最新文檔

評論

第四章小波變換

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔