基于先驗(yàn)信噪比的改進(jìn)型譜減法_第1頁(yè)
基于先驗(yàn)信噪比的改進(jìn)型譜減法_第2頁(yè)
基于先驗(yàn)信噪比的改進(jìn)型譜減法_第3頁(yè)
基于先驗(yàn)信噪比的改進(jìn)型譜減法_第4頁(yè)
基于先驗(yàn)信噪比的改進(jìn)型譜減法_第5頁(yè)
已閱讀5頁(yè),還剩37頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、 學(xué)號(hào):01021023 畢業(yè)設(shè)計(jì)論文 畢業(yè)設(shè)計(jì)題目:基于先驗(yàn)信噪比的改進(jìn)型譜減法學(xué)院:通信工程學(xué)院專業(yè):通信工程班級(jí):01-0211姓名:徐鑫昌導(dǎo)師姓名:王平(講師)摘 要語(yǔ)音增強(qiáng)的目的主要是改進(jìn)語(yǔ)音質(zhì)量,在消除背景噪音的同時(shí)提高語(yǔ)音可懂度,但是這兩個(gè)目的往往不能兼得。目前有一些對(duì)非平穩(wěn)噪聲干擾下的語(yǔ)音信號(hào)進(jìn)行增強(qiáng)的方法,可以降低背景噪聲,但有時(shí)會(huì)引入刺耳的音樂(lè)噪聲,且不能提高語(yǔ)音的可懂度,甚至略有下降。其中譜減法作為一種單信道語(yǔ)音增強(qiáng)方法,以其簡(jiǎn)單有效在使用化的語(yǔ)音增強(qiáng)應(yīng)用中深受歡迎。本文研究采用閥值法法對(duì)非平穩(wěn)背景噪聲信號(hào)進(jìn)行估計(jì),計(jì)算出先驗(yàn)信噪比,得到還原的純凈語(yǔ)音信號(hào)。本文用MATL

2、AB實(shí)現(xiàn)了整個(gè)算法的仿真,并與傳統(tǒng)譜減法結(jié)果相比較,仿真結(jié)果表明,該算法對(duì)非平穩(wěn)噪聲追蹤性較好,在抑制背景噪聲,減少音樂(lè)噪聲前提下,提高了語(yǔ)音的可懂度,其計(jì)算復(fù)雜度也可以接受。關(guān)鍵詞: 譜減法 語(yǔ)音增強(qiáng) 噪聲估計(jì) Abstract The mainly purpose of speech enhancement is to improve the quality of speech, raises the intelligibility of speech while eliminating background noise, but this two purposes can not oft

3、en be gotten simultaneously. Now there are many method of speech enhancement for the speech signal with near-stationary noise can reduce background noise, but can produce an annoying noise called music noise, and the intelligibility can not raise even drops. As a method of one channel speech enhance

4、ment, spectral subtraction is deeply welcome because it is easy and efficient.In this paper, the SNR of the speech signal is estimated, then the enhanced speech signal is gotten. MATLAB is used to realize the purpose, and it is compared with traditional spectral subtraction. It shows that this algor

5、ithm is better for the speech signal with the near-stationary noise; it restrains the music noise and reduces the background noise, it also raises the intelligibility. The complex degree also can be accepted.Keyword: Spectral subtraction Speech enhancement Noise estimation 目錄第一章 緒論11.1 課題背景及問(wèn)題提出11.2

6、 語(yǔ)音增強(qiáng)研究的主要內(nèi)容和發(fā)展方向11.3 譜減法語(yǔ)音增強(qiáng)的研究現(xiàn)狀3第二章 語(yǔ)音感知和噪聲特性52.1 語(yǔ)音特性52.2噪聲特性5第三章 譜減法語(yǔ)音增強(qiáng)算法73.1 語(yǔ)音增強(qiáng)算法概述73.2一般譜減法83.2.1 基本原理83.2.3 基本步驟和仿真結(jié)果113. 3 “音樂(lè)噪聲”的產(chǎn)生133.4 改進(jìn)的譜減法14改進(jìn)型譜減法的種類143.4.2 幅度譜平滑15 被減項(xiàng)加權(quán)值處理163.4.4 功率譜修正處理16第四章 基于先驗(yàn)信噪比估計(jì)的改進(jìn)型譜減法194.1 基本原理194.2 寂靜幀和語(yǔ)音幀的判定194.3 算法的實(shí)現(xiàn)214.4 參數(shù)的估計(jì)224.5 實(shí)驗(yàn)結(jié)果和分析22第五章 性能評(píng)價(jià)2

7、55.1 信噪比改進(jìn)255.2 主觀評(píng)價(jià)25結(jié)論 27參考文獻(xiàn) 29第一章 緒論1.1 課題背景及問(wèn)題提出眾所周知,語(yǔ)言是人類傳播信息和表達(dá)感情的重要媒介,在人類的交流中起著極其重要的作用,是人類最方便、最快捷、最有效的交流方式。二十一世紀(jì)是信息科學(xué)的世紀(jì),信息處理技術(shù)與人們的日常生活聯(lián)系也越來(lái)越緊密,因此,對(duì)人們交流中最常用的語(yǔ)音來(lái)說(shuō),對(duì)其進(jìn)行處理在現(xiàn)代信息處理中就占有極為重要的地位。隨著通訊技術(shù)的發(fā)展,語(yǔ)音通信已成為人們?nèi)粘I?、工作中不可缺少的一部分。近年?lái)雖然數(shù)據(jù)通信迅猛發(fā)展,但據(jù)國(guó)家信息部的統(tǒng)計(jì)數(shù)據(jù)顯示,語(yǔ)音通信仍是現(xiàn)階段主流,占據(jù)通信行業(yè)主導(dǎo)地位。語(yǔ)音信號(hào)處理技術(shù)一直以來(lái)都是國(guó)內(nèi)外

8、學(xué)者研究的熱點(diǎn),它跨聲學(xué)、信號(hào)處理、仿生學(xué)等多個(gè)學(xué)科,應(yīng)用前景廣闊。近年來(lái),由于計(jì)算機(jī)和因特網(wǎng)正以驚人的速度和規(guī)模滲透到社會(huì)的各個(gè)領(lǐng)域,許多應(yīng)用要求簡(jiǎn)單、自然、友善的人機(jī)界面,而語(yǔ)音就成為一種理想的人機(jī)信息交流手段,因此也就對(duì)語(yǔ)音信號(hào)處理的發(fā)展提出了更迫切的要求。然而在人們的語(yǔ)音通信過(guò)程中,不可避免地會(huì)受到來(lái)自周圍環(huán)境、傳輸媒介引入的噪聲、通信設(shè)備內(nèi)部的電噪聲、乃至其他講話者的干擾。這些干擾最終將使接收者接收到的語(yǔ)音不再是純凈的原始語(yǔ)音,而是被噪聲污染過(guò)的帶噪語(yǔ)音。語(yǔ)音增強(qiáng)目的就是從被污染的語(yǔ)音信號(hào)中,提取盡可能純凈的原始語(yǔ)音,改善語(yǔ)音質(zhì)量,使聽者不覺(jué)的疲勞,并且能夠提高語(yǔ)音的可懂度。1.2

9、語(yǔ)音增強(qiáng)研究的主要內(nèi)容和發(fā)展方向增強(qiáng)被加性噪聲污染的語(yǔ)音信號(hào),這一問(wèn)題自七十年代中期后已引起極大的注意。中,奧本海姆等人綜述了七十年代的各種各樣的噪聲語(yǔ)音信號(hào)增強(qiáng)方法。近些年來(lái),語(yǔ)音增強(qiáng)的研究工作有了一定的進(jìn)展。下面對(duì)國(guó)內(nèi)外語(yǔ)音增強(qiáng)研究的常用方法作介紹。一 頻譜相減法單聲道語(yǔ)音增強(qiáng)方法中目前常用的是一類基于短時(shí)譜幅度(STSA)估計(jì)的語(yǔ)音增強(qiáng)方法,該方法認(rèn)為語(yǔ)音信號(hào)的感知不重要,沒(méi)有必要精確計(jì)算。文中通過(guò)實(shí)驗(yàn)為此提供了一定的依據(jù),文中則證明在一定條件下語(yǔ)音相位的最小均方誤差(MMSE)估計(jì)就是帶噪語(yǔ)音相位本身,因此,基于STSA估計(jì)的語(yǔ)音增強(qiáng)方法一般都是直接采用帶噪語(yǔ)音的相位作為增強(qiáng)語(yǔ)音的相位

10、?;赟TSA估計(jì)的語(yǔ)音增強(qiáng)方法包括譜減法及其各種變形,MMSE估計(jì)法等。譜減法通過(guò)從帶噪語(yǔ)音的STSA中直接減去噪聲的平均譜幅度來(lái)得到增強(qiáng)語(yǔ)音的STSA,實(shí)現(xiàn)起來(lái)簡(jiǎn)單,但是剩余噪聲大,并且產(chǎn)生不舒服的“音樂(lè)噪聲”。后來(lái),Ephraim等人 提出了STSA的MMSE估計(jì)法,部分解決了“音樂(lè)噪聲”問(wèn)題,但在帶噪語(yǔ)音信噪(SNR)較低時(shí)其剩余噪聲還是很大,尤其是當(dāng)信噪比小于5dB時(shí)。二 自適應(yīng)噪聲對(duì)消法 適用于在帶噪語(yǔ)音信號(hào)采集過(guò)程中同時(shí)能獲得參考噪聲源的自適應(yīng)噪聲對(duì)消技術(shù),已日趨成熟。據(jù)專家報(bào)告:運(yùn)用此技術(shù)增強(qiáng)帶噪語(yǔ)音,在實(shí)驗(yàn)環(huán)境中,信噪比SNR有40dB左右的改善,在實(shí)際中也有20dB左右的提

11、高。三 小波變換法頻譜相減法是在短時(shí)平穩(wěn)假定的基礎(chǔ)上,采用固定窗傅立葉變換,時(shí)頻分辨率均是固定不變的。然而對(duì)某些“嚴(yán)格非平穩(wěn)” 的語(yǔ)音(如爆破音和塞擦音等),這種分析模糊了語(yǔ)音的細(xì)節(jié)特征,小波變換正是滿足這一需要的有力工具。語(yǔ)音增強(qiáng)已成為語(yǔ)音信號(hào)處理研究的不可忽視的重要問(wèn)題。雖然從1970年至今,人們已提出了各種各樣的語(yǔ)音增強(qiáng)方法,并應(yīng)用于語(yǔ)音識(shí)別等信號(hào)處理領(lǐng)域,但是出于語(yǔ)音增強(qiáng)研究是一復(fù)雜交叉學(xué)科的研究領(lǐng)域,其增強(qiáng)算法和聽覺(jué)模型還不完善。因此,語(yǔ)音增強(qiáng)研究的主要內(nèi)容和發(fā)展方向應(yīng)包括以下幾個(gè)內(nèi)容:(1)語(yǔ)音信號(hào)是一種非平穩(wěn)的隨機(jī)信號(hào)。在語(yǔ)音增強(qiáng)中可以利用濁音具有明顯的準(zhǔn)周期性來(lái)區(qū)別和抑制非語(yǔ)音

12、噪聲,而清輔音和寬帶噪聲區(qū)分就很困難。好的語(yǔ)音增強(qiáng)算法應(yīng)考慮和解決這個(gè)問(wèn)題。 (2)目前語(yǔ)音增強(qiáng)算法一般分這樣兩種情況:一類方法運(yùn)算量較小,容易實(shí)時(shí)實(shí)現(xiàn),但增強(qiáng)后的語(yǔ)音會(huì)含有類似音樂(lè)的殘留噪聲;另一類是增強(qiáng)語(yǔ)音效果雖較好,但運(yùn)算量大,不容易實(shí)時(shí)實(shí)現(xiàn)。國(guó)內(nèi)外學(xué)者進(jìn)行語(yǔ)音增強(qiáng)的目的之一:尋找一種運(yùn)算量小,容易實(shí)時(shí)實(shí)現(xiàn),增強(qiáng)效果好的方法(3)人耳對(duì)背景噪聲有很大的抑制作用,了解其機(jī)理大大有助于語(yǔ)音增強(qiáng)技術(shù)的發(fā)展。人類的聽覺(jué)系統(tǒng)能從非平穩(wěn)噪聲中提取有用信息,模擬人耳聽覺(jué)系統(tǒng)的語(yǔ)音增強(qiáng)也是語(yǔ)音增強(qiáng)的發(fā)展方向。(4)許多環(huán)境下的干擾噪聲是非平穩(wěn)的,因而難以找到一種通用的語(yǔ)音增強(qiáng)算法適用于各種噪聲環(huán)境。因此

13、研究非平穩(wěn)隨機(jī)噪聲下的語(yǔ)音增強(qiáng)具有重要的意義,這方面的工作有待進(jìn)一步開展。1.3 譜減法語(yǔ)音增強(qiáng)的研究現(xiàn)狀 1979年S. Boll在文中假設(shè)噪聲是平穩(wěn)的或緩慢變化的加性噪聲,并且語(yǔ)音信號(hào)和噪聲信號(hào)不相關(guān)的情況下,提出了譜減法(SS: Spectral Subtraction)。該方法能夠抑制背景噪聲的影響,但由于其局部平穩(wěn)性的假設(shè)與實(shí)際情況并不相符,因此效果不理想,殘留的音樂(lè)噪聲較大;Berouti在文中提出了傳統(tǒng)譜減法的基礎(chǔ)上增加了調(diào)節(jié)噪聲功率譜大小的系數(shù)和增強(qiáng)語(yǔ)音功率譜的最小值限制,提高了譜減法的性能,但是其修正系數(shù)和最小值是根據(jù)經(jīng)驗(yàn)確定的,適應(yīng)性較差;文中P. Lockwood在譜減法

14、的基礎(chǔ)上提出了非線性譜減法(NSS:Non-liner SpectralSubtraction),它根據(jù)語(yǔ)音信號(hào)的信噪比自適應(yīng)調(diào)節(jié)語(yǔ)音增強(qiáng)的增益函數(shù),提高了語(yǔ)音的信噪比。眾所周知,信噪比不能正確反映信號(hào)的聽覺(jué)質(zhì)量,因此用信噪比作為調(diào)整估計(jì)參數(shù)的依據(jù)并不能提高信號(hào)的聽覺(jué)質(zhì)量;文中Boh Lim Sim 等人也提出了與此相近的改進(jìn)算法,雖然提高了信號(hào)的信噪比,但殘留的音樂(lè)噪聲較大;文中Virag將人耳的掩蔽特性應(yīng)用到非線性譜減法的增強(qiáng)算法中,部分解決了譜減法殘留音樂(lè)噪聲大的問(wèn)題,但在信噪比較低或非平穩(wěn)的情況下,其增強(qiáng)效果不理想;文中I.Cohen 等人首先估計(jì)語(yǔ)音信號(hào)概率密度函數(shù),然后在此基礎(chǔ)上改

15、進(jìn)了對(duì)數(shù)譜估計(jì)算法,使得改進(jìn)的算法對(duì)非平穩(wěn)噪聲具有良好的抑制作用,該算法的缺點(diǎn)是語(yǔ)音信號(hào)的概率密度函數(shù)較難估計(jì)。 噪聲參數(shù)估計(jì)的準(zhǔn)確與否直接會(huì)影響譜減法語(yǔ)音增強(qiáng)效果。因此,帶噪語(yǔ)音中背景噪聲參數(shù)的估計(jì)問(wèn)題,尤其是非平穩(wěn)噪聲參數(shù)的估計(jì)問(wèn)題令人關(guān)注。1.4 論文章節(jié)安排第一章 介紹了語(yǔ)音通信的意義,概述了國(guó)內(nèi)外語(yǔ)音增強(qiáng)的研究概況,以及主要的研究?jī)?nèi)容和發(fā)展方向。第二章 在這部分我們首先研究了語(yǔ)音的特性,噪聲的特性和它得來(lái)源及種類各不相同,從而造成處理方法的多樣性,因此要結(jié)合語(yǔ)音特性及噪聲特性根據(jù)實(shí)際情況選用合適的語(yǔ)音增強(qiáng)方法,以及掩蔽效應(yīng)的影響和處理方法,以及掩蔽閥值的計(jì)算。第三章 我們首先論述了語(yǔ)

16、音增強(qiáng)算法的概況和種類,接著討論基本譜減法的原理及增強(qiáng)形式和在譜減法中產(chǎn)生的“音樂(lè)噪聲”,最后討論了為了減少“音樂(lè)噪聲”而提出的改進(jìn)型譜減法,以及對(duì)改進(jìn)型譜減法的算法的權(quán)值項(xiàng)的處理。第四章 在本文中確定一種改進(jìn)型譜減法,對(duì)它的原理、算法進(jìn)行更深的討論,接著論述在該算法中調(diào)節(jié)各參數(shù)對(duì)結(jié)果的影響,并對(duì)它的語(yǔ)音、噪聲進(jìn)行估計(jì)。第五章 對(duì)本文所提出的算法進(jìn)行性能比較。將本課題的方法和其它譜減法進(jìn)行比較,通過(guò)信噪比的改進(jìn)情況可以得到:本文提出的算法提高了對(duì)低輸入信噪比的改進(jìn)。主觀聽覺(jué)測(cè)試也說(shuō)明殘留噪聲對(duì)語(yǔ)音的干擾比基本譜減法要小得多。第二章 語(yǔ)音感知和噪聲特性 2.1 語(yǔ)音特性語(yǔ)音是時(shí)變的、非平穩(wěn)、非遍

17、歷的隨機(jī)過(guò)程。語(yǔ)音發(fā)聲是一個(gè)時(shí)變過(guò)程,很多因素造成了發(fā)聲系統(tǒng)的時(shí)變性,例如聲道的面積隨著時(shí)間和距離改變,氣流速度隨著聲門處壓力變化而變化等。但是聲道形狀有相對(duì)穩(wěn)定性,在一段時(shí)間內(nèi)(10ms30ms),人的聲帶和聲道形分為若干分析幀,每一幀的語(yǔ)音可以認(rèn)為是準(zhǔn)穩(wěn)定的。語(yǔ)音可以分為周期性的濁音和非周期的清音。濁音和清音經(jīng)常在一個(gè)音節(jié)中同時(shí)出現(xiàn)。濁音部分和音質(zhì)關(guān)系密切,在時(shí)域上呈現(xiàn)出明顯的周期性,在頻域上有共振峰結(jié)構(gòu),而且能量大部分集中在較低頻段內(nèi),是語(yǔ)音中大幅度高能量的部分;清音則具有明顯的時(shí)域和頻域特征,類似于白噪聲,能量較小,在強(qiáng)噪聲中容易被掩蓋,但在較高信噪比時(shí)能提供較多的信息。在語(yǔ)音增強(qiáng)中,

18、可以利用濁音的周期性特征,采用梳狀濾波器提取語(yǔ)音分量或者抑制非語(yǔ)音信號(hào),而清音則難以與寬帶噪聲區(qū)分。語(yǔ)音感知對(duì)語(yǔ)音增強(qiáng)研究有重要作用,人耳對(duì)語(yǔ)音的感知主要是通過(guò)語(yǔ)音信號(hào)頻譜分量幅度獲取的,對(duì)各分量相位則不敏感,對(duì)頻率高低的感受近似與該頻率的對(duì)數(shù)值成正比。語(yǔ)音信號(hào)可以用統(tǒng)計(jì)分析特性來(lái)描述。由于語(yǔ)音是非平穩(wěn),非遍歷的隨機(jī)過(guò)程,所以長(zhǎng)時(shí)間的時(shí)域統(tǒng)計(jì)特性在語(yǔ)音增強(qiáng)中意義不大。語(yǔ)音的短時(shí)譜幅度的統(tǒng)計(jì)是時(shí)變的,只有當(dāng)分析幀長(zhǎng)趨于無(wú)窮大時(shí),才能近似認(rèn)為其具有高斯分布。高斯分布模型是根據(jù)中心極限定理得到的。將高斯模型應(yīng)用于有限幀長(zhǎng)只是一種近似的描述。在寬帶噪聲污染的語(yǔ)音增強(qiáng)中,可將這種假設(shè)作為分析的前提。這種

19、時(shí)間依賴處理的基本手段,一般是用一個(gè)長(zhǎng)度有限的窗序列截取一段語(yǔ)音信號(hào)來(lái)進(jìn)行分析,并讓這個(gè)窗滑動(dòng)以便分析任一時(shí)刻附近的信號(hào),其一般式為: (2.1)其中T 表示某種運(yùn)算,x(m)為輸入信號(hào)序列。幾種常用的時(shí)間依賴處理方法是:當(dāng)T(m)為時(shí),相應(yīng)于短時(shí)能量;當(dāng),就是短時(shí)過(guò)零率。 2.2噪聲特性噪聲來(lái)源取決于實(shí)際的應(yīng)用環(huán)境,因而噪聲特性可以說(shuō)變化無(wú)窮。噪聲可以是加性的,也可以是非加性的。對(duì)于非加性噪聲,有些可以通過(guò)變換轉(zhuǎn)變?yōu)榧有栽肼?。例如,乘性噪聲可以通過(guò)同態(tài)變換成為加性噪聲。某些與信號(hào)相關(guān)的量化噪聲可以通過(guò)偽隨機(jī)噪聲擾動(dòng)的方法變換成信號(hào)獨(dú)立的加性噪聲。加性噪聲大致上有:周期性噪聲、脈沖噪聲、寬帶噪

20、聲和同聲道的其他語(yǔ)音干擾等。下面僅討論加性噪聲。周期性噪聲:主要來(lái)源于發(fā)動(dòng)機(jī)等周期性運(yùn)轉(zhuǎn)的機(jī)械,電氣干擾,特別是電源交流聲也會(huì)引起周期性噪聲,其特點(diǎn)是有許多離散的窄譜峰。這種周期性噪聲可以用梳狀濾波器予以抑制,可以用數(shù)字信號(hào)處理的方法來(lái)實(shí)現(xiàn)。脈沖噪聲:來(lái)源于爆炸、撞擊和放電等,表現(xiàn)為時(shí)域波形中突然出現(xiàn)的窄脈沖。消除脈沖噪聲通??梢栽跁r(shí)域內(nèi)進(jìn)行,也可以根據(jù)相鄰信號(hào)采樣值通過(guò)內(nèi)插的方法將脈沖噪聲在時(shí)域上進(jìn)行平滑。寬帶噪聲:來(lái)源很多,包括熱噪聲、氣流(如風(fēng)、呼吸)噪聲及各種隨機(jī)噪聲源,量化噪聲也可視為寬帶噪聲。由于寬帶噪聲與語(yǔ)音信號(hào)在時(shí)域和頻域上完全重疊,因而消除它最困難。這種噪聲只有在語(yǔ)音間歇期才

21、單獨(dú)存在。平穩(wěn)的寬帶噪聲,通常也可認(rèn)為是白色高斯噪聲。對(duì)于非平穩(wěn)的寬帶噪聲,情況就更為復(fù)雜一些。在本文中,我們所討論的噪聲就是指平穩(wěn)的高斯白噪聲,研究在它的影響下的語(yǔ)音增強(qiáng)方法。同聲道語(yǔ)音干擾是指當(dāng)多個(gè)語(yǔ)音疊加在一起在單信道中傳輸時(shí),雙耳信號(hào)因合并而消失。另外,背景噪聲對(duì)發(fā)音也有影響,噪聲破壞了原有的聲學(xué)特征和模型參數(shù),模糊了不同語(yǔ)音之間的差別,使語(yǔ)音質(zhì)量下降,可懂性降低。強(qiáng)噪聲不僅會(huì)使人產(chǎn)生聽覺(jué)疲勞,還會(huì)對(duì)講話人的發(fā)音方式產(chǎn)生影響,從而也改變了語(yǔ)音的特征參數(shù)。因此,噪聲會(huì)對(duì)語(yǔ)音信號(hào)帶來(lái)非常大的影響。第三章 譜減法語(yǔ)音增強(qiáng)算法3.1 語(yǔ)音增強(qiáng)算法概述 在前面的論述中我們已經(jīng)提到過(guò),對(duì)于不同的噪

22、聲有著不同的語(yǔ)音信號(hào)增強(qiáng)處理方法。最近30多年,人們針對(duì)加性寬帶噪聲研究了許多種語(yǔ)音增強(qiáng)算法。盡管目前語(yǔ)音增強(qiáng)尚沒(méi)有建立起完整的理論體系,還有待于進(jìn)一步的研究和發(fā)展,但是一些語(yǔ)音增強(qiáng)算法己被證明是有效果的。為了對(duì)這些有效的語(yǔ)音增強(qiáng)算法有一個(gè)總體的認(rèn)識(shí)。下面,我們對(duì)自相關(guān)相減法、諧波增強(qiáng)法、自適應(yīng)噪聲濾波法、基于語(yǔ)音生成模型增強(qiáng)算法、聽覺(jué)掩蔽法以及基于短時(shí)譜幅度估計(jì)算法做一介紹。自相關(guān)法:信號(hào)的功率譜是其自相關(guān)函數(shù)的傅立葉變換,因此應(yīng)用于功率譜上的任何方法都可以應(yīng)用到自相關(guān)上。這種原理是利用自相關(guān)相減法進(jìn)行增強(qiáng)的基礎(chǔ)。利用信號(hào)本身相關(guān),而信號(hào)與噪聲,噪聲與噪聲之間可看作不相關(guān)的特性,可以將帶噪信

23、號(hào)進(jìn)行自相關(guān)處理,使其得到與不帶噪信號(hào)同樣的自相關(guān)系數(shù)幀序列。諧波增強(qiáng)法:語(yǔ)音信號(hào)的濁音段具有明顯的周期性,利用這一特點(diǎn),可以采用自適應(yīng)梳狀濾波來(lái)提取語(yǔ)音分量,抑制噪聲。自適應(yīng)噪聲濾波法:自適應(yīng)濾波器的輸入為W1(n),它和信號(hào)中的加性噪聲W(n)是高度相關(guān)的,但和無(wú)噪信號(hào)S(n)無(wú)關(guān)。參考信號(hào)濾波后的輸出是加性噪聲W1(n) 的估計(jì),系統(tǒng)輸出 Z(n) 是對(duì)純凈信號(hào) S(n) 的估計(jì),并且用于調(diào)節(jié)自適應(yīng)濾坡器。假設(shè)S(n)與W(n)無(wú)關(guān),并且調(diào)節(jié)自適應(yīng)濾波器使系統(tǒng)輸出Z(n)的能量達(dá)到最小。那么,X(n)就是 S(n)在最小均方誤差下的估計(jì) 。基于語(yǔ)音生成模型的增強(qiáng)算法:語(yǔ)音的發(fā)聲過(guò)程可以模

24、型化為受激勵(lì)源激勵(lì)的一個(gè)線性時(shí)變?yōu)V波器,對(duì)不同類型的語(yǔ)音為不同的激勵(lì)源。如對(duì)于濁音,激勵(lì)源是一個(gè)與基音周期相同的周期性脈沖串;而對(duì)于清音激勵(lì)源為高斯白噪聲。通常認(rèn)為聲道模型是一個(gè)全極點(diǎn)濾波器,濾波器參數(shù)可以通過(guò)線性預(yù)測(cè)分析得到,但若考慮到鼻腔的共鳴作用,采用零極點(diǎn)模型更為合適。顯然,如果能夠知道激勵(lì)參數(shù)和聲道濾波器的參數(shù),就能利用語(yǔ)音生成模型合成得到“純凈”的語(yǔ)音,這種方法的關(guān)鍵在于如何從帶噪語(yǔ)音中準(zhǔn)確地估計(jì)語(yǔ)音模型的參數(shù)(包括激勵(lì)參數(shù)和聲道參數(shù))。這種基于語(yǔ)音的生成模型可得到一系列語(yǔ)音增強(qiáng)方法,如時(shí)變參數(shù)維納濾波及卡爾曼濾波等方法。聽覺(jué)掩蔽法:聽覺(jué)掩蔽效應(yīng)最初主要是用于音頻信號(hào)的壓縮編碼基礎(chǔ)

25、之上的。它主要的原理就是根據(jù)具體的音頻信號(hào)和人耳的聽覺(jué)掩蔽模型動(dòng)態(tài)地確定頻域上的聽覺(jué)掩蔽閾值。根據(jù)聽覺(jué)掩蔽效應(yīng)原理,低于聽覺(jué)掩蔽閾值的語(yǔ)音信號(hào)頻率成分可被高于聽覺(jué)掩蔽閾值的語(yǔ)音信號(hào)相近的頻率成分所掩蔽,因此這些被掩蔽的語(yǔ)音信號(hào)成分很難對(duì)人耳的聽覺(jué)系統(tǒng)所響應(yīng),可以被看作是冗余信號(hào),從而為進(jìn)一步提高語(yǔ)音信號(hào)的壓縮比而提供了可靠的依據(jù)。基于短時(shí)譜估計(jì)的方法:基于短時(shí)譜估計(jì)的方法是從含噪信號(hào)中直接估計(jì)出原始語(yǔ)音。如前所述,語(yǔ)音是非平穩(wěn)隨機(jī)過(guò)程,但在10ms-30ms的分析幀內(nèi)可以近似看成是平穩(wěn)的。如果能從帶噪語(yǔ)音的短時(shí)譜中估計(jì)出純語(yǔ)音信號(hào)的短時(shí)譜,則可達(dá)到增強(qiáng)的目的。由于人耳對(duì)語(yǔ)音相位的感受是不敏感的

26、,因此可以只將估計(jì)的對(duì)象放在短時(shí)譜幅度上?;诙虝r(shí)譜幅度估計(jì)的語(yǔ)音增強(qiáng)算法主要有維納濾波法和譜減法。3.2一般譜減法 基本原理一般的譜相減直接從有噪信號(hào)中減去噪聲譜得到“純凈”語(yǔ)音譜。假設(shè)s(n),d(n)和y(n)分別代表語(yǔ)音、噪聲和帶噪語(yǔ)音, 和分別表示其短時(shí)譜,由于語(yǔ)音信號(hào)是短時(shí)平穩(wěn)的,所以在短時(shí)譜幅度估計(jì)中認(rèn)為它是平穩(wěn)隨機(jī)信號(hào)。且假設(shè)噪聲d(n)是與語(yǔ)音s(n) 不相關(guān)的加性噪聲。于是得到信號(hào)的加性模型y(n)=s(n)+d(n) (3.1) 若以,和分別代表y(n),s(n)和d(n)的能量密度譜,則 (3.2)y(n),s(n)和d(n)加窗處理后的信號(hào)分別以,及表示,而,和分別對(duì)

27、應(yīng),及的傅立葉變換。則 (3.3) (3.4)式中和分別為及的復(fù)共軛。及分別代表語(yǔ)音信號(hào)和噪聲的短時(shí)能量譜。基于短時(shí)譜幅度估計(jì)的語(yǔ)音增強(qiáng)技術(shù)的目的就是設(shè)法得到的估計(jì),并由此得到的估計(jì)即增強(qiáng)后的語(yǔ)音。 由含噪語(yǔ)音信號(hào)經(jīng)加窗及傅立葉變換等運(yùn)算可直接得到,但,及無(wú)法精確得到,因而分別以三者各自的系統(tǒng)平均能量,及來(lái)近似代替。由于s(n)與d(n)獨(dú)立,所以與獨(dú)立,因此及均為0。這樣,的估計(jì)由下式獲得 (3.5)式(3.5)為功率譜減法的表達(dá)式。整個(gè)系統(tǒng)原理圖如圖3-1所示。 圖3-1 譜減法原理框圖 譜減法的建立要基于以下幾點(diǎn)假設(shè): 1) 噪聲信號(hào)和語(yǔ)音信號(hào)是互不相關(guān)的,在頻域是加性的關(guān)系。 2) 背

28、景噪聲環(huán)境相對(duì)于語(yǔ)音活動(dòng)區(qū)域來(lái)說(shuō)是近似穩(wěn)態(tài)的,這樣 3) 如果背景噪聲環(huán)境變化到一個(gè)新的穩(wěn)態(tài),則應(yīng)有足夠的時(shí)間(約 300ms左右)以便于估計(jì)出新的背景噪聲譜幅度估值。 4) 對(duì)于緩慢變化的非平穩(wěn)噪聲環(huán)境,譜減法算法中有話音激活檢測(cè)環(huán)節(jié)以便適時(shí)的判斷并進(jìn)行調(diào)整。 5) 假設(shè)主要噪聲影響的消除可以通過(guò)僅僅從帶噪語(yǔ)音譜幅度中減去噪聲而實(shí)現(xiàn)。 如果不從功率譜出發(fā),而考慮幅度譜,則可得到幅譜減的表達(dá)式 (3.6)在譜減法中,利用人耳對(duì)語(yǔ)音的幅度比較敏感,而對(duì)語(yǔ)音的相位不敏感這特性,以帶噪語(yǔ)音的相位代替純凈語(yǔ)音相位,得 (3.7) (3.8)此為增強(qiáng)后的語(yǔ)音信號(hào)。譜減法也可以用線性時(shí)變?yōu)V波器形式來(lái)表示,

29、即對(duì)乘以增益函數(shù)將式(3.5)變?yōu)槌朔e形式: (3.9)對(duì)應(yīng)于式(3.5),則 (3.10)如果,則,這樣就可以保證為實(shí)函數(shù)。從式(3.9)式(3.10)中可以清楚地看出譜減法的物理意義:它相當(dāng)于對(duì)帶噪語(yǔ)音每一個(gè)頻譜分量乘以一個(gè)系數(shù)。當(dāng)該段只含語(yǔ)音時(shí),沒(méi)有任何衰減,;而當(dāng)該段只含噪聲時(shí),衰減最大,。當(dāng)介于兩者之間時(shí),由后驗(yàn)信噪比決定,即 (3.11)在實(shí)際的增強(qiáng)過(guò)程中,更多地使用的是譜減法的推廣形式: (3.12) 式(3.12)是譜減法最為靈活的一種形式,它包含譜減法的基本思想,而且給出了三個(gè)調(diào)節(jié)系數(shù),以在噪聲抑制,剩余噪聲衰減和語(yǔ)音失真之間達(dá)到最好的折中。其中:1)過(guò)減系數(shù):值越大,剩余噪

30、聲衰減越大,同時(shí)語(yǔ)音失真也會(huì)越大。2)譜平滑系數(shù):值增大可降低剩余的音樂(lè)噪聲,但會(huì)增加增強(qiáng)后語(yǔ)音的背景噪聲。3)指數(shù);這個(gè)參數(shù)決定了增益函數(shù)從到的平滑程度。譜減參數(shù),和的選擇是譜減法的核心問(wèn)題。實(shí)際上,在低信噪比條件下,減小語(yǔ)音失真和降低剩余噪聲不可兼得,只能在二者之間達(dá)到最好的折中,提高可懂度。語(yǔ)音信號(hào)中,說(shuō)話人由于呼吸會(huì)不斷產(chǎn)生語(yǔ)音間歇,我們可以利用這些間歇估計(jì)噪聲,其中一種方法就是利用端點(diǎn)檢測(cè)來(lái)判定有/無(wú)語(yǔ)音。在無(wú)語(yǔ)音段利用下式對(duì)噪聲估計(jì)進(jìn)行更 新。 (3.13)其中,i為當(dāng)前幀數(shù),i-1為前一幀。 一般譜減法的優(yōu)缺點(diǎn)一般譜相減法是將短時(shí)噪聲語(yǔ)音譜與一個(gè)估計(jì)的噪聲譜相減來(lái)達(dá)到壓縮穩(wěn)態(tài)噪聲

31、的目的。這種方法的最大優(yōu)點(diǎn)在于其簡(jiǎn)單性。思路清晰,算法簡(jiǎn)單。但由于它的殘留噪聲還是比較多,并且產(chǎn)生了令人反感的“音樂(lè)噪聲”,語(yǔ)音的整體質(zhì)量有所下降,并沒(méi)有改善可懂度。聽者能發(fā)現(xiàn)處理后語(yǔ)音中的“音樂(lè)噪聲”比原始信號(hào)中的噪聲更為清晰,這是由于在短時(shí)譜估計(jì)中的隨機(jī)頻率點(diǎn)上出現(xiàn)的多種頻率的組合而產(chǎn)生的(在后面章節(jié)中將詳細(xì)闡述)。這是在譜減法中經(jīng)常出現(xiàn)的,也是較難解決的問(wèn)題。因此,這也嚴(yán)重限制了譜減法的應(yīng)用。 基本步驟和仿真結(jié)果 根據(jù)上文的分析,對(duì)提出的基本譜減法進(jìn)行仿真,由于相位對(duì)語(yǔ)音信號(hào)的感知并不重要,因此可以利用帶噪語(yǔ)音信號(hào)的相位代替增強(qiáng)后的語(yǔ)音信號(hào)的相位,然后利用逆傅立葉變換,即可得到增強(qiáng)的語(yǔ)應(yīng)

32、信號(hào)?;咀V減法的基本步驟為:(1)計(jì)算帶噪語(yǔ)音信號(hào)的信噪比。(2)確定語(yǔ)音信號(hào)的幀長(zhǎng),將信號(hào)進(jìn)行分幀。(3)計(jì)算各幀的能量,確定一個(gè)閥值,能量大于該值的為語(yǔ)音段標(biāo)注s(i)=1,能量小于該值的為寂靜段令s(i)=0。(4)對(duì)各幀進(jìn)行傅立葉變換。并計(jì)算功率譜,若s(i)=1,則減去噪聲功率譜,若s(i)=0,則該幀為零。(5)根據(jù)帶噪語(yǔ)音的相位,可得到增強(qiáng)后語(yǔ)音的相位。得到增強(qiáng)后語(yǔ)音的頻譜圖。(6)根據(jù)傅立葉逆變換,得到增強(qiáng)后語(yǔ)音。圖3.2給出了計(jì)算機(jī)的仿真結(jié)果。橫坐標(biāo)為時(shí)間軸,縱坐標(biāo)為幅度。選取語(yǔ)音信號(hào)的采樣頻率為22kHz,總共長(zhǎng)為110033,幀長(zhǎng)為256個(gè)樣點(diǎn),選取漢明窗(hammin

33、g)對(duì)信號(hào)加窗。根據(jù)文獻(xiàn)將信號(hào)在頻域中等分三個(gè)子帶。每幅圖中從上往下的波形依次是純凈的語(yǔ)音信號(hào),帶噪語(yǔ)音信號(hào),和增強(qiáng)后的語(yǔ)音信號(hào)。噪聲為加性高斯白噪聲。圖a的信噪比為-3dB圖b的信噪比為3dB。從圖中可以看出在不同的信噪比下基本譜減法都能很好的濾出語(yǔ)音信號(hào),但是在不同的輸入信噪比下,它們的信噪比改進(jìn)程度不一樣,通過(guò)反復(fù)的實(shí)驗(yàn)和客觀評(píng)價(jià)可知,在低輸入信噪比下,甚至語(yǔ)音信號(hào)完全淹沒(méi)在噪聲中,但它的改進(jìn)程度好,但也存在較大的語(yǔ)音失真。從圖中的波形就可看出。 圖3.2a 基本譜減法仿真圖(信噪比為-3dB) 圖3.2b 基本譜減法的仿真圖(信噪比為3dB)3. 3 “音樂(lè)噪聲”的產(chǎn)生 譜相減技術(shù)大多

34、數(shù)都是在頻域上進(jìn)行,也有在時(shí)域的。由于在譜減法處理過(guò)程中,是以無(wú)聲期間統(tǒng)計(jì)平均的噪聲方差代替當(dāng)前分析幀各頻率點(diǎn)的噪聲頻率分量,而噪聲頻譜具有高斯分布,即其幅度隨機(jī)變化范圍很寬,因此相減時(shí),若該幀某頻率點(diǎn)噪聲分量較大,就會(huì)有很大一部分保留,在頻譜上呈現(xiàn)隨機(jī)出現(xiàn)的尖峰,便產(chǎn)生了間歇短暫的突發(fā)聲調(diào),在聽覺(jué)上形成有節(jié)奏性起伏的類似音樂(lè)的殘留噪聲。這種具有音樂(lè)特性的殘余噪聲是各幀內(nèi)在隨機(jī)頻率上出現(xiàn)的許多聲調(diào)的群體結(jié)果。它要比原始語(yǔ)音中的噪聲清楚的多,也更易令人反感。 具體說(shuō)來(lái),由譜相減所產(chǎn)生的噪聲稱為殘余噪聲,與語(yǔ)音信號(hào)不相關(guān),是由具有隨機(jī)頻率和幅度的窄帶信號(hào)所組成。其幅度在零和語(yǔ)音休止期所測(cè)試到的最大

35、噪聲值之間,當(dāng)被反變換到時(shí)域時(shí),這種殘余噪聲聽起來(lái)像是以每 20ms間隔開關(guān)一次的突發(fā)音調(diào)發(fā)聲器組合而成,具有隨機(jī)的基頻和幅度,即使在有聲段也不能被語(yǔ)音所掩蔽。這種噪聲具有“音樂(lè)”的聽覺(jué)效果,因此稱為“音樂(lè)噪聲”。 音樂(lè)噪聲的消除是應(yīng)用譜減技術(shù)的一個(gè)重要難題。由于估計(jì)的噪聲信號(hào)與實(shí)際的背景噪聲信號(hào)存在一定的誤差,所以譜相減之后,會(huì)殘留一定的背景噪聲而且會(huì)產(chǎn)生音樂(lè)噪聲,尤其當(dāng)噪聲為非平穩(wěn)噪聲時(shí)將會(huì)產(chǎn)生嚴(yán)重的音樂(lè)噪聲,使語(yǔ)音信號(hào)的可懂度降低。人們提出了很多種方法來(lái)減輕或者消除音樂(lè)噪聲對(duì)人耳的影響,且取得了很大的進(jìn)展。但是在非平穩(wěn)噪聲環(huán)境、弱語(yǔ)音信號(hào)或者低輸入信噪比時(shí),音樂(lè)噪聲的抑制還是一個(gè)很大的難

36、題。許多學(xué)者和專家通過(guò)改變“音樂(lè)噪聲”的特性,努力為譜相減技術(shù)提供更好的理論基礎(chǔ)并改善其性能,以使之易于被接受。3.4 改進(jìn)的譜減法 傳統(tǒng)的譜相減法是基于人耳對(duì)聲音相位不敏感特性,從含噪語(yǔ)音中減去估計(jì)噪聲而達(dá)到語(yǔ)音增強(qiáng)的目的。它比較直觀、簡(jiǎn)單,但在提高質(zhì)量的同時(shí)損傷了語(yǔ)音的可懂度,且產(chǎn)生討厭的“音樂(lè)噪聲”。 在語(yǔ)音增強(qiáng)的過(guò)程中,消除噪聲、提高語(yǔ)音信噪比和語(yǔ)音的可懂度是一對(duì)矛盾,要濾除噪聲或多或少肯定會(huì)損害語(yǔ)音信號(hào),一般地說(shuō)噪聲濾除得越多則語(yǔ)音信號(hào)被損害程度就越厲害,語(yǔ)音的可懂度就越低,特別是在低信噪比的情況下,這一矛盾更加突出。怎樣在去除噪聲和減少語(yǔ)音失真之間取折衷,也成為譜減法研究的重點(diǎn)問(wèn)題

37、。改進(jìn)型譜減法的種類基于聽覺(jué)掩蔽效應(yīng)的改進(jìn)型譜減法:增強(qiáng)語(yǔ)音在很多情況下是直接為聽覺(jué)服務(wù)的,所以應(yīng)該結(jié)合人耳聽覺(jué)特性來(lái)提高增強(qiáng)語(yǔ)音的聽覺(jué)效果,其中將聽覺(jué)掩蔽效應(yīng)與基本譜減法相結(jié)合可獲得較好的增強(qiáng)效果。掩蔽效應(yīng)是指一個(gè)聲音的存在會(huì)對(duì)另一個(gè)聲音的感知產(chǎn)生掩蔽效應(yīng),主要發(fā)生在同時(shí)進(jìn)入人聽覺(jué)系統(tǒng)的不同頻率的兩個(gè)聲音之間,即同時(shí)掩蔽。主要算法步驟:1)加窗分幀,進(jìn)行N點(diǎn)FFT變換得到帶噪語(yǔ)音頻譜;2)端點(diǎn)檢測(cè),在無(wú)音段進(jìn)行噪聲估計(jì);3)利用基本譜減法得到語(yǔ)音頻譜的粗估計(jì),由此計(jì)算聽覺(jué)掩蔽閥T(w);4)根據(jù)T(w)來(lái)調(diào)節(jié)譜減系數(shù),;5)利用調(diào)整后的,進(jìn)行系數(shù)譜減;6)IFFT,用疊接相加法得到?;趲g

38、重疊的改進(jìn)型譜減法:去噪增強(qiáng)語(yǔ)音的過(guò)程是采用基本譜減法得到重疊各幀的語(yǔ)音頻譜,利用相鄰;幾個(gè)重疊幀的語(yǔ)音頻譜,通過(guò)差值運(yùn)算合成出語(yǔ)音信號(hào)。具體求得y(n)的計(jì)算分以下幾步:1)對(duì)每幀信號(hào)進(jìn)行語(yǔ)音有無(wú)判定,在無(wú)語(yǔ)音期間估計(jì)出噪聲譜;2)求得加窗段信號(hào)w(n-m)x(m)的L點(diǎn)FFT得;3)使窗w(n-m)以步長(zhǎng)R沿著帶噪語(yǔ)音x(m)序列滑動(dòng),在n等于求得;4)假定s(m)與噪聲d(m)獨(dú)立,對(duì)于幀內(nèi)的短時(shí)平穩(wěn)過(guò)程,由式(3.5)得到5)由插值法得到y(tǒng)(n)。將上述算法在某一超短波通信系統(tǒng)的干擾抑制應(yīng)用中,已取得了明顯的消噪效果"該系統(tǒng)受到無(wú)法擺脫的周期性干擾,干擾譜為某一相對(duì)穩(wěn)定的基波

39、及其各次諧波之和,嚴(yán)重影響語(yǔ)音信號(hào)的接收,造成電臺(tái)使用者產(chǎn)生明顯的聽覺(jué)疲勞"。,該方法消除了周期性干擾在電臺(tái)話音輸出端引起的嘯叫噪聲,除清晰度略下降外,語(yǔ)音的可懂度和自然度未受損失"該方法對(duì)白噪聲干擾消噪效果更好"若采用傳統(tǒng)的梳狀濾波器進(jìn)行消噪處理,勢(shì)必消除阻帶內(nèi)的語(yǔ)音譜,使話音質(zhì)量受到損失?;谙闰?yàn)信噪比的改進(jìn)型譜減法:該方法為本文重點(diǎn)闡述的內(nèi)容,所以將在后面的章節(jié)中,詳細(xì)討論 幅度譜平滑 譜減法在 70 年代末由 Boll 提出。通過(guò)對(duì)相鄰幀幅度譜進(jìn)行適當(dāng)?shù)钠骄梢杂行У匾种茪埩粼肼暎瑴p小估計(jì)器的誤差。當(dāng)語(yǔ)音波形變化緩慢時(shí),這種譜平均的方法效果較好,幅度平均法

40、中用來(lái)平均的相鄰幀的數(shù)目越多,殘留噪聲越少,但是由于語(yǔ)音信號(hào)的短時(shí)平穩(wěn)特性,過(guò)多的平均反而會(huì)增加估計(jì)器誤差,對(duì)語(yǔ)音造成損害,使輸出語(yǔ)音模糊不清。平均幀數(shù)的選取要綜合考慮。在對(duì)幅度譜做均值濾波時(shí),也可用加權(quán)均值法,根據(jù)距中心幀的距離,給各幀以不同的權(quán)值,距離越近,權(quán)值越大。這樣既考慮到信號(hào)前后幀之間的連貫性,又考慮到語(yǔ)音信號(hào)的非平穩(wěn)性。 為了進(jìn)一步降低噪聲,人們還提出對(duì)譜減后的每一個(gè)頻譜值,從其前后幾幀的對(duì)應(yīng)頻譜值中找到最小的,用這個(gè)值代替當(dāng)前譜減結(jié)果。這是因?yàn)檎Z(yǔ)音信號(hào)的出現(xiàn)總是需要一個(gè)過(guò)程的,利用前后幀的信息,可有效地去除突變點(diǎn),取其中最小值,這也是一種平滑的方法。 噪聲譜的估計(jì)可以在無(wú)語(yǔ)音幀

41、時(shí)進(jìn)行更新,如用平均法,噪聲譜的估計(jì)可以寫成 (3.14)這里K 是無(wú)語(yǔ)音幀的總數(shù)。也可以用濾波法 (3.15)其中是濾波系數(shù),典型取值在0.8-0.95之間。3.4.3 被減項(xiàng)加權(quán)值處理式(3.5)中的是一無(wú)聲期間的統(tǒng)計(jì)平均的噪聲方差代替當(dāng)前分析幀的噪聲頻譜,這樣,實(shí)際處理效果不是很理想,原因是:語(yǔ)音的能量往往集中在某些頻段內(nèi),在這些頻段內(nèi)的幅度相對(duì)較高,尤其是共振峰出的幅度一般大于噪音,因此,不應(yīng)同一標(biāo)準(zhǔn)處理;另一方面,噪聲的幀功率譜隨機(jī)變化范圍很寬,在頻域中的最大,最小值之比往往達(dá)到幾個(gè)數(shù)量級(jí),而最大值與均值之比也達(dá)倍。因此,在減去噪聲譜后,會(huì)有較大的功率譜分量的剩余部分,在頻譜上呈現(xiàn)出

42、隨機(jī)出現(xiàn)的間峰,在聽覺(jué)上形成殘留噪聲。這種噪聲具有一定的節(jié)奏性起伏感,所以稱之為“音樂(lè)噪聲”。因此,改進(jìn)的方法是在幅度較高的時(shí)幀出減去,這樣可以更好地突出語(yǔ)音譜,抑制純音噪聲,改善降噪性能;其次,在語(yǔ)音譜中保留少量的寬帶噪聲,在聽覺(jué)上可以起到一定的掩蔽純音噪聲的作用??紤]這兩個(gè)方面,改進(jìn)后的譜減法公式如下: (3.16)(其中)實(shí)驗(yàn)表明在輔音幀中取,在元音幀中取4-5,取可以取得較好的降噪及抑制純音噪聲的效果。同時(shí)對(duì)于應(yīng)用改進(jìn)后的方法,需要粗略地辨別語(yǔ)音幀是輔音幀還是元音幀,以確定的取值。 功率譜修正處理將圖3.1中的功率譜計(jì)算 及改為和計(jì)算(這里不一定為整數(shù)),可以得到新的更具一般性的譜減法

43、形式。這種方法稱之為功率譜修正處理。它可以增加靈活性,修正后的功率譜為: (3.17)引入三個(gè)參數(shù)為算法提供了很大的靈活性。實(shí)際的增強(qiáng)實(shí)驗(yàn)表明,適當(dāng)調(diào)節(jié)可以獲得比原始的譜減法更好的增強(qiáng)效果。當(dāng)=1,=1時(shí),可得到幅度譜減法形式,1為過(guò)減形式。當(dāng)=2 , =1時(shí),可得到功率譜減法形式,>1為過(guò)減形式。公式中的選取原則是:大則殘留噪聲衰減的程度大,但語(yǔ)音失真的程度也大;小則語(yǔ)音信息保護(hù)的好,但噪聲減少的程度也小。實(shí)際上的選取是對(duì)降低噪聲和保持語(yǔ)音不失真的一種折衷,對(duì)信噪比低的帶噪語(yǔ)音,噪聲的方差大,的選取可適當(dāng)大些,對(duì)信噪比高的帶噪語(yǔ)音, 的選取則可小些。第四章 基于先驗(yàn)信噪比估計(jì)的改進(jìn)型譜

44、減法4.1 基本原理上面我們已經(jīng)闡述了幾種改進(jìn)型譜減法的類型。接下來(lái)我們重點(diǎn)論述一下基于先驗(yàn)信噪比的改進(jìn)型譜減法。它的基本原理:Ephraim和Malah提出的最小均方誤差估計(jì)增強(qiáng)方法可以有效地抑制“音樂(lè)噪聲”,cape在文獻(xiàn)中證明:由于其在計(jì)算增益函數(shù)是引入了先驗(yàn)信噪比,并采用了“Decision-Directed”(直接判決)法,簡(jiǎn)稱為“D-D”法,進(jìn)行先驗(yàn)信噪比的估計(jì),所以取得了較好的增強(qiáng)效果。我們同樣可因?qū)⑦@種方法引入到譜減法中,得到基于先驗(yàn)信噪比估計(jì)的改進(jìn)型譜減法。先驗(yàn)信噪比定義為: (4.1)首先,將增益函數(shù)表示成先驗(yàn)信噪比的形式,即利用。其中,i為幀數(shù)。則式(3.9)可以寫為:

45、(4.2)其中,用“D-D”法進(jìn)行估計(jì),即: (4.3)其中,i為當(dāng)前幀,i-1為前一幀;為前一幀語(yǔ)音的估計(jì)結(jié)果;為調(diào)節(jié)系數(shù),一般在0.8-1之間;max為兩者之中取較大的值。從式(4.3)可以看出,先驗(yàn)信噪比是通過(guò)非線性的遞推估計(jì)得到的。4.2 寂靜幀和語(yǔ)音幀的判定在譜減法中,要利用帶噪語(yǔ)音減去噪聲,在此我們就要知道如何判定何時(shí)為寂靜幀,也就知道了噪聲頻譜。接下來(lái)我們討論它的算法:由于在大多數(shù)情況下只能獲得帶噪語(yǔ)音,所以在進(jìn)行語(yǔ)音增強(qiáng)時(shí),公式(3.5)中右邊的第2項(xiàng)是不能直接算出來(lái)的.假設(shè)帶噪語(yǔ)音中的噪聲是平穩(wěn)的,則可采用試聽的方法,在帶噪聲語(yǔ)音中找出一段不含語(yǔ)音的純?cè)胍舳?利用這一段純?cè)胍?/p>

46、算出,并以此作為整個(gè)含噪語(yǔ)音短時(shí)能量譜的估計(jì).這樣作的缺點(diǎn)是:在多數(shù)情況下噪聲強(qiáng)度是隨時(shí)間變化的,因此,用一小段噪音來(lái)估計(jì)整段語(yǔ)音,一定會(huì)產(chǎn)生很大的誤差,使增強(qiáng)效果變差.另外,在實(shí)際操作上也比較麻煩.我們對(duì)噪聲的估計(jì)采取的是利用含噪語(yǔ)音中無(wú)語(yǔ)音段的頻譜幅值統(tǒng)計(jì)平均值來(lái)實(shí)時(shí)估計(jì)被減噪聲的頻譜幅值的方法.若能以某特征值將語(yǔ)音段及噪音段分開對(duì)所有判別為噪音段的時(shí)幀進(jìn)行運(yùn)算,則使得對(duì)噪音功率譜的估計(jì).更為準(zhǔn)確,低信噪比條件下的自適應(yīng)有聲/無(wú)聲判決算法就屬于此類.其基本原理如下.一般認(rèn)為寬帶噪聲為一零均值高斯過(guò)程,則它的概率密度為 (4.4)一幀不含語(yǔ)音的純?cè)胍粜盘?hào),能量可表示為 (4.5)它的概率密度

47、則可表示為 (4.6)對(duì)于一幀含噪語(yǔ)音,由于語(yǔ)音信號(hào)s(i)與噪音d(i)不相關(guān),則它的信號(hào)能量為 (4.7)其條件概率分布為 (4.8) 由圖4.1可見,是將向右平移了一段S,而S是一幀含噪語(yǔ)音中純語(yǔ)音信號(hào)的能量,通過(guò)對(duì)一定長(zhǎng)度的帶噪語(yǔ)音進(jìn)行統(tǒng)計(jì),得到其短時(shí)能量概率密度的最大值,并由此計(jì)算出.如圖4.1所示,我們?cè)趚軸上選一門限,當(dāng)一幀信號(hào)的短時(shí)能量小于門限時(shí),我們判其為純?cè)肼?當(dāng)一幀信號(hào)的短時(shí)能量大于門限時(shí),我們判其含有語(yǔ)音.由于圖中兩條曲 圖4.1 ,及誤判概率線有重疊部分,所以不論是哪種判斷都可能有誤判,在實(shí)驗(yàn)中我們將幀長(zhǎng)定為256,以純?cè)肼曊`判為含噪語(yǔ)音的概率為10%來(lái)確定,那么把含

48、噪語(yǔ)音判別為純?cè)肼暤母怕蕜t和一幀信號(hào)中純語(yǔ)音信號(hào)的短時(shí)能量S的大小有關(guān),能量大則誤判率低,能量小則誤判率高.例如在信噪比SNR為0dB時(shí)誤判率幾乎為0,而在信噪比SN為-8dB時(shí)誤判率約為30%.我們用判斷為純?cè)肼暤哪切瑏?lái)計(jì)算噪聲的短時(shí)能量譜,雖然在判斷噪聲時(shí),可能會(huì)有錯(cuò)判,但錯(cuò)判的幀中,一般語(yǔ)音的能量能非常小,對(duì)估計(jì)噪聲不會(huì)產(chǎn)生太大的影響.由于它對(duì)噪聲特性的估計(jì)更為準(zhǔn)確,所以效果也較好.我們利用上述方法對(duì)在車間和馬路的十字路口所錄的信噪比很低的實(shí)際含噪語(yǔ)音進(jìn)行了增強(qiáng),取得了很好的結(jié)果,信噪比大大的提高,并且語(yǔ)音的可懂度也明顯提高。4.3 算法的實(shí)現(xiàn)本課題在譜減法的研究基礎(chǔ)上,將得到的帶噪語(yǔ)

49、音進(jìn)行先驗(yàn)信噪比估計(jì),從而得到增強(qiáng)后語(yǔ)音。程序流程圖如圖4.2。它主要包括以下幾步:1,帶噪語(yǔ)音輸入,計(jì)算輸入信噪比。2,將帶噪語(yǔ)音進(jìn)行分幀,計(jì)算各幀能量。3,取一門限值,對(duì)各幀進(jìn)行有聲/無(wú)聲判斷。4,對(duì)各幀進(jìn)行傅立葉變換,若為寂靜幀則將該幀判為零,否則利用式(4.3)估計(jì)出該幀的信噪比。5,用先驗(yàn)信噪比計(jì)算出濾波函數(shù),最終計(jì)算增強(qiáng)后語(yǔ)音的頻譜函數(shù)。6,對(duì)各幀的譜函數(shù)進(jìn)行逆傅立葉變換,得到增強(qiáng)后語(yǔ)音。 對(duì)以上的步驟,其中寂靜幀的判定和先驗(yàn)信噪比的估計(jì)在前面已有了詳細(xì)的介紹和分析。帶噪語(yǔ)音輸入分幀有聲/無(wú)聲判決無(wú)聲重置噪聲譜有聲頻譜計(jì)算信噪比估計(jì)先驗(yàn)信噪比利用G(w)算增強(qiáng)后語(yǔ)音計(jì)算信噪比傅立葉

50、逆變換的時(shí)域圖增強(qiáng)后語(yǔ)音輸出 圖4.2 語(yǔ)音增強(qiáng)流程圖4.4 參數(shù)的估計(jì)式 中i指幀系數(shù),是調(diào)節(jié)系數(shù)但當(dāng)噪聲不變時(shí),就必須考慮進(jìn)去。在這里,=0.9就是計(jì)算大約20幀的平均值。4.5 實(shí)驗(yàn)結(jié)果和分析 為了研究該算法的有效性,我們以一段英文為純凈的語(yǔ)音信號(hào),以平穩(wěn)的高斯白噪聲為濾波對(duì)象。采樣頻率為22050Hz,幀長(zhǎng)為256,語(yǔ)音總共長(zhǎng)為110033。選取漢明窗(hamming)對(duì)信號(hào)加窗。根據(jù)文獻(xiàn)將信號(hào)在頻域中等分三個(gè)子帶。圖4.3為計(jì)算機(jī)的仿真圖。橫坐標(biāo)為時(shí)間軸,縱坐標(biāo)為幅度軸。每幅圖中從上往下的波形依次是純凈的語(yǔ)音信號(hào),帶噪語(yǔ)音信號(hào),和增強(qiáng)后的語(yǔ)音信號(hào)。4.3a信噪比為-3dB,圖4.3b

51、信噪比為3dB。從圖中可以看出,無(wú)論信噪比是低還是高,帶噪語(yǔ)音信號(hào)經(jīng)增強(qiáng)處理后都能有較好地恢復(fù)。但低信噪比下改進(jìn)的好。 圖4.3a 改進(jìn)型譜減法的仿真圖(信噪比為-3dB) 圖4.3b 改進(jìn)型譜減法的仿真圖(信噪比為3dB)第五章 性能評(píng)價(jià)我們對(duì)本文所提出的算法進(jìn)行性能評(píng)價(jià),并將它和基本譜減法進(jìn)行比較。5.1 信噪比改進(jìn) 噪聲減少通常是以信噪比改進(jìn)來(lái)衡量的,本文提出的是輸入,輸出的分段信噪比來(lái)加以比較,即: (5.1)其中L表示信號(hào)的幀長(zhǎng)度,N表示每幀的采樣點(diǎn)。利用該方法我們對(duì)含有高斯白噪聲的語(yǔ)音信號(hào)進(jìn)行處理,語(yǔ)音為一段英文,采樣率為22050Hz。對(duì)處理結(jié)果我們用信噪比進(jìn)行評(píng)價(jià)。結(jié)果我們用表

52、5.1來(lái)表示。 -3dB 0dB 3dB基本譜減法 1.86dB 4.78dB 7.60dB改進(jìn)型譜減法 4.01dB 5.96dB 7.80dB 表5.1 信噪比改進(jìn)程度 我們對(duì)信噪比的改進(jìn)用圖5.1來(lái)表示,從圖中可以看出:兩種譜減法提供的信噪比改進(jìn)都相似,但改進(jìn)型算法提高了對(duì)低輸入信噪比的改進(jìn)。5.2 主觀評(píng)價(jià)為了確證客觀性能評(píng)估,我們采用了主觀聽覺(jué)測(cè)試。聽覺(jué)測(cè)試是在4個(gè)聽眾中進(jìn)行的,內(nèi)容是對(duì)語(yǔ)音的殘留噪聲,仍存在的背景噪聲,語(yǔ)音失真和音樂(lè)噪聲的全面評(píng)價(jià)。對(duì)于每個(gè)話音都有下列步驟:1) 純凈語(yǔ)音和帶噪語(yǔ)音均被重復(fù)播放兩次;2) 每個(gè)測(cè)試信號(hào)都被重復(fù)兩次,且以隨機(jī)順序播放三次。測(cè)試的結(jié)果:利用本方法增強(qiáng)的語(yǔ)音的剩余噪聲和“音樂(lè)噪聲”均大大降低。 結(jié)論單通道譜減系統(tǒng)在減少背景噪聲上很有效,然而它帶來(lái)了可感知的令人煩躁的“音樂(lè)噪聲”。在本文中,提出了基于先驗(yàn)信噪比的改進(jìn)型譜減法,提出的算法提高了對(duì)低輸入信噪比的改進(jìn)。主觀聽覺(jué)測(cè)試也說(shuō)明本方法殘留噪聲對(duì)語(yǔ)音的干擾比基本譜減法小的多。該算法的主要優(yōu)點(diǎn)如下:1) 設(shè)計(jì)思路簡(jiǎn)單,運(yùn)算量小與基本譜減法相當(dāng)。2) 性能好,剩余噪聲和“音樂(lè)噪聲”均大大降低。 本文用該算法對(duì)不同信噪比的帶噪語(yǔ)音進(jìn)行測(cè)試并和基本譜減法作對(duì)比。通過(guò)實(shí)驗(yàn)結(jié)果和信噪比得到的客觀評(píng)估,結(jié)合主觀聽覺(jué)結(jié)果顯示:與基本方法相比,音樂(lè)噪聲和殘留噪聲的

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論