第14章語音增強教程課件_第1頁
第14章語音增強教程課件_第2頁
第14章語音增強教程課件_第3頁
第14章語音增強教程課件_第4頁
第14章語音增強教程課件_第5頁
已閱讀5頁,還剩21頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

第15章語音增強第15章語音增強1目錄15.1概述15.2語音特性、人耳感知特性及噪聲特性15.2.1語音特性15.2.2人耳感知特性15.2.3噪聲特性15.3濾波器法15.3.1固定濾波器15-.3.2自適應(yīng)濾波15.3.3變換技術(shù)15.4非線性處理15.4.1中心削波15.4.2同態(tài)濾波法15.5減譜法15.5.1減譜法15.5.2減譜法的改進形式15.6自相關(guān)相減法15.7自適應(yīng)噪聲對消15.7.1自適應(yīng)濾波15.7.2具有參考信號的自適應(yīng)噪聲對消15.7.3利用延遲來建立參考信號的自適應(yīng)噪聲對消目錄15.1概述215.1概述語音增強是解決噪聲污染的一種有效方法,它的一個主要目標(biāo)是從帶噪語音信號中提取盡可能純凈的原始語音,即去掉語音信號中的噪聲和干擾,改善它的質(zhì)量。語音增強是語音信號處理系統(tǒng)的重要組成部分。各種增強方法各有長處并且適用于不同的應(yīng)用場合。15.1概述語音增強是解決噪聲污染的一種有效方法,它的315.1概述語音增強的目的主要有兩個:一是改進語音質(zhì)量,消除背景噪聲,使聽者樂于接受,不感覺疲勞,這是一種主觀度量;二是提高語音可懂度,這是一種客觀度量。這兩個目的往往不能兼得。15.1概述語音增強的目的主要有兩個:4語音增強方法語音增強方法有多種,大致分為三類:①基于語音產(chǎn)生模型如:線性濾波法、梳狀濾波法、自相關(guān)法②基于語音模型和噪聲模型如:維納濾波法、卡爾曼濾波法③基于噪聲特性(短時譜估計)

如:頻譜減法、自適應(yīng)噪聲抵消法語音增強方法語音增強方法有多種,大致分為三類:515.2語音特性、人耳感知特性及噪聲特性

------語音特性

語音是一時變的、非平穩(wěn)的隨機過程,但由于一段時間內(nèi)(10~30ms)人的聲帶和聲道形狀的相對穩(wěn)定性,可認(rèn)為其特征是不變的,因而語音的短時譜具有相對穩(wěn)定性。在語音增強中,可以利用濁音的周期性特征,采用梳狀濾波器提取語音分量或者抑制非語音信號,而清音則難以與寬帶噪聲區(qū)分。語音信號可以用統(tǒng)計分析特性來描述。語音的短時譜幅度的統(tǒng)計特性是時變的,只有當(dāng)分析幀長趨于無窮大時,才能近似認(rèn)為其具有高斯分布。高斯分布模型是根據(jù)中心極限定理得到的,將高斯模型應(yīng)用于有限幀長只是一種近似的描述。在寬帶噪聲污染的語音增強中,可將這種假設(shè)作為分析的前提。15.2語音特性、人耳感知特性及噪聲特性

------語音特615.2語音特性、人耳感知特性及噪聲特性

------人耳感知特性語音感知問題涉及到生理學(xué)、心理學(xué)、聲學(xué)和語音學(xué)諸多領(lǐng)域,人耳對背景噪聲有很大的抑制作用,其中很多問題有待進一步研究。目前已有一些結(jié)論可用于語音增強:①人耳對語音的感知主要是通過其幅度譜獲得的,而對相位譜則不敏感。②人耳對頻率高低的感受近似與該頻率的對數(shù)值成正比。③人耳有掩蔽效應(yīng),即強信號對弱信號有抑制作用,能夠?qū)⑵溲谏w。利用人耳的生理特點,提高語音信號的信噪比,使有用的語音信號大于噪聲一定級別,就可以在語音與噪聲共存的情況下感覺不到噪聲的存在。④共振峰對語音的感知十分重要,特別是第二共振峰比第一共振峰更為重要,因此對語音信號進行一定程度的高通濾波不會對可懂度產(chǎn)生影響。⑤人耳在兩個人以上的說話環(huán)境中能夠分辨出他所需要的聲音。15.2語音特性、人耳感知特性及噪聲特性

------人耳感715.2語音特性、人耳感知特性及噪聲特性

------噪聲特性周期性噪聲的特點是有許多離散的窄譜峰,來源于發(fā)動機等周期性運轉(zhuǎn)的機械??梢匀菀椎赝ㄟ^檢查功率譜發(fā)現(xiàn)并通過濾波或變換技術(shù)將其去掉。沖激噪聲表現(xiàn)為時域波形中突然出現(xiàn)的窄脈沖是放電的結(jié)果。根據(jù)帶噪語音信號幅度的平均值確定閾值。當(dāng)信號幅度超出這一閾值時,判別為沖激噪聲,再對其進行衰減甚至完全消除。如果干擾脈沖之間不太靠近,還可以根據(jù)信號相鄰樣本數(shù)值簡單地通過內(nèi)插法將其從時間函數(shù)中去掉。寬帶噪聲通??梢约俣楦咚乖肼暫桶自肼暋碓?風(fēng)、呼吸噪聲和一般隨機噪聲源。量化噪聲通常作為白噪聲來處理,也可以視為寬帶噪聲。消除的最成功的方法利用了某些非線性處理。目前的一些方法雖然降低了背景噪聲,提高了信噪比,但并不提高語音的可懂度。15.2語音特性、人耳感知特性及噪聲特性

------噪聲特815.2語音特性、人耳感知特性及噪聲特性

------濾波器法有三種常用的濾波器:固定濾波器自適應(yīng)濾波器傅里葉變換濾波器。15.2語音特性、人耳感知特性及噪聲特性

------濾波器915.2語音特性、人耳感知特性及噪聲特性

------固定濾波器固定濾波器用于濾除平穩(wěn)干擾成分。最常見的是50或60Hz交流聲。濾除60Hz成分很少采用高通濾波器,因為干擾是由60Hz的奇次諧波引起的,特別是3~7次諧波(交流哼聲就是60Hz交流聲,它具有豐富的諧波,這種諧波一般是由于話筒輸入插孔沒有接地而造成的)。15.2語音特性、人耳感知特性及噪聲特性

------固定濾1015.2語音特性、人耳感知特性及噪聲特性

------固定濾波器(a)中,它由一個延時器和一個加法器構(gòu)成。延遲時間為T,它等于濾波器凹口間的間隔f0的倒數(shù)。(b)反饋使極點離開原點,并接近零點。當(dāng)極點靠近零點時,除各零點附近以外,在單位圓各處都會引起部分對消。因此梳齒可以變得很窄,而梳齒之間的響應(yīng)又是平坦的。15.2語音特性、人耳感知特性及噪聲特性

------固定濾1115.2語音特性、人耳感知特性及噪聲特性

------自適應(yīng)濾波自適應(yīng)濾波能夠自動辨認(rèn)應(yīng)該濾除的成分。由線性預(yù)測器構(gòu)成一個濾波器,其頻率響應(yīng)近似等于輸入信號的逆功率譜,這就可以實現(xiàn)自適應(yīng)。如果噪聲是平穩(wěn)或是緩變的,則在無語音期間便可以對噪聲進行估計,并根據(jù)估計的結(jié)果調(diào)整波濾器。采用這種方法的主要問題是,所得到的濾波器一般不是譜平衡的,這種不平衡使恢復(fù)的語音著色,并可能干擾線性預(yù)測聲碼器的工作。如果通過上述的部分使極點-零點對消而使凹口變窄,不會明顯地改善系統(tǒng)的性能。某些實驗表明,如果使LPC預(yù)測器的階數(shù)比通常采用的階數(shù)高得多,則可以去除干擾,改善語音。15.2語音特性、人耳感知特性及噪聲特性

------自適應(yīng)1215.2語音特性、人耳感知特性及噪聲特性

------變換技術(shù)(a)所示。信號要經(jīng)過DFT變換到頻域,在頻域進行處理,然后用IDFT來重建語音信號。(b)所示為頻譜整形器,它可以是簡單的一系列選通門。它可將噪聲成分變換到零值,則反變換后的信號周期性干擾將被濾除。15.2語音特性、人耳感知特性及噪聲特性

------變換技1315.4非線性處理去除寬帶噪聲的主要方法分為三類:非線性處理減譜法自適應(yīng)對消15.4非線性處理去除寬帶噪聲的主要方法分為三類:1415.4非線性處理--中心削波可以通過削波進行非線性處理。原理是因為低幅度語音被同時消去將使語音質(zhì)量變壞,如果噪聲的幅度比語音低,則消去整個低幅度成分,就會消去噪聲。時域波形經(jīng)過中心削波對可懂度是有害的,因為低幅度語音被同時消去將使語音質(zhì)量變壞,所以中心削波必須在頻域內(nèi)進行。這種方法可以用來降低語音中的混響。這里使用一個濾波器組,并對各濾波器的輸出進行中心削波,然后在組合前使輸出再通過一個相同的濾波器組,濾除由削波產(chǎn)生的畸變成分。15.4非線性處理--中心削波可以通過削波進行非線性處理。1515.4非線性處理--同態(tài)濾波法同態(tài)濾波法的關(guān)鍵部分具有非線性處理性質(zhì),它應(yīng)用于語音識別中,著眼于將語音信息(基音、頻譜)中的乘性噪聲或干擾分離,或者將已減少了噪聲、干擾的信息重新合成得到降噪時域信號再進行識別。圖15-3非線性處理中的同態(tài)濾波法框圖15.4非線性處理--同態(tài)濾波法同態(tài)濾波法的關(guān)鍵部分具有非1615.5減譜法由于人耳對語音相位不敏感,所以對語音的可懂度及質(zhì)量起重要作用的是語音的短時幅度譜,而不是相位。因而,這里只考慮了幅度譜。因為噪聲是局部平穩(wěn)的,故可以認(rèn)為發(fā)語音前的噪聲與發(fā)語音期的噪聲功率譜相同,因而可以利用發(fā)語音前(或后)的“寂靜幀”來估計噪聲。圖中,平方根的處理是用以將功率轉(zhuǎn)換為幅度。只要噪聲假定為白噪聲,則被減去的估計譜可近似為一常數(shù)。此時,減譜法的功能與中心削波法相同。圖15-4減譜法的原理框圖15.5減譜法由于人耳對語音相位不敏感,所以對語音的可懂度1715.5減譜法–改進形式原來的缺點:噪聲的幀功率譜隨機變化范圍很寬,在頻域中的最大、最小值之比往往達到幾個數(shù)量級,而最大值與均值之比也達6~8倍。因此,帶噪信號在減去噪聲譜后,噪聲分量很大的那些頻率點上就會剩余較大的部分,在頻譜上呈現(xiàn)出隨機出現(xiàn)的尖峰,使去噪語音在聽覺上形成殘留噪聲。這種噪聲具有一定的節(jié)奏性起伏感,所以稱之為“音樂噪聲”,它影響了語音的自然度甚至可懂度。另一方面,在增強語音的過程中,提高信噪比與提高語音的可懂度是一對矛盾。在濾除噪聲的同時或多或少地會損害語音信號。一般說來,噪聲濾除得越多,語音信號被損害的程度就越厲害,可懂度就越多。特別在低噪比情況下,這一矛盾更為突出。減譜的改進形式可以較好地消除音樂噪聲,優(yōu)化處理語音質(zhì)量和可懂度這一對矛盾。噪聲的能量往往分布于整個頻率范圍,而語音能量則較集中于某些頻率或頻段,尤其在元音的共振峰處。15.5減譜法–改進形式原來的缺點:1815.5減譜法–改進形式引入α、β兩個參數(shù)為算法提供了很大的靈活性。當(dāng)α=2、β=1時即變?yōu)榛镜臏p譜法。針對語音信號的強弱及噪聲的特點,選擇恰當(dāng)?shù)膮?shù),可更好地消除音樂噪聲。實際的增強實驗表明,適當(dāng)調(diào)節(jié)α、β,可以獲得比原始的減譜法更好的增強效果。15.5減譜法–改進形式引入α、β兩個參數(shù)為算法提供了很大1915.5減譜法–改進形式它增加了一步IFFT變換,變換到偽倒譜域中(實際上這并不是真正的倒譜,故稱其為“偽”倒譜)。在偽倒譜域中語音和噪聲可以更好地進行分離。α的數(shù)值根據(jù)經(jīng)驗選取。α為3~4時,信噪比可改善6dB左右。將該方法應(yīng)用于LPC編碼前的帶噪語音上,使可懂度得到了改善。這是因為采用減譜法改善了頻譜畸變,使預(yù)測器和要求的語音頻譜匹配得更好。圖15-6偽倒譜相減法15.5減譜法–改進形式它增加了一步IFFT變換,變換到偽2015.6自相關(guān)相減法基本出發(fā)點是:從含噪語音中減去寬帶噪聲的最佳估計。利用信號本身相關(guān),而信號與噪聲、噪聲與噪聲之間可看做不相關(guān)的特性,可以將帶噪信號進行自相關(guān)處理,使其得到與不帶噪信號同樣的自相關(guān)系數(shù)幀序列。15.6自相關(guān)相減法基本出發(fā)點是:從含噪語音中減去寬帶噪聲2115.6自相關(guān)相減法w(t)為窗函數(shù),由于s(t)、n(t)不相關(guān),所以上式第2、3項的交叉乘積項的積分結(jié)果為0,故可寫為Ryy(τ)=Rss(τ)+Rnn(τ)式中Rss(τ)為信號的自相關(guān)。因假定噪聲為白噪聲,故其自相關(guān)函數(shù)Rnn(τ)為沖激函數(shù)語音的自相關(guān)可以從Ryy(τ)中減去噪聲功率估值的方法來估計。這種方法很有吸引力,因為它不要求進行傅里葉變換。15.6自相關(guān)相減法w(t)為窗函數(shù),由于s(t)、n(t)2215.7自適應(yīng)噪聲對消--自適應(yīng)濾波帶自適應(yīng)濾波器的自適應(yīng)噪聲對消法的語音增強效果最好。這是因為:這種方法比其他方法多用了一個參考噪聲作為輔助輸入,從而獲得了比較全面的關(guān)于噪聲的信息。特別是輔助輸入噪聲與語音中的噪聲完全相關(guān)的情況下,自適應(yīng)噪聲對消能完全排除噪聲的隨機性,徹底抵消語音中的噪聲成分,從而無論在信噪比還是語音可懂度方面都能獲得較大的提高。這種方法的缺點是輔助輸入在某些情況下難以獲得,這就限制了其應(yīng)用范圍。15.7自適應(yīng)噪聲對消--自適應(yīng)濾波帶自適應(yīng)濾波器的自適2315.7自適應(yīng)噪聲對消--自適應(yīng)濾波自適應(yīng)濾波器:在輸入過程的統(tǒng)計特性未知或變化時,能夠調(diào)整濾波器參數(shù)以滿足某種最佳準(zhǔn)則的要求。它根據(jù)前一時刻已獲得的濾波器參數(shù)等結(jié)果,自動地調(diào)節(jié)當(dāng)前時刻的濾波器參數(shù)。以適應(yīng)信號或噪聲未知的或隨時間變化的統(tǒng)計特性,從而實現(xiàn)最優(yōu)濾波。15.7自適應(yīng)噪聲對消--自適應(yīng)濾波自適應(yīng)濾波器:在輸入過2415.7自適應(yīng)噪聲對消

--具有參考信號的自適應(yīng)噪聲對消采用兩個(或多個)話筒的語音采集系統(tǒng),一個用來采集帶噪語音,另一個(或多個)用來采集噪聲兩個話筒必須要有相當(dāng)?shù)母綦x度,但采集到的兩種信號之間不可避免地會有時間差即產(chǎn)生延遲,因此實時采集到的兩路信號中所包含的噪聲段是不同的。因而采集到的噪聲必須經(jīng)過數(shù)字濾波器,以便得到盡可能接近帶噪語音中的噪聲。通常,需要采用自適應(yīng)濾波器,使相減噪聲與帶噪語音中的噪聲基本一致。圖15-7一種雙話筒采集的自適應(yīng)噪聲對消原理15.7自適應(yīng)噪聲對消

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論