第14章語音增強教程課件

上傳人：文*** IP屬地：貴州上傳時間：2023-07-31 格式：PPT 頁數(shù)：26 大小：211.41KB 積分：25 舉報 版權(quán)申訴

已閱讀5頁，還剩21頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進行舉報或認(rèn)領(lǐng)

文檔簡介

第15章語音增強第15章語音增強1目錄15.1概述15.2語音特性、人耳感知特性及噪聲特性15.2.1語音特性15.2.2人耳感知特性15.2.3噪聲特性15.3濾波器法15.3.1固定濾波器15-.3.2自適應(yīng)濾波15.3.3變換技術(shù)15.4非線性處理15.4.1中心削波15.4.2同態(tài)濾波法15.5減譜法15.5.1減譜法15.5.2減譜法的改進形式15.6自相關(guān)相減法15.7自適應(yīng)噪聲對消15.7.1自適應(yīng)濾波15.7.2具有參考信號的自適應(yīng)噪聲對消15.7.3利用延遲來建立參考信號的自適應(yīng)噪聲對消目錄15.1概述215.1概述語音增強是解決噪聲污染的一種有效方法，它的一個主要目標(biāo)是從帶噪語音信號中提取盡可能純凈的原始語音，即去掉語音信號中的噪聲和干擾，改善它的質(zhì)量。語音增強是語音信號處理系統(tǒng)的重要組成部分。各種增強方法各有長處并且適用于不同的應(yīng)用場合。15.1概述語音增強是解決噪聲污染的一種有效方法，它的315.1概述語音增強的目的主要有兩個：一是改進語音質(zhì)量，消除背景噪聲，使聽者樂于接受，不感覺疲勞，這是一種主觀度量；二是提高語音可懂度，這是一種客觀度量。這兩個目的往往不能兼得。15.1概述語音增強的目的主要有兩個：4語音增強方法語音增強方法有多種，大致分為三類：①基于語音產(chǎn)生模型如：線性濾波法、梳狀濾波法、自相關(guān)法②基于語音模型和噪聲模型如：維納濾波法、卡爾曼濾波法③基于噪聲特性(短時譜估計)

如：頻譜減法、自適應(yīng)噪聲抵消法語音增強方法語音增強方法有多種，大致分為三類：515.2語音特性、人耳感知特性及噪聲特性

------語音特性

語音是一時變的、非平穩(wěn)的隨機過程，但由于一段時間內(nèi)(10～30ms)人的聲帶和聲道形狀的相對穩(wěn)定性，可認(rèn)為其特征是不變的，因而語音的短時譜具有相對穩(wěn)定性。在語音增強中，可以利用濁音的周期性特征，采用梳狀濾波器提取語音分量或者抑制非語音信號，而清音則難以與寬帶噪聲區(qū)分。語音信號可以用統(tǒng)計分析特性來描述。語音的短時譜幅度的統(tǒng)計特性是時變的，只有當(dāng)分析幀長趨于無窮大時，才能近似認(rèn)為其具有高斯分布。高斯分布模型是根據(jù)中心極限定理得到的，將高斯模型應(yīng)用于有限幀長只是一種近似的描述。在寬帶噪聲污染的語音增強中，可將這種假設(shè)作為分析的前提。15.2語音特性、人耳感知特性及噪聲特性

------語音特615.2語音特性、人耳感知特性及噪聲特性

------人耳感知特性語音感知問題涉及到生理學(xué)、心理學(xué)、聲學(xué)和語音學(xué)諸多領(lǐng)域，人耳對背景噪聲有很大的抑制作用，其中很多問題有待進一步研究。目前已有一些結(jié)論可用于語音增強：①人耳對語音的感知主要是通過其幅度譜獲得的，而對相位譜則不敏感。②人耳對頻率高低的感受近似與該頻率的對數(shù)值成正比。③人耳有掩蔽效應(yīng)，即強信號對弱信號有抑制作用，能夠?qū)⑵溲谏w。利用人耳的生理特點，提高語音信號的信噪比，使有用的語音信號大于噪聲一定級別，就可以在語音與噪聲共存的情況下感覺不到噪聲的存在。④共振峰對語音的感知十分重要，特別是第二共振峰比第一共振峰更為重要，因此對語音信號進行一定程度的高通濾波不會對可懂度產(chǎn)生影響。⑤人耳在兩個人以上的說話環(huán)境中能夠分辨出他所需要的聲音。15.2語音特性、人耳感知特性及噪聲特性

------人耳感715.2語音特性、人耳感知特性及噪聲特性

------噪聲特性周期性噪聲的特點是有許多離散的窄譜峰，來源于發(fā)動機等周期性運轉(zhuǎn)的機械?？梢匀菀椎赝ㄟ^檢查功率譜發(fā)現(xiàn)并通過濾波或變換技術(shù)將其去掉。沖激噪聲表現(xiàn)為時域波形中突然出現(xiàn)的窄脈沖是放電的結(jié)果。根據(jù)帶噪語音信號幅度的平均值確定閾值。當(dāng)信號幅度超出這一閾值時，判別為沖激噪聲，再對其進行衰減甚至完全消除。如果干擾脈沖之間不太靠近，還可以根據(jù)信號相鄰樣本數(shù)值簡單地通過內(nèi)插法將其從時間函數(shù)中去掉。寬帶噪聲通?？梢约俣楦咚乖肼暫桶自肼暋碓?風(fēng)、呼吸噪聲和一般隨機噪聲源。量化噪聲通常作為白噪聲來處理，也可以視為寬帶噪聲。消除的最成功的方法利用了某些非線性處理。目前的一些方法雖然降低了背景噪聲，提高了信噪比，但并不提高語音的可懂度。15.2語音特性、人耳感知特性及噪聲特性

------噪聲特815.2語音特性、人耳感知特性及噪聲特性

------濾波器法有三種常用的濾波器：固定濾波器自適應(yīng)濾波器傅里葉變換濾波器。15.2語音特性、人耳感知特性及噪聲特性

------濾波器915.2語音特性、人耳感知特性及噪聲特性

------固定濾波器固定濾波器用于濾除平穩(wěn)干擾成分。最常見的是50或60Hz交流聲。濾除60Hz成分很少采用高通濾波器，因為干擾是由60Hz的奇次諧波引起的，特別是3～7次諧波(交流哼聲就是60Hz交流聲，它具有豐富的諧波，這種諧波一般是由于話筒輸入插孔沒有接地而造成的)。15.2語音特性、人耳感知特性及噪聲特性

------固定濾1015.2語音特性、人耳感知特性及噪聲特性

------固定濾波器(a)中，它由一個延時器和一個加法器構(gòu)成。延遲時間為T，它等于濾波器凹口間的間隔f0的倒數(shù)。(b)反饋使極點離開原點，并接近零點。當(dāng)極點靠近零點時，除各零點附近以外，在單位圓各處都會引起部分對消。因此梳齒可以變得很窄，而梳齒之間的響應(yīng)又是平坦的。15.2語音特性、人耳感知特性及噪聲特性

------固定濾1115.2語音特性、人耳感知特性及噪聲特性

------自適應(yīng)濾波自適應(yīng)濾波能夠自動辨認(rèn)應(yīng)該濾除的成分。由線性預(yù)測器構(gòu)成一個濾波器，其頻率響應(yīng)近似等于輸入信號的逆功率譜，這就可以實現(xiàn)自適應(yīng)。如果噪聲是平穩(wěn)或是緩變的，則在無語音期間便可以對噪聲進行估計，并根據(jù)估計的結(jié)果調(diào)整波濾器。采用這種方法的主要問題是，所得到的濾波器一般不是譜平衡的，這種不平衡使恢復(fù)的語音著色，并可能干擾線性預(yù)測聲碼器的工作。如果通過上述的部分使極點-零點對消而使凹口變窄，不會明顯地改善系統(tǒng)的性能。某些實驗表明，如果使LPC預(yù)測器的階數(shù)比通常采用的階數(shù)高得多，則可以去除干擾，改善語音。15.2語音特性、人耳感知特性及噪聲特性

------自適應(yīng)1215.2語音特性、人耳感知特性及噪聲特性

------變換技術(shù)(a)所示。信號要經(jīng)過DFT變換到頻域，在頻域進行處理，然后用IDFT來重建語音信號。(b)所示為頻譜整形器，它可以是簡單的一系列選通門。它可將噪聲成分變換到零值，則反變換后的信號周期性干擾將被濾除。15.2語音特性、人耳感知特性及噪聲特性

------變換技1315.4非線性處理去除寬帶噪聲的主要方法分為三類：非線性處理減譜法自適應(yīng)對消15.4非線性處理去除寬帶噪聲的主要方法分為三類：1415.4非線性處理--中心削波可以通過削波進行非線性處理。原理是因為低幅度語音被同時消去將使語音質(zhì)量變壞，如果噪聲的幅度比語音低，則消去整個低幅度成分，就會消去噪聲。時域波形經(jīng)過中心削波對可懂度是有害的，因為低幅度語音被同時消去將使語音質(zhì)量變壞，所以中心削波必須在頻域內(nèi)進行。這種方法可以用來降低語音中的混響。這里使用一個濾波器組，并對各濾波器的輸出進行中心削波，然后在組合前使輸出再通過一個相同的濾波器組，濾除由削波產(chǎn)生的畸變成分。15.4非線性處理--中心削波可以通過削波進行非線性處理。1515.4非線性處理--同態(tài)濾波法同態(tài)濾波法的關(guān)鍵部分具有非線性處理性質(zhì)，它應(yīng)用于語音識別中，著眼于將語音信息(基音、頻譜)中的乘性噪聲或干擾分離，或者將已減少了噪聲、干擾的信息重新合成得到降噪時域信號再進行識別。圖15-3非線性處理中的同態(tài)濾波法框圖15.4非線性處理--同態(tài)濾波法同態(tài)濾波法的關(guān)鍵部分具有非1615.5減譜法由于人耳對語音相位不敏感，所以對語音的可懂度及質(zhì)量起重要作用的是語音的短時幅度譜，而不是相位。因而，這里只考慮了幅度譜。因為噪聲是局部平穩(wěn)的，故可以認(rèn)為發(fā)語音前的噪聲與發(fā)語音期的噪聲功率譜相同，因而可以利用發(fā)語音前(或后)的“寂靜幀”來估計噪聲。圖中，平方根的處理是用以將功率轉(zhuǎn)換為幅度。只要噪聲假定為白噪聲，則被減去的估計譜可近似為一常數(shù)。此時，減譜法的功能與中心削波法相同。圖15-4減譜法的原理框圖15.5減譜法由于人耳對語音相位不敏感，所以對語音的可懂度1715.5減譜法–改進形式原來的缺點:噪聲的幀功率譜隨機變化范圍很寬，在頻域中的最大、最小值之比往往達到幾個數(shù)量級，而最大值與均值之比也達6～8倍。因此，帶噪信號在減去噪聲譜后，噪聲分量很大的那些頻率點上就會剩余較大的部分，在頻譜上呈現(xiàn)出隨機出現(xiàn)的尖峰，使去噪語音在聽覺上形成殘留噪聲。這種噪聲具有一定的節(jié)奏性起伏感，所以稱之為“音樂噪聲”，它影響了語音的自然度甚至可懂度。另一方面，在增強語音的過程中，提高信噪比與提高語音的可懂度是一對矛盾。在濾除噪聲的同時或多或少地會損害語音信號。一般說來，噪聲濾除得越多，語音信號被損害的程度就越厲害，可懂度就越多。特別在低噪比情況下，這一矛盾更為突出。減譜的改進形式可以較好地消除音樂噪聲，優(yōu)化處理語音質(zhì)量和可懂度這一對矛盾。噪聲的能量往往分布于整個頻率范圍，而語音能量則較集中于某些頻率或頻段，尤其在元音的共振峰處。15.5減譜法–改進形式原來的缺點:1815.5減譜法–改進形式引入α、β兩個參數(shù)為算法提供了很大的靈活性。當(dāng)α＝2、β＝1時即變?yōu)榛镜臏p譜法。針對語音信號的強弱及噪聲的特點，選擇恰當(dāng)?shù)膮?shù)，可更好地消除音樂噪聲。實際的增強實驗表明，適當(dāng)調(diào)節(jié)α、β，可以獲得比原始的減譜法更好的增強效果。15.5減譜法–改進形式引入α、β兩個參數(shù)為算法提供了很大1915.5減譜法–改進形式它增加了一步IFFT變換，變換到偽倒譜域中(實際上這并不是真正的倒譜，故稱其為“偽”倒譜)。在偽倒譜域中語音和噪聲可以更好地進行分離。α的數(shù)值根據(jù)經(jīng)驗選取。α為3～4時，信噪比可改善6dB左右。將該方法應(yīng)用于LPC編碼前的帶噪語音上，使可懂度得到了改善。這是因為采用減譜法改善了頻譜畸變，使預(yù)測器和要求的語音頻譜匹配得更好。圖15-6偽倒譜相減法15.5減譜法–改進形式它增加了一步IFFT變換，變換到偽2015.6自相關(guān)相減法基本出發(fā)點是：從含噪語音中減去寬帶噪聲的最佳估計。利用信號本身相關(guān)，而信號與噪聲、噪聲與噪聲之間可看做不相關(guān)的特性，可以將帶噪信號進行自相關(guān)處理，使其得到與不帶噪信號同樣的自相關(guān)系數(shù)幀序列。15.6自相關(guān)相減法基本出發(fā)點是：從含噪語音中減去寬帶噪聲2115.6自相關(guān)相減法w(t)為窗函數(shù)，由于s(t)、n(t)不相關(guān)，所以上式第2、3項的交叉乘積項的積分結(jié)果為0，故可寫為Ryy(τ)＝Rss(τ)+Rnn(τ)式中Rss(τ)為信號的自相關(guān)。因假定噪聲為白噪聲，故其自相關(guān)函數(shù)Rnn(τ)為沖激函數(shù)語音的自相關(guān)可以從Ryy(τ)中減去噪聲功率估值的方法來估計。這種方法很有吸引力，因為它不要求進行傅里葉變換。15.6自相關(guān)相減法w(t)為窗函數(shù)，由于s(t)、n(t)2215.7自適應(yīng)噪聲對消--自適應(yīng)濾波帶自適應(yīng)濾波器的自適應(yīng)噪聲對消法的語音增強效果最好。這是因為:這種方法比其他方法多用了一個參考噪聲作為輔助輸入，從而獲得了比較全面的關(guān)于噪聲的信息。特別是輔助輸入噪聲與語音中的噪聲完全相關(guān)的情況下，自適應(yīng)噪聲對消能完全排除噪聲的隨機性，徹底抵消語音中的噪聲成分，從而無論在信噪比還是語音可懂度方面都能獲得較大的提高。這種方法的缺點是輔助輸入在某些情況下難以獲得，這就限制了其應(yīng)用范圍。15.7自適應(yīng)噪聲對消--自適應(yīng)濾波帶自適應(yīng)濾波器的自適2315.7自適應(yīng)噪聲對消--自適應(yīng)濾波自適應(yīng)濾波器:在輸入過程的統(tǒng)計特性未知或變化時，能夠調(diào)整濾波器參數(shù)以滿足某種最佳準(zhǔn)則的要求。它根據(jù)前一時刻已獲得的濾波器參數(shù)等結(jié)果，自動地調(diào)節(jié)當(dāng)前時刻的濾波器參數(shù)。以適應(yīng)信號或噪聲未知的或隨時間變化的統(tǒng)計特性，從而實現(xiàn)最優(yōu)濾波。15.7自適應(yīng)噪聲對消--自適應(yīng)濾波自適應(yīng)濾波器:在輸入過2415.7自適應(yīng)噪聲對消

--具有參考信號的自適應(yīng)噪聲對消采用兩個(或多個)話筒的語音采集系統(tǒng)，一個用來采集帶噪語音，另一個(或多個)用來采集噪聲兩個話筒必須要有相當(dāng)?shù)母綦x度，但采集到的兩種信號之間不可避免地會有時間差即產(chǎn)生延遲，因此實時采集到的兩路信號中所包含的噪聲段是不同的。因而采集到的噪聲必須經(jīng)過數(shù)字濾波器，以便得到盡可能接近帶噪語音中的噪聲。通常，需要采用自適應(yīng)濾波器，使相減噪聲與帶噪語音中的噪聲基本一致。圖15-7一種雙話筒采集的自適應(yīng)噪聲對消原理15.7自適應(yīng)噪聲對消

人人文庫> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

第14章語音增強教程課件

文檔簡介

溫馨提示

最新文檔

評論

第14章語音增強教程課件

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔