共振峰提取的幾種方法_第1頁
共振峰提取的幾種方法_第2頁
共振峰提取的幾種方法_第3頁
共振峰提取的幾種方法_第4頁
共振峰提取的幾種方法_第5頁
已閱讀5頁,還剩3頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、題目:共振峰提取技術(shù)的理論研究作業(yè)題目與要求:題目:共振峰提取技術(shù)的理論研究要求:(1) 大量查閱關(guān)于共振峰提取技術(shù)的資料(通過Internet或圖書館,在Internet上可以通過搜索:formant Estimation等關(guān)鍵字來查找相關(guān)的信息)。(2) 分析總結(jié)各種共振峰分析方法及其應(yīng)用領(lǐng)域;(3) 寫一篇關(guān)于共振峰提取技術(shù)及其應(yīng)用技術(shù)現(xiàn)狀的論文。一、共振峰的概念共振峰是反映聲道諧振特性的重要特征,它代表了發(fā)音信息的最直接的來源,而且人在語音感知中利用了共振峰信息。所以共振峰是語音信號處理中非常重要的特征參數(shù),已經(jīng)廣泛地用作語音識別的主要特征和語音編碼傳輸?shù)幕拘畔ⅰ9舱穹逍畔陬l率

2、包絡(luò)之中,因此共振峰參數(shù)提取的關(guān)鍵是估計自然語音頻譜包絡(luò),一般認(rèn)為譜包絡(luò)中的最大值就是共振峰。與基因檢測類似,共振峰估計也是表面上看起來很容易,而實際上又受很多問題困擾。這些問題包括:(1)虛假峰值。在正常情況下,頻譜包絡(luò)中的極大值完全是又共振峰引起的。但在線性預(yù)測分析方法出現(xiàn)之前的頻譜包絡(luò)估計器中,出現(xiàn)虛假峰值是相當(dāng)普遍的現(xiàn)象。甚至在采用線性預(yù)測方法時,也并非沒有虛假峰值。為了增加靈活性會給預(yù)測器增加個額外的極點,有時可利用這些極點代表虛假峰值。(2)共振峰合并。相鄰共振峰的頻率可能會靠的太近而難以分辨。這時會產(chǎn)生共振峰合并現(xiàn)象,而探討一種理想的能對共振峰合并進(jìn)行識別的共振峰提取算法存在很多

3、實際困難。(3)高音調(diào)語音。傳統(tǒng)的頻譜包絡(luò)估計方法是利用由諧波峰值提供的樣點。高音調(diào)語音的諧波間隔比較寬,因而為頻譜包絡(luò)估值所提供的樣點比較少,所以譜包絡(luò)的估計就不夠精確。即使采用線性預(yù)測進(jìn)行頻譜包絡(luò)估計也會出現(xiàn)這個問題。在這樣的語音中,線性預(yù)測包絡(luò)峰值趨向于離開真實位置,而朝著最接近的諧波峰位移動。共振峰參數(shù)包括共振峰頻率、頻帶寬度和幅值,共振峰信息包含在語音頻譜的包絡(luò)中。因此共振峰參數(shù)提取的關(guān)鍵是估計語音頻譜包絡(luò),并認(rèn)為譜包絡(luò)中的最大值就是共振峰。利用語音頻譜傅里葉變換相應(yīng)的低頻部分進(jìn)行逆變換,就可以得到語音頻譜的包絡(luò)曲線。依據(jù)頻譜包絡(luò)線各峰值能量的大小確定出第1 第4共振峰,如圖所示。二

4、、提取共振峰的方法提取共振峰的幾種常用方法包括:(1)基于線性預(yù)測(LPC)的共振峰求取方法。一種有效的頻譜包絡(luò)估計方法是從線性預(yù)測分析角度推導(dǎo)出聲道濾波器,根據(jù)這個聲道濾波器找出共振峰。雖然線性預(yù)測法也有一定的缺點,例如其頻率靈敏度與人耳不相匹配,但對于許多應(yīng)用來說,它仍然是一種行之有效的方法。線性預(yù)測共振峰通常有兩種途徑可供選擇:一種途徑是利用一種標(biāo)準(zhǔn)的尋找復(fù)根的程序計算預(yù)測誤差濾波器的根,稱為求根法;另一種途徑是找出由預(yù)測器導(dǎo)出的頻譜包絡(luò)中的局部極大值,稱為選峰法。(2)倒譜法。聲道響應(yīng)的倒譜衰減很快,在-25,25之外的值相當(dāng)小,因此可以構(gòu)造一個相應(yīng)的倒譜濾波器,將聲道的倒譜分離,對分

5、離出來的倒譜做相應(yīng)的反變換,就可以得到聲道函數(shù)的對數(shù)譜,對此做進(jìn)一步處理即可求得所需的各個共振峰。三、提取共振峰的實現(xiàn)(1)基于線性預(yù)測(LPC)在語音信號的LPC模型中,語音信號樣本s(n)可由如下差分方程表示: 式中,u(n)為激勵函數(shù),G是增益,ak;k =1,2,P是LPC系數(shù)。相應(yīng)的數(shù)字濾波器傳遞函數(shù)H(z)為上式還可表示為P個極點的級聯(lián)形式:式中,是H(z)在Z平面上第k個極點:若H(z)是穩(wěn)定的,其所有極點都在z平面的單位圓內(nèi)。則第k個共振峰的頻率和帶寬分別為和,T為語音信號采樣周期。語音信號的共振峰能由數(shù)字激光器傳遞函數(shù)H(z)進(jìn)行估計,最直接的方式是對H(z)進(jìn)行多項式求根,

6、由所求的根來判斷共振峰或譜形狀極點。然而,該方法難以快速而有效地找到根值。另一有效的獲取共振峰的途徑是語音信號LPC譜的譜峰檢測的方法進(jìn)行估計共振峰,該方法需要解決共振峰臺并的問題。McCandless試圖采用在z平面單位圓內(nèi)重復(fù)計算H(z)的方式來分離合并的共振峰,另一個有效的方法是采用對數(shù)LPC譜的二階導(dǎo)數(shù)進(jìn)行估計共振峰,取得較好效果。(2)倒譜法語音信號不是加性信號,而是卷積信號。為了能用線性系統(tǒng)對其進(jìn)行處理,可以先采用卷積同態(tài)系統(tǒng)處理。經(jīng)過卷積同態(tài)系統(tǒng)后輸出的偽時序序列稱為原序列的“復(fù)倒頻譜”。它的定義式可以表示為: 倒譜或稱“倒頻譜”的定義為: 它和復(fù)倒譜的主要區(qū)別是對序列對數(shù)幅度譜

7、的傅立葉逆變換,它是復(fù)倒譜中的偶對稱分量。它們都將卷積運算,變?yōu)閭螘r域中的加法運算,使得信號可以運用滿足疊加性的線性系統(tǒng)進(jìn)行處理。復(fù)倒譜涉及復(fù)對數(shù)運算,而倒譜只進(jìn)行實數(shù)的對數(shù)運算,較復(fù)倒譜的運算量大大減少。如果和分別是和的倒譜,x(n)= *,那么x(n)的倒譜c(n)= +。(2)倒譜法選擇最普遍的極零模式來描述聲道相應(yīng)x(n),其z變換的形式為: 經(jīng)過傅立葉變換,取對數(shù)和逆傅立葉變換后可以得到其復(fù)倒譜: 對于倒譜可以只考慮它的幅度特性,可以看出,它是一個衰減序列,且衰減的速度比1/|n|快。因而它比原信號x(n)更集中于原點附近,或者說它更具有短時性。四、提取共振峰的實現(xiàn)方法的應(yīng)用(1)基

8、于線性預(yù)測(LPC)的應(yīng)用技術(shù)現(xiàn)狀肺部氣流沖擊聲帶通過聲道的響應(yīng),形成語音。不同的聲道形狀產(chǎn)生不同的聲道響應(yīng),導(dǎo)致不同的語音。就聲道的數(shù)學(xué)模型,主要有兩種觀點:(一)把聲道看作由多個不同截面積的聲管串聯(lián)而成,即聲管模型;(二)把聲道看作諧振腔,共振峰就是該腔體的諧振頻率,即共振峰模型。因人耳聽覺的柯替氏器官就是按頻率感受而排列其位置的,因而,實踐證明共振峰模型方法是非常有效的。共振峰是描述語音信號特征的重要參數(shù),所以,準(zhǔn)確有效的共振峰提取算法對語音信號的分析、臺成、編碼有重要意義。線性預(yù)測編碼(LPC)是進(jìn)行語音信號分析、語音信號編碼最有效的技術(shù)之一 其重要性在于提供了一組簡潔的語音信號模型參

9、數(shù),比較精確地表征了語音信號的幅度譜,而分析它們所需的計算量相對而言并不大口 語音信號共振峰的LPC分析方法的一個主要特點在于能夠由預(yù)測系數(shù)構(gòu)成的多項式中精確地估計共振峰頻率和帶寬。在過去的研究中,已有許多利用LPC分析提取共振峰方法被提出 。(2)倒譜法的應(yīng)用技術(shù)現(xiàn)狀倒譜法根據(jù)對數(shù)功率譜的逆傅立葉變換,能夠分離頻譜包絡(luò)和細(xì)微結(jié)構(gòu),很精確地得到基音頻率和共振峰信息,但它的運算量比較大。當(dāng)采用無噪語音時,用倒譜進(jìn)行基音提取的效果是很理想的。然而當(dāng)存在加性噪聲時,在對數(shù)功率譜的低電平部分會被噪聲填滿,從而掩蓋了基音諧波的周期性。這意味著倒譜的輸入不再是純凈的周期性成分,而倒譜中的基音峰值將會展寬,并受到噪聲的污染從而使倒譜檢測方法的靈敏度也隨之下降。在基音估計中還可以使用經(jīng)過中心削波或三電平削波后的自相關(guān)方法,這種方法在信噪比低的情況下可以獲得良好的性能。五、總結(jié) 共振峰是反映聲道諧振特性的重要特征,它代表了發(fā)音信息的最直接的來源。改變共振峰可以產(chǎn)生出所有原音和某些輔音,在共振峰中也包含著輔音的重要信息。人在語音感知中也

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論