語(yǔ)音信號(hào)特征參數(shù)提取方法_第1頁(yè)
語(yǔ)音信號(hào)特征參數(shù)提取方法_第2頁(yè)
語(yǔ)音信號(hào)特征參數(shù)提取方法_第3頁(yè)
語(yǔ)音信號(hào)特征參數(shù)提取方法_第4頁(yè)
語(yǔ)音信號(hào)特征參數(shù)提取方法_第5頁(yè)
已閱讀5頁(yè),還剩5頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、語(yǔ)音信號(hào)特征參數(shù)提取方法阮雄飛 微電子學(xué)與固體電子學(xué)摘要:在語(yǔ)音技術(shù)的發(fā)展過(guò)程中使用了大量的語(yǔ)音信號(hào)特征參數(shù),好的語(yǔ)音信號(hào)特征參數(shù)能對(duì)語(yǔ)音識(shí)別起至關(guān)重要的作用。 本文對(duì)語(yǔ)音信號(hào)特征參數(shù)提取方法以及國(guó)內(nèi)外研究現(xiàn)狀進(jìn)行 了介紹,最后介紹了 Hilbert-Hua ng這一新興理論成果以及在特征提取中的應(yīng)用。關(guān)鍵詞:語(yǔ)音技術(shù)特征提取HHT1引言語(yǔ)音信號(hào)是一種短時(shí)平穩(wěn)信號(hào),即時(shí)變的,十分復(fù)雜,攜帶很多有用的信息, 這些信息包括語(yǔ)義、個(gè)人特征等,其特征參數(shù)的準(zhǔn)確性和唯一性將直接影響語(yǔ)音 識(shí)別率的高低,并且這也是語(yǔ)音識(shí)別的基礎(chǔ) 。特征參數(shù)應(yīng)該能夠比較準(zhǔn)確地表 達(dá)語(yǔ)音信號(hào)的特征具有一定的唯一性。上世紀(jì)40年

2、代,potter等人提出了 Visiblespeech'的概念,指出語(yǔ)譜圖對(duì)語(yǔ) 音信號(hào)有很強(qiáng)的描述能力,并且試著用語(yǔ)譜信息進(jìn)行語(yǔ)音識(shí)別,這就形成了最早 的語(yǔ)音特征,直到現(xiàn)在仍有很多的人用語(yǔ)譜特征來(lái)進(jìn)行語(yǔ)音識(shí)別。后來(lái),人們發(fā)現(xiàn)利用語(yǔ)音信號(hào)的時(shí)域特征可以從語(yǔ)音波形中提取某些反映語(yǔ)音特性的參數(shù), 比如:幅度、短時(shí)幀平均能量、短時(shí)幀過(guò)零率、短時(shí)自相關(guān)系數(shù)、平均幅度差函 數(shù)等。這些參數(shù)不但能減小模板數(shù)目運(yùn)算量及存儲(chǔ)量而且還可以濾除語(yǔ)音信號(hào)中 無(wú)用的冗余信息。語(yǔ)音信號(hào)特征參數(shù)是分幀提取的,每幀特征參數(shù)一般構(gòu)成一個(gè) 矢量,所以語(yǔ)音信號(hào)特征是一個(gè)矢量序列。我們將語(yǔ)音信號(hào)切成一幀一幀,每幀大小大約是20

3、-30ms。幀太大就不能得到語(yǔ)音信號(hào)隨時(shí)間變化的特性,幀太小就 不能提取出語(yǔ)音信號(hào)的特征,每幀語(yǔ)音信號(hào)中包含數(shù)個(gè)語(yǔ)音信號(hào)的基本周期。有時(shí)希望相鄰幀之間的變化不是太大,幀之間就要有重疊,幀疊往往是幀長(zhǎng)的1/2 或1/3。幀疊大,相應(yīng)的計(jì)算量也大3。隨著語(yǔ)音識(shí)別技術(shù)的不斷發(fā)展時(shí)域特征參 數(shù)的種種不足逐漸暴露出來(lái),如這些特征參數(shù)缺乏較好穩(wěn)定性且區(qū)分能力不好。 于是頻域參數(shù)開始作為語(yǔ)音信號(hào)的特征比如頻譜共振峰等。經(jīng)典的特征提取方法 主要有LPCC (線性預(yù)測(cè)倒譜系數(shù))、MFCC (美爾頻率倒譜系數(shù))、HMM (隱馬 爾科夫模型)、DTW (動(dòng)態(tài)時(shí)間規(guī)整)等。2語(yǔ)音信號(hào)特征參數(shù)提取方法對(duì)語(yǔ)音信號(hào)的大量分

4、析表明,語(yǔ)音信號(hào)中包含著持續(xù)的準(zhǔn)諧波成分和瞬變的 遷越成分,即語(yǔ)音信號(hào)是一種多分量、非線性、非平穩(wěn)信號(hào)。諸如聲門、聲道 以及輻射等影響因素很多,使得語(yǔ)音信號(hào)特征參數(shù)的準(zhǔn)確提取和修正較為困難。 這就需要一種精確的時(shí)頻表示方法5,6,來(lái)準(zhǔn)確表現(xiàn)語(yǔ)音信號(hào)的各種特征。傳統(tǒng) 的語(yǔ)音信號(hào)處理都是基于語(yǔ)音信號(hào)的兩個(gè)基本假設(shè),即人的發(fā)聲系統(tǒng)是線性的 及語(yǔ)音信號(hào)是短時(shí)平穩(wěn)的。這兩個(gè)假定導(dǎo)出了各種 短時(shí)”處理方法,如:短時(shí)傅 里葉變換、倒譜分析和線性預(yù)測(cè)分析等。這些 短時(shí)”處理方法雖然引入了時(shí)頻局 部化思想,但它們的 短時(shí)窗口 ”大小是固定不變的,不能敏感地反映信號(hào)的突 變,從而忽略了語(yǔ)音信號(hào)的時(shí)變特征,所以提取

5、出來(lái)的參數(shù)往往不夠精確。隨著小波分析理論9的發(fā)展,小波分析也逐漸應(yīng)用于語(yǔ)音信號(hào)的分析和處 理。雖然小波分析具有可調(diào)的時(shí)頻窗口, 但是也存在一定的局限性,主要表現(xiàn)在 以下幾個(gè)方面9,10:難以選擇的小波基。在小波分析中,可以根據(jù)不同的要求構(gòu)造不同的小波基。但是對(duì)某一信號(hào),依據(jù)什么原則、用什么判據(jù)選擇小波基在理論上和實(shí)際應(yīng)用中還是一個(gè)難點(diǎn)固定的基函數(shù)。小波基一旦選定就不能再更改,而小波基的選擇往往是根據(jù)特定的語(yǔ)音信號(hào)特征,所以它不具有自適應(yīng)性。恒定的多分辨率。小波變換的多尺度特性使小波具有數(shù)學(xué)顯微鏡”的特性和多分辨率分析功能。然而,一旦選擇了小波基函數(shù)和變換尺度, 分辨率的大小也就 確定了,并不會(huì)

6、隨信號(hào)的改變而改變,因此小波變換可以實(shí)現(xiàn)多分辨率分析, 但 其分辨率是恒定的。LPCC是基于聲道模型,它是目前應(yīng)用最多的一種倒譜特征提取方法。線性 預(yù)測(cè)系數(shù)LPC用線性預(yù)測(cè)法分析語(yǔ)音信號(hào)相鄰樣值之間的關(guān)系,得到一組相關(guān) 的參數(shù)。由此語(yǔ)音特派生的聲學(xué)特征還有線譜對(duì)LSP、PARCOR系數(shù)(反射系數(shù))、對(duì)數(shù)面積比系數(shù)等。LPCC為L(zhǎng)PC的倒譜參數(shù),它的原理和計(jì)算都較為簡(jiǎn) 單,容易實(shí)現(xiàn)。算的快速有效使得現(xiàn)在的很多商用化的語(yǔ)音識(shí)別系統(tǒng)都是用 LPCC作為特征提取方法的?;谌祟惵犛X(jué)模型的 MFCC,它所采用的mel頻率 是人耳聽到聲音的高低和實(shí)際頻率的非線性映射得到的一個(gè)頻率尺度。MFCC是繼LPCC

7、之后語(yǔ)音識(shí)別領(lǐng)域中又一大創(chuàng)新理論,計(jì)算過(guò)程如圖1。相比于LPCC它的識(shí)別性能有明顯的改進(jìn),只是算量大于LPCC,用C語(yǔ)言在算機(jī)上做模擬時(shí) 其運(yùn)算時(shí)間是LPCC的近十倍。由于它是一種基于聽覺(jué)模型的特征提取方法, 在有信道噪聲和頻譜失真的情況下,仍具有較高的識(shí)別精度,特別是對(duì)噪聲情況下的識(shí)別具有定的魯棒性。更隨著 DSP技術(shù)的發(fā)展以及它對(duì)FFT算的支持,使 得MFCC的參數(shù)提取速度也很快。結(jié)合 LPC與MFC的后來(lái)提出的一種特征提 取的方法PLP (感知線性預(yù)測(cè)參數(shù)),用durbin法計(jì)算LPC參數(shù),而在算自相 關(guān)時(shí)用類似MFC的方法。PLP性能類似MFCC,甚至在某些特征提取結(jié)果上 要好于MFC

8、C。王彪12提出了一種改進(jìn)的語(yǔ)音信號(hào)特征參數(shù)提取算法,即在 MFCC參數(shù)的基礎(chǔ)上加入了語(yǔ)音信號(hào)的短時(shí)能量和短時(shí)平均過(guò)零率信息,結(jié)果如表1,說(shuō)明此改進(jìn)的MFCC方法是有效的。語(yǔ)音輸入x(n)X(m)O(Mk)MFCC輸出預(yù)處理傅里葉濾波器離散余加窗變換 一 .組能量弦變換圖1 MFCC計(jì)算過(guò)程商種方濟(jì)說(shuō)別率的比輟1 Ttuc reroiutiuu rule fornp百 ri金m of Iwn methodsMKCC試剛*新料毎字牧說(shuō)劇*D.9K50,9614-fr 3(吃圾詢0.9130;9211998年,由美籍華人黃鍔(N.E.Hua ng)等人提出的Hilbert-Hua ng變換(Hil

9、bert-Huang Transform,HHT)13,14具有精確的時(shí)頻表示,它不僅適合于非平穩(wěn) 信號(hào)也適合于非線性信號(hào)。它通過(guò)經(jīng)驗(yàn)?zāi)B(tài)分解(Empirical Mode Decompositi on,EMD)把信號(hào)分解成一族固有模態(tài)函數(shù)(intrinsic mode function,IMF),然后將每個(gè)固有模態(tài)函數(shù)與它的 Hilbert變換構(gòu)成一個(gè)復(fù)解析函數(shù),并由此導(dǎo)出作為時(shí)域 函數(shù)的瞬時(shí)幅度(能量)和瞬時(shí)頻率,從而給出被分析信號(hào)幅度(能量)的時(shí)間-頻 率分布,稱為信號(hào)的Hilbert譜(Hilbert spectrum)。這種Hilbert譜具有精確的時(shí) 頻表示15。3語(yǔ)音特征提取的研

10、究現(xiàn)狀概述3.1基音檢測(cè)和共振峰提取研究現(xiàn)狀概述語(yǔ)音信號(hào)的特征參數(shù)主要指的是語(yǔ)音信號(hào)的基音頻率和共振峰頻率,語(yǔ)音 特征參數(shù)的提取也主要是指語(yǔ)音信號(hào)的基音檢測(cè)和共振峰提取。(一)基音檢測(cè)自從進(jìn)行語(yǔ)音分析研究以來(lái),基音檢測(cè)一直是一個(gè)重點(diǎn)研究的問(wèn)題, 很多方 法已被提出,然而這些方法都有它們的局限性。 迄今為止,尚未找到一個(gè)完善的 可以適用于不同說(shuō)話人、不同環(huán)境要求的基音檢測(cè)方法。其原因主要有以下幾個(gè) 方面16: (a)基音周期受聲道易變性、說(shuō)話人的情感、聲調(diào)等因素的影響; (b)基 音周期變化范圍很大;(c)受說(shuō)話人的發(fā)音習(xí)慣的影響?;糁芷诘奶崛》椒ㄒ?般可以分為兩個(gè)大類17:基于分段的方法和基

11、于事件的方法。基于分段的提取 方法一般都先將語(yǔ)音信號(hào)分成長(zhǎng)度一定的語(yǔ)音幀,然后對(duì)每一幀語(yǔ)音數(shù)據(jù)求取平 均基音周期。這些方法主要有:自相關(guān)法;倒譜法;平均幅度差法;簡(jiǎn) 化逆濾波器法18,19等。它們的共同優(yōu)點(diǎn)是計(jì)算簡(jiǎn)單。然而,由于它們都是建立在 語(yǔ)音信號(hào)是線性和短時(shí)平穩(wěn)的假設(shè)上,因此,從本質(zhì)上說(shuō),這些方法都無(wú)法檢測(cè)幀內(nèi)基音周期的非平穩(wěn)變化,檢測(cè)精度不高。相比而言,基于事件20的基音周期提取方法并不多見。己有的幾種方法都是通過(guò)定位聲門關(guān)閉(聲門的一次關(guān)閉稱為一個(gè)事件)的瞬時(shí)時(shí)間,然后確定兩個(gè)相鄰的事件的時(shí)間間隔來(lái)確定基音周 期。顯然,確定聲門關(guān)閉的瞬時(shí)時(shí)間是決定被提取的基音周期精度高低的關(guān)鍵所 在

12、。文獻(xiàn)21通過(guò)計(jì)算給定信號(hào)的自協(xié)方差矩陣行列式的極大值來(lái)確定事件發(fā)生 的時(shí)刻。該方法對(duì)部分元音有很好的檢測(cè)精度, 但它不適合所有元音,也不適合 基音周期發(fā)生非平穩(wěn)性變化時(shí)的情況,并且,計(jì)算十分復(fù)雜。文獻(xiàn)22, 23利用聲門關(guān)閉時(shí)聲門氣流的導(dǎo)數(shù)不連續(xù)這一性質(zhì)來(lái)確定事件發(fā)生的時(shí)刻,獲得了比較滿意的檢測(cè)精度。但是,它們對(duì)噪聲太敏感,不適合用于帶噪語(yǔ)音數(shù)據(jù)基音周期的 提取。文獻(xiàn)24將最大似然關(guān)鍵點(diǎn)判別技術(shù)用于檢測(cè)聲門關(guān)閉事件,結(jié)果表明, 該方法對(duì)大部分元音、帶噪語(yǔ)音都有很高的檢測(cè)精度,但不適合用于高音調(diào)語(yǔ)音 基音周期的提取。文獻(xiàn)25,26用小波方法來(lái)檢測(cè)聲門關(guān)閉引起的語(yǔ)音信號(hào)的導(dǎo)數(shù)不 連續(xù)事件,實(shí)驗(yàn)表

13、明它們能適應(yīng)于很寬的基音周期變化,并且也具有較好的抗噪 能力。這些方法有一個(gè)共同的假設(shè)是在聲門關(guān)閉的瞬時(shí)聲門激勵(lì)是瞬時(shí)中斷的, 由此將導(dǎo)致語(yǔ)音信號(hào)在這一時(shí)刻其導(dǎo)數(shù)不連續(xù)。顯然,對(duì)于聲門關(guān)閉很好的元音它們會(huì)有很好的結(jié)果,但是對(duì)于聲門關(guān)閉比較緩慢的元音檢測(cè)精度將會(huì)受到很大 的影響。(二)共振峰提取與基音檢測(cè)類似,共振峰提取表面上看起來(lái)很容易,而實(shí)際上又為許多問(wèn)題所困擾,這些問(wèn)題27是:虛假峰值,共振峰合并,高音調(diào)語(yǔ)音。傳統(tǒng)的 共振峰提取方法主要有倒譜法和線性預(yù)測(cè)法,這些方法是建立在語(yǔ)音信號(hào)是線性 和短時(shí)平穩(wěn)的假設(shè)上。隨著對(duì)語(yǔ)音發(fā)生機(jī)理研究的深入,在理論分析與實(shí)驗(yàn)分析 中都證實(shí)了在語(yǔ)音產(chǎn)生過(guò)程中存在

14、非線性,語(yǔ)音信號(hào)的這種非線性特性是傳統(tǒng)的線性共振峰參數(shù)估計(jì)方法的準(zhǔn)確性受到影響的主要原因。另一方面,隨著對(duì)語(yǔ)音信號(hào)處理要求的不斷提高,共振峰參數(shù)隨時(shí)間快速變化的動(dòng)態(tài)信息也越來(lái)越受到 語(yǔ)音研究者們的重視,但由于傳統(tǒng)分析方法的局限性,對(duì)快速變化的共振峰的提 取無(wú)能為力。近年來(lái),盡管也提出了一些新的共振峰提取算法,如文獻(xiàn)28 采用了基于逆濾波器的共振峰提取方法,文獻(xiàn)29將語(yǔ)音信號(hào)分解為調(diào)制成分并采用 頻域線性預(yù)測(cè)算法的共振峰估計(jì)方法,但這些方法只是在處理方法和算法上作了 一些改進(jìn),本質(zhì)上還是屬于線性分析方法的范疇,而且分析過(guò)程復(fù)雜,許多參數(shù)需要根據(jù)人的主觀經(jīng)驗(yàn)確定,會(huì)造成人為的不確定誤差和數(shù)據(jù)的不穩(wěn)

15、定性。隨著語(yǔ)音信號(hào)非線性模型的發(fā)展,近年來(lái)也提出了許多采用非線性處理方法提取共振 峰的算法,其中最具有代表性的算法是文獻(xiàn)30-32中的基于多頻帶能量分離的共振 峰提取算法,它以語(yǔ)音信號(hào)的調(diào)頻-調(diào)幅非線性產(chǎn)生模型為基礎(chǔ),用一組帶通濾 波器把各個(gè)共振峰分量分離開來(lái),再用能量分離算法求取各共振峰的瞬時(shí)頻率和 瞬時(shí)幅度,但在濾波前,仍須用短時(shí)傅里葉變換粗略估計(jì)各個(gè)共振峰頻率和帶寬, 依然存在受虛假峰值、共振峰合并和高音調(diào)語(yǔ)音的影響。3.2 Hilbert-Hua ng變換研究現(xiàn)狀概述由于HHT具有自適應(yīng)性而且是分析非線性、非平穩(wěn)數(shù)據(jù)的有效工具,從1998 年公開發(fā)表到現(xiàn)在九年多時(shí)間里一直受到國(guó)內(nèi)外學(xué)者

16、的廣泛關(guān)注。到目前為止 HHT已被應(yīng)用于很多數(shù)據(jù)的分析,向世人展現(xiàn)了其強(qiáng)大的分析能力:黃本人將 其應(yīng)用于13,14非線性系統(tǒng)分析、水波分析風(fēng)速分析、潮汐和海嘯分析、海洋環(huán)流 分析和地震信號(hào)分析中,別人將其應(yīng)用到了醫(yī)藥學(xué)33,34、結(jié)構(gòu)土木工程35及機(jī)械 故障診斷36等領(lǐng)域。國(guó)內(nèi)等高校均有學(xué)者著手對(duì)該算法進(jìn)行研究:大連理工大 學(xué)的張海勇37將HHT與WVD結(jié)合起來(lái),提出了一種交叉信號(hào)分析方法;重慶 大學(xué)的譚善文38提出了多分辨希爾伯特-黃變換;鐘佑明39強(qiáng)調(diào)了局瞬量的意義, 提出了希爾伯特-黃變換局瞬信號(hào)分析方法;青島海洋大學(xué)的蔣濟(jì)同40將HHT應(yīng) 用于海洋平臺(tái)損傷診斷;浙江大學(xué)的胡勁松41等人

17、將HHT應(yīng)用于旋轉(zhuǎn)機(jī)械振動(dòng)信號(hào)。另外國(guó)內(nèi)的許多研究所及其下屬科室例如國(guó)家海洋局的第一及第三海洋研 究室、中科院遙感應(yīng)用研究所等也對(duì)該算法進(jìn)行了研究和初步的應(yīng)用,并且得到了較好的應(yīng)用效果。在語(yǔ)音分析處理方面,國(guó)內(nèi)學(xué)者也對(duì)其進(jìn)行了大量的研究: 湘潭大學(xué)的李凌42、浙江大學(xué)的許艷紅43把它應(yīng)用到說(shuō)話人識(shí)別,哈爾濱工業(yè) 大學(xué)的申麗然44等把它應(yīng)用到語(yǔ)音增強(qiáng),在語(yǔ)音特征提取方面,文獻(xiàn)45,46把它應(yīng) 用到基音檢測(cè),文獻(xiàn) 旳把它應(yīng)用到共振峰的提取。大量的事實(shí)表明,HHT以其獨(dú)特的優(yōu)點(diǎn)在各種領(lǐng)域得到了廣泛成功的應(yīng)用,證明了其優(yōu)越性。事實(shí)也證明 HHT在語(yǔ)音分析處理領(lǐng)域,特別是在語(yǔ)音特征提取中,有很多不同于傳

18、統(tǒng)方法 的優(yōu)點(diǎn):(1)不需要對(duì)語(yǔ)音信號(hào)作短時(shí)平穩(wěn)性假設(shè),可以一次性地分析和處理任 意長(zhǎng)度的語(yǔ)音數(shù)據(jù),因此,用于分幀和拼合的開銷減少,幀間拼合痕跡也減??;(2) 檢測(cè)精度高,適應(yīng)范圍廣。這種高的檢測(cè)精度和強(qiáng)的適應(yīng)能力在理論上可以 解釋為由于HHT的高時(shí)頻分辨能力和對(duì)信號(hào)的自適應(yīng)能力所致。在實(shí)際中也被 來(lái)自于不同性別、年齡、語(yǔ)音采集環(huán)境等的實(shí)際語(yǔ)音信號(hào)的檢測(cè)結(jié)果所證實(shí);(3) 具有跟蹤語(yǔ)音信號(hào)變化的能力。傳統(tǒng)方法大都是建立在語(yǔ)音信號(hào)短時(shí)平穩(wěn)性假設(shè) 的基礎(chǔ)上,因而提取出來(lái)的語(yǔ)音特征是一個(gè)語(yǔ)音幀內(nèi)的平均值。HHT方法打破了這一基本假設(shè),從本質(zhì)上就是把語(yǔ)音數(shù)據(jù)看成是非線性、非平穩(wěn)的數(shù)據(jù),因而,提取結(jié)果更

19、加符合客觀實(shí)際。因此,語(yǔ)音信號(hào)作為一種典型的非平穩(wěn)信號(hào),研究應(yīng)用HHT處理語(yǔ)音信號(hào),無(wú)疑是一項(xiàng)很有意義的工作。4結(jié)論本文主要介紹了語(yǔ)音信號(hào)處理中的特征提取的方法, 總結(jié)和展望了特征提取 的各個(gè)常規(guī)方法以及一些研究成果。最后介紹了 HHT在特征提取中的優(yōu)點(diǎn)及應(yīng) 用,并指出這個(gè)新興理論的研究前景。參考文獻(xiàn)1湯子瀛.計(jì)算機(jī)操作系統(tǒng)M.西安西安電子科技大學(xué)出版社,1996.2郭皞巖.Windows程序設(shè)計(jì)教程M.北京人民郵電出版社,2009.3石海燕.語(yǔ)音信號(hào)特征參數(shù)研究J.電腦知識(shí)與技術(shù),2008,4.4陳亮,張雄偉.語(yǔ)音信號(hào)非線性特征的研究J.解放軍理工大學(xué)學(xué)報(bào),2000,1(2):11-17.張

20、賢達(dá).現(xiàn)代信號(hào)處理M.北京:清華大學(xué)出版社,2002.349-492.科恩L著.時(shí)頻分析:理論與應(yīng)用M.白居憲譯.西安:西安交通大學(xué)出版社,1998.121-159.7韓紀(jì)慶,張磊,鄭鐵然.語(yǔ)音信號(hào)處理M.北京:清華大學(xué)出版社,2004.11-94 ,160-189.8 Patrick J Loughli n, Leon Cohe n. The un certa inty prin ciple: Global, Local, or Both? J.IEEE Tran sactio ns Sig nal Processi ng. 2004, 52(5) ,1218-1227.9 梁學(xué)章何甲興,王

21、新民等.小波分析M.北京:國(guó)防工業(yè)出版社,2004.1-162.10 Masoud Karimi-Ghartemani, Alirera K Ziarani. A nonlinear time-frequency an alysis methodJ. IEEE Tran sactio ns on Sig nal Process ing, 2004, 52(6) :1585-1595. 11 閻福智.語(yǔ)音信號(hào)處理中特征提取方法研究J.中國(guó)新通信,2013,21:127-128.12 王彪.一種改進(jìn)的語(yǔ)音信號(hào)特征參數(shù)提取算法研究J.電子設(shè)計(jì)工 程,2011,21:59-61.13 Hua ng N

22、 E, Zheng She n. The Empirical Mode Decompositi on and the Hilbert Spectrum for Non li near and Non-Stati onary Time Series An alysisJ. Proceed ings of the Royal Society of Lon don Series, 1998, 454:903-995.14 Huang N E, Shen Zheng, Long S R. A new view of nonlinear water waves:the Hilbert spectrumJ

23、. Annu Rev Fluid Mech, 1999,31(1):417-457.15 Mess ina A R, Vittal V. Non li near, non-stati onary an alysis of in terarea oscillati ons via Hilbert spectral analysisJ. IEEE Transactions on Power Systems, 2006,21(3):1234-1241.17 Resch B, Nilss on M, Ekman A, Kleij n W B. Estimation of the In sta ntan

24、 eous Pitch of SpeechJ. IEEE Transactions on Audio, Speech and Language Processing, 2007,15(3):813-822.18 La neau J, Wouters J. Pitch percepti on in cochlear impla nts with differe nt filter bank designsC. the 25th Annual International Conference of the IEEE on Engin eeri ng in Medici ne and Biology

25、 Society, 2003,3:1995-1998.19 Salor O, Demirekler M, Orguner U. An Efficient Algorithm for Pitch Determ in ati on of Speech Sig nals-Kalma n Filter ApproachC. Signal Process ing and Commu ni catio ns Applicatio ns, 2006.1-4.20 Bo Li, Ying-Ying Li, Cheng-You Wang, etc. A new efficient pitch-tracking

26、algorithmC. IEEE International Conference on Robotics, Intelligent Systems and Sig nal Processi ng, 2003, 2:1102-1107.21 Yo ng Duk Cho, Hong Kook Kim, Moo You ng Kim, Sa ng Ryo ng Kim. Pitch estimation using spectral covarianee method for low-delay MBE vocoderC. IEEE Workshop on Speech Coding For Te

27、lecom muni cati ons Proceed ing, 1997.21-22.22 Ananthapadmanabha T V, Yegnanarayana B. Epoch prediction residual for identification of closed glottis intervalJ. IEEE Transactions on Signal Processi ng,1979, 27:309-319.23 Cheng Y M, ShaughnessyD O. Automatic and reliable estimation of glottal closure

28、 instant and periodJ. IEEE Transactions on Signal Processing, 1989,37(12):1805-1814.24 Deshmukh O, Singh J, Espy-Wilson C. A novel method for computation of periodicity,aperiodicity and pitch of speech sig nalsC. IEEE Intern ati onal Conference on Acoustics, Speech, and Sig nal Process ing, 2004,1:1

29、17-120.25 Kadambe S, Boudreaux-Bartels G Faye. Applicati on of the wavelets tran sform for pitch detect ion of speech sig nalsJ. IEEE Tran sacti ons on In formatio n Theory,1992,38(2):917-924.26 LI Jing, BAO Chan gch un.A pitch detector based on the dyadic wavelet tran sform and the autocorrelation

30、functionC. International Conference on Signal Processing, 2002,1:414-417.27 Ya n Q, Vaseghi S, Ren tzos D, etc. An alysis and Syn thesis of Forma nt Spaces of British,Australian, and American AccentsJ. IEEE Transactions on Audio, Speech and Lan guage Processi ng, 2007,15(2):676-689.28 WATANABE A. Fo

31、rma nt estimation method using in verse filter con trolJ. IEEE Tran sactio ns on Speech and Audio Process ing, 2001,9 :317-326.29 RAO P, BARMAN A D. Speech forma nt freque ncy estimatio n: evaluat ing a non statio nary an alysis methodJ. Sig nal Processi ng , 2000, 80(8):1655-1667.30 Maragos P, Jame

32、s F Kaiser, Thomas F Quatieri. On Amplitude and Frequency Demodulation Using Energy OperatorsJ. IEEE Transactions on Signal Processi ng,1993, 41:1532-1550.31 Potamia nos A, Maragos P. Speech forma nt freque ncy and ban dwidth track ing using multiband energy demodulationC.International Conference on

33、 Acoustics, Speech, and Sig nal Processi ng, 1995.784-787.32 Maragos P, Kaiser J F, Quatieri T F. En ergy Separatio n in Sig nal Modulati ons with Application to Speech AnalysisJ. IEEE Transactions on Signal Processing, 1993,41 (2):3024-3051.33 Hui Fang Che n. Heart Rate Variability An alysis of Orthostatic Fai nting in Spi nal Cord Injury Treatme nt by Hilbert Huang Tran sformD.Master Degree Thesis.S in gapore:Natio nal Un iversity of Sin gapore, 2004.34 We ng Bin wei, Bla nco-Velasco Manu el, Barn

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論