語音識別文獻綜述_第1頁
語音識別文獻綜述_第2頁
語音識別文獻綜述_第3頁
語音識別文獻綜述_第4頁
語音識別文獻綜述_第5頁
已閱讀5頁,還剩4頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、噪音環(huán)境下的語音識別1.引言隨著社會的不斷進步和科技的飛速發(fā)展,計算機對人們的幫助越來越大,成為了人們不可缺少的好助手,但是一直以來人們都是通過鍵盤、鼠標等和它進行通信,這限制了人與計算機之間的交流,更限制了消費人群。為了能讓多數(shù)人甚至是殘疾人都能使用計算機,讓計算機能聽懂人的語言,理解人們的意圖,人們開始了對語音識別的研究語音識別是語音學與數(shù)字信號處理技術相結合的一門交叉學科,它和認知學、心理學、語言學、計算機科學、模式識別和人工智能等學科都有密切關系。2.語音識別的發(fā)展歷史和研究現(xiàn)狀2.1國外語音識別的發(fā)展狀況國外的語音識別是從1952年貝爾實驗室的Davis等人研制的特定說話人孤立數(shù)字識

2、別系統(tǒng)開始的。20世紀60年代,日本的很多研究者開發(fā)了相關的特殊硬件來進行語音識別RCA實驗室的Martin等人為解決語音信號時間尺度不統(tǒng)一的問題,開發(fā)了一系列的時問歸正方法,明顯地改善了識別性能。與此同時,蘇聯(lián)的Vmtsyuk提出了采用動態(tài)規(guī)劃方法解決兩個語音的時聞對準問題,這是動態(tài)時間彎折算法DTW(dymmic time warping)的基礎,也是其連續(xù)詞識別算法的初級版20世紀70年代,人工智能技術走入語音識別的研究中來人們對語音識別的研究也取得了突破性進展線性預測編碼技術也被擴展應用到語音識別中,DTw也基本成熟。20世紀80年代,語音識別研究的一個重要進展,就是識別算法從模式匹配

3、技術轉向基于統(tǒng)計模型的技術,更多地追求從整體統(tǒng)計的角度來建立最佳的語音識別系統(tǒng)。隱馬爾可夫模型(hidden Markov model,刪)技術就是其中一個典型技術。刪的研究使大詞匯量連續(xù)語音識別系統(tǒng)的開發(fā)成為可能。20世紀90年代,人工神經(jīng)網(wǎng)絡(artificial neural network,ANN)也被應用到語音識別的研究中,并使相應的研究工作在模型的細化、參數(shù)的提取和優(yōu)化以及系統(tǒng)的自適應技術等方面取得了一些關鍵性的進展,此時,語音識別技術進一步成熟,并走向實用。許多發(fā)達國家,如美國、日本、韓國,已經(jīng)IBM、Microsoft、Apple、AT&T、Nrr等著名公司都為語音識別

4、系統(tǒng)的實用化開發(fā)研究投以巨資。當今,基于HMM和ANN相結合的方法得到了廣泛的重視。而一些模式識別、機器學習方面的新技術也被應用到語音識別過程中,如支持向量機(supportvector machine,SVM)技術、進化算法(evolutionary computation)技術等。2.2國內(nèi)語音識別的發(fā)展狀況20世紀50年代我國就有人嘗試用電子管電路進行元音識別,到70年代才由中科院聲學所開始進行計算機語音識別的研究80年代開始,很多學者和單位參與到語音識別的研究中來,也開展了從最初的特定人、小詞匯量孤立詞識別,到非特定人、大詞匯量連續(xù)語音識別的研究工作80年代末,以漢語全音節(jié)識別作為主攻

5、方向的研究已經(jīng)取得了相當大的進展,一些漢語語音輸入系統(tǒng)已經(jīng)向實用化邁進。90年代j四達技術開發(fā)中心和哈爾濱工業(yè)大學合作推出了具有自然語言理解能力的新產(chǎn)品在國家“863”計劃的支持下,清華大學和中科院自動化所等單位在漢語聽寫機原理樣機的研制方面開展了卓有成效的研究經(jīng)過60多年的發(fā)展,語音識別技術已經(jīng)得到了很大發(fā)展,對于語音識別的研究也達到了相當高的水平,并在實驗室環(huán)境下能達到很好的識別效果。但是,在實際應用中,噪聲以及各種因素的影響,使語音識別系統(tǒng)的性能大幅度下降,很難達到讓人滿意的效果。因此,對噪聲環(huán)境下的語音識別的研究有著異常重要的理論價值和現(xiàn)實意義2.3語音識別的分類語音識別存在不同的分類

6、方法:(1)按詞匯量大小分。每個語音識別系統(tǒng)都有一個詞匯表,系統(tǒng)能識別詞匯表中所包含的詞條。通常按詞匯量可分為小詞匯量、中詞匯量和大詞匯量,一般小詞匯量包括10100個詞;中詞匯量大約包括100500個詞條;大詞匯量則至少包含500個以上的詞條。(2)按發(fā)音方式分。語音識別可以分為孤立詞識別、連續(xù)詞識別、連續(xù)語音識別以及關鍵詞檢出等。孤立詞識別,是機器只識別一個個孤立的音節(jié)、詞或者短語等;連續(xù)語音識別,是機器識別連續(xù)自然的書面朗讀形式的語音;在連續(xù)詞識別中,發(fā)音方式介于孤立詞和連續(xù)語音之間,它表面上看起來象連續(xù)語音發(fā)音,但能明顯感受到音與音之間的停頓;關鍵詞檢出,通常用于說話人以類似自由交談方

7、式的發(fā)音,在這種發(fā)音方式下,只需要進行其中的關鍵詞識別(3)按說話人分可分為特定說話人和非特定說話人兩種。前者只能識別固定某個人的聲音,而后者是機器能識別出任意人的發(fā)音。(4)從語音識別的方法分 有模式匹配法、隨機模型法和概率語法分析法。模式匹配法是將測試語音與參考模板的參數(shù)一一進行比較和匹配,判決的依據(jù)是失真測度最小準則;隨機模型法是一種使用隱馬爾可夫模型來對似然函數(shù)進行估計和判決,從而得到相應的識別結果的方法;概率語法分析法適用于大范圍的連續(xù)語音識別,它可以利用連續(xù)語音中的語法約束知識來對似然函數(shù)進行估計和判決 2.4噪聲對語音識別的影響隨著科技的發(fā)展,人們對語音識別的研究越來越深入,在理

8、論上達到了很成熟的階段,也開始步入實用化階段。以mM的ViaVoice為代表,其對連續(xù)語的識別率可以達到95以上但是所有識別系統(tǒng)對噪聲都是極為敏感的,在噪聲環(huán)境下,識別性能會大幅度下降州例如,在一個典型的孤立詞識別系統(tǒng)中,用純凈語音訓練,識別效果會達到100,但在以100公里每小時的速度行駛的小車上,其識別率將下降70左右;一個用純凈語音訓練的識別系統(tǒng),誤識率不到l,但是在自助餐廳里,其誤識率竟然上升近50:一個與說話者無關的語音識別系統(tǒng),在實驗室環(huán)境下其誤識率不到l,但是如果用來識別一個通過長距離電話線并且信噪比為15dB的語音,其錯誤率將高達44。在噪聲環(huán)境下,識別系統(tǒng)的識別率大幅度下降,

9、是現(xiàn)在語音識別產(chǎn)品無法廣泛走入實用的主要障礙。在噪聲環(huán)境下語音識別系統(tǒng)的識別率大幅度下降的根本原因就是錄入環(huán)境和識別環(huán)境的不匹配。在實驗室環(huán)境下,訓練環(huán)境相對安靜,基本上是對純凈語音迸行訓練,模板庫的特征矢量。是通過提取純凈語音的特征參數(shù)得到的。但是在實際應用中,噪聲是不可避免的,同一語音在噪聲的影響下特征參數(shù)發(fā)生了變化,從而影響了識別語音和模板庫中的語音的相似度,導致識別系統(tǒng)的識別率大幅度下降。為解決噪聲環(huán)境下,識別語音的特征參數(shù)和模叛庫中的特征不匹配的問題我們必須想辦法消除噪聲對語音特征參數(shù)的影響,根據(jù)語音識別過程可知,有以下三種方法:(1)假定語音模板和背景噪聲無關,即無論是清晰語音還是

10、帶噪語音,都用同一套模板來識別在這種情況下,重點在識別階段,從帶噪語音中提取出抗噪的特征參數(shù)或者采取抗噪聲的失真測度(2)在語音的識別階段,語音識別系統(tǒng)加一個前端處理,從帶噪語音中提取出純凈語音,然后再提取語音的特征參數(shù)這種方法被稱為語音增強。(3)在語音識別階段,根據(jù)識別現(xiàn)場的環(huán)境噪聲對語音模板進行變換,使之接近根據(jù)現(xiàn)場帶噪語音訓練而成的語音模板這種方法稱為語音模板的噪聲補償無論使用哪種方法消除噪聲,我們首先要了解噪聲。根據(jù)噪聲對語音頻譜的干擾方式不同可以把噪聲分為加性噪聲和乘性噪聲兩類(1)如性噪聲噪聲和語音信號是相互獨立的,而所采集到的信號是真實的語音信號和噪聲的和,這種噪聲就是所謂的加

11、性噪聲。語音信號在實際環(huán)境中受到的背景噪聲、辦公室里的打印機的工作聲、計算機中的磁盤驅動器和風扇等設備的聲音以及周圍說話人的聲音等都是加性噪聲(2)乘性噪聲乘性噪聲也叫卷積噪聲,是指噪聲和語音在頻譜是相乘的關系,在時域上則是卷積關系的噪聲。乘性噪聲可以轉換為加性噪聲由于實際環(huán)境中的背景噪聲多數(shù)是加性噪聲,因此致使系統(tǒng)識別率的大幅度下降的“元兇”就是加性噪音。我們在后面講到的去噪,也是指去除加性噪聲。2.5語音增強方法由于噪聲的種類很多,特性并不完全相同,因此針對各類噪聲必須采取不同的語音增強方法。一直以來,人們都在加性噪聲的模型上進行研究,提出了各種語音增強算法,總的來說可分為三類:第一類是時

12、域方法,例如基于參數(shù)和模型的方法 34 、子空間的方法 56 等;第二類是頻域方法,例如減譜法 79 、自適應濾波法 11 ,以及基于馬爾可夫模型濾波方法 12 等;第三類是其它方法,例如小波變換法、聽覺掩蔽法等。2.6時域方法1. 基于參數(shù)和模型的方法?;趨?shù)和模型的方法通常有兩大類 10 :分析合成法和利用濾波器進行濾波處理的方法。前者是把聲道模型看作一個全極點濾波器,采用線性預測分析得到濾波器的參數(shù)。通過從帶噪語音中準確估計模型的參數(shù)來合成干凈的語音,這種方法關鍵在于如何從帶噪語音中準確地估計語音模型的參數(shù)(包括激勵參數(shù)和聲道參數(shù)) 。后者則是考慮到激勵參數(shù)難以準確估計,采用只利用聲道

13、參數(shù)構造濾波器進行濾波處理。而在低信噪比下,很難對模型參數(shù)進行準確估計,并且此類方法往往因需要迭代而增加算法的復雜度。在實際應用中有時也會把兩者合并在一起相互補充。具體來說主要有以下幾種方法。(1)最大后驗概率估計法最大后驗概率估計法是把語音看作一個全極點的模型,首先依據(jù)最大后驗概率準則估計LPC線性預測參數(shù),然后根據(jù)LPC參數(shù)的功率譜來構造一個非因果的維納濾波器對帶噪語音信號進行濾波,通過多次迭代直到滿足預先設定的閾值為止。此種算法適用于高斯白噪聲。它在一定程度上能消除噪聲,提高信噪比。但是由于維納濾波器只能在平穩(wěn)條件下才能保證最小均方誤差意義下的最優(yōu)估計,而語音和背景噪音的非平穩(wěn)性,會導致

14、最優(yōu)估計的誤差。而且采用維納濾波也沒有完全利用語音的生成模型,增強后的語音帶有不悅耳的聲音。(2)卡爾曼濾波法 1, 3 卡爾曼濾波在一定程度上可以彌補維納濾波引起的誤差。因為它是基于語音生成模型的,且在非平穩(wěn)條件下也可以保證最小均方誤差意義下的最優(yōu),適用于非平穩(wěn)噪聲干擾下的語音增強。卡爾曼濾波通過引入卡爾曼信息,將要解決的濾波與預測的混合問題轉化為純?yōu)V波和純預測兩個獨立的問題來考慮進行語音增強??柭鼮V波的優(yōu)點是噪聲在平穩(wěn)和非平穩(wěn)情況下都能使用,能在不同程度上消除噪聲,提高信噪比,其缺點是計算量大,需要假設LPC生成模型的激勵源為白噪聲源并且只在清音段才成立,主觀試聽發(fā)現(xiàn)該方法對語音造成了一

15、定的損傷。(3)梳狀濾波器法 1 語音信號濁音段有明顯周期性的特點,可采用梳狀濾波器來提取語音分量,抑制噪聲。梳狀濾波器的輸出信號是輸入信號的延時加權和的平均值,當延時與信號的基音周期一致時,這個平均過程使周期性分量加強,而非周期分量或周期不同于信號的其他周期分量被抑制或消除。這種方法的關鍵是要準確估計出語音信號的基音周期。在基音變化的過渡段和強噪聲背景干擾下無法精確估計時,方法的應用受到限制。這種方法一般也只適用于平穩(wěn)的非白噪聲。2.7子空間的方法在子空間法中,大量實驗表明,語音矢量的協(xié)方差陣有很多零特征值,這說明干凈語音信號矢量的能量只分布在它對應空間的某個子集中。而噪聲的方差通常都假設已

16、知且嚴格正定,這說明噪聲矢量存在于整個帶噪語音信號張成的空間中。因此,帶噪語音信號的矢量空間可以認為由一個信號與加噪聲的子空間和一個純噪聲子空間構成。子空間法就是將帶噪聲語音信號分解為正交的信號加噪聲子空間和噪聲子空間,對純凈語音信號的估計可以將噪聲子空間中的信號舍棄,只保留信號子空間中的信號,來預測干凈的語音以達到降噪的目的。子空間法的優(yōu)點是有效地去除帶噪語音中的背景噪聲,使語音的質量和可懂度都有較大的提高,但是計算量較大,因此在快速計算中該方法需要進一步研究。2.8頻域方法語音信號的短時譜具有較強的相關性,而噪聲的前后相關性很弱,因此可以利用短時譜估計的方法從帶噪語音中估計原始語音。同時人

17、耳對語音相位感受不敏感,可將估計的對象放在短時譜的幅度上。典型的方法有譜減法 7 、維納濾波法 8 、短時譜幅度的MMSE估計 9 、自適應濾波法等。1. 譜減法譜減法是在假定加性噪聲與短時平穩(wěn)的語音信號相互獨立的條件下,從帶噪語音的功率譜中減去噪聲功率譜,從而得到較為“純凈”的語音頻譜。它的優(yōu)點是運算量小,容易實時實現(xiàn),增強效果也較好。但是也存在一定的缺陷,譜減法是一種最大似然估計,沒有對語音頻譜的分布進行假設,而語音頻譜分量的幅度對人耳的聽覺是最重要的。因此譜減法進行增強處理后,會帶來音樂噪聲,不僅使聽者在聽覺效果上產(chǎn)生一定的干擾影響,還影響后續(xù)處理,如語音編碼等。譜減法通常包括有線性譜減

18、法、非線性譜減法和概率譜減法。2.維納濾波法維納濾波法是在最小均方準則下實現(xiàn)對語音信號估計的一種濾波器。對于帶噪語音信號,確定濾波器的沖擊響應,使得帶噪語音信號經(jīng)過該濾波器后得到最接近于“純凈”的語音信號。采用維納濾波的好處是增強后的殘留噪聲類似于白噪聲,而不是有節(jié)奏起伏的音樂噪聲。維納濾波是平穩(wěn)條件下時域波形的最小均方誤差準則估計。由于沒有考慮到語音頻譜分量的幅度對人的聽覺最重要,因此采用維納濾波來增強語音存在一定的缺陷。3.短時譜幅度的最小均方誤差(MMSE)估計法針對特定的失真準則和后驗概率不敏感的特性,利用已知的噪聲功率譜信息,從帶噪語音短時譜中估計出“純凈”語音短時譜,達到語音增強的

19、目的。對于語音短時譜幅度的分布,通常通過兩種途徑解決:一是假設一個合理的概率分布模型;另一個則是通過實際統(tǒng)計的方法去獲得。為此,假設語音頻譜分布為高斯分布,并在此假設下推導MMSE估計公式,然后討論實際分布情況。另外,可以利用相鄰幀間頻率點信息的相關性,對當前幀頻率點的頻譜幅度值進行估計,這就是基于幀間頻譜分布約束的MMSE估計方法。又因為人耳對聲音強度的感受是與譜幅度的對數(shù)成正比的,因此在處理語音譜幅度時,采用對數(shù)失真準則更為適合一些,將上述MMSE估計式進行推廣,得到頻域分布約束下的短時對數(shù)譜的MMSE估計。短時譜幅度的MMSE估計在降噪和提高語音可懂度方面進行了折衷,適用信噪比的范圍較廣

20、,但是計算量較大,而且語音頻譜的先驗分布獲得在很大程度上要取決于統(tǒng)計結果的代表性、重現(xiàn)性等。4. 自適應濾波法以均方誤差或方差最小為準則,對噪聲信號進行最優(yōu)估計,然后從帶噪語音中減去噪聲達到降噪,提高信噪比,增強語音的目的。當輸入信號的統(tǒng)計特性未知,或者輸入信號的統(tǒng)計特性變化時,自適應濾波器能夠自動地迭代調節(jié)自身的濾波器參數(shù),以滿足某種準則的要求,從而實現(xiàn)最優(yōu)濾波。因此,自適應濾波器具有“自我調節(jié)”和“跟蹤”能力。此方法的關鍵是如何得到帶噪語音中的噪聲。在多聲道采集系統(tǒng)中,兩個話筒間要有一定的距離,因而實時采集的兩路信號的噪聲不同,而且還受到回聲及其他可變衰減特性的影響。在用單聲道系統(tǒng)來采集帶

21、噪語音時,必須在語音間歇期間利用采集到的噪聲進行估值,如果噪聲是非平穩(wěn)的,會嚴重影響語音的增強效果,另一個缺點是增強后的語音中含有明顯的“音樂噪聲”。5.隱馬爾可夫模型法可以采用基于狀態(tài)空間的變換方法,對不同類別的語音和噪聲信號建立不同的模型。HMM的各個狀態(tài)可以對帶噪信號、噪聲信號所有不同的區(qū)域進行充分的建模,將帶噪信號中的噪聲信號部分去除就可得到語音的增強,甚至于在只有帶噪信號的情況下,利用HMM對狀態(tài)轉移概率進行建模,將可能為噪聲的信號部分濾除就可以做到語音增強。但是這種方法,在只有帶噪信號的情況下要正確分類,準確估計噪聲會有一定的誤差。2.9其它方法隨著信號處理的理論和技術不斷發(fā)展完善

22、,涌現(xiàn)出許多的新方法,如小波變換 1314 、神經(jīng)網(wǎng)絡 15 、聽覺掩蔽 16 、分形理論 17 等。1.小波變換利用具體問題的先驗知識,根據(jù)信號和噪聲的小波系數(shù)在不同尺度上具有不同性質的機理,構造相應規(guī)則,在小波域采用其他數(shù)學方法對帶噪信號的小波系數(shù)進行處理。處理的實質在于減小甚至完全剔除由噪聲產(chǎn)生的系數(shù),同時最大限度地保留真實信號的系數(shù),最后由經(jīng)過處理的小波系數(shù)重構原信號,得到真實信號的最優(yōu)估計?!白顑?yōu)”的精確定義依賴于應用要求。小波變換進行信號去噪時,能夠在去除噪聲的同時,很好地保留信號的突變部分。但是在使用這種方法時,還應考慮抑制噪聲與保留信號細節(jié)之間的折衷問題,以及分解尺度的選取、閾

23、值的選取。2. 神經(jīng)網(wǎng)絡語音增強在一定意義上也是一種說話人區(qū)分問題,只不過所區(qū)分的是在背景中的噪聲,因此可以利用人工神經(jīng)網(wǎng)絡來實現(xiàn)語音的增強。假設測試語音和噪聲環(huán)境的分布保持不變且與訓練時相同,利用帶噪語音和干凈的目標語音分別進行訓練,得到合適的預測神經(jīng)元模型,構造可以對語音和噪聲進行分類的分類器,對當前語音信號進行最佳匹配,來實現(xiàn)語音增強。3.聽覺掩蔽聽覺掩蔽法是利用人耳聽覺特性的一種增強算法。人耳能夠掩蔽語音信號中能量較小的噪聲信號,使得這部分噪聲不為人所感知。聽覺掩蔽模型常與語音增強算法結合實現(xiàn)去噪,其實現(xiàn)過程為:首先基于一種語音增強方法對語音信號進行粗估計,再由語音信號粗估計計算出聽覺

24、的掩蔽閾值,根據(jù)聽覺掩蔽閾值和噪聲參數(shù)的估值,結合相應的增強算法計算出增益,并依此估計出純凈語音。這種方法在消噪的同時可以減少不必要的語音失真。但由于噪聲掩蔽閾值是在純凈語音基礎上得到的,在實際應用中常只能用帶噪語音來估計掩蔽閾值,這樣估計的結果誤差較大。4.分形理論語音與噪聲具有不同的混沌和分形特性,因此可將分形維數(shù)用于語音增強。根據(jù)分形結構的語音信號在一定的尺度范圍內(nèi)具有等價標度不變性,導出帶噪語音信號的真實分形維數(shù)的計算方法,利用分形維數(shù)內(nèi)插方法計算出信號的維數(shù)。根據(jù)它們之間的差值進行對重構的閾值和位置自適應控制,實現(xiàn)語音信號與噪聲的分離。既抑制了噪聲,又減少了語音段的信息的損失,提高了

25、信噪比。3. 結束語以上討論了一些語音增強算法,它們各有優(yōu)缺點,分別適用于不同的場合。在實際應用時,要根據(jù)具體的噪聲情況和特定環(huán)境,選用不同的語音增強方法或語音增強方法的組合,來達到消除噪聲或提高語音清晰度的目的。如有的情況下,只要求消除帶噪語音中的噪聲,可以采用一些傳統(tǒng)的語音增強方法:如譜減法、自適應濾波法等,達到提高信噪比,增強語音的效果;如有時為了減小對語音的聽覺失真,提高語音的清晰度,權衡考慮增強后的語音失真和去噪效果,可以采用聽覺掩蔽效應和其它方法相結合,如基于聽覺掩蔽效應的改進譜減算法 18 或基于AR -HMM模型的譜減算法 19 等方法,更多的時候,不同的語音增強方法之間進行互

26、補,達到更高的增強效果,如基于HMM模型的方法也可以和擴展的卡爾曼濾波器聯(lián)合使用,小波閾值算法中關鍵是閾值的選取可采用MMSE準則來自適應尋找等等。隨著信號處理技術不斷完善和發(fā)展,語音增強算法的新方法必將層出不窮,有待于進一步的研究。參考文獻: 1 楊行峻,遲惠生,等. 語音信號數(shù)字處理M . 北京:電子工業(yè)出版社, 1995. 2 趙力. 語音信號處理M . 北京: 機械工業(yè)出版社,2003. 3 Gannot S, Burshtein D, Weinstein E. Iterative and se2quential Kalman filter2based speech enhanceme

27、nt algo2rithms J . IEEE Trans Speech and Audio Process, 1998, 6(4) : 3732385. 4 Kin J B, Lee K Y , Lee CW. On the app lications of theinteracting multip le model algorithm for enhancing noisyspeech J . IEEE Trans Speech and Audio Process, 2000,8 (3) : 3492352. 5 Y Ephraim, H L V Trees. A signal subs

28、pace app roach forspeech enhancement J . IEEE Trans. Speech and AudioProcessing, 1995, 3 (7) : 2512266. 6 F Jabloun, B Champagne. A multi - microphone signalsubspace app roach for speech enhancementA . In Proc.IEEE ICASSP01 C . 2001. 2052208 . 7 Boll S. Supp ression of acoustic noise in speech using

29、 spec2tral subtraction J . IEEE Trans on Acoustic Speech andSignal Processing, 1979, 27 (2) : 1132120. 8 Ningp ing Fan. Low distortion speech denoising using an a2dap tive parametric Wiener filter A . IEEE InternationalConference on Acoustics, Speech and Signal Processing( ICASSP) C . 2004, 1: 12230

30、9. 9 Ephraim Y, Malah D. Speech enhancement using a mini2mum2mean square error short2time spectral amp litude esti2mator J . IEEE Transactions on Acoustics, Speech andSignal Processing, 1984, 32 (60) : 110921121. 10 韓紀慶,張磊,鄭鐵然. 語音信號處理M . 北京:清華大學出版社, 2004年. 11 高鷹,謝勝利. 一種變步長LMS自適應濾波算法及分析 J . 電子學報, 200

31、1, 29 (8) : 109421097. 12 Jax P Vary P. Artificial bandwidth extension of speechsignals usingMMSE estimation based on a hidden Markovmodel A . IEEE International Conference on Acoustics,Speech, and Signal Processing ( ICASSP) C . 2003. 6802683 13 SMallat and W L Hwang. Singularity detection and p ro2cessing with

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論