![語音信號(hào)處理第6講_第1頁](http://file2.renrendoc.com/fileroot_temp3/2021-11/12/77c99454-4c3e-42ae-8a9a-bf9fef30a51f/77c99454-4c3e-42ae-8a9a-bf9fef30a51f1.gif)
![語音信號(hào)處理第6講_第2頁](http://file2.renrendoc.com/fileroot_temp3/2021-11/12/77c99454-4c3e-42ae-8a9a-bf9fef30a51f/77c99454-4c3e-42ae-8a9a-bf9fef30a51f2.gif)
![語音信號(hào)處理第6講_第3頁](http://file2.renrendoc.com/fileroot_temp3/2021-11/12/77c99454-4c3e-42ae-8a9a-bf9fef30a51f/77c99454-4c3e-42ae-8a9a-bf9fef30a51f3.gif)
![語音信號(hào)處理第6講_第4頁](http://file2.renrendoc.com/fileroot_temp3/2021-11/12/77c99454-4c3e-42ae-8a9a-bf9fef30a51f/77c99454-4c3e-42ae-8a9a-bf9fef30a51f4.gif)
![語音信號(hào)處理第6講_第5頁](http://file2.renrendoc.com/fileroot_temp3/2021-11/12/77c99454-4c3e-42ae-8a9a-bf9fef30a51f/77c99454-4c3e-42ae-8a9a-bf9fef30a51f5.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、5.1 概述5.2端點(diǎn)檢測5.3基音周期估計(jì)5.4共振峰估計(jì) 語音信號(hào)是一種短時(shí)平穩(wěn)信號(hào)時(shí)變,復(fù)雜且攜帶包含語義、個(gè)人特征等有用信息 特征參數(shù)應(yīng)該能夠比較準(zhǔn)確地表達(dá)語音信號(hào)的特征,具有準(zhǔn)確性和唯一性,是語音識(shí)別的基礎(chǔ) 20世紀(jì)40年代,提出的語譜圖,對(duì)語音信號(hào)有很強(qiáng)的描述能力,形成最早的語音特征 后來,人們發(fā)現(xiàn)利用語音信號(hào)的時(shí)域特征可以從語音波形中提取反映語音特性的參數(shù),如短時(shí)幅度,短時(shí)幀平均能量,短時(shí)幀過零率,短時(shí)自相關(guān)系數(shù)、平均幅度差函數(shù)等不僅能減小模板數(shù)目,運(yùn)算量和存儲(chǔ)量,還能消除冗余信息 語音信號(hào)分幀提取,每幀構(gòu)成一個(gè)矢量,即語音信號(hào)特征是一個(gè)矢量序列 端點(diǎn)檢測:一段語音信號(hào)中準(zhǔn)確地找
2、出語音信號(hào)的起始點(diǎn)和結(jié)束點(diǎn) 目的:把有效的語音信號(hào)好無用的噪聲信號(hào)分離 在語音識(shí)別,語音增強(qiáng),語音編碼,回聲抵消等系統(tǒng)中應(yīng)用廣泛 語音端點(diǎn)檢測方法分類(1)基于閾值的方法:根據(jù)語音信號(hào)和噪聲信號(hào)的不同特征,提取每一段語音信號(hào)的特征并與設(shè)定的閾值進(jìn)行比較(2)基于模式識(shí)別的方法,需要估計(jì)語音信號(hào)和噪聲信號(hào)的模型參數(shù)來進(jìn)行比較,鑒于模式識(shí)別方法自身復(fù)雜度高,運(yùn)算量大,很難應(yīng)用到實(shí)時(shí)語音信號(hào)中 端點(diǎn)檢測本質(zhì)上是根據(jù)語音和噪聲的相同參數(shù)所表現(xiàn)出的不同特征來進(jìn)行區(qū)分。 傳統(tǒng)的短時(shí)能量和過零率相結(jié)合的語音端點(diǎn)檢測算法,短時(shí)過零率來檢測清音,用短時(shí)能量來檢測濁音,兩者相配合實(shí)現(xiàn)了信號(hào)信噪比較大情況下的端點(diǎn)檢
3、測(以短時(shí)能量檢測為主,短時(shí)過零率檢測為輔) 短時(shí)能量法(已講)可以較好地區(qū)分出濁音和靜音 短時(shí)過零率(已講)對(duì)于清音,其能量較小,會(huì)因?yàn)榈陀谀芰块T限而被誤判為靜音,短時(shí)過零率可以區(qū)分靜音和清音 雙門限法:基于短時(shí)能量(高門限)和過零率(低門限)的雙門限端點(diǎn)檢測算法(當(dāng)?shù)烷T限被超過時(shí),有可能是噪聲引起的,未必是語音的開始,當(dāng)高門限被超過并在接下來的時(shí)間段內(nèi)一直超過低門限時(shí),意味著語音信號(hào)的開始) 雙門限法步驟:(1)計(jì)算短時(shí)能量(高門限) 和過零率(低門限)(2)選取一個(gè)較高的門限 ,語音信號(hào)的能量包絡(luò)大部分都在此門限之上,進(jìn)行一次初判,語音起止點(diǎn)位于該門限與短時(shí)能量包絡(luò)交點(diǎn)所對(duì)應(yīng)的時(shí)間間隔之
4、外(3)根據(jù)噪聲能量,確定一個(gè)較低的門限 并從初判起點(diǎn)往左,從初判終點(diǎn)往右搜索,分別找到能零比曲線 第一次與門限 ,相交的兩個(gè)點(diǎn),兩點(diǎn)之間段就是用雙門限方法所判定的語音段(4)以短時(shí)平均過零率為準(zhǔn),從低門限點(diǎn)往左右搜索,找到短時(shí)平均過零率低于某閾值的兩點(diǎn),為語音的起止點(diǎn)注:門限值要通過多次實(shí)驗(yàn)來確定2T1T1T 自相關(guān)法:(1)短時(shí)自相關(guān)(已講)(2)由于兩種信號(hào)的自相關(guān)函數(shù)存在極大的差異,可以利用這種差別來提取語音端點(diǎn)。根據(jù)噪聲的情況,設(shè)置兩個(gè)閾值 和 ,當(dāng)相關(guān)函數(shù)最大值大于 時(shí),便判定是語音;當(dāng)相關(guān)函數(shù)最大值大于或小于 時(shí),則判定為語音信號(hào)的端點(diǎn)。 譜熵法u熵表示信息的有序程度,語音的熵和
5、噪聲的熵存在較大的差異,可以體現(xiàn)語音和噪聲在整個(gè)信號(hào)段中的分布概率u譜熵語音端點(diǎn)檢測方法是通過檢測譜的平坦程度,達(dá)到語音端點(diǎn)檢測的目的。2T1T1T2T 譜熵定義:設(shè)語音信號(hào)時(shí)域波形為 ,加窗分幀處理后得到的第n幀語音信號(hào)為 ,其FFT表示為 ,k表示為第k條譜線。該語音幀在頻域中的短時(shí)能量為:某一譜線k的能量譜為則每個(gè)頻率分量的歸一化譜概率密度函數(shù)為該語音幀的短時(shí)譜熵為:( )nXk2*0( )( )NnnnkEXk Xk( )x i( )nx m*( )( )nnnYXk Xk20( )( )( )nnnNnnlY kY kpEY l20( )ln( )NnnnlHp lp l 基于譜熵的
6、端點(diǎn)檢測:基于譜熵語音端點(diǎn)檢測方法是通過檢測譜的平坦程度,來進(jìn)行語音端點(diǎn)檢測的,為了更好地進(jìn)行語音端點(diǎn)檢測,采用語音信號(hào)的短時(shí)功率譜構(gòu)造語音信息譜熵,從而對(duì)語音段和噪聲段進(jìn)行區(qū)分。檢測思路:對(duì)語音信號(hào)進(jìn)行分幀加窗,取FFT的點(diǎn)數(shù)計(jì)算每一幀的譜能量計(jì)算出每一幀中每個(gè)樣本點(diǎn)的概率密度函數(shù)計(jì)算出每一幀的譜熵值設(shè)置判決門限 根據(jù)各幀的譜熵值進(jìn)行端點(diǎn)檢測20( )( )( )nnnNnnlY kY kpEY l20( )ln( )NnnnlHp lp l 比例法(1)能零比的端點(diǎn)檢測在噪聲情況下,信號(hào)的短時(shí)能量和短時(shí)過零率會(huì)發(fā)生一定變化,嚴(yán)重時(shí)會(huì)影響端點(diǎn)檢測。如右圖所示,語音信號(hào)的說話區(qū)間能量是向上凸起
7、的,而過零率相反,是下凹的,這說明說話區(qū)間能量值大,過零率小,噪聲區(qū)間能量值小,過零率大,從而可以檢測語音端點(diǎn) 比例法(1)能零比的端點(diǎn)檢測為此,提出改進(jìn)式能量 ,a為常數(shù),適當(dāng)?shù)娜≈涤兄趨^(qū)分噪聲和清音進(jìn)行限幅之后的過零率故能零比表示為 ,b為較小的常數(shù),用于防止分母為零(2)能熵比的端點(diǎn)檢測譜熵值類似于過零率,能熵比的表示為 對(duì)數(shù)頻譜距離法(自學(xué))lg 1nnELEa( )( )( )0( )nnnnx mx mx mx mnnnLEEZRZCRb1nnnLEEEFH 基音:一般的聲音都是由發(fā)音體發(fā)出的一系列頻率、振幅各不相同的振動(dòng)復(fù)合而成的。這些振動(dòng)中有一個(gè)頻率最低的振動(dòng),由它發(fā)出的音就
8、是基音基音,其余為泛音泛音。 基音周期是指聲帶振動(dòng)頻率的倒數(shù)。 基音周期是語音信號(hào)最重要的參數(shù)之一,它描述了語音激勵(lì)源的一個(gè)重要特征。 基音周期信息在多個(gè)領(lǐng)域有著廣泛的應(yīng)用,如:語音識(shí)別、說話人識(shí)別、語音分析與綜合以及低碼率語音編碼、發(fā)音系統(tǒng)疾病診斷、聽覺殘障者的語言指導(dǎo)等。 由于漢語是一種有調(diào)語言,基音的變化模式稱為聲調(diào),它攜帶著非常重要的具有辨意作用的信息,有區(qū)別意義的功能,所以,基音的提取和估計(jì)對(duì)漢語更是一個(gè)十分重要的問題。 基音檢測的主要困難在于:聲門激勵(lì)信號(hào)并不是一個(gè)完整周期的序列,在語音的頭、尾部并不具有聲帶振動(dòng)那樣的周期性,有些清音和濁音的過度幀是很難準(zhǔn)確地判斷是周期還是非周期性
9、的;在許多情況下,清音語音和低電平濁音語音段之間的過渡段是非常細(xì)微的,確定它是極其困難的;從語音信號(hào)中去除聲道影響,直接取出僅和聲帶振動(dòng)有關(guān)的激勵(lì)信號(hào)的信息并不容易,例如聲道的共振峰有時(shí)會(huì)嚴(yán)重影響激勵(lì)信號(hào)的諧波結(jié)構(gòu)。這種影響在發(fā)音器官快速動(dòng)作而共振峰也快速改變時(shí),對(duì)對(duì)基音檢測是最具危害性的。 盡管基音檢測有許多困難,但因?yàn)樗闹匾?,基音的檢測提取一直是一個(gè)研究的課題。 為此提出了各種各樣的基音檢測算法,如u自相關(guān)函數(shù)(ACF)法、u峰值提取算法(PPA)、u平均幅度差函數(shù)(AMDF)法、u并行處理技術(shù)、u倒譜法、u簡化逆濾波法(SIFT)u譜圖法、u小波法u這一節(jié)將介紹幾種常用的基音提取方法
10、。語音信號(hào)是非平穩(wěn)的信號(hào),所以對(duì)信號(hào)的處理都使用短時(shí)自相關(guān)函數(shù)。短時(shí)自相關(guān)函數(shù)是在信號(hào)的第N個(gè)樣本點(diǎn)附近用短時(shí)窗截取一段信號(hào),做自相關(guān)計(jì)算所得的結(jié)果m表示窗函數(shù)是從第m點(diǎn)開始加入10)()()(kNmnnnkmSmSkR 自相關(guān)法自相關(guān)法語音信號(hào)s(m)經(jīng)窗長為N的窗口截取為一段加窗語音信號(hào)Sn(m)后,定義Sn(m)的自相關(guān)函數(shù)(ACF),Rn(k)(亦即語音信號(hào)s(m)的短時(shí)自相關(guān)函數(shù))為:Rn(k)不為零的范圍為是k=(-N+1)(N1),且為偶函數(shù)。由4章的分析可知,濁音信號(hào)的自相關(guān)函數(shù)在基音周期的整數(shù)倍位置上出現(xiàn)峰值;而清音的自相關(guān)函數(shù)沒有明顯的峰值出現(xiàn)。因此檢測是否有峰值就可判斷是
11、清音或濁音,檢測峰值的位置就可提取基音周期值。10)()()(kNmnnnkmSmSkRclcclear all x= wavread(C:UsersDesktopbearings.wav);figure(1); stem(x,.); n=160; %取20ms的聲音片段,即160個(gè)樣點(diǎn) for m=1:length(x)/n; %對(duì)每一幀求短時(shí)自相關(guān)函數(shù) for k=1:n; Rm(k)=0; for i=(k+1):n; Rm(k)=Rm(k)+x(i+(m-1)*n)*x(i-k+(m-1)*n); end end p=Rm(10:n); %防止誤判,去掉前邊10個(gè)數(shù)值較大的點(diǎn) Rmax
12、,N(m)=max(p); %讀取第一個(gè)自相關(guān)函數(shù)的最大值 end %補(bǔ)回前邊去掉的10個(gè)點(diǎn) N=N+10; T=N/8; %計(jì)算出對(duì)應(yīng)的周期 figure(2);stem(T,.);axis(0 length(T) 0 10); xlabel(幀數(shù)(n);ylabel(周期(ms);title(各幀基音周期); 平均幅度差函數(shù)法(平均幅度差函數(shù)法(AMDFAMDF) 語音信號(hào)的短時(shí)平均幅度差函數(shù)(AMDF) Fn(k)定義為: 與短時(shí)自相關(guān)函數(shù)一樣,對(duì)周期性的濁音語音,F(xiàn)n(k)也呈現(xiàn)與濁音語音周期相一致的周期特性,不過不同的是Fn(k)在周期的各個(gè)整數(shù)倍點(diǎn)上具有谷值特性而不是峰值特性 因而
13、通過Fn(k)的計(jì)算同樣可以來確定基音周期。而對(duì)于清音語音信號(hào),F(xiàn)n(k)卻沒有這種周期特性。利用Fn(k)的這種特性,可以判定一段語音是濁音還是清音,并估計(jì)出濁音語音的基音周期。 但是,短時(shí)平均幅度差函數(shù)來估計(jì)基音周期時(shí),要求窗長取得足夠長??梢圆捎肔PC逆濾波和中心削波處理等方法來減少輸入語音中聲道特性或共振峰的影響,提供基音周期估計(jì)效果10)()()(kNmnnnmSkmSkF 無論是利用自相關(guān)函數(shù)還是平均幅度差函數(shù),語音幀應(yīng)使用矩形窗窗長的選擇要合適,一般認(rèn)為窗長至少應(yīng)該大于兩個(gè)基音周期,而為了改善估計(jì)結(jié)果,窗長應(yīng)選的更長一些,是幀信號(hào)包含足夠多個(gè)語音周期平均幅度差的計(jì)算無需乘法運(yùn)算,
14、其計(jì)算復(fù)雜度較小,且基音周期點(diǎn)處的平均幅度差的谷點(diǎn)銳度比自相關(guān)函數(shù)的峰點(diǎn)銳度更尖銳,估值精度更高(原因:平均幅度差與語音信號(hào)幅度的快速變化比較敏感,影響估計(jì)的精度)( ) ( )nnR kand F k 倒譜(倒譜(CEPCEP)法)法倒譜法是傳統(tǒng)的基音周期檢測算法之一,它利用語音信號(hào)的倒頻譜特征,檢測出表征聲門激勵(lì)周期的基音信息。原因:濁音語音的復(fù)倒譜中存在峰值,其出現(xiàn)時(shí)間等于基因周期;而清音語音段的復(fù)倒譜則不出現(xiàn)這種峰值。利用這一性質(zhì)可以進(jìn)行清/濁音判斷并估計(jì)濁音的基音周期。步驟:計(jì)算復(fù)倒譜解卷提取出聲門激勵(lì)信息,在預(yù)期的基音周期附近尋找峰值 如果峰值超過了預(yù)先設(shè)定的門限,則語音斷定為濁音
15、,而峰的位置就是基音周期的估值 如果不存在超出門限的峰值,則語音斷定為清音 如果計(jì)算的是依賴于時(shí)間的復(fù)倒譜,則可估計(jì)出激勵(lì)源模型及基音周期隨時(shí)間的變化 倒譜(倒譜(CEPCEP)法)法如前面所述,語音s(n)是由聲門脈沖激勵(lì)e(n)經(jīng)聲道響應(yīng)v(n)濾波而得。即:s(n)=e(n)*v(n)設(shè)三者的倒譜分別為 及 ,則有:可見,倒譜域中基音信息與聲道信息可以認(rèn)為是相對(duì)分離的。采取簡單的倒濾波方法可以分離并恢復(fù)出e(n)和v(n),根據(jù)激勵(lì)e(n)及其倒譜的特征可以求出基音周期。估計(jì)基音周期時(shí),沒有必要對(duì)語音波形完全解卷,所以用倒譜c(n)就完全可以,這樣可以從復(fù)雜的相位計(jì)算中解脫出來;對(duì)于人耳
16、而言,對(duì)語音信號(hào)的相位不很敏感,可以假定輸入語音信號(hào)是最小相位序列,這樣可由最小相位信號(hào)法計(jì)算c(n)( ), ( )s n e n( )v n( )( )( )s ne nv n 倒譜(倒譜(CEPCEP)法)法 反應(yīng)信息的倒譜峰,在過渡音和含噪語音中將會(huì)變得不清晰甚至完全消失。其原因當(dāng)然主要是因?yàn)檫^渡音中周期激勵(lì)信號(hào)能量降低和類噪激勵(lì)信號(hào)干擾或含噪語音中的噪聲干擾所致。 對(duì)于一幀典型的濁音語音的倒譜,其倒譜域中基音信息與聲道信息并不是完全分離的,在周期激勵(lì)信號(hào)能量較低的情況下,聲道響應(yīng)(特別是其共振峰)對(duì)基音倒譜峰的影響就不可忽略。 如果設(shè)法除去語音信號(hào)中的聲道響應(yīng)信息,對(duì)類噪激勵(lì)和噪聲加
17、以適當(dāng)抑制,倒譜基音檢測算法的檢測結(jié)果將有所改善,特別對(duì)過渡語音的檢測結(jié)果將有明顯改善。 倒譜(倒譜(CEPCEP)法)法 除去語音信號(hào)中的聲道響應(yīng)信息可以采用LPC方法,此時(shí)語音信號(hào)可以表示為: 在預(yù)測分析之后,可構(gòu)成逆濾波器A(z)原始語音 逆濾波器A(z)進(jìn)行逆濾波 獲得預(yù)測余量信號(hào) 基音信息 倒譜分析1( )()( )piis na s niGe n 00( ),1piiiA za za理想情況下不包含聲道響應(yīng)信息( )( )nGe n( )n低通濾波抑制噪聲干擾注:倒譜法一般采用漢明窗 簡化逆濾波法(簡化逆濾波法(SIFTSIFT)簡化的逆濾波跟蹤(SIFT)算法是相關(guān)處理法進(jìn)行基音
18、提取的一種現(xiàn)代化的版本。該方法的基本思想是:先對(duì)語音信號(hào)進(jìn)行LPC分析和逆濾波,獲得語音信號(hào)的預(yù)測殘差,然后將殘差信號(hào)通過自相關(guān)濾波器濾波,再作峰值檢測,進(jìn)而獲得基音周期。語音信號(hào)通過線性預(yù)測逆濾波器后達(dá)到頻譜的平坦化,因?yàn)槟鏋V波器是一個(gè)使頻譜子坦化的濾波器,所以它提供了一個(gè)簡化的(亦即廉價(jià)的)頻譜平滑器。預(yù)測誤差是自相關(guān)器的輸入,通過與門限的比較可以確定濁音,通過輔助信息可以減少誤差。作用:將頻譜包絡(luò)逐漸平坦下去。得到的線性預(yù)測誤差信號(hào)只包含有激勵(lì)的信息,去除了聲道影響。所以SIFT提供了一個(gè)簡化的(廉價(jià)的)頻譜平滑器。 簡化逆濾波法(簡化逆濾波法(SIFTSIFT)簡化逆濾波器的原理框圖如
19、圖所示。其工作過程為:語音信號(hào)經(jīng)過8kHz取樣后,通過0-900Hz的數(shù)字低通濾器,其目的是濾除聲道譜中聲道響應(yīng)部分的影響,使峰值檢測更加容易。然后降低取樣率為原來的1/4(因?yàn)榧?lì)序列的寬度小于1 kHz,所以用2kHz取樣就足夠了) 提取降低取樣率后的信號(hào)模型參數(shù)(LPC參數(shù))內(nèi)插提高采樣率,恢復(fù)到8kHz檢測出峰值及其位置就得到基音周期值。一幀語音信號(hào)低通/帶通濾波4:1降采樣LPC分析逆濾波求預(yù)測誤差計(jì)算預(yù)測誤差自相關(guān)函數(shù)1:4曾采樣峰值檢測基音周期值 基音檢測的后處理基音檢測的后處理無論采用哪一種基音檢測算法都可能產(chǎn)生基音檢測錯(cuò)誤,使求得的基音周期軌跡中有一個(gè)或幾個(gè)基音周期估值偏離了
20、正常軌跡(通常是偏離到正常值的2倍或1/2),此情況如圖所示。并稱這種偏離點(diǎn)為基音軌跡的“野點(diǎn)”?;糁芷谲壽E以及軌跡中的“野點(diǎn)”為了去除這些野點(diǎn),可以采用各種平滑算法,其中最常用的是中值平滑算法和線性平滑算法。1 1中值平滑處理 中值平滑處理的基本原理是:設(shè)x(n)為輸入信號(hào),y(n)為中值濾波器的輸出,采用一滑動(dòng)窗,則n0處的輸出值y(n0)就是將窗的中心移到n0處時(shí)窗內(nèi)輸入樣點(diǎn)的中值。即在n0點(diǎn)的左右各取L個(gè)樣點(diǎn)。連同被平滑點(diǎn)共同構(gòu)成一組信號(hào)采樣值(共(2L+1)個(gè)樣值),然后將這(2L+1)個(gè)樣值按大小次序排成一隊(duì),取此隊(duì)列中的中間者作為平滑器的輸出。 L值一般取為1或2,即中值平滑的
21、“窗口”一般套住3或5個(gè)樣值,稱為3點(diǎn)或5點(diǎn)中值平滑。 中值平滑的優(yōu)點(diǎn)是既可以有效地去除少量的野點(diǎn),又不會(huì)破壞基音周期軌跡中兩個(gè)平滑段之間的階躍性變化。2.2.線性平滑處理線性平滑是用滑動(dòng)窗進(jìn)行線性濾波處理,即:其中(m),m = -L,-L+1,0,1,2,L為2L+1點(diǎn)平滑窗,滿足:例如三點(diǎn)窗的權(quán)值可取為0.25,0.5,0.25。線性平滑在糾正輸入信號(hào)中不平滑處樣點(diǎn)值的同時(shí),也使附近各樣點(diǎn)的值做了修改。所以窗的長度加大雖然可以增強(qiáng)平滑的效果,但是也可能導(dǎo)致兩個(gè)平滑段之間階躍的模糊程度加重。為了改善平滑的效果,可以將中值平滑處理和線性平滑處理兩種平滑技術(shù)結(jié)合起來使用。( )1LmLmLLm
22、mmnsny)()()(3 3組合平滑處理為了改善平滑的效果可以將兩個(gè)中值平滑串接,圖a所示是將一個(gè)5點(diǎn)中值平滑和一個(gè)3點(diǎn)中值平滑串接.另一種方法是將中值平滑和線性平滑組合,如圖b所示。為了使平滑的基音軌跡更貼近,還可以采用二次平滑的算法,全部算法的框圖如圖所示。由于中值平滑和線性平滑都會(huì)引入延時(shí),所以在實(shí)現(xiàn)上述方案時(shí)應(yīng)考慮到它的影響。d是一個(gè)采用襝延時(shí)的可實(shí)現(xiàn)二次平滑方案。其中的延時(shí)大小可由中值平滑的點(diǎn)數(shù)和線性平滑的點(diǎn)數(shù)來決定。聲道可以看成是一根具有非均勻截面的聲管,在發(fā)音時(shí)起共鳴器的作用。當(dāng)準(zhǔn)周期脈沖激勵(lì)進(jìn)入聲道時(shí)會(huì)引起共振特性,產(chǎn)生一組共振頻率,稱為共振峰頻率或簡稱共振峰。共振峰參數(shù)包括
23、共振峰頻率和頻帶寬度,它是區(qū)別不同韻母的重要參數(shù)。共振峰信息包含在語音頻譜包絡(luò)中,因此共振峰參數(shù)提取的關(guān)鍵是估計(jì)自然語音頻譜包絡(luò),并認(rèn)為譜包絡(luò)中的最大值就是共振峰。提取共振峰特性最簡便的手段是使用語譜儀。分析共振峰參數(shù)也可采用數(shù)字信號(hào)處理的方法,它可獲得與語譜圖相同的信息。但精確的共振峰估值是很困難的(原因:虛假峰值、共振峰合并、高音調(diào)語音)為此,下面討論常用的幾種解決方法。 帶通濾波器組法帶通濾波器組法這種方法類似于語譜儀,但由于使用了計(jì)算機(jī),使濾波器特性的選取更具靈活性,實(shí)現(xiàn)框圖如圖所示。這是共振峰提取的最早形式,與線性預(yù)測法相比,濾波器組法有些遜色。但通過濾波器組的設(shè)計(jì)可以使估計(jì)的共振峰
24、頻率同人耳的靈敏度相匹配,其匹配的程度比線性預(yù)測法要好。帶通濾波器組法提取共振峰 帶通濾波器組法帶通濾波器組法濾波器的中心頻率有兩種分布方法:等間距地分布在分析頻段上,則所有帶通濾波器的帶寬可設(shè)計(jì)成相同,從而保證了各通道的群延時(shí)相同。是非均勻地分布,例如為了獲得類似于人耳的頻率分辨特性,在低頻端間距小,高頻端間距大,帶寬也隨之增加,這時(shí)濾波器的階數(shù)必須設(shè)計(jì)成與帶寬成正比,使得它們輸出的群延時(shí)相同,不會(huì)產(chǎn)生波形失真。缺點(diǎn):p由于濾波器組中的濾波器數(shù)目有限,估計(jì)的共振峰頻率不可避免地存在誤差;p而且對(duì)共振峰帶寬不易確定;p由于無法去除聲門激勵(lì)的影響,可能會(huì)造成虛假峰值。 倒譜法倒譜法共振峰估計(jì)雖然
25、可以直接對(duì)語音信號(hào)求離散傅里葉變換(DFT),通過DFT譜來提取信號(hào)的共振峰參數(shù),但是,直接DFT的譜要愛基頻諧波的影響,最大值只能出現(xiàn)在諧波頻率上,因而共振峰測定誤差較大。為了消除基頻諧波的影響,可以采用同態(tài)解卷技術(shù),經(jīng)過同態(tài)濾波后得到平滑的譜,這樣簡單地檢測峰值就可以直接提取共振峰參數(shù),這種方法更為有效和精確。倒譜運(yùn)用對(duì)數(shù)運(yùn)算和二次變換將基音諧波和聲道的頻譜包絡(luò)分離開來。因此用低時(shí)窗l(fā)(n)從語音信號(hào)倒譜c(n)中所截取出來的沖激響應(yīng)h(n),能更精確地反映聲道響應(yīng)。由h(n)經(jīng)DFT得到的 ,就是聲道的離散譜曲線。用 代替直接DFT的頻譜,去除了激勵(lì)引起的諧波波動(dòng),可以更精確地得到共振峰
26、參數(shù)。( )H k( )H k 倒譜法倒譜法如圖所示,倒譜法求取語音頻譜包絡(luò)。倒譜法因?yàn)槠漕l譜曲線的波動(dòng)比較小,所以估計(jì)共振峰參數(shù)的效果是較好的,但其運(yùn)算量太大。 111( )ln()ln()ln()jjjc nFS eFU eFH e聲門激勵(lì)序列的倒譜,是以基音周期為周期的沖激序列聲道沖激響應(yīng)序列的倒譜,集中在n=0附近的低倒譜 倒譜法倒譜法 111( )ln()ln()ln()jjjc nFS eFU eFH e聲門激勵(lì)序列的倒譜,是以基音周期為周期的沖激序列聲道沖激響應(yīng)序列的倒譜,集中在n=0附近的低倒譜可在倒譜域用一個(gè)濾波器(倒濾波器)消除聲門激勵(lì)的影響21101( )ln()ln()
27、,01NjknjjNkc nFH eH eenNN利用逆傅立葉變換求c(n)時(shí),為避免發(fā)生混疊,需要將N取得足夠大 倒譜法倒譜法對(duì)于濁音和清音,倒譜法的檢測效果不同:p濁音時(shí),若頻譜包絡(luò)的變換和基音峰值的變換在倒譜中的間隔足夠大,則頻譜包絡(luò)的變換很容易識(shí)別。而聲道沖激響應(yīng)h(n)的倒譜的特性取決于聲道傳遞函數(shù)H(z)的極零點(diǎn)分布。當(dāng)H(z)的極零點(diǎn)的模不是很接近于1時(shí),將隨n的增加而迅速減小。p清音時(shí),聲門激勵(lì)序列具有噪聲特性,其倒譜沒有明顯峰值,且分布于從低倒譜域到高倒譜域的很寬的范圍內(nèi),因而在低倒譜域?qū)β暤理憫?yīng)的信息產(chǎn)生了影響。注意:求得的聲道模型對(duì)數(shù)譜與實(shí)際的聲道對(duì)數(shù)譜之間將存在一定差別 倒譜法倒譜法倒譜法存在的缺陷:并不是所有的譜峰都為共振峰;帶寬的計(jì)算。 原因:當(dāng)兩個(gè)共振峰很靠近時(shí)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年立式紅外線治療燈項(xiàng)目投資可行性研究分析報(bào)告-20241226-190706
- 廣西師范大學(xué)《模式識(shí)別》2023-2024學(xué)年第二學(xué)期期末試卷
- 青島城市學(xué)院《電氣制圖與CAD》2023-2024學(xué)年第二學(xué)期期末試卷
- 上海海洋大學(xué)《幼兒認(rèn)知與學(xué)習(xí)》2023-2024學(xué)年第二學(xué)期期末試卷
- 山東外事職業(yè)大學(xué)《企業(yè)經(jīng)營決策模擬》2023-2024學(xué)年第二學(xué)期期末試卷
- 2025年新高考藝術(shù)生數(shù)學(xué)突破講義 專題03 等式與不等式的性質(zhì)
- 貧困學(xué)生申請(qǐng)書
- 常州機(jī)電職業(yè)技術(shù)學(xué)院《建筑與室內(nèi)發(fā)展史》2023-2024學(xué)年第二學(xué)期期末試卷
- 黑龍江八一農(nóng)墾大學(xué)《工控網(wǎng)絡(luò)與通信》2023-2024學(xué)年第二學(xué)期期末試卷
- 新疆職業(yè)大學(xué)《水產(chǎn)養(yǎng)殖及疾病防治》2023-2024學(xué)年第二學(xué)期期末試卷
- 地理-廣東省上進(jìn)聯(lián)考領(lǐng)航高中聯(lián)盟2025屆高三下學(xué)期開學(xué)考試題和答案
- GB/T 20032-2024項(xiàng)目風(fēng)險(xiǎn)管理應(yīng)用指南
- 2025年熱管換熱氣行業(yè)深度研究分析報(bào)告
- 華為采購質(zhì)量優(yōu)先及三化一穩(wěn)定推進(jìn)
- 職業(yè)學(xué)院學(xué)生晚出、晚歸、不歸管理辦法
- 2025年高三歷史高考第二輪復(fù)習(xí)知識(shí)梳理中國史部分復(fù)習(xí)提綱
- 《安利蛋白質(zhì)粉》課件
- 護(hù)理三基三嚴(yán)習(xí)題+參考答案
- 2025門診護(hù)理工作計(jì)劃
- 員工互評(píng)表(含指標(biāo))
- 電氣領(lǐng)域知識(shí)培訓(xùn)課件
評(píng)論
0/150
提交評(píng)論