




已閱讀5頁,還剩63頁未讀, 繼續(xù)免費(fèi)閱讀
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1 緒論1.1 綜述 語音是人類信息活動(dòng)的重要手段之一,語音不僅是人與人之間進(jìn)行信息交流的最直接最方便的和最有效的工具。人機(jī)對(duì)話意味著計(jì)算機(jī)應(yīng)該具有語音輸入和語音識(shí)別的功能,即計(jì)算機(jī)具有聽覺,能夠“聽懂”人話,這就是語音識(shí)別的功能。無論,人與人之間,還是人與計(jì)算機(jī)之間的語音通信,語音信號(hào)處理,特別是語音信號(hào)處理的理論和技術(shù),都具有特別重要的作用。數(shù)字語音處理包含三個(gè)方面內(nèi)容:語音信號(hào)的數(shù)字表達(dá)方法語音信號(hào)的數(shù)字處理的各種方法以及數(shù)字語音處理理論和技術(shù)在各個(gè)領(lǐng)域的應(yīng)用。這些內(nèi)容涉及到了數(shù)字信號(hào)處理計(jì)算機(jī)科學(xué)模式識(shí)別語音學(xué)生理學(xué)等學(xué)科,還涉及到通信和電子系統(tǒng),信號(hào)和信息處理系統(tǒng)等具體的應(yīng)用領(lǐng)域。對(duì)于語音信號(hào),數(shù)字處理比模擬處理具有更多優(yōu)點(diǎn)。這是因?yàn)椋旱谝唬瑪?shù)字技術(shù)能夠完成很多很復(fù)雜的信號(hào)處理工作;第二,通過語音進(jìn)行交換的信息,本質(zhì)上具有離散的性質(zhì),因?yàn)檎Z音可以看成是語素的組合,這就特別適用于數(shù)字處理;第三,數(shù)字語音具有更高的可靠性價(jià)廉緊湊快速等特點(diǎn),很容易完成實(shí)時(shí)處理要求;第四,數(shù)字語音具有在強(qiáng)干擾信道中傳輸?shù)奶攸c(diǎn),易于和數(shù)據(jù)一起在通信網(wǎng)中傳輸,也易于進(jìn)行加密傳輸,因此,數(shù)字語音也是主要研究方向。語音信號(hào)處理的方法是多種多樣的。和一般的數(shù)字與信號(hào)的處理相類似,其方法可以是時(shí)域的,也可以是頻域的,但都應(yīng)考慮到語音信號(hào)本身的特點(diǎn)。語音信號(hào)是時(shí)變信號(hào),只是在一個(gè)一個(gè)短段內(nèi)才可以看成平穩(wěn)的,因此,短時(shí)處理是處理語音信號(hào)的一種基本方法。在時(shí)域內(nèi),這就是各種短時(shí)處理技術(shù)的方法,如短時(shí)能量短是平均過零率及短時(shí)自相關(guān)函數(shù)等計(jì)算;在頻域內(nèi),這就是短時(shí)傅立葉變換方法。線性預(yù)測(cè)技術(shù)本質(zhì)上屬于時(shí)域分析方法,但結(jié)果可以是頻域的參數(shù)。數(shù)字語音處理有著廣泛的應(yīng)用領(lǐng)域,其中最重要的包括:語音壓縮語音合成、語音識(shí)別以及語音增強(qiáng)。這些方面的研究以深入到通信辦公自動(dòng)化遠(yuǎn)距離控制聲控電話撥號(hào)計(jì)算機(jī)語音應(yīng)答,以及機(jī)器人聽覺和口語系統(tǒng)等實(shí)用的系統(tǒng)中。1.2主要研究?jī)?nèi)容根據(jù)設(shè)計(jì)任務(wù)書的要求,本設(shè)計(jì)主要內(nèi)容如下:(1) 語音信號(hào)產(chǎn)生的數(shù)字模型,以及語音信號(hào)模型的建立機(jī)理。(2) 語音信號(hào)的時(shí)域分析。(3) 語音信號(hào)的頻域分析。(4) 語音信號(hào)的線性預(yù)測(cè)技術(shù)。(5) matlab軟件編程。第三第四章主要是介紹如何將本不平穩(wěn)的語音信號(hào)轉(zhuǎn)換為平穩(wěn)的語音信號(hào),以及短時(shí)處理的一些基本理論和方法。第五章是本書要重點(diǎn)研究的內(nèi)容,也是語音處理一種非常重要的方法。 第六章是對(duì)matlab的一些基本介紹和程序上的運(yùn)用。1.3語音處理技術(shù)的發(fā)展概況語音處理研究的歷史可追溯到1876年貝爾發(fā)明電話,那是首次采用聲電電聲轉(zhuǎn)換技術(shù)實(shí)現(xiàn)遠(yuǎn)距離語音通訊。1939年h.dudley 研制成功了第一個(gè)聲碼器,這一發(fā)明奠定了語音數(shù)字模型的基本思想,在語音信號(hào)處理領(lǐng)域具有劃時(shí)代的意義。1958年duddley等人改進(jìn)了數(shù)字實(shí)驗(yàn)裝置,將語音分割為元音和輔音等單元。六十年代以來,有關(guān)語音信號(hào)處理的論文數(shù)量達(dá)到高峰,但處理方多以軟件形式出現(xiàn)。八十年代以來出現(xiàn)的語音信號(hào)處理產(chǎn)品的熱潮.ibm于1997年推出的漢語聽寫機(jī),為語音識(shí)別技術(shù)的實(shí)際應(yīng)用開辟了新的道路。近幾年來,語音信號(hào)處理不僅在理論上取得了重大進(jìn)步,而且其應(yīng)用范圍也不斷擴(kuò)大。如自動(dòng)控制系統(tǒng),公共交通中的自動(dòng)報(bào)站各種場(chǎng)合的自動(dòng)報(bào)警公安機(jī)關(guān)破案等國家安全事務(wù)有重要應(yīng)用?,F(xiàn)在,語音信號(hào)處理的理論與方法已成為許多專業(yè)的共同基礎(chǔ)。2 語音信號(hào)的數(shù)字建模語音信號(hào)分析大體上有時(shí)域、頻域、倒譜域等分析方法。但是按語音學(xué)觀點(diǎn),可將它分為模型分析法和非模型分析法兩種。模型分析法是依據(jù)語音信號(hào)的數(shù)學(xué)模型的理論來求得這些模型參數(shù),而將其它分析方法籠統(tǒng)地歸于非模型分析法中。模型分析法中的各種模型只適合于信號(hào)是平穩(wěn)或局部平穩(wěn)的情形。由于不同的語音是由人的口腔肌肉運(yùn)動(dòng)構(gòu)成聲道某種形狀而產(chǎn)生的響應(yīng),而這種肌肉運(yùn)動(dòng)相對(duì)于語音頻率來說是極緩慢的,因此一般認(rèn)為在2040ms的短時(shí)間內(nèi)語音信號(hào)是平穩(wěn)的,所以完全可以用短時(shí)平穩(wěn)的分析方法。語音信號(hào)產(chǎn)生模型是對(duì)發(fā)聲器官的模擬和仿真。數(shù)字模型就是用數(shù)字處理方法實(shí)現(xiàn)這種物理系統(tǒng)的模擬,由此可估計(jì)出語音波形的參數(shù),因此,這種數(shù)字模型也是語音參數(shù)模型。我們知道發(fā)聲器官能發(fā)出一系列的聲波是出于聲道受到氣流的激勵(lì)而產(chǎn)生的。聲道的一端是喉,另一端是嘴,其中包含有聲帶、聲門、口腔和鼻腔等。根據(jù)聲帶振動(dòng)與否,語音可分為濁音和清音兩大類。聲帶在氣流的作用下發(fā)生振動(dòng),從而產(chǎn)生準(zhǔn)周期的聲波激勵(lì),這種激勵(lì)經(jīng)過口腔和鼻腔的諧振作用而形成濁音,有時(shí)稱為有聲音。氣流經(jīng)過口腔的唇齒部分,如果引起湍流就產(chǎn)生摩擦音,有時(shí)因?yàn)榇讲客蝗粡堥_而形成爆破音。凡是聲帶不振動(dòng)的聲音,統(tǒng)稱清音,有時(shí)也稱為無聲音。用數(shù)字方法模擬這種功能時(shí),用準(zhǔn)周期的脈沖序列來模擬聲帶振動(dòng)的激勵(lì),而用隨機(jī)噪聲模擬清音的激勵(lì),口腔、鼻腔等所組成的聲道諧振特性可用時(shí)變數(shù)字濾波器來模擬。所謂建立數(shù)學(xué)模型,就是要尋找一種可以表達(dá)一定物理狀態(tài)下量與量的數(shù)學(xué)表示。建立了數(shù)學(xué)模型才能夠用計(jì)算機(jī)對(duì)語音信號(hào)進(jìn)行模擬和處理。建立數(shù)學(xué)模型的基本原則是要使這種關(guān)系不僅能具有最大的精確度,還要最簡(jiǎn)單。數(shù)字濾波器的頻率響應(yīng)受到一些參數(shù)的控制。不斷控制清濁音開關(guān)、激勵(lì)脈沖的周期以及噪聲源強(qiáng)度,同時(shí)隨著不同的發(fā)音改變?yōu)V波器特性,輸出的信號(hào)就是所要求的語音信號(hào)序列。通過對(duì)發(fā)音機(jī)理和語音信號(hào)的產(chǎn)生機(jī)理的分析,可以將語音信號(hào)分為三個(gè)部分,在聲帶以下,稱為“聲門子系統(tǒng)”,它負(fù)責(zé)產(chǎn)生激勵(lì)振動(dòng),是“激勵(lì)系統(tǒng)”;從聲門到嘴唇的呼氣通道是聲道,是“聲道系統(tǒng)”;語音從嘴唇輻射出去,所以嘴唇以外是“輻射系統(tǒng)”。如圖2-1所示為語音信號(hào)的產(chǎn)生模型:圖2-1 語音信號(hào)產(chǎn)生模型語音信號(hào)是一個(gè)局部平穩(wěn)的隨機(jī)信號(hào),它的激勵(lì)參數(shù)和聲道濾波器的參數(shù)均隨時(shí)間而變化,但是由于發(fā)聲器官的慣性使這些參數(shù)的變化速度受到限制, 對(duì)于聲道參數(shù),在一較短的時(shí)間內(nèi)(1030ms)可近似認(rèn)為是不變的,因此語音的短時(shí)分析幀長(zhǎng)一般取為20ms左右。對(duì)于激勵(lì)源參數(shù),大多數(shù)情況下這一結(jié)論也是正確的。但是有些音的變化速度特別快,例如塞音或塞擦音的爆破段,20ms的時(shí)間間隔就過長(zhǎng),這時(shí)取5ms的間隔更為恰當(dāng)。模型中將語音信號(hào)截然分為受周期脈沖激勵(lì)和噪聲激勵(lì)兩種情況,與實(shí)際情況并不完全符合,將清濁音開關(guān)換為疊加號(hào)更為合適,這樣激勵(lì)信號(hào)可以是上述兩種激勵(lì)按任意比例相疊加,這更加符合實(shí)際情況(即使如此,這個(gè)模型也不能完全包括所有的情況)。除了這些限制以外,這個(gè)模型的局限性主要表現(xiàn)在它的傳輸函數(shù)不包含有限傳輸零點(diǎn),而像鼻音、擦音這樣一些音的聲道傳輸函數(shù)中是包含有限零點(diǎn)的。一種解決問題的方法是在聲道模型中引入若干有限傳輸零點(diǎn),但是這將使模型復(fù)雜化。另一種方法是適當(dāng)提高階數(shù)p,使得全極點(diǎn)模型能更好地逼近具有此種零點(diǎn)的傳輸函數(shù)。綜上所述,完整的語音信號(hào)得數(shù)字模型可以用三個(gè)子模型:激勵(lì)模型聲道模型和輻射模型的串聯(lián)來表示。它的傳遞函數(shù)可表示為:h(z)=au(z)v(z)r(z) (2-1)這里,u(z)是激勵(lì)信號(hào),濁音時(shí)u(z)是聲門脈沖即斜三角脈沖序列的z變換;在清音的情況下,u(z)是一個(gè)隨機(jī)噪聲的z變換。v(z)是聲道傳輸函數(shù),既可以用聲管模型,也可以用共峰模型來描述。實(shí)際上就是全集點(diǎn)模型: 應(yīng)該指出,式(2-1)所示模型的內(nèi)部結(jié)構(gòu)并不和物理過程相一致,但這種模型和真實(shí)的模型在輸出上是一致的。另外,這種模型是“短時(shí)”的模型,因?yàn)橐恍┱Z音信號(hào)的變化是緩慢的,例如元音在1020ms內(nèi)其參數(shù)是假定不變的。這里聲道轉(zhuǎn)移函數(shù)v(z)是一個(gè)參數(shù)隨時(shí)間變化的模型。另外,這一模型認(rèn)為語音是聲門激勵(lì)線形預(yù)測(cè)系統(tǒng)聲道所產(chǎn)生的;實(shí)際上,聲帶-聲道相互作用的非線形特征還有待研究。另外,模型中,用濁音和清音這種簡(jiǎn)單的劃分方法是有缺陷的,對(duì)于某些音是不適用的,例如濁音當(dāng)中的摩擦音。這種音要有發(fā)濁音和發(fā)清音的兩種激勵(lì),而且兩者不是簡(jiǎn)單的疊加關(guān)系。對(duì)于這些音可以用一些修正模型或更精確的模型來模擬.3 語音信號(hào)的時(shí)域分析語言信號(hào)的時(shí)域分析就是分析和提取語音信號(hào)的時(shí)域參數(shù)。進(jìn)行語音分析時(shí),最先接觸到并且也是最直觀的是它的時(shí)域波形。語音信號(hào)本身就是時(shí)域信號(hào),因而時(shí)域分析就是最早使用,也是應(yīng)用最廣泛的一種分析方法,這種方法直接利用語音信號(hào)的時(shí)域波形。時(shí)域分析通常用于最基本的參數(shù)分析及應(yīng)用,如語音的分割、預(yù)處理、大分類等。這種分析方法的特點(diǎn)是:(1)表示語音信號(hào)比較直觀、物理意義明確。(2)實(shí)現(xiàn)起來比較簡(jiǎn)單、運(yùn)算量少。(3)可以得到語音的一些重要參數(shù)。(4)只使用示波器等通用設(shè)備,使用較為簡(jiǎn)單等。語音信號(hào)的時(shí)域參數(shù)有短時(shí)能量、短時(shí)過零率、短時(shí)自相關(guān)函數(shù)和短視平均幅度差函數(shù)等,這是語音信號(hào)的一組最基本的短時(shí)參量,在各種語音信號(hào)數(shù)字處理技術(shù)中都要應(yīng)用。在計(jì)算這些參量時(shí)使用的一般是方窗或汗明窗?,F(xiàn)在分別討論如下。3.1短時(shí)能量及短時(shí)平均幅度分析設(shè)語音波形時(shí)域信號(hào)為x(l)、加窗分鎮(zhèn)處理后得到的第n真語音信號(hào)為xn(m), 則xn(m)滿足下式: xn(m)=w(m)x(n+m) 0m0)。因此由式(5-16)看出 , k-10或l0)的情況下,h(z)只有極點(diǎn),即 (5-20)相應(yīng)的差分方程為 (5-21)信號(hào)的功率譜為 (5-22)這種形式的信號(hào)模型稱為全極點(diǎn)模型或自回歸模型(簡(jiǎn)稱為ar模型)。p階自回歸模型一般表示為ar(p)。這是一種最重要,應(yīng)用最廣的模型。對(duì)于ar(p)模型,式(6.20)中的bl應(yīng)代之以單位取樣序列,于是得到 (5-23) 考慮到h(k)的因果性,即當(dāng)k0時(shí)有h(-k)=0;同時(shí)根據(jù)初值定理1知道 (5-24)所以,式(6.24)可簡(jiǎn): (5-25) 式中a0=1。這就是ar(p)模型的模型參數(shù)與信號(hào)自相關(guān)函數(shù)之間的關(guān)系式。將其與線性預(yù)測(cè)的yule-walker方程式(5-11)對(duì)照可以看出,如果線性預(yù)測(cè)和信號(hào)模型是對(duì)同一信號(hào)而言的,即兩個(gè)方程組中的已知數(shù)相同rzz(k-l)=r(k-l),那么兩組方程的解應(yīng)當(dāng)相同(可以證明,只要r(k-l)或rzz(k-l)是正定的,則兩組方程有唯一解),即 (5-26)這意味著,解最佳線性預(yù)測(cè)問題等效于解信號(hào)模型問題。具體地說,信號(hào)x(n)的線性系數(shù)和它的ar(p)模型參數(shù)al相同,而預(yù)測(cè)誤差功率與模型的極力源的功率相同。一個(gè)平穩(wěn)隨機(jī)過程,如果它是p階自回歸過程,那么用一個(gè)ar(p)模型就能精確地描述它。在第二章曾經(jīng)討論過,語音信號(hào)可以看成是一個(gè)線性時(shí)變系統(tǒng)在準(zhǔn)周期脈沖序列(相應(yīng)于濁音)或隨機(jī)噪聲(相應(yīng)與清音)激勵(lì)下所產(chǎn)生的輸出,參看圖2.1。在語音信號(hào)的這個(gè)數(shù)字模型中,時(shí)變線性系統(tǒng)綜合反映了輻射、聲門脈沖以及聲道的總的影響,并且對(duì)于除鼻音和摩擦音以外的大多數(shù)語音來說,都可以用一個(gè)全極點(diǎn)系統(tǒng)來表示。這個(gè)全極點(diǎn)時(shí)變線性系統(tǒng)的參數(shù)隨著時(shí)間的變化是非常緩慢的,因而可以近似地認(rèn)為,在一 語音時(shí)間內(nèi)它是非時(shí)變的。這樣一來,圖2.1所表示的語音信號(hào)模型,正是一個(gè)平穩(wěn)隨機(jī)過程的自回歸模型(在短時(shí)間內(nèi)可以近似的認(rèn)為語音信號(hào)是平穩(wěn)的)。根據(jù)本節(jié)前面的討論,很容易理解,線性預(yù)測(cè)是描述語音信號(hào)的一種很精確的方法。對(duì)語音信號(hào)進(jìn)行線性預(yù)測(cè)分析,其合理性和精確性可以從另一個(gè)角度來加以解釋。線性預(yù)測(cè)系數(shù)(等效于語音信號(hào)的模型參數(shù))是根據(jù)最小均方誤差準(zhǔn)則來決定的,而最小均方誤差恰等于信號(hào)模型的激勵(lì)源的方差;另一方面,語音信號(hào)模型的激勵(lì)源只能是準(zhǔn)周期沖激序列或隨機(jī)白噪聲序列激勵(lì),而這兩種序列的均方值都是最小的。由此可見,對(duì)語音信號(hào)進(jìn)行線性預(yù)測(cè)分析是合理的。反過來說,如果用某個(gè)準(zhǔn)周期沖激序列或隨機(jī)白噪聲序列激勵(lì)一個(gè)全極點(diǎn)系統(tǒng),產(chǎn)生出某個(gè)信號(hào),然后根據(jù)該信號(hào)p個(gè)取樣值對(duì)信號(hào)的當(dāng)前值進(jìn)行預(yù)測(cè),而且在均方誤差最小的意義上這種預(yù)測(cè)是最佳的,那么預(yù)測(cè)系數(shù)必將等于全極點(diǎn)系統(tǒng)的參數(shù)。最后需要指出,對(duì)語音信號(hào)x(n) 進(jìn)行線性預(yù)測(cè),實(shí)際上意味著建立一個(gè)由白噪聲源激勵(lì)一個(gè)全極點(diǎn)系統(tǒng)的自回歸模型,使得該模型產(chǎn)生的信號(hào)在z(n)的自相關(guān)函數(shù)與語音信號(hào)x(n)的自相關(guān)函數(shù)相匹配,或者說使得z(n)和x(n)的譜包絡(luò)相匹配。5.4 levinson-durbin 算法通過以上討論可以看到:求取信號(hào)的模型參數(shù)可以通過線性預(yù)測(cè)來完成,而線性預(yù)測(cè)系數(shù)以及預(yù)測(cè)誤差功率可以有式(5.11)所表示的yule-walker方程解出。本節(jié)討論由已知的自相關(guān)函數(shù),通過解式(5.11)以求取線性預(yù)測(cè)系數(shù)及預(yù)測(cè)誤差功率的方法。將式(5.11)寫成矩陣形式,并注意到平穩(wěn)隨機(jī)信號(hào)的自相關(guān)函數(shù)的對(duì)稱性質(zhì),可以得到下面的結(jié)果: (5-27)值得注意的是,上列方程組的系數(shù)矩陣中,沿任何一條對(duì)角線上的元素都相同,這樣的矩陣稱為toeplitz矩陣,同時(shí)系數(shù)矩陣還是一個(gè)對(duì)稱矩陣。利用系數(shù)矩陣的對(duì)稱toeplitz性質(zhì),提出了一種高效算法來求解該方程組,這就是著名的levinson-durbin算法,簡(jiǎn)稱為levinson算法,該算法的運(yùn)算數(shù)量級(jí)為o(p2),而線性方程組的一般解法的運(yùn)算量數(shù)量級(jí)為o(p3),后者比前者要大的多。levinson算法是一個(gè)迭代計(jì)算過程。它從最低預(yù)測(cè)器開始,由低階到高階,逐階進(jìn)行遞推計(jì)算。即是說,總是由前一階段預(yù)測(cè)器求出了所要求的p階預(yù)測(cè)器的系數(shù),而且得到了所有低階預(yù)測(cè)器的系數(shù)。在圖5-2中,最上面表示了過去p個(gè)取樣值預(yù)測(cè)當(dāng)前值xn;下面依次畫出了1階、2階、3階、p階預(yù)測(cè)器的預(yù)測(cè)系數(shù);旁邊寫出了個(gè)階預(yù)測(cè)誤差。預(yù)測(cè)系數(shù)有兩個(gè)下標(biāo),第一個(gè)下標(biāo)表示階數(shù),第二個(gè)下標(biāo)表示該階預(yù)測(cè)器系數(shù)的序數(shù)。 1 1 1 1 圖5-2levinson算法遞推示意圖為了說明levinson算法的迭代計(jì)算過程,現(xiàn)在討論在已知第p階預(yù)測(cè)器系數(shù)后如何求出第p+1階預(yù)測(cè)器系數(shù)的問題。圖5.3表示了第p階預(yù)測(cè)器和第p+1階預(yù)測(cè)器,其中第p階預(yù)測(cè)器假定是已知的?,F(xiàn)在的問題是,如何根據(jù)第p階預(yù)測(cè)器系數(shù)計(jì)算出第p+1階預(yù)測(cè)器的系數(shù),說者說,如何找出二者的迭代計(jì)算關(guān)系式。levinson算法的推導(dǎo)方法有多種,下面介紹1980年提出的一種推導(dǎo)方法,稱之為缺口推導(dǎo)方法(gapped function method)23 1 1圖5-3 由p階預(yù)測(cè)器遞推p+1階預(yù)測(cè)器缺口函數(shù)定義為預(yù)測(cè)誤差與觀測(cè)數(shù)據(jù)(即xn-1,xn-2, ,xn-p)之間的相互關(guān),即 (5-28)式中rex(k)代表與xn-1,xn-2, , xn-p之間的互相關(guān)函數(shù),r(k-l)代表滯后為(k-l)時(shí)x(n)的自相關(guān)函數(shù)。根據(jù)正交定理(見式(5-6)可得到 (5-29)這是p階預(yù)測(cè)器應(yīng)該滿足的條件?,F(xiàn)在的任務(wù)是利用 造p+1階預(yù)測(cè)器的缺口函數(shù).顯然,gp+1(k)的缺口應(yīng)該等于p+1.為此,先將對(duì)稱于縱軸進(jìn)行折疊,得 ;然后將其右移p+1個(gè)單位,于是得到 現(xiàn)在 與 的缺口已經(jīng)對(duì)齊了。為了得到一個(gè)缺口寬度為p+1的新的缺口函數(shù),可將 乘以某個(gè)常量 ,然后將其從 中減去,這樣便得到一個(gè)新的缺口函數(shù),用 表示,即 (5-30)式中 的選擇應(yīng)使缺口擴(kuò)大一個(gè)單位(從原來的p增為p+1)。為此,選擇 使下式成立: (5-31)這就是說,選擇 使得 的缺口右邊的第一個(gè)取樣值經(jīng)加權(quán)后恰好等于 缺口右邊的第一個(gè)取樣值。式(5-31)即 (5-32)由此得到 (5-33)根據(jù)式(5-28)關(guān)于缺口函數(shù)的定義,可以得到 (5-34)將式(5-34)代入(5-33),得到 (5-35)這個(gè)加權(quán)系數(shù)稱做為反射系數(shù)。由式(6.10)知道,最小均方誤差等于 (5-36)為了區(qū)別不同階段的預(yù)測(cè)器的最小均方預(yù)測(cè)誤差,用下標(biāo)來表示階,例如第p階預(yù)測(cè)器的最小均方預(yù)測(cè)誤差用 表示。于是,有聯(lián)系到缺口函數(shù)的定義式(5-28),式(5-36)也可以寫成類似地有 (5-37)將式(5-33)代入上式,得到 (5-38)這就是最小均方預(yù)測(cè)誤差的遞推計(jì)算公式。下面推導(dǎo)線性預(yù)測(cè)系數(shù)的遞推計(jì)算公式。首先寫出p階和p+1階線性預(yù)測(cè)器的缺口函數(shù)的定義式: (5-39)對(duì)上二式求z變換得到 (5-40)式中的和 是 和 的z變換; 是r(k)的z變換,即信號(hào)x(n)的功率譜; 和 分別是序列 (l=0,1, ,p+1)的z變換,稱為預(yù)測(cè)多項(xiàng)式,即 (5-41)另一方面,取式(5-31)的z變換得到 (5-42)將式(5-40)代入式(5-42),得 (5-43)考慮到自相關(guān)函數(shù)的對(duì)稱性,由上式可以得出這就是由p階預(yù)測(cè)多項(xiàng)式迭代計(jì)算p+1階預(yù)測(cè)多項(xiàng)式的公式。對(duì)上式取反z變換,便得到預(yù)測(cè)系數(shù)的迭代計(jì)算式 (5-44)或 (5-45)以上三個(gè)式子是相互等效的??偟膩碚f,式(5-35),(5-38),和(5-43)便構(gòu)成了完整的levinson迭代算法。迭代計(jì)算從零階即從p=0開始。零階預(yù)測(cè)即不做預(yù)測(cè),這時(shí)預(yù)測(cè)多項(xiàng)式為 預(yù)測(cè)誤差為預(yù)測(cè)誤差功率為以上便是迭代計(jì)算的初始條件。迭代計(jì)算步驟如下:(1) 初始化(2)假設(shè)已知p階預(yù)測(cè)器的參數(shù),即已知 和 。(3)計(jì)算p+1階預(yù)測(cè)器的反射系數(shù)(4)計(jì)算p+1階預(yù)測(cè)器的預(yù)測(cè)多項(xiàng)式(5)計(jì)算p+1階預(yù)測(cè)誤差功率(式(5-38))(6)返回第(2)步。當(dāng)?shù)^程達(dá)到預(yù)先指定的階時(shí),迭代計(jì)算終止。計(jì)算結(jié)束后,得到了以下三類結(jié)果: (1)各階預(yù)測(cè)器的預(yù)測(cè)系數(shù)。(2)各階預(yù)測(cè)器的反射系數(shù)。(2) 各階預(yù)測(cè)器誤差功率。5.5 線性預(yù)測(cè)的頻域解釋迄今為止,一直是在時(shí)域中根據(jù)差分方程和相關(guān)函數(shù)來討論線性預(yù)測(cè)問題。本節(jié)將從頻域的角度對(duì)線性預(yù)測(cè)做出解釋,從而得到更深刻的認(rèn)識(shí)。對(duì)語音進(jìn)行線性預(yù)測(cè)分析的結(jié)果,對(duì)應(yīng)于每一幀語音將得到一組線性預(yù)測(cè)系數(shù)。這組系數(shù)正是語音產(chǎn)生模型中全極點(diǎn)線性濾波器的參數(shù)。說的準(zhǔn)確些,這組系數(shù)正是濾波器的傳輸函數(shù)的分母和多項(xiàng)式的系數(shù)。由于全極點(diǎn)濾波器是聲門,聲道的共振特性。當(dāng)根據(jù)一幀語音取樣求得一組線性預(yù)測(cè)系數(shù)后,也就意味著求得了這真語音信號(hào)的產(chǎn)生模型中全極點(diǎn)線性濾波器的頻率特性。根據(jù)語音信號(hào)的產(chǎn)生模型,語音的功率譜等于激勵(lì)源的功率譜與全極點(diǎn)線性濾波器頻率特性的摸的平方的乘積。激勵(lì)源是(準(zhǔn)周期)沖激序列或白噪聲,其功率譜是平坦的,因此語音的功率譜主要地由全極點(diǎn)濾波器的頻率特性所確定,這樣,線性預(yù)測(cè)可以看成是對(duì)語音信號(hào)的短時(shí)譜進(jìn)行估計(jì)的一種有效方法。 6 算法的軟件實(shí)現(xiàn)本設(shè)計(jì)選擇了levinson-durbin算法,并對(duì)其進(jìn)行了軟件實(shí)現(xiàn)。首先我先采用c語言對(duì)此算法進(jìn)行了編程,然后又用vc語言使其生成一個(gè)動(dòng)態(tài)鏈接庫,最后用matlab調(diào)用該動(dòng)態(tài)鏈接庫,最終完成了matlab對(duì)該算法的軟件實(shí)現(xiàn)。在以下的章節(jié),將對(duì)上述步驟做進(jìn)一步的闡述。為了使運(yùn)算結(jié)果清晰直觀,在matlab中還采用了界面顯示結(jié)果的方式,使得處理的運(yùn)算結(jié)果更加直觀。關(guān)于圖形用戶界面的生成,雖然不屬于本設(shè)計(jì)的主體部分,但本設(shè)計(jì)也做了一定層面的研究。6.1 matlab語言簡(jiǎn)介matlab是matrix和laboratory前三個(gè)字母的縮寫,意思是“矩陣實(shí)驗(yàn)室”,是mathworks公司推出的數(shù)學(xué)類科技應(yīng)用軟件。其dos版本發(fā)行于1984年,現(xiàn)已推出了windows版本。經(jīng)過十多年的不斷發(fā)展和完善,它已成為國際上公認(rèn)的最優(yōu)秀的科技應(yīng)用軟件。它具有如下主要特點(diǎn):1)具有豐富的數(shù)學(xué)功能,其中包括矩陣各種運(yùn)算,如正交變換,三角分解,特征值,常見的特殊矩陣;包括各種特殊函數(shù),如貝塞爾函數(shù),勒讓德函數(shù),伽嗎函數(shù),貝塔函數(shù),橢圓函數(shù)等;包括各種數(shù)學(xué)運(yùn)算功能,如數(shù)值微分,數(shù)值積分,插值,求極值,方程求根,fft,常微分方程的數(shù)值解,殘數(shù)計(jì)算等等。也就是說,matlab給使用者提供了足夠多的數(shù)學(xué)工具,以便他們來解決各種各樣的理論問題和工程問題。2)具有很好的繪圖功能,可方便地畫出二維和三維圖形,如直角坐標(biāo)曲線圖,極坐標(biāo)曲線,直方圖,對(duì)數(shù)坐標(biāo)曲線,網(wǎng)格圖,三維曲面圖,等高線圖,區(qū)域圖等,同時(shí)屏幕上出現(xiàn)的各種圖形均可輸送到打印機(jī)直接打印,或輸送到windows的剪貼板內(nèi)供各種應(yīng)用軟件調(diào)用。3)使用方便,便于掌握,便于修改,使用matlab語言編寫的程序可直接運(yùn)行而無須進(jìn)行編譯。具有很友好的圖形界面,且使用者可根據(jù)自己的需求方便的編寫出自己所希望的圖形界面。擴(kuò)充性能很好,使用者可使用此語言編寫出自己所需的各種函數(shù),同時(shí)采用一定的措施之后可以直接調(diào)用c語言的函數(shù)及fortran語言的子程序。4)具有若干功能強(qiáng)大的應(yīng)用工具箱,如語音處理,通信,小波變換,圖象處理,統(tǒng)計(jì),仿真,插值,符號(hào)運(yùn)算,系統(tǒng)識(shí)別,系統(tǒng)優(yōu)化,神經(jīng)網(wǎng)絡(luò),數(shù)據(jù)庫,功率系統(tǒng),地圖,偏微分方程,系統(tǒng)控制,模糊邏輯等。5)可以直接處理計(jì)算機(jī)內(nèi)的聲音文件;安裝圖形處理工具箱后,可以直接處理各種格式的圖形文件,如:bmp,gif,pcx,和jpeg等等。matlab的命令又稱為函數(shù),其名稱的后綴為.m。matlab語言采用解釋運(yùn)行的方式,在這一點(diǎn)上它的運(yùn)行方式與basic語言類似,在程序運(yùn)行的過程中可以隨時(shí)顯示中間的結(jié)果,這樣便于查找程序中的錯(cuò)誤。另外由于用matlab語言編寫的程序無須進(jìn)行編譯,因此它本身就像一個(gè)超級(jí)的函數(shù)計(jì)算器。由于很多的matlab語言的命令與人們通常的書寫習(xí)慣類似,因此有人又稱之為演算紙似的科學(xué)工程計(jì)算語言。由于matlab語言本身所具有的種種特點(diǎn),它特別適合對(duì)電子系統(tǒng)進(jìn)行信號(hào)處理,在通信等工具箱內(nèi),設(shè)有專門為電子系統(tǒng)設(shè)計(jì)的各種專門的函數(shù),可以進(jìn)行各種模擬和數(shù)字濾波器的設(shè)計(jì)和分析。matlab語言的另一個(gè)突出的優(yōu)點(diǎn)就是便于學(xué)習(xí),容易掌握。一般來說,一個(gè)初學(xué)者可在幾十分鐘內(nèi)學(xué)會(huì)并掌握它的基本操作命令,進(jìn)而就可以解決一些比較煩瑣的數(shù)學(xué)運(yùn)算問題,如矩陣求逆。由于matlab給使用者提供了極為豐富的,現(xiàn)成的數(shù)學(xué)工具,因此使用者無須掌握很復(fù)雜的編程技巧,如排隊(duì),指針,堆棧等等。另外,matlab本身提供了十分明確,十分詳細(xì)的聯(lián)機(jī)幫助文件,便于使用者進(jìn)行自學(xué),而無須依賴教師指導(dǎo)。6.2 vc中mex程序的建立和設(shè)置 一個(gè)mex程序?qū)嶋H上就是一個(gè)特別的dll,它的輸出函數(shù)為mexfunction。 那么在vc中就可用project wizard 建立一個(gè)dll工程,并為其指定輸出函數(shù)為mexfunction。1. 建立新的dll工程啟動(dòng)vc,選擇菜單file/new,在projects頁面中選擇mfc appwizard(dll),輸入路徑名和工程名,并單擊ok按鈕。這里將工程命名為mextest。2. 設(shè)定輸出函數(shù) appwizard 將會(huì)自動(dòng)生成如下幾個(gè)文件:* mextest.cpp* mextest.def * mextest.rc * stdafx.cpp需要mextest.def中指定該dll文件的輸出函數(shù),也就是mexfunction。為此,在vc的workspace欄中,單擊“fileview”屬性頁,展開“sourse files”欄,打開文件mextest.def,將其內(nèi)容進(jìn)行編譯,在“exports”后面加入mexfunction一行。3. 環(huán)境設(shè)置 由于再編譯和連接mex程序的時(shí)候,需要用到matlab提供的若干頭文件和庫文件,因此應(yīng)該對(duì)這些文件的路徑進(jìn)行指定。在matlab6以前的版本中,沒有提供必要的庫文件,只提供了必要的def文件,必須由用戶自己用lib命令手工將def文件轉(zhuǎn)換為lib文件,步驟比較麻煩。在matlab6中,則直接提供lib文件,不需要用戶生成了。matlab對(duì)于不同版本的編譯器提供了不同的庫文件,分別放在
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 煙酒服務(wù)協(xié)議書
- 打磨機(jī)安全培訓(xùn)
- 轉(zhuǎn)讓農(nóng)家樂門面合同協(xié)議
- 足浴技師招聘合同協(xié)議
- 遼寧奶站轉(zhuǎn)讓合同協(xié)議
- 邊界協(xié)議書格式
- 車輛買賣協(xié)議書和合同
- 審計(jì)保障企業(yè)合規(guī)的重要性試題及答案
- 精神障礙政策培訓(xùn)體系構(gòu)建
- 無人機(jī)組裝技能試題及答案分享
- 2024-2030年中國湖北省建筑行業(yè)市場(chǎng)深度分析及發(fā)展趨勢(shì)預(yù)測(cè)報(bào)告
- 中考語文一輪復(fù)習(xí)-名著閱讀勾連整合課件
- 紀(jì)委案件評(píng)查培訓(xùn)課件
- 魁北克腰痛障礙評(píng)分表(Quebec-Baclain-Disability-Scale-QBPDS)
- 基于S7-1200PLC的碼頭單向皮帶輸送機(jī)控制系統(tǒng)
- 開源軟件價(jià)值評(píng)估與度量
- 2020年全國中學(xué)生生物學(xué)聯(lián)賽試題解析
- 2024年南網(wǎng)國際公司招聘筆試參考題庫含答案解析
- 2023年江蘇南京林業(yè)大學(xué)招聘90人(第二批)筆試參考題庫(共500題)答案詳解版
- 集裝箱七點(diǎn)檢查表
- 功能室使用記錄表
評(píng)論
0/150
提交評(píng)論