語音信號畢業(yè)設(shè)計(jì)論文.doc

上傳人：伐*** IP屬地：寧夏上傳時(shí)間：2019-01-27 格式：DOC 頁數(shù)：68 大?。?83KB 積分：20 舉報(bào) 版權(quán)申訴

已閱讀5頁，還剩63頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1 緒論1.1 綜述語音是人類信息活動(dòng)的重要手段之一，語音不僅是人與人之間進(jìn)行信息交流的最直接最方便的和最有效的工具。人機(jī)對話意味著計(jì)算機(jī)應(yīng)該具有語音輸入和語音識(shí)別的功能，即計(jì)算機(jī)具有聽覺，能夠“聽懂”人話，這就是語音識(shí)別的功能。無論，人與人之間，還是人與計(jì)算機(jī)之間的語音通信，語音信號處理，特別是語音信號處理的理論和技術(shù)，都具有特別重要的作用。數(shù)字語音處理包含三個(gè)方面內(nèi)容：語音信號的數(shù)字表達(dá)方法語音信號的數(shù)字處理的各種方法以及數(shù)字語音處理理論和技術(shù)在各個(gè)領(lǐng)域的應(yīng)用。這些內(nèi)容涉及到了數(shù)字信號處理計(jì)算機(jī)科學(xué)模式識(shí)別語音學(xué)生理學(xué)等學(xué)科，還涉及到通信和電子系統(tǒng)，信號和信息處理系統(tǒng)等具體的應(yīng)用領(lǐng)域。對于語音信號，數(shù)字處理比模擬處理具有更多優(yōu)點(diǎn)。這是因?yàn)椋旱谝唬瑪?shù)字技術(shù)能夠完成很多很復(fù)雜的信號處理工作；第二，通過語音進(jìn)行交換的信息，本質(zhì)上具有離散的性質(zhì)，因?yàn)檎Z音可以看成是語素的組合，這就特別適用于數(shù)字處理；第三，數(shù)字語音具有更高的可靠性價(jià)廉緊湊快速等特點(diǎn)，很容易完成實(shí)時(shí)處理要求；第四，數(shù)字語音具有在強(qiáng)干擾信道中傳輸?shù)奶攸c(diǎn)，易于和數(shù)據(jù)一起在通信網(wǎng)中傳輸，也易于進(jìn)行加密傳輸，因此，數(shù)字語音也是主要研究方向。語音信號處理的方法是多種多樣的。和一般的數(shù)字與信號的處理相類似，其方法可以是時(shí)域的，也可以是頻域的，但都應(yīng)考慮到語音信號本身的特點(diǎn)。語音信號是時(shí)變信號，只是在一個(gè)一個(gè)短段內(nèi)才可以看成平穩(wěn)的，因此，短時(shí)處理是處理語音信號的一種基本方法。在時(shí)域內(nèi)，這就是各種短時(shí)處理技術(shù)的方法，如短時(shí)能量短是平均過零率及短時(shí)自相關(guān)函數(shù)等計(jì)算；在頻域內(nèi)，這就是短時(shí)傅立葉變換方法。線性預(yù)測技術(shù)本質(zhì)上屬于時(shí)域分析方法，但結(jié)果可以是頻域的參數(shù)。數(shù)字語音處理有著廣泛的應(yīng)用領(lǐng)域，其中最重要的包括：語音壓縮語音合成、語音識(shí)別以及語音增強(qiáng)。這些方面的研究以深入到通信辦公自動(dòng)化遠(yuǎn)距離控制聲控電話撥號計(jì)算機(jī)語音應(yīng)答，以及機(jī)器人聽覺和口語系統(tǒng)等實(shí)用的系統(tǒng)中。1.2主要研究內(nèi)容根據(jù)設(shè)計(jì)任務(wù)書的要求，本設(shè)計(jì)主要內(nèi)容如下：(1) 語音信號產(chǎn)生的數(shù)字模型，以及語音信號模型的建立機(jī)理。(2) 語音信號的時(shí)域分析。(3) 語音信號的頻域分析。(4) 語音信號的線性預(yù)測技術(shù)。(5) matlab軟件編程。第三第四章主要是介紹如何將本不平穩(wěn)的語音信號轉(zhuǎn)換為平穩(wěn)的語音信號，以及短時(shí)處理的一些基本理論和方法。第五章是本書要重點(diǎn)研究的內(nèi)容，也是語音處理一種非常重要的方法。第六章是對matlab的一些基本介紹和程序上的運(yùn)用。1.3語音處理技術(shù)的發(fā)展概況語音處理研究的歷史可追溯到1876年貝爾發(fā)明電話，那是首次采用聲電電聲轉(zhuǎn)換技術(shù)實(shí)現(xiàn)遠(yuǎn)距離語音通訊。1939年h.dudley 研制成功了第一個(gè)聲碼器，這一發(fā)明奠定了語音數(shù)字模型的基本思想，在語音信號處理領(lǐng)域具有劃時(shí)代的意義。1958年duddley等人改進(jìn)了數(shù)字實(shí)驗(yàn)裝置，將語音分割為元音和輔音等單元。六十年代以來，有關(guān)語音信號處理的論文數(shù)量達(dá)到高峰，但處理方多以軟件形式出現(xiàn)。八十年代以來出現(xiàn)的語音信號處理產(chǎn)品的熱潮.ibm于1997年推出的漢語聽寫機(jī)，為語音識(shí)別技術(shù)的實(shí)際應(yīng)用開辟了新的道路。近幾年來，語音信號處理不僅在理論上取得了重大進(jìn)步，而且其應(yīng)用范圍也不斷擴(kuò)大。如自動(dòng)控制系統(tǒng)，公共交通中的自動(dòng)報(bào)站各種場合的自動(dòng)報(bào)警公安機(jī)關(guān)破案等國家安全事務(wù)有重要應(yīng)用。現(xiàn)在，語音信號處理的理論與方法已成為許多專業(yè)的共同基礎(chǔ)。2 語音信號的數(shù)字建模語音信號分析大體上有時(shí)域、頻域、倒譜域等分析方法。但是按語音學(xué)觀點(diǎn)，可將它分為模型分析法和非模型分析法兩種。模型分析法是依據(jù)語音信號的數(shù)學(xué)模型的理論來求得這些模型參數(shù)，而將其它分析方法籠統(tǒng)地歸于非模型分析法中。模型分析法中的各種模型只適合于信號是平穩(wěn)或局部平穩(wěn)的情形。由于不同的語音是由人的口腔肌肉運(yùn)動(dòng)構(gòu)成聲道某種形狀而產(chǎn)生的響應(yīng)，而這種肌肉運(yùn)動(dòng)相對于語音頻率來說是極緩慢的，因此一般認(rèn)為在2040ms的短時(shí)間內(nèi)語音信號是平穩(wěn)的，所以完全可以用短時(shí)平穩(wěn)的分析方法。語音信號產(chǎn)生模型是對發(fā)聲器官的模擬和仿真。數(shù)字模型就是用數(shù)字處理方法實(shí)現(xiàn)這種物理系統(tǒng)的模擬，由此可估計(jì)出語音波形的參數(shù)，因此，這種數(shù)字模型也是語音參數(shù)模型。我們知道發(fā)聲器官能發(fā)出一系列的聲波是出于聲道受到氣流的激勵(lì)而產(chǎn)生的。聲道的一端是喉，另一端是嘴，其中包含有聲帶、聲門、口腔和鼻腔等。根據(jù)聲帶振動(dòng)與否，語音可分為濁音和清音兩大類。聲帶在氣流的作用下發(fā)生振動(dòng)，從而產(chǎn)生準(zhǔn)周期的聲波激勵(lì)，這種激勵(lì)經(jīng)過口腔和鼻腔的諧振作用而形成濁音，有時(shí)稱為有聲音。氣流經(jīng)過口腔的唇齒部分，如果引起湍流就產(chǎn)生摩擦音，有時(shí)因?yàn)榇讲客蝗粡堥_而形成爆破音。凡是聲帶不振動(dòng)的聲音，統(tǒng)稱清音，有時(shí)也稱為無聲音。用數(shù)字方法模擬這種功能時(shí)，用準(zhǔn)周期的脈沖序列來模擬聲帶振動(dòng)的激勵(lì)，而用隨機(jī)噪聲模擬清音的激勵(lì)，口腔、鼻腔等所組成的聲道諧振特性可用時(shí)變數(shù)字濾波器來模擬。所謂建立數(shù)學(xué)模型，就是要尋找一種可以表達(dá)一定物理狀態(tài)下量與量的數(shù)學(xué)表示。建立了數(shù)學(xué)模型才能夠用計(jì)算機(jī)對語音信號進(jìn)行模擬和處理。建立數(shù)學(xué)模型的基本原則是要使這種關(guān)系不僅能具有最大的精確度，還要最簡單。數(shù)字濾波器的頻率響應(yīng)受到一些參數(shù)的控制。不斷控制清濁音開關(guān)、激勵(lì)脈沖的周期以及噪聲源強(qiáng)度，同時(shí)隨著不同的發(fā)音改變?yōu)V波器特性，輸出的信號就是所要求的語音信號序列。通過對發(fā)音機(jī)理和語音信號的產(chǎn)生機(jī)理的分析，可以將語音信號分為三個(gè)部分，在聲帶以下，稱為“聲門子系統(tǒng)”，它負(fù)責(zé)產(chǎn)生激勵(lì)振動(dòng)，是“激勵(lì)系統(tǒng)”；從聲門到嘴唇的呼氣通道是聲道，是“聲道系統(tǒng)”；語音從嘴唇輻射出去，所以嘴唇以外是“輻射系統(tǒng)”。如圖2-1所示為語音信號的產(chǎn)生模型：圖2-1 語音信號產(chǎn)生模型語音信號是一個(gè)局部平穩(wěn)的隨機(jī)信號，它的激勵(lì)參數(shù)和聲道濾波器的參數(shù)均隨時(shí)間而變化，但是由于發(fā)聲器官的慣性使這些參數(shù)的變化速度受到限制，對于聲道參數(shù)，在一較短的時(shí)間內(nèi)(1030ms)可近似認(rèn)為是不變的，因此語音的短時(shí)分析幀長一般取為20ms左右。對于激勵(lì)源參數(shù)，大多數(shù)情況下這一結(jié)論也是正確的。但是有些音的變化速度特別快，例如塞音或塞擦音的爆破段，20ms的時(shí)間間隔就過長，這時(shí)取5ms的間隔更為恰當(dāng)。模型中將語音信號截然分為受周期脈沖激勵(lì)和噪聲激勵(lì)兩種情況，與實(shí)際情況并不完全符合，將清濁音開關(guān)換為疊加號更為合適，這樣激勵(lì)信號可以是上述兩種激勵(lì)按任意比例相疊加，這更加符合實(shí)際情況(即使如此，這個(gè)模型也不能完全包括所有的情況)。除了這些限制以外，這個(gè)模型的局限性主要表現(xiàn)在它的傳輸函數(shù)不包含有限傳輸零點(diǎn)，而像鼻音、擦音這樣一些音的聲道傳輸函數(shù)中是包含有限零點(diǎn)的。一種解決問題的方法是在聲道模型中引入若干有限傳輸零點(diǎn)，但是這將使模型復(fù)雜化。另一種方法是適當(dāng)提高階數(shù)p，使得全極點(diǎn)模型能更好地逼近具有此種零點(diǎn)的傳輸函數(shù)。綜上所述，完整的語音信號得數(shù)字模型可以用三個(gè)子模型：激勵(lì)模型聲道模型和輻射模型的串聯(lián)來表示。它的傳遞函數(shù)可表示為：h（z）=au（z）v（z）r（z）（2-1）這里，u（z）是激勵(lì)信號，濁音時(shí)u（z）是聲門脈沖即斜三角脈沖序列的z變換；在清音的情況下，u（z）是一個(gè)隨機(jī)噪聲的z變換。v（z）是聲道傳輸函數(shù)，既可以用聲管模型，也可以用共峰模型來描述。實(shí)際上就是全集點(diǎn)模型：應(yīng)該指出，式（2-1）所示模型的內(nèi)部結(jié)構(gòu)并不和物理過程相一致，但這種模型和真實(shí)的模型在輸出上是一致的。另外，這種模型是“短時(shí)”的模型，因?yàn)橐恍┱Z音信號的變化是緩慢的，例如元音在1020ms內(nèi)其參數(shù)是假定不變的。這里聲道轉(zhuǎn)移函數(shù)v（z）是一個(gè)參數(shù)隨時(shí)間變化的模型。另外，這一模型認(rèn)為語音是聲門激勵(lì)線形預(yù)測系統(tǒng)聲道所產(chǎn)生的；實(shí)際上，聲帶-聲道相互作用的非線形特征還有待研究。另外，模型中，用濁音和清音這種簡單的劃分方法是有缺陷的，對于某些音是不適用的，例如濁音當(dāng)中的摩擦音。這種音要有發(fā)濁音和發(fā)清音的兩種激勵(lì)，而且兩者不是簡單的疊加關(guān)系。對于這些音可以用一些修正模型或更精確的模型來模擬.3 語音信號的時(shí)域分析語言信號的時(shí)域分析就是分析和提取語音信號的時(shí)域參數(shù)。進(jìn)行語音分析時(shí)，最先接觸到并且也是最直觀的是它的時(shí)域波形。語音信號本身就是時(shí)域信號，因而時(shí)域分析就是最早使用，也是應(yīng)用最廣泛的一種分析方法，這種方法直接利用語音信號的時(shí)域波形。時(shí)域分析通常用于最基本的參數(shù)分析及應(yīng)用，如語音的分割、預(yù)處理、大分類等。這種分析方法的特點(diǎn)是：（1）表示語音信號比較直觀、物理意義明確。（2）實(shí)現(xiàn)起來比較簡單、運(yùn)算量少。（3）可以得到語音的一些重要參數(shù)。（4）只使用示波器等通用設(shè)備，使用較為簡單等。語音信號的時(shí)域參數(shù)有短時(shí)能量、短時(shí)過零率、短時(shí)自相關(guān)函數(shù)和短視平均幅度差函數(shù)等，這是語音信號的一組最基本的短時(shí)參量，在各種語音信號數(shù)字處理技術(shù)中都要應(yīng)用。在計(jì)算這些參量時(shí)使用的一般是方窗或汗明窗。現(xiàn)在分別討論如下。3.1短時(shí)能量及短時(shí)平均幅度分析設(shè)語音波形時(shí)域信號為x(l)、加窗分鎮(zhèn)處理后得到的第n真語音信號為xn(m), 則xn(m)滿足下式： xn(m)=w(m)x(n+m) 0m0)。因此由式（5-16）看出 , k-10或l0)的情況下，h(z)只有極點(diǎn)，即 (5-20)相應(yīng)的差分方程為 (5-21)信號的功率譜為 (5-22)這種形式的信號模型稱為全極點(diǎn)模型或自回歸模型（簡稱為ar模型）。p階自回歸模型一般表示為ar（p）。這是一種最重要，應(yīng)用最廣的模型。對于ar(p)模型，式(6.20)中的bl應(yīng)代之以單位取樣序列，于是得到 (5-23) 考慮到h(k)的因果性，即當(dāng)k0時(shí)有h(-k)=0；同時(shí)根據(jù)初值定理1知道 (5-24)所以，式(6.24)可簡: (5-25) 式中a0=1。這就是ar(p)模型的模型參數(shù)與信號自相關(guān)函數(shù)之間的關(guān)系式。將其與線性預(yù)測的yule-walker方程式(5-11)對照可以看出，如果線性預(yù)測和信號模型是對同一信號而言的，即兩個(gè)方程組中的已知數(shù)相同rzz(k-l)=r(k-l),那么兩組方程的解應(yīng)當(dāng)相同（可以證明，只要r（k-l）或rzz(k-l)是正定的，則兩組方程有唯一解），即 (5-26)這意味著，解最佳線性預(yù)測問題等效于解信號模型問題。具體地說，信號x(n)的線性系數(shù)和它的ar(p)模型參數(shù)al相同，而預(yù)測誤差功率與模型的極力源的功率相同。一個(gè)平穩(wěn)隨機(jī)過程，如果它是p階自回歸過程，那么用一個(gè)ar（p）模型就能精確地描述它。在第二章曾經(jīng)討論過，語音信號可以看成是一個(gè)線性時(shí)變系統(tǒng)在準(zhǔn)周期脈沖序列（相應(yīng)于濁音）或隨機(jī)噪聲（相應(yīng)與清音）激勵(lì)下所產(chǎn)生的輸出，參看圖2.1。在語音信號的這個(gè)數(shù)字模型中，時(shí)變線性系統(tǒng)綜合反映了輻射、聲門脈沖以及聲道的總的影響，并且對于除鼻音和摩擦音以外的大多數(shù)語音來說，都可以用一個(gè)全極點(diǎn)系統(tǒng)來表示。這個(gè)全極點(diǎn)時(shí)變線性系統(tǒng)的參數(shù)隨著時(shí)間的變化是非常緩慢的，因而可以近似地認(rèn)為，在一語音時(shí)間內(nèi)它是非時(shí)變的。這樣一來，圖2.1所表示的語音信號模型，正是一個(gè)平穩(wěn)隨機(jī)過程的自回歸模型（在短時(shí)間內(nèi)可以近似的認(rèn)為語音信號是平穩(wěn)的）。根據(jù)本節(jié)前面的討論，很容易理解，線性預(yù)測是描述語音信號的一種很精確的方法。對語音信號進(jìn)行線性預(yù)測分析，其合理性和精確性可以從另一個(gè)角度來加以解釋。線性預(yù)測系數(shù)（等效于語音信號的模型參數(shù)）是根據(jù)最小均方誤差準(zhǔn)則來決定的，而最小均方誤差恰等于信號模型的激勵(lì)源的方差；另一方面，語音信號模型的激勵(lì)源只能是準(zhǔn)周期沖激序列或隨機(jī)白噪聲序列激勵(lì)，而這兩種序列的均方值都是最小的。由此可見，對語音信號進(jìn)行線性預(yù)測分析是合理的。反過來說，如果用某個(gè)準(zhǔn)周期沖激序列或隨機(jī)白噪聲序列激勵(lì)一個(gè)全極點(diǎn)系統(tǒng)，產(chǎn)生出某個(gè)信號，然后根據(jù)該信號p個(gè)取樣值對信號的當(dāng)前值進(jìn)行預(yù)測，而且在均方誤差最小的意義上這種預(yù)測是最佳的，那么預(yù)測系數(shù)必將等于全極點(diǎn)系統(tǒng)的參數(shù)。最后需要指出，對語音信號x(n) 進(jìn)行線性預(yù)測，實(shí)際上意味著建立一個(gè)由白噪聲源激勵(lì)一個(gè)全極點(diǎn)系統(tǒng)的自回歸模型，使得該模型產(chǎn)生的信號在z(n)的自相關(guān)函數(shù)與語音信號x(n)的自相關(guān)函數(shù)相匹配，或者說使得z(n)和x(n)的譜包絡(luò)相匹配。5.4 levinson-durbin 算法通過以上討論可以看到：求取信號的模型參數(shù)可以通過線性預(yù)測來完成，而線性預(yù)測系數(shù)以及預(yù)測誤差功率可以有式（5.11）所表示的yule-walker方程解出。本節(jié)討論由已知的自相關(guān)函數(shù)，通過解式(5.11)以求取線性預(yù)測系數(shù)及預(yù)測誤差功率的方法。將式(5.11)寫成矩陣形式，并注意到平穩(wěn)隨機(jī)信號的自相關(guān)函數(shù)的對稱性質(zhì)，可以得到下面的結(jié)果：（5-27）值得注意的是，上列方程組的系數(shù)矩陣中，沿任何一條對角線上的元素都相同，這樣的矩陣稱為toeplitz矩陣，同時(shí)系數(shù)矩陣還是一個(gè)對稱矩陣。利用系數(shù)矩陣的對稱toeplitz性質(zhì)，提出了一種高效算法來求解該方程組，這就是著名的levinson-durbin算法，簡稱為levinson算法，該算法的運(yùn)算數(shù)量級為o(p2)，而線性方程組的一般解法的運(yùn)算量數(shù)量級為o(p3)，后者比前者要大的多。levinson算法是一個(gè)迭代計(jì)算過程。它從最低預(yù)測器開始，由低階到高階，逐階進(jìn)行遞推計(jì)算。即是說，總是由前一階段預(yù)測器求出了所要求的p階預(yù)測器的系數(shù)，而且得到了所有低階預(yù)測器的系數(shù)。在圖5-2中，最上面表示了過去p個(gè)取樣值預(yù)測當(dāng)前值xn；下面依次畫出了1階、2階、3階、p階預(yù)測器的預(yù)測系數(shù)；旁邊寫出了個(gè)階預(yù)測誤差。預(yù)測系數(shù)有兩個(gè)下標(biāo)，第一個(gè)下標(biāo)表示階數(shù)，第二個(gè)下標(biāo)表示該階預(yù)測器系數(shù)的序數(shù)。 1 1 1 1 圖5-2levinson算法遞推示意圖為了說明levinson算法的迭代計(jì)算過程，現(xiàn)在討論在已知第p階預(yù)測器系數(shù)后如何求出第p+1階預(yù)測器系數(shù)的問題。圖5.3表示了第p階預(yù)測器和第p+1階預(yù)測器，其中第p階預(yù)測器假定是已知的。現(xiàn)在的問題是，如何根據(jù)第p階預(yù)測器系數(shù)計(jì)算出第p+1階預(yù)測器的系數(shù)，說者說，如何找出二者的迭代計(jì)算關(guān)系式。levinson算法的推導(dǎo)方法有多種，下面介紹1980年提出的一種推導(dǎo)方法，稱之為缺口推導(dǎo)方法(gapped function method)23 1 1圖5-3 由p階預(yù)測器遞推p+1階預(yù)測器缺口函數(shù)定義為預(yù)測誤差與觀測數(shù)據(jù)（即xn-1,xn-2, ,xn-p）之間的相互關(guān)，即（5-28）式中rex（k）代表與xn-1,xn-2, , xn-p之間的互相關(guān)函數(shù)，r（k-l）代表滯后為(k-l)時(shí)x(n)的自相關(guān)函數(shù)。根據(jù)正交定理(見式(5-6)可得到 (5-29)這是p階預(yù)測器應(yīng)該滿足的條件。現(xiàn)在的任務(wù)是利用造p+1階預(yù)測器的缺口函數(shù).顯然,gp+1(k)的缺口應(yīng)該等于p+1.為此，先將對稱于縱軸進(jìn)行折疊，得；然后將其右移p+1個(gè)單位，于是得到現(xiàn)在與的缺口已經(jīng)對齊了。為了得到一個(gè)缺口寬度為p+1的新的缺口函數(shù)，可將乘以某個(gè)常量 ,然后將其從中減去，這樣便得到一個(gè)新的缺口函數(shù)，用表示，即（5-30）式中的選擇應(yīng)使缺口擴(kuò)大一個(gè)單位（從原來的p增為p+1）。為此，選擇使下式成立：（5-31）這就是說，選擇使得的缺口右邊的第一個(gè)取樣值經(jīng)加權(quán)后恰好等于缺口右邊的第一個(gè)取樣值。式(5-31)即（5-32）由此得到（5-33）根據(jù)式（5-28）關(guān)于缺口函數(shù)的定義，可以得到（5-34）將式(5-34)代入(5-33),得到（5-35）這個(gè)加權(quán)系數(shù)稱做為反射系數(shù)。由式（6.10）知道，最小均方誤差等于（5-36）為了區(qū)別不同階段的預(yù)測器的最小均方預(yù)測誤差，用下標(biāo)來表示階，例如第p階預(yù)測器的最小均方預(yù)測誤差用表示。于是，有聯(lián)系到缺口函數(shù)的定義式（5-28），式（5-36）也可以寫成類似地有（5-37）將式（5-33）代入上式，得到（5-38）這就是最小均方預(yù)測誤差的遞推計(jì)算公式。下面推導(dǎo)線性預(yù)測系數(shù)的遞推計(jì)算公式。首先寫出p階和p+1階線性預(yù)測器的缺口函數(shù)的定義式：（5-39）對上二式求z變換得到（5-40）式中的和是和的z變換；是r(k)的z變換，即信號x(n)的功率譜；和分別是序列 (l=0,1, ,p+1)的z變換，稱為預(yù)測多項(xiàng)式，即（5-41）另一方面，取式（5-31）的z變換得到（5-42）將式（5-40）代入式（5-42）,得（5-43）考慮到自相關(guān)函數(shù)的對稱性,由上式可以得出這就是由p階預(yù)測多項(xiàng)式迭代計(jì)算p+1階預(yù)測多項(xiàng)式的公式。對上式取反z變換，便得到預(yù)測系數(shù)的迭代計(jì)算式（5-44）或（5-45）以上三個(gè)式子是相互等效的?？偟膩碚f，式(5-35)，（5-38），和（5-43）便構(gòu)成了完整的levinson迭代算法。迭代計(jì)算從零階即從p=0開始。零階預(yù)測即不做預(yù)測，這時(shí)預(yù)測多項(xiàng)式為預(yù)測誤差為預(yù)測誤差功率為以上便是迭代計(jì)算的初始條件。迭代計(jì)算步驟如下：（1）初始化（2）假設(shè)已知p階預(yù)測器的參數(shù)，即已知和。（3）計(jì)算p+1階預(yù)測器的反射系數(shù)（4）計(jì)算p+1階預(yù)測器的預(yù)測多項(xiàng)式（5）計(jì)算p+1階預(yù)測誤差功率(式（5-38）)（6）返回第（2）步。當(dāng)?shù)^程達(dá)到預(yù)先指定的階時(shí)，迭代計(jì)算終止。計(jì)算結(jié)束后，得到了以下三類結(jié)果：（1）各階預(yù)測器的預(yù)測系數(shù)。（2）各階預(yù)測器的反射系數(shù)。（2）各階預(yù)測器誤差功率。5.5 線性預(yù)測的頻域解釋迄今為止，一直是在時(shí)域中根據(jù)差分方程和相關(guān)函數(shù)來討論線性預(yù)測問題。本節(jié)將從頻域的角度對線性預(yù)測做出解釋，從而得到更深刻的認(rèn)識(shí)。對語音進(jìn)行線性預(yù)測分析的結(jié)果，對應(yīng)于每一幀語音將得到一組線性預(yù)測系數(shù)。這組系數(shù)正是語音產(chǎn)生模型中全極點(diǎn)線性濾波器的參數(shù)。說的準(zhǔn)確些，這組系數(shù)正是濾波器的傳輸函數(shù)的分母和多項(xiàng)式的系數(shù)。由于全極點(diǎn)濾波器是聲門，聲道的共振特性。當(dāng)根據(jù)一幀語音取樣求得一組線性預(yù)測系數(shù)后，也就意味著求得了這真語音信號的產(chǎn)生模型中全極點(diǎn)線性濾波器的頻率特性。根據(jù)語音信號的產(chǎn)生模型，語音的功率譜等于激勵(lì)源的功率譜與全極點(diǎn)線性濾波器頻率特性的摸的平方的乘積。激勵(lì)源是（準(zhǔn)周期）沖激序列或白噪聲，其功率譜是平坦的，因此語音的功率譜主要地由全極點(diǎn)濾波器的頻率特性所確定，這樣，線性預(yù)測可以看成是對語音信號的短時(shí)譜進(jìn)行估計(jì)的一種有效方法。 6 算法的軟件實(shí)現(xiàn)本設(shè)計(jì)選擇了levinson-durbin算法，并對其進(jìn)行了軟件實(shí)現(xiàn)。首先我先采用c語言對此算法進(jìn)行了編程，然后又用vc語言使其生成一個(gè)動(dòng)態(tài)鏈接庫，最后用matlab調(diào)用該動(dòng)態(tài)鏈接庫，最終完成了matlab對該算法的軟件實(shí)現(xiàn)。在以下的章節(jié)，將對上述步驟做進(jìn)一步的闡述。為了使運(yùn)算結(jié)果清晰直觀，在matlab中還采用了界面顯示結(jié)果的方式，使得處理的運(yùn)算結(jié)果更加直觀。關(guān)于圖形用戶界面的生成，雖然不屬于本設(shè)計(jì)的主體部分，但本設(shè)計(jì)也做了一定層面的研究。6.1 matlab語言簡介matlab是matrix和laboratory前三個(gè)字母的縮寫，意思是“矩陣實(shí)驗(yàn)室”，是mathworks公司推出的數(shù)學(xué)類科技應(yīng)用軟件。其dos版本發(fā)行于1984年，現(xiàn)已推出了windows版本。經(jīng)過十多年的不斷發(fā)展和完善，它已成為國際上公認(rèn)的最優(yōu)秀的科技應(yīng)用軟件。它具有如下主要特點(diǎn)：1）具有豐富的數(shù)學(xué)功能，其中包括矩陣各種運(yùn)算，如正交變換,三角分解，特征值，常見的特殊矩陣；包括各種特殊函數(shù)，如貝塞爾函數(shù)，勒讓德函數(shù)，伽嗎函數(shù)，貝塔函數(shù)，橢圓函數(shù)等；包括各種數(shù)學(xué)運(yùn)算功能，如數(shù)值微分，數(shù)值積分，插值，求極值，方程求根，fft，常微分方程的數(shù)值解，殘數(shù)計(jì)算等等。也就是說，matlab給使用者提供了足夠多的數(shù)學(xué)工具，以便他們來解決各種各樣的理論問題和工程問題。2）具有很好的繪圖功能，可方便地畫出二維和三維圖形，如直角坐標(biāo)曲線圖，極坐標(biāo)曲線，直方圖，對數(shù)坐標(biāo)曲線，網(wǎng)格圖，三維曲面圖，等高線圖，區(qū)域圖等，同時(shí)屏幕上出現(xiàn)的各種圖形均可輸送到打印機(jī)直接打印，或輸送到windows的剪貼板內(nèi)供各種應(yīng)用軟件調(diào)用。3）使用方便，便于掌握，便于修改，使用matlab語言編寫的程序可直接運(yùn)行而無須進(jìn)行編譯。具有很友好的圖形界面，且使用者可根據(jù)自己的需求方便的編寫出自己所希望的圖形界面。擴(kuò)充性能很好，使用者可使用此語言編寫出自己所需的各種函數(shù)，同時(shí)采用一定的措施之后可以直接調(diào)用c語言的函數(shù)及fortran語言的子程序。4）具有若干功能強(qiáng)大的應(yīng)用工具箱，如語音處理，通信，小波變換，圖象處理，統(tǒng)計(jì)，仿真，插值，符號運(yùn)算，系統(tǒng)識(shí)別，系統(tǒng)優(yōu)化，神經(jīng)網(wǎng)絡(luò)，數(shù)據(jù)庫，功率系統(tǒng)，地圖，偏微分方程，系統(tǒng)控制，模糊邏輯等。5）可以直接處理計(jì)算機(jī)內(nèi)的聲音文件；安裝圖形處理工具箱后，可以直接處理各種格式的圖形文件，如：bmp,gif,pcx,和jpeg等等。matlab的命令又稱為函數(shù)，其名稱的后綴為.m。matlab語言采用解釋運(yùn)行的方式，在這一點(diǎn)上它的運(yùn)行方式與basic語言類似，在程序運(yùn)行的過程中可以隨時(shí)顯示中間的結(jié)果，這樣便于查找程序中的錯(cuò)誤。另外由于用matlab語言編寫的程序無須進(jìn)行編譯，因此它本身就像一個(gè)超級的函數(shù)計(jì)算器。由于很多的matlab語言的命令與人們通常的書寫習(xí)慣類似，因此有人又稱之為演算紙似的科學(xué)工程計(jì)算語言。由于matlab語言本身所具有的種種特點(diǎn)，它特別適合對電子系統(tǒng)進(jìn)行信號處理，在通信等工具箱內(nèi)，設(shè)有專門為電子系統(tǒng)設(shè)計(jì)的各種專門的函數(shù)，可以進(jìn)行各種模擬和數(shù)字濾波器的設(shè)計(jì)和分析。matlab語言的另一個(gè)突出的優(yōu)點(diǎn)就是便于學(xué)習(xí)，容易掌握。一般來說，一個(gè)初學(xué)者可在幾十分鐘內(nèi)學(xué)會(huì)并掌握它的基本操作命令，進(jìn)而就可以解決一些比較煩瑣的數(shù)學(xué)運(yùn)算問題，如矩陣求逆。由于matlab給使用者提供了極為豐富的，現(xiàn)成的數(shù)學(xué)工具，因此使用者無須掌握很復(fù)雜的編程技巧，如排隊(duì)，指針，堆棧等等。另外，matlab本身提供了十分明確，十分詳細(xì)的聯(lián)機(jī)幫助文件，便于使用者進(jìn)行自學(xué)，而無須依賴教師指導(dǎo)。6.2 vc中mex程序的建立和設(shè)置一個(gè)mex程序?qū)嶋H上就是一個(gè)特別的dll，它的輸出函數(shù)為mexfunction。那么在vc中就可用project wizard 建立一個(gè)dll工程，并為其指定輸出函數(shù)為mexfunction。1. 建立新的dll工程啟動(dòng)vc，選擇菜單file/new,在projects頁面中選擇mfc appwizard(dll),輸入路徑名和工程名，并單擊ok按鈕。這里將工程命名為mextest。2. 設(shè)定輸出函數(shù) appwizard 將會(huì)自動(dòng)生成如下幾個(gè)文件：* mextest.cpp* mextest.def * mextest.rc * stdafx.cpp需要mextest.def中指定該dll文件的輸出函數(shù)，也就是mexfunction。為此，在vc的workspace欄中，單擊“fileview”屬性頁，展開“sourse files”欄，打開文件mextest.def，將其內(nèi)容進(jìn)行編譯，在“exports”后面加入mexfunction一行。3. 環(huán)境設(shè)置由于再編譯和連接mex程序的時(shí)候，需要用到matlab提供的若干頭文件和庫文件，因此應(yīng)該對這些文件的路徑進(jìn)行指定。在matlab6以前的版本中，沒有提供必要的庫文件，只提供了必要的def文件，必須由用戶自己用lib命令手工將def文件轉(zhuǎn)換為lib文件，步驟比較麻煩。在matlab6中，則直接提供lib文件，不需要用戶生成了。matlab對于不同版本的編譯器提供了不同的庫文件，分別放在

人人文庫> 全部分類> 專業(yè)文獻(xiàn) > 工程機(jī)械

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

語音信號畢業(yè)設(shè)計(jì)論文.doc

文檔簡介

溫馨提示

最新文檔

評論

語音信號畢業(yè)設(shè)計(jì)論文.doc

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔