




已閱讀5頁,還剩3頁未讀, 繼續(xù)免費閱讀
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
綜合實驗報告自相關法及其變種學 院 電子與信息學院 專 業(yè) 信息與信號處理 學生姓名 學生學號 提交日期 2013年7月10日 一、實驗目標1.1 了解語音基音周期估計方法,掌握自相關法估計基音周期的原理,分析其變種。二、實驗基礎知識2.1 基音與基音周期估計人在發(fā)音時,根據聲帶是否震動可以將語音信號分為清音跟濁音兩種。濁音又稱有聲語言,攜帶者語言中大部分的能量,濁音在時域上呈現出明顯的周期性;而清音類似于白噪聲,沒有明顯的周期性。發(fā)濁音時,氣流通過聲門使聲帶產生張弛震蕩式振動,產生準周期的激勵脈沖串。這種聲帶振動的頻率稱為基音頻率,相應的周期就成為基音周期?;糁芷诘墓烙嫹Q謂基音檢測,基音檢測的最終目的是為了找出和聲帶振動頻率完全一致或盡可能相吻合的軌跡曲線。基因周期作為語音信號處理中描述激勵源的重要參數之一,在語音合成、語音壓縮編碼、語音識別和說話人確認等領域都有著廣泛而重要的問題,尤其對漢語更是如此。漢語是一種有調語言,而基因周期的變化稱為聲調,聲調對于漢語語音的理解極為重要。因為在漢語的相互交談中,不但要憑借不同的元音、輔音來辨別這些字詞的意義,還需要從不同的聲調來區(qū)別它,也就是說聲調具有辨義作用;另外,漢語中存在著多音字現象,同一個字的不同的語氣或不同的詞義下具有不同的聲調。因此準確可靠地進行基音檢測對漢語語音信號的處理顯得尤為重要。2.2 基音周期估計的現有方法到目前為止,基音檢測的方法大致上可以分為三類:1)時域估計法,直接由語音波形來估計基音周期,常見的有:自相關法、并行處理法、平均幅度差法、數據減少法等;2)變換法,它是一種將語音信號變換到頻域或者時域來估計基音周期的方法,首先利用同態(tài)分析方法將聲道的影響消除,得到屬于激勵部分的信息,然后求取基音周期,最常用的就是倒譜法,這種方法的缺點就是算法比較復雜,但是基音估計的效果卻很好;3)混合法,先提取信號聲道模型參數,然后利用它對信號進行濾波,得到音源序列,最后再利用自相關法或者平均幅度差法求得基因音周期。三、實驗原理3.1 自相關函數能量有限的語音信號x(n)的短時自相關函數定義為:此公式表示一個信號和延遲m點后該信號本身的相似性。如果信號x(n)具有周期性,那么它的自相關函數也具有周期性,而且周期與信號x(n)的周期性相同。自相關函數提供了一種獲取周期信號周期的方法。在周期信號周期的整數倍上,它的自相關函數可以達到最大值,因此可以不考慮起始時間,而從自相關函數的第一個最大值的位置估計出信號的基音周期,這使自相關函數成為信號基音周期估計的一種工具。3.2 短時自相關函數法語音信號是非穩(wěn)態(tài)信號它的特征是隨時間變化的,但在一個很短的時間段內可以認為具有相對穩(wěn)定的特征即 短時平穩(wěn)性。因此語音具有短時自相關性。這個時間段約5ms-50ms。為其統(tǒng)計特性和頻譜特性都是對短時段而言的。這使得要對語音信號作數字處理必須先按短時段對語音信號分幀。這樣每一幀信號都具有短時平穩(wěn)性從而進行短時相關分析。能量有限的語音信號s(n)的短時自相關函數定義為:一般要求一幀至少包含2個以上的周期。而且相鄰幀之間要有足夠的重疊。3.3 自相關方法變種3.3.1 中心削波由于語音信號與聲道特性影響有關,有的情況下即使窗長已選得足夠長,第一最大峰值點與基音仍不一致,這就是聲道特性的共振峰特性造成的“干擾”。實際上影響從自相關函數中正確提取基音周期的最主要的因素就是聲道響應部分。當基音的周期性和共振峰的周期性混疊在一起時,被檢測出來的峰值就會偏離原來峰值的真實位置。另外,某些濁音中,第一共振峰頻率可能會等于或低于基音頻率。此時,如果其幅度很高,它就可能在自相關函數中產生一個峰值,而該峰值又可以同基音頻率的峰值相比擬,從而給基音檢測帶來誤差。為了提高基音周期檢測的可靠性,采用中心削波法對原始信號進行預處理。 其中削波電平 CL 一般取最大信號幅度的 60%70%。圖1給出了中心削波處理后的結果。中心削波后,再用自相關檢測出基音頻率,錯判為倍頻或分頻的情況就可以大大減少了。中心削波法實質上是對信號做非線性處理,它消除語音信號的低幅值部分,而保留高振幅的峰值,從而能有利于信號的基音周期估計。圖1 中心削波處理經過中心削波后的信號,削去了大部分與聲道響應有關的波動,只保留了超過削波電平的部分。對中心削波后的語音信號計算自相關函數,這樣在基音周期位置呈現大而尖的峰值,而其余的次要峰值幅度都很小。3.3.2 三電平削波由自相關函數表達式可知,自相關需要大量的乘法運算,算法的運行效率低。結合自相關函數法和中心削波法對信號做基音周期估計,并在不影響基音周期估計準確性的前提下,用兩個信號的互相關序列代替自相關序列而避免了大量的乘法運算,有效地提高了算法的運行效率。 圖2 顯示的是經過三電平削波后的信號。經過三電平削波后的信號原始輸入的語音信號圖2 經過三電平削波后的信號顯然 x(n)只有-1,0,1 三種可能的取值。自相關中的乘法運算都變成了加減運算,使得算法的效率得到大幅度的提高。3.3.3 基于時域自相關平方函數第一峰值點的位置非常重要,峰值越尖銳則確定的位置就越準確。求短時自相關函數的平方:它們周期一致,但平方后在峰值處波形尖銳尤為明顯。圖3示為某女性發(fā)元音a的波形/短時自相關函數及短時自相關平方函數波形.圖3 某女性發(fā)元音a的波形/短時自相關函數及短時自相關平方函數波形 3.4 短時能量分析語音信號x(n)的某幀信號的短時平均能量En的定義為:式中,w(n)為窗函數,N為窗長,h(n)= w2(n),則有 由上式表明,短時平均能量En相當于將語音信號的平方通過一個單位沖激響應為h(n)的線性濾波器的輸出。實驗統(tǒng)計發(fā)現,語音中濁音段的短時平均能量遠遠大于清音段的短時平均能量。因此,短時平均能量的計算給出了區(qū)分清音段與濁音段的依據,即En(濁)En(清)。根據E由高到低的跳變可定出濁音變?yōu)榍逡粽Z音的時刻,E由低向高的跳變可定出清音變?yōu)闈嵋粽Z音的時刻,又由于只有濁音才有基音周期,清音的基音周期為零,這樣就可判別出清、濁音。圖4 男聲“確定”的語音波形及其局部短時能量四、結果與分析檢測流程如下:我們先通過Matlab實現,然后再通過C+實現。圖5 基于自相關函數的基因周期檢測流程實驗采用一段男聲讀“播放”兩個字的聲音wav文件,其為16KHz采樣率,16bit量化。整段語音長656.7ms,節(jié)點共10508個。圖6 男聲讀“播放”兩個字的聲音文件4.1 濾波將濾波器低端截止頻率設為60Hz,這是因為可以抑制50Hz電源工頻的干擾;高端截止頻率設為900Hz既可除去大部分共振峰影響,又可以當基音最高頻率為450Hz時仍能保留其一二次諧波。圖7 經過濾波器后的語音信號4.2 不同幀長窗口長度至少要大于基音周期的兩倍。一般,基頻最低50Hz,故周期最長為20ms,再根據采樣率確定幀長。圖8 截取不同幀長的語音信號4.3 清濁音區(qū)分這里我們通過計算短時能量來區(qū)分清濁音,結果如圖9所示。圖9 清、濁音短時能量圖4.4 平滑 去除野點。圖10 平滑后的結果五、總結通過本次課程實驗設計,我們從中學習了語音信號處理的一些基本知識,了解了基音周期
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 健康人際關系與溝通技巧評估測試題及答案
- 2025年甘肅省隴南事業(yè)單位招聘啥時候發(fā)布筆試參考題庫及參考答案詳解1套
- 物資藥品器械管理制度
- 物資驗收倉儲管理制度
- 特殊場所飯店管理制度
- 特殊病人住院管理制度
- 特種作業(yè)人員管理制度
- 特種美發(fā)設備管理制度
- 特種門窗車間管理制度
- 特藥銷售團隊管理制度
- 2025至2030軍工裝備行業(yè)市場發(fā)展現狀及競爭形勢及有效策略與實施路徑評估報告
- 兵團精神試題及答案
- 村寨垃圾收費管理制度
- 江蘇保安證考試題及答案
- 智聯(lián)銀行筆試題庫及答案
- 高校學生資助誠信教育主題班會
- 2025年入團考試評委提問的常見問題及答案
- 貿易咨詢服務合同協(xié)議
- 施工現場常見的安全隱患排查及試題與答案
- GA/T 2161-2024法庭科學非法集資類案件資金數據分析規(guī)程
- 食管癌病例分析 手術、化療與放療方案優(yōu)化
評論
0/150
提交評論