語音信號處理實(shí)驗(yàn)報(bào)告_第1頁
語音信號處理實(shí)驗(yàn)報(bào)告_第2頁
語音信號處理實(shí)驗(yàn)報(bào)告_第3頁
語音信號處理實(shí)驗(yàn)報(bào)告_第4頁
語音信號處理實(shí)驗(yàn)報(bào)告_第5頁
已閱讀5頁,還剩1頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

語音信號處理實(shí)驗(yàn)報(bào)告——語音信號分析實(shí)驗(yàn)實(shí)驗(yàn)?zāi)康募霸碚Z音信號分析是語音信號處理的前提和基礎(chǔ),只有分析出可表示語音信號本質(zhì)特征的參數(shù),才有可能利用這些參數(shù)進(jìn)行高效的語音通信、語音合成和語音識別等處理,并且語音合成的音質(zhì)好壞和語音識別率的高低,都取決于對語音信號分析的準(zhǔn)確性和精確性。貫穿語音分析全過程的是“短時(shí)分析技術(shù)”。因?yàn)閺恼w來看,語音信號的特性及表征其本質(zhì)特征的參數(shù)均是隨時(shí)間變化的,所以它是一個非平穩(wěn)態(tài)過程,但是在一個短時(shí)間范圍內(nèi)(一般認(rèn)為在10~30ms的時(shí)間內(nèi)),其特性基本保持不變,即相對穩(wěn)定,可將其看做一個準(zhǔn)穩(wěn)態(tài)過程,即語音信號具有短時(shí)平穩(wěn)性。所以要將語音信號分幀來分析其特征參數(shù),幀長一般取為10ms~30ms。實(shí)驗(yàn)過程系統(tǒng)結(jié)構(gòu)語音信號語音信號數(shù)字化數(shù)字化編碼采樣模/數(shù)轉(zhuǎn)換編碼采樣模/數(shù)轉(zhuǎn)換帶通濾波器增益控制加窗分幀預(yù)加重預(yù)處理加窗分幀預(yù)加重預(yù)處理短時(shí)能量分析/短短時(shí)能量分析/短時(shí)過零率分析/短時(shí)相關(guān)分析時(shí)域分析頻域分析頻域分析倒頻域分析倒頻域分析線性預(yù)測分析線性預(yù)測分析仿真結(jié)果時(shí)域分析男聲及女聲(藍(lán)色為時(shí)域信號,紅色為每一幀的能量,綠色為每一幀的過零率)某一幀的自相關(guān)函數(shù)頻域分析=1\*GB3①一幀信號的倒譜分析和FFT及LPC分析對應(yīng)的LPC預(yù)測系數(shù):1,對應(yīng)的LPC預(yù)測系數(shù):1,-0.1,-0.02,-0.4,-0.27,……對應(yīng)的倒譜系數(shù):119.2,-7.6895,……=2\*GB3②男聲和女聲的倒譜分析一幀語音波形一幀語音的倒譜原語音波形一幀語音波形一幀語音的倒譜原語音波形=3\*GB3③濁音和清音的倒譜分析=4\*GB3④濁音和清音的FFT分析和LPC分析(紅色為FFT圖像,綠色為LPC圖像)實(shí)驗(yàn)結(jié)果分析時(shí)域分析實(shí)驗(yàn)中采用的是漢明窗,窗的長度對能否由短時(shí)能量反應(yīng)語音信號的變化起著決定性影響。這里窗長合適,En能夠反應(yīng)語音信號幅度變化。同時(shí),從圖像可以看出,En可以作為區(qū)分濁音和清音的特征參數(shù)。短時(shí)過零率表示一幀語音中語音信號波形穿過橫軸(零電平)的次數(shù)。從圖中可以看出,短時(shí)能量和過零率可以近似為互補(bǔ)的情況,短時(shí)能量大的地方過零率小,短時(shí)能量小的地方過零率較大。從濁音和清音的時(shí)域分析可以看出,清音過零率高,濁音過零率低。從男聲女聲的時(shí)域信號對比圖中可以看出,女音信號在高頻率分布得更多,女聲信號在高頻段的能量分布更多,并且女聲有較高的過零率,這是因?yàn)檎Z音信號中的高頻段有較高的過零率。頻域分析這里對信號進(jìn)行快速傅里葉變換(FFT),可以發(fā)現(xiàn),當(dāng)窗口函數(shù)不同,傅里葉變換的結(jié)果也不相同。根據(jù)信號的時(shí)寬帶寬之積為一常數(shù)這一性質(zhì),可以知道窗口寬度與主瓣寬度成反比,N越大,主瓣越窄。漢明窗在頻譜范圍中的分辨率較高,而且旁瓣的衰減大,具有頻譜泄露少的有點(diǎn),所以在實(shí)驗(yàn)中采用的是具有較小上下沖的漢明窗。為了使頻域信號的頻率分辨率較高,所取的DFT及相應(yīng)的FFT點(diǎn)數(shù)應(yīng)該足夠多,但時(shí)域信號的長度受到采樣率和和短時(shí)性的限制,這里可以采用補(bǔ)零的辦法,對補(bǔ)零后的序列進(jìn)行FFT變換。從實(shí)驗(yàn)仿真圖可以看出濁音的頻率分布比清音高。倒譜分析通過實(shí)驗(yàn)可以發(fā)現(xiàn),倒譜的基音檢測與語音加窗的選擇也是有關(guān)系的。如果窗函數(shù)選擇矩形窗,在許多情況下倒譜中的基音峰將變得不清晰,窗函數(shù)選擇漢明窗較為合理,可以發(fā)現(xiàn),加漢明窗的倒譜基音峰較為突出。在典型的濁音清音倒譜對比中,理論上濁音倒譜基音峰應(yīng)比較突出,而清音不出現(xiàn)這種尖峰,只是在倒譜的低時(shí)域部分包含關(guān)于聲道沖激響應(yīng)的信息。實(shí)驗(yàn)仿真的圖形不是很理想。線性預(yù)測分析從實(shí)驗(yàn)中可以發(fā)現(xiàn),LPC譜估計(jì)具有一個特點(diǎn),在信號能量較大的區(qū)域即接近譜的峰值處,LPC譜和信號譜很接近;而在信號能量較低的區(qū)域即接近譜的谷底處,則相差比較大。在濁音清音對比中,可以發(fā)現(xiàn),對呈現(xiàn)諧波特征的濁音語音譜來說這個特點(diǎn)很明顯,就是在諧波成分處LPC譜匹配信號譜的效果要遠(yuǎn)比諧波之間好得多。在實(shí)驗(yàn)中,當(dāng)P值增加到一定程度,預(yù)測平方誤差的改善就不很明顯了,而且會增加計(jì)算量,一般取為8~14,這里P取為10。基音周期估計(jì)=1\*GB3①自互相關(guān)函數(shù)法=2\*GB3②短時(shí)平均幅度差法=3\*GB3③倒譜分

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論