語音信號處理 第4版 第2章 語音信號處理的基礎(chǔ)知識 思考題答案_第1頁
語音信號處理 第4版 第2章 語音信號處理的基礎(chǔ)知識 思考題答案_第2頁
語音信號處理 第4版 第2章 語音信號處理的基礎(chǔ)知識 思考題答案_第3頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第二章語音信號處理的基礎(chǔ)知識思考題答案人的發(fā)音器官有哪些?人耳聽覺外周和聽覺中樞的功能是什么?人的發(fā)音器官包括:肺、氣管、喉(包括聲帶)、咽、鼻和口。這些器官共同形成一條形狀復(fù)雜的管道。喉的部分稱為聲門。從聲門到嘴唇的呼氣通道叫作聲道。聽覺外周包括位于腦及腦干以外的結(jié)構(gòu),即外耳、中耳、內(nèi)耳和蝸神經(jīng),主要完成聲音采集、頻率分解以及聲能轉(zhuǎn)換等功能;聽覺中樞包含位于聽神經(jīng)以上的所有聽覺結(jié)構(gòu),對聲音有加工和分析的作用,主要包括感覺聲音的音色、音調(diào)、音強(qiáng)、判斷方位等功能。此外,聽覺中樞還承擔(dān)與語言中樞聯(lián)系和實(shí)現(xiàn)聽覺反射的功能。人耳聽覺的掩蔽效應(yīng)分為哪幾種?掩蔽效應(yīng)的存在對我們研究語音信號處理系統(tǒng)有什么啟示?掩蔽效應(yīng)分為同時(shí)掩蔽和短時(shí)掩蔽。同時(shí)掩蔽是指同時(shí)存在的一個弱信號和一個強(qiáng)信號頻率接近時(shí),強(qiáng)信號會提高弱信號的聽閾,當(dāng)弱信號的聽閾被升高到一定程度時(shí)就會導(dǎo)致這個弱信號變得不可聞。當(dāng)A聲和B聲不同時(shí)出現(xiàn)時(shí)也存在掩蔽作用,稱為短時(shí)掩蔽。短時(shí)掩蔽又分為后向掩蔽和前向掩蔽。純音對窄帶噪聲的掩蔽量當(dāng)加寬噪聲聲寬時(shí)最初是掩蔽量增大,但超過某一寬帶后就不再增大,這一帶寬稱為臨界帶寬。當(dāng)A聲被B聲掩蔽時(shí),若A聲的頻率處在以B聲為中心的臨界帶的頻率范圍內(nèi)時(shí),掩蔽效應(yīng)最為明顯,當(dāng)A聲處在B聲的臨界帶以外時(shí),仍然會產(chǎn)生掩蔽效應(yīng),這種掩蔽效應(yīng)取決于A聲和B聲的頻率間隔相當(dāng)于幾個臨界帶,這一間隔越寬,掩蔽效應(yīng)越弱。根據(jù)發(fā)音器官和語音產(chǎn)生機(jī)理,語音生成系統(tǒng)可分成哪幾個部分?各有什么特點(diǎn)?語音是從肺部呼出的氣流通過在喉頭至嘴唇的器官的各種作用而發(fā)出的。作用的方式有三種:第一是把從肺部呼出的直氣流變?yōu)橐粼矗醋優(yōu)榻涣鞯臄嗬m(xù)流或者亂流;第二是對音源起共振和反共振的作用,使它帶有音色;第三是從嘴唇或鼻孔向空間輻射的作用。產(chǎn)生語音的能量來源于正常呼吸時(shí)肺部呼出的穩(wěn)定氣流。講話時(shí)聲帶不斷地張開與閉合,使聲門向上送出一連串噴流而形成一系列脈沖。聲帶每開啟和閉合一次的時(shí)間,即聲帶的振動周期就是音調(diào)周期或基音周期。從聲門到嘴唇的呼氣通道叫作聲道。在說話的時(shí)候,聲門處氣流沖擊聲帶產(chǎn)生振動,然后通過聲道響應(yīng)變成語音。語音信號的數(shù)學(xué)模型包括哪些子模型?激勵模型是怎樣推導(dǎo)出來的?輻射模型又是怎樣推導(dǎo)出來的?它們各屬于什么性質(zhì)的濾波器?語音信號的數(shù)字模型可以用激勵模型、聲道模型和輻射模型這三個子模型串聯(lián)來表示,如下圖所示激勵模型一般分為濁音激勵和清音激勵。發(fā)濁音時(shí),由于聲帶不斷地張開和光比,將產(chǎn)生間歇的脈沖波。這個脈沖波的波形類似于斜三角形的脈沖(二階低通濾波器),因此濁音激勵是一個以基音周期為周期的斜三角波脈沖串。發(fā)清音時(shí),無論是發(fā)阻塞音還是摩擦音,聲道都被阻礙形成湍流因而可以把清音激勵模擬成隨機(jī)白噪聲。實(shí)際情況一般使用均值為0、方差為1,并在時(shí)間或/和幅值上為白色分布的序列。由輻射引起的能量損耗正比于輻射阻抗的實(shí)部,所以輻射模型是一階類高通濾波器。什么是聲強(qiáng)和聲壓?它們之間有什么關(guān)系?聲壓是定量描述聲波的最基本的物理量,它是由聲擾動產(chǎn)生的逾量壓強(qiáng),是空間位置和時(shí)間的函數(shù)。聲波在單位時(shí)間內(nèi)作用在與其傳遞方向垂直的單位面積上的能量稱為聲強(qiáng)。對于球面波和平面波,聲壓與聲強(qiáng)的關(guān)系是I=P2/(ρc)式中,ρ為空氣密度;c為聲速。什么是響度?是如何定義的?響度描述的是聲音的響亮程度,表示人耳對聲音的主觀感受,其計(jì)量單位是宋。定義為聲壓級為40dB的1kHz純音的響度為1宋。人耳對聲音的感覺,不僅和聲壓有關(guān),還和頻率有關(guān)。聲壓級相同,頻率不同的聲音,聽起來響亮程度也不同。什么是音高?與頻率的關(guān)系如何?以Hz為單位所測得的物理量—頻率,在聽者來說感知為心理量—音高,即用人的主觀感覺來評價(jià)所聽到的聲音是高調(diào)還是低調(diào)。音高隨頻率的增加而提高。美(Mel):美是心理聲學(xué)測量音高的單位。1000美是1000Hz純音40dBSL時(shí)的音高。音調(diào)高的聲波具有高美值,音調(diào)低的聲波美值就低。在語音信號參數(shù)分析前為什么要進(jìn)行預(yù)處理?有哪些預(yù)處理過程?語音信號的預(yù)處理包括預(yù)加重,加窗和分幀等。語音信號的數(shù)字化一般包括放大及增益控制、反混疊濾波、采樣、A/D轉(zhuǎn)換及編碼。預(yù)濾波的目的有兩個:一是抑制輸入信號各頻域分量中頻率超出fs/2的所有分量(fs為采樣頻率),以防止混疊干擾;二是抑制50Hz的電源工頻干擾。A/D轉(zhuǎn)換中要對信號進(jìn)行量化。語音信號低頻段能量大,高頻段信號能量?。欢b頻器輸出噪聲的功率譜密度隨頻率的平方而增加(低頻噪聲小,高頻噪聲大),造成信號的低頻信噪比很大,而高頻信噪比明顯不足,使高頻傳輸困難。通常采用預(yù)加重(發(fā)送端對輸入信號高頻分量的提升)和去加重(解調(diào)后對高頻分量的壓低)技術(shù)來解決該問題。對語音信號進(jìn)行處理時(shí)為什么要進(jìn)行分幀?分幀的常用方法是什么?貫穿于語音分析全過程的是“短時(shí)分析技術(shù)”。雖然語音信號具有時(shí)變特性,但是在一個短時(shí)間范圍內(nèi)(一般認(rèn)為在10~30ms的短時(shí)間內(nèi)),其特性基本保持不變即相對穩(wěn)定,因而可以將其看作是一個準(zhǔn)穩(wěn)態(tài)過程,即語音信號具有短時(shí)平穩(wěn)性。所以任何語音信號的分析和處理必須

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論