


下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、幀和加窗的概念1.短時(shí)分析將語(yǔ)音流分為一段一段來處理,每一段稱為一“幀”;2.幀長(zhǎng):1030ms,20ms常見;(幀率)幀移:01/2幀長(zhǎng),幀與幀之間的平滑過度;3.為了減少語(yǔ)音幀的截?cái)嘈?yīng),需要加窗處理;將具有不連續(xù)點(diǎn)的周期函數(shù)(如矩形脈沖)進(jìn)行傅立葉級(jí)數(shù)展開后,選取有限項(xiàng)進(jìn)行合成。當(dāng)選取的項(xiàng)數(shù)越多,在所合成的波形中出現(xiàn)的峰起越靠近原信號(hào)的不連續(xù)點(diǎn)。當(dāng)選取的項(xiàng)數(shù)很大時(shí),該峰起值趨于一個(gè)常數(shù),大約等于總跳變值的9%。這種現(xiàn)象稱為截?cái)嘈?yīng),又叫吉布斯效應(yīng)。矩形窗、Hamming、Hann等窗函數(shù)及其比較三種窗函數(shù)都有低通特性,通過分析三種窗的頻率響應(yīng)幅度特性可以發(fā)現(xiàn):矩形窗的主瓣寬度最小,旁瓣高
2、度最高,會(huì)導(dǎo)致泄露現(xiàn)象,漢明窗的主瓣最寬,旁瓣高度最低,可以有效的克服泄露現(xiàn)象,具有更平滑的低通特性,應(yīng)用更廣泛。短時(shí)平均能量的主要用途(1)可以從語(yǔ)音中區(qū)別濁音來,因?yàn)闈嵋魰r(shí)短時(shí)平均能量的值要比清音時(shí)短時(shí)平均能量的值大很多;(2)可以用來區(qū)別聲母和韻母的分界、無聲和有聲的分界等。短時(shí)過零率短時(shí)過零率可以看作信號(hào)頻率的簡(jiǎn)單度量(1)過零就是指信號(hào)通過零值。過零率就是每秒內(nèi)信號(hào)值通過零值得次數(shù)。(2)對(duì)于離散時(shí)間序列,過零則是指序列取樣值改變符號(hào),過零率則是每個(gè)樣本的改變符號(hào)的次數(shù)。對(duì)于語(yǔ)音信號(hào),則是指在一幀語(yǔ)音中語(yǔ)音信號(hào)波形穿過橫軸(零電平)的次數(shù)??梢杂孟噜弮蓚€(gè)取樣改變符號(hào)的次數(shù)來計(jì)算。應(yīng)用
3、于語(yǔ)音信號(hào)分析中(1)發(fā)濁音時(shí),聲帶振動(dòng),因而聲門激勵(lì)是以此音調(diào)頻率為基頻來使聲道共振;盡管有若干個(gè)共振峰,但其能量的分布集中于低于3KHz的頻率范圍內(nèi)。(2)發(fā)清音時(shí)聲帶不振動(dòng),聲道某部分阻塞產(chǎn)生類白噪聲激勵(lì),通過聲道后其能量集中在比濁音時(shí)更高的頻率范圍內(nèi)。(3)濁音時(shí)能量集中于較低頻率段內(nèi),具有較低的過零率,而清音時(shí)能量集中于較高頻率段內(nèi),具有較高的過零率。(4)短時(shí)平均能量和短時(shí)平均過零率兩個(gè)參數(shù),也都可以用于語(yǔ)音識(shí)別中。主要用于識(shí)別無聲段和語(yǔ)音段的起點(diǎn)和終點(diǎn)的位置。(5)在背景噪聲比較小的時(shí)候用平均能量來識(shí)別比較有效,在背景噪聲比較大的時(shí)候用平均過零率來識(shí)別比較有效,但是通常情況是兩個(gè)
4、參數(shù)聯(lián)合進(jìn)行識(shí)別。濁音、清音、無聲的短時(shí)特性S(無聲)U(清音)V(濁音)三種情況下短時(shí)平均幅度條件概率密度的示意圖??梢钥闯?,濁音的短時(shí)平均幅度最大,無聲的短時(shí)平均幅度最小。清音的短時(shí)過零率最大,無聲居中,濁音的短時(shí)過零率最小。語(yǔ)音信號(hào)短時(shí)能量和過零率的特征 語(yǔ)音一般分為無聲段,清音段和濁音段。一般把濁音認(rèn)為是一個(gè)以基音周期為周期的斜三角脈沖串,把清音模擬成隨機(jī)白噪聲。由于語(yǔ)音信號(hào)是一個(gè)非平穩(wěn)態(tài)過程,不能用處理平穩(wěn)信號(hào)的信號(hào)處理技術(shù)對(duì)其進(jìn)行分析處理。但由于語(yǔ)音信號(hào)本身的特點(diǎn),在1030ms的短時(shí)間范圍內(nèi),其特性可以看作是一個(gè)準(zhǔn)穩(wěn)態(tài)過程,即具有短時(shí)性,因此采用短時(shí)能量和過零率來對(duì)語(yǔ)音進(jìn)行端點(diǎn)檢
5、測(cè)是可行的。語(yǔ)音和噪聲的區(qū)別可以體現(xiàn)在他們的能量上,語(yǔ)音段的能量比噪聲段的能量大,如果環(huán)境噪聲和系統(tǒng)輸入的噪聲比較小,只要計(jì)算輸入信號(hào)的短時(shí)能量就能夠把語(yǔ)音段和噪聲背景區(qū)分開,除此之外,用基于能量的算法來檢測(cè)濁音通常效果也是比較理想的,因?yàn)闈嵋舻哪芰恐当惹逡舸蟮枚?,可以判斷濁音和清音之間過渡的時(shí)刻3,但對(duì)清音來說,效果不是很好,因此還需要借助短時(shí)過零率來表征。短時(shí)能量可以近似為互補(bǔ)的情況,短時(shí)能量大的地方過零率小,短時(shí)能量小的地方過零率較大?;诙虝r(shí)能量和過零率的檢測(cè)方法 盡管基于短時(shí)能量和過零率的檢測(cè)方法各有其優(yōu)缺點(diǎn),但是若將這兩種基本方法相結(jié)合起來使用也可以實(shí)現(xiàn)對(duì)語(yǔ)音信號(hào)可靠的端
6、點(diǎn)檢測(cè)。無聲段的短時(shí)能量為零,清音段的短時(shí)能量又比濁音段的短時(shí)能量大,而在過零率方面,理想的情況是無聲段的過零率為零,濁音段的過零率比清音段的過零率要大的多,因此,假設(shè)有一段語(yǔ)音,如果某部分短時(shí)能量和過零率都為零或者為很小的值,就可以認(rèn)為這部分為無聲段,如果該部分語(yǔ)音短時(shí)能量很大但是過零率很小,則認(rèn)為該部分語(yǔ)音為濁音段,如果該部分短時(shí)能量很小但是過零率很大,則認(rèn)為該部分語(yǔ)音為清音段。正如前面提到,語(yǔ)音信號(hào)具有短時(shí)性,因此在對(duì)語(yǔ)音信號(hào)進(jìn)行分析時(shí),需要將語(yǔ)音信號(hào)以30ms為一段分為若干幀來進(jìn)行分析,則兩幀起始點(diǎn)之間的間隔為10ms。為防止誤判以及無聲段過零率太大,設(shè)tmp1和tmp2為相鄰兩個(gè)采樣
7、點(diǎn),則同時(shí)滿足tmp1*tmp2<0和tmp1-tmp2的絕對(duì)值大于delta時(shí)才算一次過零,除此之外,為短時(shí)能量和過零率分別確定兩個(gè)門限,一個(gè)是較低的門限和,其數(shù)值較小,對(duì)信號(hào)的變化比較敏感,很容易就會(huì)被超過。另一個(gè)是較高的門限和,數(shù)值較大,信號(hào)必須達(dá)到一定的強(qiáng)度,該門限才可能被超過。低門限被超過有可能是時(shí)間很短的噪聲引起的,高門限被超過則可以基本確定是由語(yǔ)音信號(hào)引起的,如圖3所示。短時(shí)能量分析是通過能量的高低來區(qū)分清音和濁音,不容易確定語(yǔ)音信號(hào)片段的起始點(diǎn);而過零率分析僅僅是表明清音的過零率高于濁音,對(duì)噪聲的存在比較敏感,如果背景中有反復(fù)穿越坐標(biāo)軸的隨機(jī)噪聲,會(huì)產(chǎn)生大量的虛假過零率,影響檢測(cè)結(jié)果。對(duì)于背景噪聲和清音的區(qū)分則顯得無能為力。將這兩種方法結(jié)合起來,通過短時(shí)能量分析
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 鄭州安置房購(gòu)房合同協(xié)議
- 軟件項(xiàng)目承包合同協(xié)議
- 漏水保修協(xié)議書
- 收購(gòu)企業(yè)保密協(xié)議
- 退房協(xié)議書合同協(xié)議
- 汽車原廠協(xié)議書
- 消防聯(lián)盟協(xié)議書
- 民事終結(jié)協(xié)議書
- 建筑工程招投標(biāo)與合同管理教材
- 產(chǎn)品聯(lián)合研發(fā)戰(zhàn)略合作協(xié)議簽署備忘錄
- 02區(qū)域分析與區(qū)域規(guī)劃(第三版)電子教案(第二章)
- LED制程與工藝介紹
- 工會(huì)經(jīng)費(fèi)內(nèi)控制度
- 金免疫技術(shù)(免疫學(xué)檢驗(yàn)課件)
- 《馬克思主義中國(guó)化思想通史》導(dǎo)讀-南京林業(yè)大學(xué)中國(guó)大學(xué)mooc課后章節(jié)答案期末考試題庫(kù)2023年
- 2022年安徽工貿(mào)職業(yè)技術(shù)學(xué)院輔導(dǎo)員招聘考試真題
- 北京中考語(yǔ)文詞語(yǔ)表
- 化工原理課程教學(xué)大綱
- 全套質(zhì)量管理體系文件
- ABAQUS官方培訓(xùn)資料PPTlecture2-creating-parts
- 水資源利用智慧樹知到答案章節(jié)測(cè)試2023年西安理工大學(xué)
評(píng)論
0/150
提交評(píng)論