《數(shù)字通信技術(shù)》PPT課件.ppt_第1頁
《數(shù)字通信技術(shù)》PPT課件.ppt_第2頁
《數(shù)字通信技術(shù)》PPT課件.ppt_第3頁
《數(shù)字通信技術(shù)》PPT課件.ppt_第4頁
《數(shù)字通信技術(shù)》PPT課件.ppt_第5頁
已閱讀5頁,還剩53頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

2 3語音的產(chǎn)生模型和LPC聲碼器 3 人的發(fā)聲系統(tǒng)由聲帶 聲門 聲道以及次聲門組成 次聲門又由肺和氣管等組成 是語音的激勵(lì)源 次聲門系統(tǒng)產(chǎn)生的氣流作用于聲帶 通過聲道后就產(chǎn)生聲音 根據(jù)發(fā)音機(jī)理 聲音信號(hào)可分為清音和濁音 一 語音信號(hào)的基本特性 4 一 語音信號(hào)的基本特性 當(dāng)聲帶震動(dòng)產(chǎn)生一個(gè)準(zhǔn)周期空氣脈沖激勵(lì)聲道時(shí)就產(chǎn)生濁音 濁音具有明顯的準(zhǔn)周期性 聲帶震動(dòng)的頻率稱為基音頻率 周期為基音周期 基音頻率一般在70 450Hz范圍內(nèi) 相當(dāng)于周期為2 15ms 基音周期是語音信號(hào)的主要特征之一 5 一 語音信號(hào)的基本特性 6 一 語音信號(hào)的基本特性 如果聲道在某處發(fā)生收縮 迫使空氣以高速?zèng)_過這一收縮部位而產(chǎn)生湍流 就得到清音 發(fā)清音時(shí)聲帶不振動(dòng) 是由湍流建立的寬帶噪聲源激勵(lì)聲道而發(fā)聲 清音波形類似于白噪聲 7 一 語音信號(hào)的基本特性 8 一 語音信號(hào)的基本特性 9 一 語音信號(hào)的基本特性 語音信號(hào)的基本特性語音信號(hào)是非穩(wěn)態(tài)信號(hào) 特征隨時(shí)間變化 但在一個(gè)很短的時(shí)間段內(nèi) 約5ms 50ms 具有相對(duì)穩(wěn)定的特征 稱為準(zhǔn)平穩(wěn)信號(hào) 語音信號(hào)通??梢苑譃闈嵋?清音和混合音 濁音在時(shí)域上具有準(zhǔn)周期性 在頻域上 精細(xì)譜具有周期性起伏的諧波特性 譜包絡(luò)具有共振峰結(jié)構(gòu) 清音類似于隨機(jī)噪聲 其頻帶較寬 濁音段的信號(hào)能量要比清音段的能量高 這一特點(diǎn)可用于判斷區(qū)分清 濁音 10 一 語音信號(hào)的基本特性 11 激勵(lì)源等效為基音頻率的周期性脈沖或具有平坦頻譜的白噪聲 聲道等效為時(shí)變線性數(shù)字濾波器 當(dāng)激勵(lì)源采用周期脈沖源時(shí) 聲道輸出的是濁音 采用白噪聲源時(shí) 聲道輸出的是清音 二 語音信號(hào)的產(chǎn)生模型 12 二 語音信號(hào)的產(chǎn)生模型 13 二 語音信號(hào)的產(chǎn)生模型 14 產(chǎn)生語音信號(hào)s n 的參量清 濁音類型 基音周期TP 代表聲道的時(shí)變?yōu)V波器的系數(shù) aj 及濾波器階數(shù)p 增益系數(shù)G 說明 根據(jù)語音信號(hào)慢變化的特點(diǎn) 可以每隔10 30ms左右預(yù)測(cè)一次上述各參數(shù)的值 即以每10 30ms為一幀傳送一次參數(shù)樣值的編碼 并不傳送話音樣值的編碼 因此比特速率低得多 二 語音信號(hào)的產(chǎn)生模型 15 三 LPC聲碼器的工作原理 16 1 全極點(diǎn)數(shù)字濾波器參數(shù)的確定階數(shù)P模型階數(shù)P的選擇 應(yīng)該從頻譜估計(jì)精度 計(jì)算量 存儲(chǔ)量等多方面綜合進(jìn)行考慮 P取很大值時(shí) 可以獲得很好的信號(hào)譜估計(jì) 但增加的計(jì)算量和存儲(chǔ)量代價(jià)太大 語音譜估計(jì)時(shí)主要關(guān)心的是聲道的諧振特性 P值過大 估計(jì)的譜中保留許多信號(hào)譜細(xì)節(jié) 反而使共振峰分析效果變壞 階數(shù)P的經(jīng)驗(yàn)值在8 12之間 通常采用10個(gè)極點(diǎn)的濾波器 模型就能正確描述共振峰特性和譜的基本形狀 三 LPC聲碼器的工作原理 17 濾波器系數(shù) aj 三 LPC聲碼器的工作原理 設(shè)計(jì)的濾波器系數(shù) aj 就是使得誤差e n 在某個(gè)預(yù)定的準(zhǔn)則下最小 通常是根據(jù)最小均方誤差準(zhǔn)則求解 aj 在LPC模型中 信號(hào)s n 的估計(jì)誤差e n 為 18 三 LPC聲碼器的工作原理 根據(jù)最小均方誤差準(zhǔn)則通過求解P個(gè)方程來得到P個(gè)未知數(shù)aj 19 三 LPC聲碼器的工作原理 2 基音檢測(cè)根據(jù)語音信號(hào)的特性檢測(cè)基音周期的方法有 利用時(shí)域特性檢測(cè) 利用頻域特性檢測(cè) 同時(shí)利用時(shí)域和頻域特性檢測(cè) 這里只介紹利用時(shí)域特性檢測(cè) 20 基本原理 利用語音信號(hào)的時(shí)域波形的相似性 通過比較原始信號(hào)和它的移位信號(hào)的相似程度來尋找基音周期 如果移位的距離等于基音周期 則兩個(gè)信號(hào)之間將具有最大的相似性 常用方法 短時(shí)自相關(guān)函數(shù)和短時(shí)平均幅度差函數(shù)AMDF 利用時(shí)域特性檢測(cè) 三 LPC聲碼器的工作原理 21 三 LPC聲碼器的工作原理 基于求短時(shí)自相關(guān)函數(shù)的基音周期估計(jì) 22 三 LPC聲碼器的工作原理 sw n 的自相關(guān)函數(shù)稱為語音信號(hào)s n 的短時(shí)自相關(guān)函數(shù) 用Rw l 表示 如果s n 是濁音 其短時(shí)自相關(guān)函數(shù)Rw l 呈現(xiàn)出明顯的周期性 其周期等于s n 的基音周期 基音周期就是第一個(gè)峰值點(diǎn)到零點(diǎn)之間的距離 23 三 LPC聲碼器的工作原理 24 設(shè)sw n 是一段加窗的語音信號(hào) 它的非零區(qū)域?yàn)?n 0 N 1 sw n 的短時(shí)平均幅度差函數(shù)rw l 定義為 三 LPC聲碼器的工作原理 基于短時(shí)平均幅度差函數(shù) AMDF 的基音周期估計(jì) 25 三 LPC聲碼器的工作原理 如果s n 是濁音 其AMDF也呈現(xiàn)出明顯的周期性 其周期等于s n 的基音周期 與Rw l 不同的是在基音周期的各個(gè)整數(shù)倍點(diǎn)上 rw l 具有谷值而非峰值 要通過尋找最深谷值點(diǎn)的位置來確定基音周期 26 三 LPC聲碼器的工作原理 27 兩種基音周期估計(jì)方法比較AMDF方法計(jì)算簡(jiǎn)單 只需減法和取幅度運(yùn)算 不需要乘法運(yùn)算 AMDF的動(dòng)態(tài)范圍較小 易于算法的定點(diǎn)實(shí)現(xiàn) AMDF在基音周期點(diǎn)上 它的谷點(diǎn)銳度較之短時(shí)自相關(guān)函數(shù)的峰點(diǎn)銳度更尖銳 估值精度更高 更穩(wěn)健 但信號(hào)不夠平穩(wěn)時(shí) 這個(gè)特點(diǎn)不明顯 短時(shí)自相關(guān)函數(shù)法的特點(diǎn)是對(duì)相位不敏感 在信號(hào)有相位失真時(shí)能較好地檢測(cè)基音 三 LPC聲碼器的工作原理 28 窗長(zhǎng)為了使較好地反映sw n 的周期性 窗長(zhǎng)N至少應(yīng)大于兩個(gè)基音周期 一般取長(zhǎng)度為10 30ms 克服共振峰特性造成的干擾由于共振峰的干擾 會(huì)出現(xiàn)Rw l 的第一最大峰值點(diǎn)或rw l 的第一最深谷值點(diǎn)與基音周期不一致的情況 當(dāng)基音周期性和共振峰周期性混在一起時(shí) 檢測(cè)出來的周期可能是Np Nf Np是基音周期 Nf是第一共振峰的周期 三 LPC聲碼器的工作原理 討論 29 克服上述干擾有兩種方法 用低通濾波器 60Hz 900Hz 對(duì)語音信號(hào)進(jìn)行濾波 去除大部分共振峰的影響 基音頻率最高約450Hz 濾波后可以保留其一 二次諧波 先對(duì)語音信號(hào)進(jìn)行非線性變換 例如 中心削波 然后再求Rw l 或rw l 這樣可以明顯地改善基音估計(jì)的效果 基音周期點(diǎn)上 峰值點(diǎn)或深谷值點(diǎn)比削波前得到的要尖銳 突出 三 LPC聲碼器的工作原理 30 中心削波中 為了保證表征基音周期的峰值不被削掉 削波電平CL的選擇很重要 由于語音信號(hào)的電平變化很大 不宜選擇固定電平 通常是找到語音幀的前1 3和最后1 3內(nèi)的最大幅度 選取二值中較小的幅值 削波電平取其60 80 即可 通常定為68 三 LPC聲碼器的工作原理 31 對(duì)于加窗的語音信號(hào)sw n 當(dāng)窗的起點(diǎn)n 0時(shí) 語音信號(hào)sw n 的短時(shí)能量用E表示 短時(shí)平均幅度用M表示 計(jì)算公式如下 三 LPC聲碼器的工作原理 3 濁音 清音及無聲的判別根據(jù)語音信號(hào)的短時(shí)能量 短時(shí)平均幅度和短時(shí)過零率來判斷當(dāng)前幀的語音信號(hào)是濁音 清音 還是無聲 32 語音信號(hào)的過零率用Z表示 它表示一幀語音信號(hào)中波形穿過橫軸 零電平 的次數(shù) 它可以用相鄰兩個(gè)取樣改變符號(hào)的次數(shù)來計(jì)算 三 LPC聲碼器的工作原理 33 濁音 V 的M最大而Z最低 當(dāng)采樣率為8kHz 幀長(zhǎng)為20ms時(shí) Z的平均值約為20 清音 U 的M居中而Z最高 當(dāng)采樣率為8kHz 幀長(zhǎng)為20ms時(shí) Z的平均值約為70 無聲 S 的M最低而Z居中 判斷當(dāng)前幀是濁音 清音 無聲的依據(jù)如下 三 LPC聲碼器的工作原理 34 三 LPC聲碼器的工作原理 在S U V三種情況下 短時(shí)平均幅度M和短時(shí)過零率Z的條件概率密度函數(shù)示意圖 35 四 LPC10聲碼器 復(fù)習(xí) LPC聲碼器的工作原理 36 1 LPC10聲碼器概況LPC 10聲碼器采用10階線性預(yù)測(cè)分析濾波器 編碼速率為2 4kb s 被美國在1981年作為聯(lián)邦標(biāo)準(zhǔn)FS 1015用于窄帶保密通信 其語音質(zhì)量清晰可懂 但抗噪聲的能力和自然度尚有欠缺 四 LPC10聲碼器 37 四 LPC10聲碼器 2 LPC10編碼器 38 LPC 10編碼器的特點(diǎn) 1 采樣采樣率8kHz 每個(gè)樣本量化為12bit得到數(shù)字化語音 每180個(gè)樣點(diǎn)分為一幀 22 5ms 以幀為處理單元 四 LPC10聲碼器 預(yù)加重的目的是加強(qiáng)語音譜中的高頻共振峰 使語音短時(shí)譜以及線性預(yù)測(cè)分析中的余數(shù) 殘差 頻譜變得更為平坦 從而提高了譜參數(shù)估值的精確性 2 預(yù)加重在提取聲道參數(shù)之前 先進(jìn)行預(yù)加重 高頻提升 處理 預(yù)加重濾波器的傳輸函數(shù)Hpw z 為 39 傳輸函數(shù)Hpw z 的幅頻和相頻特性 四 LPC10聲碼器 40 3 聲道濾濾器參數(shù)RC該編碼方案中采用協(xié)方差法計(jì)算預(yù)測(cè)系數(shù) ai i 1 P P 10 預(yù)測(cè)系數(shù)不適于直接量化 因?yàn)樗奈⑿∽兓瘯?huì)導(dǎo)致LP綜合濾波器極點(diǎn)位置很大的變化 很可能造成濾波器不穩(wěn)定 為了保證濾波器的穩(wěn)定性 要求有相當(dāng)高的量化精度 每個(gè)系數(shù)需要8 10bits 四 LPC10聲碼器 41 四 LPC10聲碼器 為了降低量化比特?cái)?shù) 采用了在數(shù)學(xué)上完全等價(jià)的P個(gè)反射系數(shù) RC ReflectionCoefficient ki i 1 P代替預(yù)測(cè)系數(shù)進(jìn)行量化編碼 濾波器穩(wěn)定的條件是參數(shù)ki滿足下式 此條件在量化時(shí)容易保證 可以通過Levinson Durbin算法求得部分相關(guān)系數(shù) PartialCorrelation 部分相關(guān)系數(shù)與RC在理論上是互為相反數(shù) 42 4 增益RMS增益RMS由下式計(jì)算 Si是經(jīng)過預(yù)加重后的數(shù)字語音信號(hào)樣本 N是分析幀長(zhǎng)度 對(duì)于濁音幀 其分析幀長(zhǎng)取為130個(gè)樣本以內(nèi)的基音周期整數(shù)倍值 對(duì)于清音幀 其分析幀長(zhǎng)取為長(zhǎng)度為22 5ms的整個(gè)幀的中點(diǎn)為中心的130個(gè)樣點(diǎn) 四 LPC10聲碼器 43 清 濁音判決是利用模式匹配技術(shù) 基于低帶能量 AMDF函數(shù)的最大值與最小值之比 過零率三個(gè)因素判別 最后對(duì)基音值 清濁音判決結(jié)果用動(dòng)態(tài)規(guī)劃算法 在三幀范圍內(nèi)進(jìn)行平滑和錯(cuò)誤校正 從而給出當(dāng)前幀的基音周期 清濁音判決參數(shù)V U 5 提取基音周期和檢測(cè)清 濁音采用基于短時(shí)平均幅度差函數(shù) AMDF 法提取基音周期 四 LPC10聲碼器 44 6 參數(shù)編碼對(duì)10個(gè)反射系數(shù)RC 增益RMS 基音周期 U V判決標(biāo)志以及同步信號(hào)共編碼成每幀54bits 幀長(zhǎng)22 5ms 因此編碼速率為2 4kb s 各比特分配如下表 四 LPC10聲碼器 45 四 LPC10聲碼器 46 四 LPC10聲碼器 3 LPC10譯碼器 47 LPC 10聲碼器的缺點(diǎn) 1 采用過分簡(jiǎn)化的二元激勵(lì) 合成的語音自然度較低 2 穩(wěn)健性 Robustness 差 3 LPC 10的語音譜共振峰的位置以及帶寬估值有時(shí)會(huì)產(chǎn)生很大的失真 從而影響語音的質(zhì)量 當(dāng)濁音的基音頻率接近譜包絡(luò)中的第一共振峰時(shí) LPC譜估計(jì)在共振峰位置上出現(xiàn)極其尖銳的峰值 估計(jì)失真 使得相應(yīng)得在合成語音中會(huì)出現(xiàn)尖峰或較大的毛刺 影響語音質(zhì)量 四 LPC10聲碼器 48 采用混合激勵(lì)代替簡(jiǎn)單的二元激勵(lì) 使合成語音的質(zhì)量得到改善 激勵(lì)脈沖加抖動(dòng) 對(duì)每個(gè)基音周期的長(zhǎng)度乘上一個(gè)0 75 1 25之間均勻分布的隨機(jī)數(shù)以改善語音的自然度 4 LPC 10e聲碼器LPC 10e聲碼器采用針對(duì)LPC 10聲碼器的缺點(diǎn)加以改進(jìn)的算法 并能與LPC 10聲碼器兼容 用于美國第三代保密電話 四 LPC10聲碼器 1 激勵(lì)源的改善 49 2 基音提取方法的改進(jìn)LPC 10提取基音采用的是AMDF 它的顯著特點(diǎn)是不需要乘法 計(jì)算較小 LPC 10e中采用LPC的殘差信號(hào)或語音信號(hào)的短時(shí)自相關(guān)函數(shù) 利用動(dòng)態(tài)規(guī)劃的平滑算法來更準(zhǔn)確地提取基音周期 四 LPC10聲碼器 50 3 聲道濾波器參數(shù)量化的改進(jìn)線譜頻率LSF LineSpectrumFrequency 或稱為線譜對(duì) LineSpectrumPair 是數(shù)學(xué)上與線性預(yù)測(cè)系數(shù) ai i 1 P 和反射系數(shù) ki i 1 P 完全等價(jià)的另一種表示方式 LSF參數(shù)集 i i 1 P 都在單位圓上 它們?cè)陬l域描述全極點(diǎn)濾波器H Z LSF在數(shù)學(xué)上有良好的量化特性 四 LPC10聲碼器 51 四 LPC10聲碼器 在求取LSF參數(shù)及量化過程中 如果保持LSF參數(shù)的有序有界性質(zhì) 即 就可以保證全極點(diǎn)濾波器H Z 是穩(wěn)定的 LSF參數(shù)有序有界性 52 LSF誤差相對(duì)獨(dú)立性某個(gè)頻率點(diǎn)的LSF偏差只對(duì)該頻率附近的語音頻譜產(chǎn)生影響 而對(duì)其它LSF頻率上的語音頻譜影響不大 這有利于LSF的參數(shù)量化和插值 四 LPC10聲碼器 53 LSF參數(shù)的量化在標(biāo)量量化時(shí) 通過設(shè)計(jì)最佳的LSF參數(shù)的非均勻標(biāo)量量化器 可以用較少的量化比特達(dá)到較高的量化精度 例如 對(duì)10個(gè)LSF參數(shù) 根據(jù)每個(gè)參數(shù)所起的作用 分配的量化比特?cái)?shù)為 3 4 4

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論