語音信號處理復(fù)習(xí)資料-_第1頁
語音信號處理復(fù)習(xí)資料-_第2頁
語音信號處理復(fù)習(xí)資料-_第3頁
語音信號處理復(fù)習(xí)資料-_第4頁
語音信號處理復(fù)習(xí)資料-_第5頁
已閱讀5頁,還剩4頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、 具體參見 P170 圖 11-1 § 11.8 語音編碼的性能指標(biāo)和質(zhì)量評價(jià) 一、語音編碼的基本性能指標(biāo)包括編碼速率和頑健性。 編碼速率:又稱比特率,是指一個編碼器的信息速率。 頑健性:通過取多種不同來源的語音信號進(jìn)行編碼解碼,并對輸出語音質(zhì)量進(jìn)行比 較測試得到的一種指標(biāo)。 二、編碼器的質(zhì)量評價(jià)方法,包括主觀評價(jià)法和客觀評價(jià)法。 客觀評價(jià)準(zhǔn)則:信噪比和譜失真測度。 主觀評價(jià)準(zhǔn)則:通過人的感覺器官來測試。 三、可懂度與自然度 語音編碼后,其再生語音質(zhì)量包括可懂度和自然度。 可懂度:是衡量語音中的字、單詞和句的可懂程度,反映了對語音輸出內(nèi)容的識別 程度。 自然度:指語音聽起來有多自然,

2、聽起來像是機(jī)器發(fā)出的,不能辨認(rèn)出說話人是誰。 四、常用的幾種語音主觀評價(jià)標(biāo)準(zhǔn)包括:平均評價(jià)測試法 MOS、押韻測試 DRT 和可接受程 度測試 DAM。 不同編碼對應(yīng)的 MOS 值 1、 64kbit/s PCM 4.2 2、 32kbit/s ADPCM4.0 3、 4.8kbit/s CELP 3.2 4、 2.4kbit/s LPC 聲碼器2.2 § 12.1 概述 一、語音合成的概念 26 由人工制作出來的語音稱為語音合成,即由機(jī)器產(chǎn)生出聲音,它是人機(jī)語聲通信的 重要組成部分。 二、用語音合成來傳遞語言的優(yōu)點(diǎn) 1、不用特別注意和專門訓(xùn)練,任何人都可以理解。 2、可以直接使用電

3、話網(wǎng)和電話機(jī)。 3、無需消耗紙張等資源 三、語音合成技術(shù)的兩個關(guān)鍵性能 一是正確,一是自然。 § 12.2 語音合成原理 一、語音合成的三個基本方法 1、語音合成的三種基本方法:波形合成法、參數(shù)合成法和規(guī)則合成法。 2、波形合成法、參數(shù)合成法和規(guī)則合成法的概念 (1)波形合成法:把人發(fā)音的語音波形直接存儲或者進(jìn)行波形編碼后存儲,根據(jù)需 要編輯組合輸出。 ( 2)參數(shù)合成法:也稱分析-合成法,采用聲碼器技術(shù),是一種比較復(fù)雜的方法。 ( 3)規(guī)則合成法:通過語音學(xué)規(guī)則產(chǎn)生語音。 3、波形合成法、參數(shù)合成法和規(guī)則合成法三者在波形、特征參數(shù)、語言的符號組合 方面的比較 具體參見表 12-1

4、Ch13 語音識別 § 13.1 概述 一、語音識別的概念 語音識別是語音鏈中的一環(huán),它是研究使機(jī)器能準(zhǔn)確地聽出人的語音內(nèi)容的問題, 27 即準(zhǔn)確地識別所說的話。 二、用語音識別的優(yōu)點(diǎn) 1、語音是人們最自然、最方便的交互工具,不需要作專門訓(xùn)練; 2、操作簡單,使用方便; 3、語音的反應(yīng)速度快; 4、同時(shí)利用手、腳等,在進(jìn)行其他工作的同時(shí)兼顧周圍動作來輸入信息; 5、在輸入終端可使用麥克風(fēng)等,非常經(jīng)濟(jì),可直接利用電話網(wǎng)遙控輸入信息。 三、語音識別的 7 種分類方法 1、從所要識別的單位來分:孤立單詞語音識別、選詞語音識別、連續(xù)語音識別、語 音理解。 2、從識別的用詞量來分:小詞匯(10

5、-50 個) 、中詞匯(50-200 個) 、大詞匯(200 個以上) 。 3、從講話人的范圍來分:單個特定講話人、多講話人、與講話者無關(guān)。 4、從識別的方法分:模板匹配法、隨機(jī)模型法、概率語法分析法。 (1)模板匹配法:將測試語音與模板的參數(shù)一一進(jìn)行比較與匹配,判決的依據(jù)是失 真測度最小準(zhǔn)則。 (2)隨機(jī)模型法:一種是用 HMM 的概率參數(shù)來對似然函數(shù)進(jìn)行估計(jì)與判決,從而得 到識別結(jié)果的方法。 (3)概率語法分析法:利用連續(xù)語言中的形式語法約束的知識來對似然函數(shù)進(jìn)行估 計(jì)和判決。 5、從識別的環(huán)境分:隔音室、計(jì)算機(jī)房、公共場合。 6、從傳輸系統(tǒng)分:高質(zhì)量話筒、電話、近講話筒。 7、從說話人的類型分:男聲、女聲、兒童聲。 28 § 13.2 語音識別原理 一、根據(jù)比較輸入模式與標(biāo)準(zhǔn)模式方法不同,模式識別被分為模式匹配法、統(tǒng)計(jì)模式識 別和句法模式

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論