版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、 具體參見 P170 圖 11-1 § 11.8 語音編碼的性能指標(biāo)和質(zhì)量評價(jià) 一、語音編碼的基本性能指標(biāo)包括編碼速率和頑健性。 編碼速率:又稱比特率,是指一個編碼器的信息速率。 頑健性:通過取多種不同來源的語音信號進(jìn)行編碼解碼,并對輸出語音質(zhì)量進(jìn)行比 較測試得到的一種指標(biāo)。 二、編碼器的質(zhì)量評價(jià)方法,包括主觀評價(jià)法和客觀評價(jià)法。 客觀評價(jià)準(zhǔn)則:信噪比和譜失真測度。 主觀評價(jià)準(zhǔn)則:通過人的感覺器官來測試。 三、可懂度與自然度 語音編碼后,其再生語音質(zhì)量包括可懂度和自然度。 可懂度:是衡量語音中的字、單詞和句的可懂程度,反映了對語音輸出內(nèi)容的識別 程度。 自然度:指語音聽起來有多自然,
2、聽起來像是機(jī)器發(fā)出的,不能辨認(rèn)出說話人是誰。 四、常用的幾種語音主觀評價(jià)標(biāo)準(zhǔn)包括:平均評價(jià)測試法 MOS、押韻測試 DRT 和可接受程 度測試 DAM。 不同編碼對應(yīng)的 MOS 值 1、 64kbit/s PCM 4.2 2、 32kbit/s ADPCM4.0 3、 4.8kbit/s CELP 3.2 4、 2.4kbit/s LPC 聲碼器2.2 § 12.1 概述 一、語音合成的概念 26 由人工制作出來的語音稱為語音合成,即由機(jī)器產(chǎn)生出聲音,它是人機(jī)語聲通信的 重要組成部分。 二、用語音合成來傳遞語言的優(yōu)點(diǎn) 1、不用特別注意和專門訓(xùn)練,任何人都可以理解。 2、可以直接使用電
3、話網(wǎng)和電話機(jī)。 3、無需消耗紙張等資源 三、語音合成技術(shù)的兩個關(guān)鍵性能 一是正確,一是自然。 § 12.2 語音合成原理 一、語音合成的三個基本方法 1、語音合成的三種基本方法:波形合成法、參數(shù)合成法和規(guī)則合成法。 2、波形合成法、參數(shù)合成法和規(guī)則合成法的概念 (1)波形合成法:把人發(fā)音的語音波形直接存儲或者進(jìn)行波形編碼后存儲,根據(jù)需 要編輯組合輸出。 ( 2)參數(shù)合成法:也稱分析-合成法,采用聲碼器技術(shù),是一種比較復(fù)雜的方法。 ( 3)規(guī)則合成法:通過語音學(xué)規(guī)則產(chǎn)生語音。 3、波形合成法、參數(shù)合成法和規(guī)則合成法三者在波形、特征參數(shù)、語言的符號組合 方面的比較 具體參見表 12-1
4、Ch13 語音識別 § 13.1 概述 一、語音識別的概念 語音識別是語音鏈中的一環(huán),它是研究使機(jī)器能準(zhǔn)確地聽出人的語音內(nèi)容的問題, 27 即準(zhǔn)確地識別所說的話。 二、用語音識別的優(yōu)點(diǎn) 1、語音是人們最自然、最方便的交互工具,不需要作專門訓(xùn)練; 2、操作簡單,使用方便; 3、語音的反應(yīng)速度快; 4、同時(shí)利用手、腳等,在進(jìn)行其他工作的同時(shí)兼顧周圍動作來輸入信息; 5、在輸入終端可使用麥克風(fēng)等,非常經(jīng)濟(jì),可直接利用電話網(wǎng)遙控輸入信息。 三、語音識別的 7 種分類方法 1、從所要識別的單位來分:孤立單詞語音識別、選詞語音識別、連續(xù)語音識別、語 音理解。 2、從識別的用詞量來分:小詞匯(10
5、-50 個) 、中詞匯(50-200 個) 、大詞匯(200 個以上) 。 3、從講話人的范圍來分:單個特定講話人、多講話人、與講話者無關(guān)。 4、從識別的方法分:模板匹配法、隨機(jī)模型法、概率語法分析法。 (1)模板匹配法:將測試語音與模板的參數(shù)一一進(jìn)行比較與匹配,判決的依據(jù)是失 真測度最小準(zhǔn)則。 (2)隨機(jī)模型法:一種是用 HMM 的概率參數(shù)來對似然函數(shù)進(jìn)行估計(jì)與判決,從而得 到識別結(jié)果的方法。 (3)概率語法分析法:利用連續(xù)語言中的形式語法約束的知識來對似然函數(shù)進(jìn)行估 計(jì)和判決。 5、從識別的環(huán)境分:隔音室、計(jì)算機(jī)房、公共場合。 6、從傳輸系統(tǒng)分:高質(zhì)量話筒、電話、近講話筒。 7、從說話人的類型分:男聲、女聲、兒童聲。 28 § 13.2 語音識別原理 一、根據(jù)比較輸入模式與標(biāo)準(zhǔn)模式方法不同,模式識別被分為模式匹配法、統(tǒng)計(jì)模式識 別和句法模式
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024呂蝶與伴侶離婚協(xié)議書涉及婚姻終止后的經(jīng)濟(jì)補(bǔ)償金支付3篇
- 2021年浙江省杭州市西湖區(qū)六年級下冊期末語文試卷及答案
- 2022-2023學(xué)年四川省成都市青羊區(qū)小學(xué)三年級下冊語文期末試題及答案
- 2023-2024學(xué)年廣東廣州花都區(qū)五年級上冊語文期末試卷及答案
- 四年級數(shù)學(xué)(三位數(shù)乘兩位數(shù))計(jì)算題專項(xiàng)練習(xí)及答案
- 2021-2022學(xué)年北京市平谷區(qū)六年級下冊期末數(shù)學(xué)試卷及答案(人教版)
- 2022-2023學(xué)年浙江省杭州市蕭山區(qū)六年級下冊期中語文試卷及答案(部編版)
- 《模擬電子技術(shù)》大學(xué)期末考試題及答案(十一)
- 2023-2024學(xué)年廣東省汕尾市陸豐市碣石鎮(zhèn)四年級上學(xué)期期中語文真題及答案
- 家禽飼養(yǎng)業(yè)節(jié)能減排與低碳發(fā)展考核試卷
- 菲律賓民宿行業(yè)分析
- 招標(biāo)代理機(jī)構(gòu)內(nèi)部監(jiān)督管理制度
- PCB設(shè)計(jì)工程師年終個人工作總結(jié)與工作計(jì)劃
- 2024北京西城區(qū)初二(上)期末英語試卷及答案
- 廣西柳州市2023-2024學(xué)年九年級上學(xué)期期末數(shù)學(xué)試卷+
- 2024年上海市黃埔區(qū)九年級英語一模試卷
- 初中勵志主題班會《梅花香自苦寒來》課件(共17張)
- 小學(xué)生思維漫畫合輯
- 課本劇西門豹治鄴劇本
- 新(完整)小學(xué)三年級語文教學(xué)案例
- 《多式聯(lián)運(yùn)單證》課件
評論
0/150
提交評論