


下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、精選優(yōu)質(zhì)文檔-傾情為你奉上 語音質(zhì)量包括兩方面內(nèi)容:可懂度和自然度。前者對應(yīng)語音的辨識水平。而后者則是是衡量語音中字、單詞和句的自然流暢程度??傮w上看可以將語音質(zhì)量評價可分為兩大類:主觀評價和客觀評價。1、主觀評價 主觀評價以人為主體來評價語音的質(zhì)量。主觀評價方法的優(yōu)點是符合人類聽話時對語音質(zhì)量的感覺,目前得到了廣泛的應(yīng)用。常用的方法有平均意見得分(Mean Opinion Score,MOS得分),診斷韻字測試(Diagnostic Rhyme Test,DRT得分),診斷滿意度測量(
2、Diagnostic Acceptability Measure,DAM得分)等。語音質(zhì)量的主觀評價要求大量的人、大量次數(shù)的測聽實驗,以便能得到普遍接受的結(jié)果。但是由于主觀評價耗費大、經(jīng)歷時間長,因此語音質(zhì)量的主觀評價不容易實現(xiàn)。 為了克服主觀評價缺點,人們尋求一種能夠方便,快捷地給出語音質(zhì)量評價的客觀評價方法。不過值得注意的是,研究語音客觀評價的目的不是要用客觀評價來完全替代主觀評價,而是使客觀評價成為一種既方便快捷并能夠準確預(yù)測出主觀評價價值的語音質(zhì)量評價手段。盡管客觀評價具有省時省 力等優(yōu)點,但它還不能反映人對語音質(zhì)量的全
3、部感覺,而且當前的大多客觀評價方法都是以語音信號的時域、頻域及變換域等特征參量作為評價依據(jù),沒有涉及到語義、語法、語調(diào)等影響語音質(zhì)量主觀評價的重要因素。MOS評分:MOS得分方法是由CCITT推薦的主觀評價方法,現(xiàn)已廣泛作為不同系統(tǒng)之間的比較標準。它采用五級評分制。MOS評分五級標準:MOS判分 質(zhì)量級別 失真級別 5 優(yōu) 不覺
4、察 4 良 剛有覺察 3 一般 有覺察且稍覺可厭 2 &
5、#160; 差 明顯覺察,可厭仍可忍受 1 極差 不可忍受 MOS評分中質(zhì)量優(yōu)表示重建語音和原始語音只有很少的細節(jié)差異,且若不進行對照聽比就覺察不出這種差異;質(zhì)量良表示重建語音的畸變或失真不明顯,不注意聽感覺不到;質(zhì)量一般表示重建語音有比較明顯可
6、感知的畸變成失真,但語音自然度和清晰度仍很好,且聽起來沒有疲勞感;質(zhì)量差表示重建語音有較強的畸變或失真,聽起來已有疲勞感;質(zhì)量極差表示重建語音的質(zhì)量極差,聽覺無法忍受。 在數(shù)字語音通信中,通常認為MOS分為4.0 4.5為高質(zhì)量數(shù)字化語音,達到長途電話網(wǎng)的質(zhì)量要求,接近于透明信道編碼,也常稱之為網(wǎng)絡(luò)質(zhì)量。MOS分為3.5分左右稱為通信質(zhì)量,這時能感到重建話音質(zhì)量有所下降,但不妨礙正常通話,可以滿足多數(shù)語音通信系統(tǒng)使用要求。MOS分3.0以下常稱為合成語音質(zhì)量,系指一些聲碼器合成的語音所能達到的質(zhì)量。它雖然有較高的可懂度,但自然度較差。MOS
7、得分法的優(yōu)點是:一、由于編碼系統(tǒng)的質(zhì)量是按數(shù)值大小等級排列,所以不同失真類型的編碼系統(tǒng)就可以相互比較;二、評測者只需實現(xiàn)進行簡單訓(xùn)練,就可直接參與評測,因而容易完成。其缺點是:它把不同種類的失真混為一談,沒有指出失真的原因,不利于算法的改進。另外,測試條件的選擇及其他一些因素會影響MOS方法的結(jié)果。診斷韻字測試(Diagnostic Rhyme Test) 判斷韻字測試是反映語音清晰度或可懂度的一種測試方法,它主要用于低速率語音編碼的質(zhì)量測試,因為這時可懂度已成為主要問題。這種測試方法使用若干對(通常是96對)同韻母進行測試,例如中文的“為
8、”和“費”,英文的fast和vast等。讓受試者每次聽到一對韻字中的某個音,然后讓他判斷所聽到的音是哪一個字,全體實驗者判斷正確的百分比就是DRT得分,通常認為DRT為95%以上時清晰度為優(yōu),85%-94%為良,75%-84%為中,65%-75%為差而65%以下為不可接受。在實際通話中,清晰度為50%時,整句的可懂度大約為80%,這是因為整句中具有較高的冗余度,即使個別字聽不清楚,人們也能理解整句話的意思。當清晰度為90%時,整句話的可懂度已接近100%,所以對于低速率語音編碼,一般要求其清晰度能達到90%或以上。診斷滿意度測量(Diagnostic Acceptability Measure
9、)DAM是對語音質(zhì)量的綜全評估,它是在多種條件下對話音質(zhì)量的接受程度的一種度量。這種評分體系相當全面,也相當復(fù)雜,這里就不再贅述。2、客觀評價 語音質(zhì)量客觀評價方法采用某個特定的參數(shù)去表征語音通過增強或編碼系統(tǒng)后的失真程度,并以此來評估處理系統(tǒng)的性能優(yōu)劣。信噪比(Signal-to-Noise Ratio,SNR) SNR一直是衡量針對寬帶噪聲失真的語音增強算的常規(guī)方法。但要計算信噪比必需知道純凈語音信號,但在實際應(yīng)用中這是不可能的。因此,SNR主要用于純凈語音信號和噪聲信號都是己知的算法的仿真中。 &
10、#160; 信噪比計算整個時間軸上的語音信號與噪聲信號的平均功率之比。由于語音信號是一種緩慢變化的短時平穩(wěn)信號,因而在不同時間段上的信噪比也應(yīng)不一樣。為了改善上面的問題,可以采用分段信噪比。坂倉距離測度(Itakura-Saito Distortion, ISD) 坂倉距離測度是通過語音信號的線性預(yù)測分析來實現(xiàn)的。ISD基于兩組線性預(yù)測參數(shù)(分別從原純凈語音和處理過的語音的同步幀得到)之間的差異。對數(shù)似然比測度(Log Likelihood Ratio Measure,LLR)
11、0; LLR可以看成一種坂倉距離(Itakura Distance,IS),但IS距離需要考慮模型增益。而LLR不考慮模型增益引起的幅度位移,更重視整體譜包絡(luò)的相似度。對數(shù)譜距離(log spectral distance,LSD) 對數(shù)譜距離的定義PESQ(Perceptual Evaluation of Speech Quality) 2001年2月,ITU-T推出了P.862 標準窄帶電話網(wǎng)絡(luò)端到端語音質(zhì)量和話音編解碼器質(zhì)量的客觀評價方法,推薦使用語音質(zhì)量感知評價PESQ算法,該建議是基于輸入-輸出方式的典型算法,效果良好。 PESQ算法需要帶噪的衰減信號和一個原始的參考信號。開始時將兩個待比較的語音信號經(jīng)過電平調(diào)整、輸入濾波器濾波、時間對準和補償、聽覺變換之后, 分別提取兩路信號的參數(shù), 綜合其時頻特性, 得到PESQ分數(shù), 最終將這個分數(shù)映射到主觀平均意見分(MOS)。PESQ得分范圍在-0.5 - 4.5之間。得分越高表示語音質(zhì)量越好。參考文獻:
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025最終版鍋爐爐墻砌筑工程分包合同(無錫密封)
- 2025合同法實施情況調(diào)查問卷-mQY
- 醫(yī)院服務(wù)文化與員工培訓(xùn)
- 學(xué)生學(xué)習(xí)動力與學(xué)習(xí)興趣的激發(fā)
- 2025年雷達、無線電導(dǎo)航及無線電遙控設(shè)備項目合作計劃書
- 幫助我們的人
- 跨國企業(yè)供應(yīng)鏈中的保密管理策略
- 商業(yè)模式創(chuàng)新與案例分析
- 企業(yè)內(nèi)部知識管理與人力資源管理結(jié)合
- 健康運動鞋的選擇與評價標準分享
- 2024航空工業(yè)集團校園招聘筆試參考題庫附帶答案詳解
- 神經(jīng)外科常見引流管護理課件
- 欽州市充電站建設(shè)計劃書
- 自縊的護理查房
- 安全生產(chǎn)費用使用臺賬
- 新外研版高一英語必修二unit6課文
- 精神障礙社區(qū)康復(fù)服務(wù)投標方案
- 冰箱溫度監(jiān)測登記表
- 《利用導(dǎo)數(shù)研究函數(shù)的零點問題》教學(xué)設(shè)計
- 唯識二十論述記講記(完整版)-智敏上師
- 建設(shè)單位甲方對監(jiān)理單位考核管理辦法
評論
0/150
提交評論