PESQ算法介紹與分析_第1頁
PESQ算法介紹與分析_第2頁
PESQ算法介紹與分析_第3頁
PESQ算法介紹與分析_第4頁
PESQ算法介紹與分析_第5頁
已閱讀5頁,還剩13頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

PESQ算法學(xué)習(xí)匯報,QoE小組龐惠方,語音質(zhì)量評價方法,語音質(zhì)量評價分為主觀評價及客觀評價。主觀評價優(yōu)點(diǎn):是人對語音質(zhì)量的真實(shí)反映缺點(diǎn):費(fèi)時費(fèi)力,受測試條件的限制和測試人員主觀因素的影響,且不滿足實(shí)時性的要求。因而考慮用客觀評價算法來模擬主觀評價。MOSPESQ,MOS方法,MOS方法在ITU-T的P.800建議和P.830建議有詳細(xì)描述。,PESQ算法,PESQ算法是ITU在2001年提出的一種新的語音質(zhì)量客觀評價算法,并且形成ITU-T的P.862建議。PESQ算法是目前與MOS評分相關(guān)度最高的客觀語音質(zhì)量評價算法,達(dá)到0.97。,相關(guān)度,PESQ算法概述,PESQ的總體思路為:首先將參考語音信號和失真語音信號的電平調(diào)整到標(biāo)準(zhǔn)聽覺電平,再用輸入濾波器模擬標(biāo)準(zhǔn)電話聽筒進(jìn)行濾波,然后將兩個信號進(jìn)行時間對齊,將對齊好的信號進(jìn)行聽覺轉(zhuǎn)換,轉(zhuǎn)換之后的輸入和輸出信號差值稱為干擾度,通過認(rèn)知模型處理,最后得到PESQ分值。在干擾度的處理中可能會識別出壞區(qū)間,這樣就需要對壞區(qū)間進(jìn)行重新對齊。,PESQ算法框圖,頻域整形:電平調(diào)整+濾波電平調(diào)整:不同的語音系統(tǒng)增益差別很大,當(dāng)原始語音信號通過語音系統(tǒng)之后,信號電平發(fā)生了差異。為了便于比較,需要將二者調(diào)整到統(tǒng)一、恒定的電平上來。PESQ設(shè)定首選的聽覺電平為79dBSPL。IRS濾波:PESQ算法用修正的IRS濾波來模擬電話機(jī)的發(fā)送頻率特性,該濾波特性充分考慮了原始語音信號的特性,得到的語音信號可以作為電話終端輸出再反饋到網(wǎng)絡(luò)中去。,時間對齊:1.預(yù)處理2.整體語音的時延估計3.語句的標(biāo)識4.語句的延時估計5.語句的分割,聽覺轉(zhuǎn)換:,聽覺轉(zhuǎn)換模型,認(rèn)知模型描述參考語音信號與失真語音信號在聽覺變換過程中產(chǎn)生的干擾差,通過模擬不對稱和對稱語音信號不同部分的不同加權(quán)改進(jìn)了客觀評估分值與MoS分值的相關(guān)性。,認(rèn)知模型相關(guān)計算式:,PESQ算法的改進(jìn),P862.1將PESQ得分映射為MoS-LQO得分P862.2將PESQ算法擴(kuò)展到寬帶(3003400Hz507000Hz)。,PESQ的局限性,當(dāng)系統(tǒng)中存在下列因素時會導(dǎo)致PESQ的評分與MoS評分有較大差異,即得到的PESQ評分不準(zhǔn)確。,原因推測及分析,根據(jù)PESQ的算法及各種異常發(fā)生的原因,對評分不準(zhǔn)原因進(jìn)行了如下推測及分析:Listeninglevels,Loudnessloss:由于PESQ算法在預(yù)處理時需要把參考信號及退化信號進(jìn)行電平對齊,都調(diào)到79dBSPL,故語音樣本整體的聽力水平和響度損耗對人耳感知的影響在算法中被忽略。Effectofdelayinconversationaltests:由于算法中需要對參考信號和退化信號進(jìn)行時間對齊處理,相當(dāng)于對退化信號作了延遲補(bǔ)償,所以對帶延遲效應(yīng)的語音評分不準(zhǔn)。,Talkerecho:講話者的回聲延時在30ms內(nèi)是不易被察覺的,因?yàn)榛芈晭缀跖c自己的聲音重合,但PESQ算法只能進(jìn)行單向評分,無法將接收端發(fā)出的信號與收到的信號進(jìn)行關(guān)聯(lián),故評分有誤。Sidetone:PESQ算法在預(yù)處理階段需要將參考信號與退化信號兩者的電平均方根進(jìn)行電平對齊,如果在傳輸語音過程中發(fā)生單通,則退化信號在進(jìn)行電平轉(zhuǎn)換后正常語音段的電平會明顯高于參考信號的值,這將導(dǎo)致PESQ最終的評分有較大的偏頗。,亟待解決的問題華為現(xiàn)階段的PESQ算法主要問題是不能夠檢測出某些人耳能夠感受到的雜音樣本,即注入此雜音異常前后MOS評分變化甚微,但接聽者能夠聽到這些雜音。,由于尚未了解雜音樣本的特征及華為采用的PESQ具體算法,針對各種可能的情況提出了幾個對PESQ算法的改進(jìn)方案:1.樣本為響度較小的雜音加入響度較大的雜音,測試結(jié)果

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論