PESQ算法介紹與分析_第1頁(yè)
PESQ算法介紹與分析_第2頁(yè)
PESQ算法介紹與分析_第3頁(yè)
PESQ算法介紹與分析_第4頁(yè)
PESQ算法介紹與分析_第5頁(yè)
已閱讀5頁(yè),還剩13頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

PESQ算法學(xué)習(xí)匯報(bào),QoE小組龐惠方,語(yǔ)音質(zhì)量評(píng)價(jià)方法,語(yǔ)音質(zhì)量評(píng)價(jià)分為主觀評(píng)價(jià)及客觀評(píng)價(jià)。主觀評(píng)價(jià)優(yōu)點(diǎn):是人對(duì)語(yǔ)音質(zhì)量的真實(shí)反映缺點(diǎn):費(fèi)時(shí)費(fèi)力,受測(cè)試條件的限制和測(cè)試人員主觀因素的影響,且不滿足實(shí)時(shí)性的要求。因而考慮用客觀評(píng)價(jià)算法來(lái)模擬主觀評(píng)價(jià)。MOSPESQ,MOS方法,MOS方法在ITU-T的P.800建議和P.830建議有詳細(xì)描述。,PESQ算法,PESQ算法是ITU在2001年提出的一種新的語(yǔ)音質(zhì)量客觀評(píng)價(jià)算法,并且形成ITU-T的P.862建議。PESQ算法是目前與MOS評(píng)分相關(guān)度最高的客觀語(yǔ)音質(zhì)量評(píng)價(jià)算法,達(dá)到0.97。,相關(guān)度,PESQ算法概述,PESQ的總體思路為:首先將參考語(yǔ)音信號(hào)和失真語(yǔ)音信號(hào)的電平調(diào)整到標(biāo)準(zhǔn)聽(tīng)覺(jué)電平,再用輸入濾波器模擬標(biāo)準(zhǔn)電話聽(tīng)筒進(jìn)行濾波,然后將兩個(gè)信號(hào)進(jìn)行時(shí)間對(duì)齊,將對(duì)齊好的信號(hào)進(jìn)行聽(tīng)覺(jué)轉(zhuǎn)換,轉(zhuǎn)換之后的輸入和輸出信號(hào)差值稱(chēng)為干擾度,通過(guò)認(rèn)知模型處理,最后得到PESQ分值。在干擾度的處理中可能會(huì)識(shí)別出壞區(qū)間,這樣就需要對(duì)壞區(qū)間進(jìn)行重新對(duì)齊。,PESQ算法框圖,頻域整形:電平調(diào)整+濾波電平調(diào)整:不同的語(yǔ)音系統(tǒng)增益差別很大,當(dāng)原始語(yǔ)音信號(hào)通過(guò)語(yǔ)音系統(tǒng)之后,信號(hào)電平發(fā)生了差異。為了便于比較,需要將二者調(diào)整到統(tǒng)一、恒定的電平上來(lái)。PESQ設(shè)定首選的聽(tīng)覺(jué)電平為79dBSPL。IRS濾波:PESQ算法用修正的IRS濾波來(lái)模擬電話機(jī)的發(fā)送頻率特性,該濾波特性充分考慮了原始語(yǔ)音信號(hào)的特性,得到的語(yǔ)音信號(hào)可以作為電話終端輸出再反饋到網(wǎng)絡(luò)中去。,時(shí)間對(duì)齊:1.預(yù)處理2.整體語(yǔ)音的時(shí)延估計(jì)3.語(yǔ)句的標(biāo)識(shí)4.語(yǔ)句的延時(shí)估計(jì)5.語(yǔ)句的分割,聽(tīng)覺(jué)轉(zhuǎn)換:,聽(tīng)覺(jué)轉(zhuǎn)換模型,認(rèn)知模型描述參考語(yǔ)音信號(hào)與失真語(yǔ)音信號(hào)在聽(tīng)覺(jué)變換過(guò)程中產(chǎn)生的干擾差,通過(guò)模擬不對(duì)稱(chēng)和對(duì)稱(chēng)語(yǔ)音信號(hào)不同部分的不同加權(quán)改進(jìn)了客觀評(píng)估分值與MoS分值的相關(guān)性。,認(rèn)知模型相關(guān)計(jì)算式:,PESQ算法的改進(jìn),P862.1將PESQ得分映射為MoS-LQO得分P862.2將PESQ算法擴(kuò)展到寬帶(3003400Hz507000Hz)。,PESQ的局限性,當(dāng)系統(tǒng)中存在下列因素時(shí)會(huì)導(dǎo)致PESQ的評(píng)分與MoS評(píng)分有較大差異,即得到的PESQ評(píng)分不準(zhǔn)確。,原因推測(cè)及分析,根據(jù)PESQ的算法及各種異常發(fā)生的原因,對(duì)評(píng)分不準(zhǔn)原因進(jìn)行了如下推測(cè)及分析:Listeninglevels,Loudnessloss:由于PESQ算法在預(yù)處理時(shí)需要把參考信號(hào)及退化信號(hào)進(jìn)行電平對(duì)齊,都調(diào)到79dBSPL,故語(yǔ)音樣本整體的聽(tīng)力水平和響度損耗對(duì)人耳感知的影響在算法中被忽略。Effectofdelayinconversationaltests:由于算法中需要對(duì)參考信號(hào)和退化信號(hào)進(jìn)行時(shí)間對(duì)齊處理,相當(dāng)于對(duì)退化信號(hào)作了延遲補(bǔ)償,所以對(duì)帶延遲效應(yīng)的語(yǔ)音評(píng)分不準(zhǔn)。,Talkerecho:講話者的回聲延時(shí)在30ms內(nèi)是不易被察覺(jué)的,因?yàn)榛芈晭缀跖c自己的聲音重合,但PESQ算法只能進(jìn)行單向評(píng)分,無(wú)法將接收端發(fā)出的信號(hào)與收到的信號(hào)進(jìn)行關(guān)聯(lián),故評(píng)分有誤。Sidetone:PESQ算法在預(yù)處理階段需要將參考信號(hào)與退化信號(hào)兩者的電平均方根進(jìn)行電平對(duì)齊,如果在傳輸語(yǔ)音過(guò)程中發(fā)生單通,則退化信號(hào)在進(jìn)行電平轉(zhuǎn)換后正常語(yǔ)音段的電平會(huì)明顯高于參考信號(hào)的值,這將導(dǎo)致PESQ最終的評(píng)分有較大的偏頗。,亟待解決的問(wèn)題華為現(xiàn)階段的PESQ算法主要問(wèn)題是不能夠檢測(cè)出某些人耳能夠感受到的雜音樣本,即注入此雜音異常前后MOS評(píng)分變化甚微,但接聽(tīng)者能夠聽(tīng)到這些雜音。,由于尚未了解雜音樣本的特征及華為采用的PESQ具體算法,針對(duì)各種可能的情況提出了幾個(gè)對(duì)PESQ算法的改進(jìn)方案:1.樣本為響度較小的雜音加入響度較大的雜音,測(cè)試結(jié)果

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論