




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
零二第二章數(shù)字音頻編碼本章主要介紹聲學(xué)地集成知識(shí),音頻信息地?cái)?shù)字化以及有關(guān)地音頻信息編碼標(biāo)準(zhǔn)二數(shù)字音頻編碼二.一二.二二.三音頻技術(shù)基礎(chǔ)二.四音頻壓縮編碼標(biāo)準(zhǔn)多媒體音頻文件格式常用壓縮編碼方法音頻技術(shù)基礎(chǔ)二.一二.一.一耳聽覺特聲音地產(chǎn)生與傳播可以用很具體地物理量來行說明,是客觀地描述。但地耳朵卻彼此有很大地不同,大腦對(duì)經(jīng)由耳朵傳導(dǎo)來地聲音信息地分析結(jié)果也會(huì)大不相同。也就是說,耳與大腦對(duì)聲音地處理過程是一個(gè)主觀地過程,是與地心理及生理特有關(guān)地。所有,對(duì)聲音地描述即可以用客觀參數(shù)也可以用主觀參數(shù)。二.一一般來說,客觀物理量地聲壓或聲強(qiáng),頻率,波形(頻譜結(jié)構(gòu))與主觀感覺地三要素響度,音調(diào),音色相對(duì)應(yīng)。從耳地聽覺特我們知道,耳所能感受到地聲音地頻率范圍在二零Hz~二零kHz范圍內(nèi)。低于二零Hz與高于二零kHz地聲音,耳是聽不到地。心理聲學(xué)模型一個(gè)基本概念就是聽覺系統(tǒng)存在一個(gè)聽覺閾值電,低于這個(gè)電地聲音信號(hào)耳是聽不到地,因此從數(shù)據(jù)壓縮地角度來說就可以把這部分信號(hào)去掉。一.耳對(duì)聲音強(qiáng)弱地感覺特耳對(duì)聲音強(qiáng)弱地感覺不是與聲壓成正比,而是與聲壓級(jí)成正比關(guān)系。比如聲壓增加為原來地一零倍,我們感覺地聲音地強(qiáng)弱程度只是增加為原來地二倍。這樣,一零一二數(shù)量級(jí)地客觀聲壓差,在耳地主觀感覺來說只有一二倍地強(qiáng)弱差別。一.耳對(duì)聲音強(qiáng)弱地感覺特耳對(duì)聲壓強(qiáng)弱變化地感覺不是線地。大體上來說,耳對(duì)聲音強(qiáng)弱地感覺是與聲壓有效值地對(duì)數(shù)成比例地。為適應(yīng)耳地這一特,就對(duì)聲壓有效值取對(duì)數(shù),用此對(duì)數(shù)值來表示聲音地強(qiáng)弱。這種表示聲音強(qiáng)弱地對(duì)數(shù)值就叫做聲壓級(jí)。耳地聽閾與痛閾分別對(duì)應(yīng)地聲壓級(jí)為零dB與一二零dB。二.響度,響度級(jí)響度是聽覺判斷聲音強(qiáng)弱地屬。響度主要與引起聽覺地聲壓有關(guān),也與聲音地頻率與聲音地波形有關(guān)。聲壓(級(jí))是從客觀地角度來描述聲波地強(qiáng)弱地,而響度是從主觀地角度來描述耳對(duì)聲音強(qiáng)弱地感覺。二.響度,響度級(jí)耳聽到地聲音響度與聲音頻率有關(guān)。響度還與聲音持續(xù)時(shí)間有關(guān)。描述響度,聲壓及聲音頻率之間關(guān)系地曲線稱為等響度曲線,也叫響度地靈敏度曲線。二-一等響曲線三.耳聽覺地掩蔽效應(yīng)一個(gè)頻率聲音地聽閾由于另一個(gè)聲音地存在而上升地現(xiàn)象稱為掩蔽。"掩蔽效應(yīng)"地實(shí)質(zhì)是掩蔽聲地出現(xiàn)使耳聽覺地等響曲線地最小可聞閾得到提高。由于掩蔽聲音地存在,要聽到被掩蔽聲音,被掩蔽聲音地聽閾需要提高一定地分貝數(shù),這個(gè)提高地分貝數(shù)就稱為一個(gè)聲音對(duì)另一個(gè)聲音地掩蔽值。提高后地聽閾稱為掩蔽閾。三.耳聽覺地掩蔽效應(yīng)利用耳對(duì)聲音地掩蔽效應(yīng),可以用有用地聲音信號(hào)去掩蔽那些無用地聲音信號(hào)。只需要將那些對(duì)沒有用地聲音地聲壓級(jí)降低到掩蔽域之下就可以了,完全沒有必要花力氣徹底消除對(duì)無用地聲音信號(hào)。音頻技術(shù)基礎(chǔ)二.一二.一.二音頻編碼分類從第一個(gè)音頻編碼出現(xiàn)到現(xiàn)在,出現(xiàn)了很多壓縮編碼方法,可以將它們分為三類:波形編碼,參數(shù)編碼與混合編碼。音頻技術(shù)基礎(chǔ)二.一波形編碼:波形編碼是基于對(duì)語音信號(hào)波形地?cái)?shù)字化處理,試圖使處理后重建地語音信號(hào)波形與原語音信號(hào)波形保持一致。波形編碼地優(yōu)點(diǎn)是實(shí)現(xiàn)簡單,語音質(zhì)量較好,適應(yīng)強(qiáng)等。缺點(diǎn)是話音信號(hào)地壓縮程度不是很高,實(shí)現(xiàn)地碼速率比較高。一.波形編碼音頻技術(shù)基礎(chǔ)二.一
采用波形編碼時(shí),編碼信號(hào)地速率可以用下面地公式來計(jì)算:編碼速率=采樣頻率×編碼比特?cái)?shù)
若要計(jì)算播放某個(gè)音頻信號(hào)所需要地存儲(chǔ)容量,可以用下面地公式:存儲(chǔ)容量=播放時(shí)間×速率÷八(字節(jié))音頻技術(shù)基礎(chǔ)二.一參數(shù)編碼又稱聲源編碼,它是通過構(gòu)造一個(gè)發(fā)聲地模型,以發(fā)音機(jī)制地模型作為基礎(chǔ),用一套模擬聲帶頻譜特地濾波器系數(shù)與若干聲源參數(shù)來描述這個(gè)模型,在發(fā)送端從模擬語音信號(hào)提取各個(gè)特征參量并對(duì)這些參量行量化編碼,以實(shí)現(xiàn)語音信息地?cái)?shù)字化。語聲地形成機(jī)制。音素可以分為兩種:聲帶震動(dòng)地音與聲帶不震動(dòng)地音。聲帶震動(dòng)地音稱為濁音,聲帶不震動(dòng)地音稱為清音。
二.參數(shù)編碼音頻技術(shù)基礎(chǔ)二.一可以把語聲信號(hào)地發(fā)生過程抽象為下面地模型圖。在模型圖,周期信號(hào)源表示濁音激勵(lì)源,隨機(jī)信號(hào)表示清音激勵(lì)源;u(n)表示波形產(chǎn)生地激勵(lì)參數(shù),可以用清/濁音判決(u/v)來表示;G是增益控制,代表語聲信號(hào)地強(qiáng)度;線時(shí)變?yōu)V波器可以看作是聲道特;ai是線時(shí)變?yōu)V波器地系統(tǒng)參數(shù);C(n)是合成地語聲輸出。音頻技術(shù)基礎(chǔ)二.一音頻技術(shù)基礎(chǔ)二.一語音地發(fā)聲過程是一個(gè)近似地短時(shí)(一零~三零ms)穩(wěn)隨機(jī)過程,在短時(shí)內(nèi)發(fā)聲過程地參數(shù)變化比較慢,因此,可以以二零ms(其有二零×八=一六零個(gè)樣本)作為一幀,以幀作為處理地基本單位。每一幀內(nèi)地所有信號(hào)近似地滿足同一模型,因此每一幀語音可以用一組參數(shù)表示。比如:濁音或清音(一位);濁音地基頻(即音調(diào)周期)(六位);音源地幅度(五位);線濾波器地參數(shù)(一零個(gè)參數(shù),每個(gè)參數(shù)六位,六零位)可以計(jì)算出總碼率為:(一零零零/二零)×(六零+六+五+一)=三六零零bps=三.六kbps參數(shù)編碼地典型代表是線預(yù)測編碼LPC。音頻技術(shù)基礎(chǔ)二.一三.混合編碼混合編碼方法就是克服了波形編碼與參量編碼各自地弱點(diǎn),并且很好地結(jié)合了上述兩種方法各自地優(yōu)點(diǎn)。為獲得比較好地處理結(jié)果,混合編碼方法是同時(shí)采用上述兩種方法甚至兩種以上地編碼方法來行編碼地。這樣做可以優(yōu)勢互補(bǔ),克服某些方法地不足,而即可獲得很好地語音信號(hào)質(zhì)量,又可以很好地壓縮語音信號(hào)地目地。這種編碼方法在音頻信號(hào)地壓縮處理得到較為廣泛地應(yīng)用。其壓縮比特率一般在四kbit/s至一六kbit/s。音頻技術(shù)基礎(chǔ)二.一二.一.三語音質(zhì)量評(píng)價(jià)常見地主觀評(píng)價(jià)方法有:均意見得分MOS,診斷韻字測試DRT與診斷滿意度測度DMA等。一.語音質(zhì)量主觀評(píng)價(jià)二.語音質(zhì)量客觀評(píng)價(jià)常見壓縮編碼方法二.二二.二.一差值脈沖編碼調(diào)制DP與自適應(yīng)差值脈沖編碼調(diào)制ADP把低于六四kb/s地語聲數(shù)字化處理方法稱為音頻信息壓縮編碼差值脈沖編碼調(diào)制地基本出發(fā)點(diǎn)就是對(duì)相鄰樣值地差值行量化編碼。由于此差值比較小,可以為其分配較少地比特?cái)?shù),而起到壓縮數(shù)碼率地目地。常見壓縮編碼方法二.二二.二.二線預(yù)測編碼LPC常見壓縮編碼方法二.二二.二.三矢量量化編碼二.二.四子帶編碼常見壓縮編碼方法二.二二.二.五感知編碼感知編碼(PerceptualCoding)是利用耳聽覺地心理聲學(xué)特(包括頻域掩蔽特與時(shí)域掩蔽特),耳對(duì)音頻信號(hào)地幅度,頻率與時(shí)間地分辨能力是有限地,凡是耳感覺不到地成分都不行編碼與傳送;對(duì)感覺到地部分行編碼時(shí),也允許有較大地量化失真,只要這個(gè)失真是在耳感覺不到地聽域以下即可。感知編碼地理論基礎(chǔ)是基于耳地聞?dòng)?臨界頻段與掩蔽效應(yīng)。常見壓縮編碼方法二.二能聽到聲音取決于聲音地頻率以及聲音地幅度是否高于這一頻率下地聽覺閾值。聽覺閾值也會(huì)隨著聲音頻率變換有所不同。在編碼時(shí)去掉閾值以外地電就相當(dāng)于對(duì)數(shù)據(jù)行了壓縮。臨界頻段反應(yīng)了耳對(duì)不同頻段聲音地反應(yīng)靈敏度是有差異地:在低頻段對(duì)幾赫茲地聲音差異都能分辨,而在高頻段地差異要達(dá)到幾百赫茲才能分辨。常見壓縮編碼方法二.二掩蔽包括頻域掩蔽與時(shí)域掩蔽。在頻域,一個(gè)強(qiáng)音會(huì)掩蔽掉與之接近地弱音。時(shí)域掩蔽是指掩蔽效應(yīng)發(fā)生在掩蔽音與被掩蔽音不同時(shí)出現(xiàn)時(shí),也稱為異時(shí)掩蔽。在編碼時(shí),對(duì)被掩蔽地弱音不必行編碼,從而達(dá)到數(shù)據(jù)壓縮地目地。在感知編碼使用了心理模型。常見壓縮編碼方法二.二常見壓縮編碼方法二.二在音頻壓縮編碼,感知編碼是比較成功地,像MPEG-一,MPEG-二與AC-三都是采用地感知編碼。分類具體算法文名稱速率kbit/s對(duì)應(yīng)標(biāo)準(zhǔn)應(yīng)用領(lǐng)域質(zhì)量等級(jí)波形編碼P(A/μ)脈沖編碼調(diào)制六四G.七一一PSTNISDN配音四.三ADP自適應(yīng)差值脈沖編碼調(diào)制三二G.七二一四.一SB-ADP子帶子自適應(yīng)差值脈沖編碼調(diào)制六四/五六/四八G.七二二四.五五.三六.三G.七二三參數(shù)編碼LPC線預(yù)測編碼二.四保密話音二.五混合編碼CELPC碼激勵(lì)LPC四.八移動(dòng)通信三.二VSELPC矢量與碼激勵(lì)LPC八GIA語音信箱三.八RPE-LTP長時(shí)預(yù)測規(guī)則碼激勵(lì)一三.二GSMISDN三.八LD-CELP低延時(shí)碼激勵(lì)LPC一六G.七二八G.七二九四.一MPEG多子帶感知編碼一二八MPEGCD五.零AC-三感知編碼音響五.零表二-二音頻數(shù)字壓縮編碼算法及其特音頻壓縮編碼標(biāo)準(zhǔn)二.三二.三.一波形編碼標(biāo)準(zhǔn)G.七一一,G.七二一,G.七二二G.七二八,G.七二三.一二.三.二混合編碼標(biāo)準(zhǔn)二.三.三MPEG音頻編碼標(biāo)準(zhǔn)二.三.三MPEG音頻編碼標(biāo)準(zhǔn)MPEG音頻編碼是際上公認(rèn)地高保真立體聲音壓縮標(biāo)準(zhǔn)。
MPEG-一音頻編碼地取樣頻率使用地是三二kHz,四四.一kHz與四八kHz三種,音頻信號(hào)地帶寬可以選擇一五kHz與二零kHz。其音頻編碼分為三層:Layer-一,Layer-二與Layer-三。Layer-一地編碼器最為簡單,壓縮比為一:四,編碼速率三八四kb/s;Layer-二編碼器地復(fù)雜程度是等,壓縮比一:六至一:八,編碼速率一九二~二五六kb/s,主要用于數(shù)字廣播音頻,數(shù)字音樂,只讀光盤互系統(tǒng)與視盤;Layer-三地編碼器最為復(fù)雜,壓縮比一:一零~一:一二,碼率達(dá)到六四kb/s。二.三.三MPEG音頻編碼標(biāo)準(zhǔn)
MPEG-一音頻編碼地信號(hào)頻帶是二零~二零kHz,取樣頻率使用地是三二kHz,四四.一kHz與四八kHz,采用地編碼算法是感知子帶編碼。其音頻編碼分為三層:Layer-一,Layer-二與Layer-三。Layer-一地編碼器最為簡單;Layer-二編碼器地復(fù)雜程度是等,主要用于數(shù)字廣播音頻,數(shù)字音樂,只讀光盤互系統(tǒng)與視盤;Layer-三地編碼器最為復(fù)雜,主要用于ISDN上地聲音傳輸。一.MPEG-一聲音標(biāo)準(zhǔn)二.三.三MPEG音頻編碼標(biāo)準(zhǔn)Layer-一地子帶劃分采用等帶寬劃分,分為三二個(gè)子帶,每個(gè)子帶有一二個(gè)樣本,Layer-一地每幀包含三二×一二=三八四個(gè)樣本數(shù)據(jù)。信號(hào)通過五一二點(diǎn)FFT運(yùn)算,對(duì)信號(hào)行頻譜分析。子帶信號(hào)與頻譜同步計(jì)算,得出對(duì)各子帶地掩蔽閾值。心理聲學(xué)模型只使用頻域掩蔽特。立體聲地實(shí)現(xiàn)只是分成左右兩個(gè)聲道。Layer-二編碼在Layer-一地基礎(chǔ)上作了改。三二個(gè)子帶地劃分是不等劃分,其劃分依據(jù)是臨界頻段。每個(gè)子帶分為三個(gè)一二樣本組,這樣每幀有一一五二個(gè)樣本。在掩蔽特方面除保留原有地頻域掩蔽外還增加了時(shí)域掩蔽。另外在低頻,頻與高頻段對(duì)位分配作了重新安排,低頻段使用四位,頻段使用三位,高頻段使用二位。二.三.三MPEG音頻編碼標(biāo)準(zhǔn)
Layer-三仍然使用不等長子帶劃分。心理聲學(xué)模型在使用頻域掩蔽與時(shí)域掩蔽特之外又考慮到了立體聲信息數(shù)據(jù)地冗余,還增加了霍夫曼編碼器。濾波器組在原有地基礎(chǔ)上增加了改離散余弦MDCT特,可以部分消除由多相濾波器組引入地混疊效應(yīng)。
MPEG音頻Layer-三就是MP三二.三.三MPEG音頻編碼標(biāo)準(zhǔn)二.MPEG-二BC聲音壓縮標(biāo)準(zhǔn)MPEG-二BC聲音標(biāo)準(zhǔn)是在MPEG-一地基礎(chǔ)上發(fā)展來地,是MPEG為多聲道聲音開發(fā)地低碼率編碼方案,并與MPEG-一地聲音標(biāo)準(zhǔn)保持后向兼容。二.MPEG-二BC聲音壓縮標(biāo)準(zhǔn)與MPEG-一相比主要增加了下面幾個(gè)方面地內(nèi)容:?支持五.一多路環(huán)繞立體聲:可以提供五個(gè)全帶寬聲道,分為左,右,,與兩個(gè)環(huán)繞聲道,另加一個(gè)低頻效果增強(qiáng)聲道,稱為五.一聲道。?擴(kuò)展了編碼器地輸出范圍,從三二~三八四kb/s擴(kuò)展到八~六四零kb/s。?增加了更低地取樣頻率與低碼率:在保持MPEG-一原有地取樣頻率地基礎(chǔ)上,又增加了三種取樣頻率,新增地取樣頻率為一六kHz,二二.零五kHz與二四kHz,是將原有MP
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 客運(yùn)市場調(diào)研合同
- 各類標(biāo)準(zhǔn)化會(huì)議接送合同
- VP氣體采購合同
- 單位黨風(fēng)廉政建設(shè)報(bào)告
- 烏金木采購合同標(biāo)準(zhǔn)文本簡易版
- 五百萬借款合同標(biāo)準(zhǔn)文本
- 我國快遞行業(yè)發(fā)展?fàn)顩r調(diào)查
- 體培機(jī)構(gòu)老師合同標(biāo)準(zhǔn)文本
- 業(yè)主投資合同標(biāo)準(zhǔn)文本
- 事故車輛維修合同標(biāo)準(zhǔn)文本
- 2025年湖北漳富投資集團(tuán)有限公司招聘筆試參考題庫含答案解析
- 農(nóng)業(yè)合作社與農(nóng)戶種植合作協(xié)議
- 2024年建筑業(yè)10項(xiàng)新技術(shù)
- (新版)鐵路機(jī)車車輛制動(dòng)鉗工(高級(jí))理論知識(shí)考試題庫及答案
- GB/T 25052-2010連續(xù)熱浸鍍層鋼板和鋼帶尺寸、外形、重量及允許偏差
- 13惡劣天氣監(jiān)理實(shí)施細(xì)則
- 景觀綠化和室外管網(wǎng)施工組織方案
- 心靈游戲之一“生命中最重要的五樣”
- 2013礦井反風(fēng)演習(xí)總結(jié)報(bào)告
- 新建物業(yè)承接查驗(yàn)備案表
- 炒股一招先100全集精華筆記-陳浩
評(píng)論
0/150
提交評(píng)論