版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、主要內(nèi)容模擬信號數(shù)字化1信源編碼2MPEG3常用的音頻編碼方法44.1 MUSICAMMUSICAM(Masking Pattern adapted Universal Sub-band Integrated Coding And Multiplexing,掩蔽型自適應(yīng)通用子帶綜合編碼與復(fù)用),即MPEG-1的音頻編碼Layer2。PCM寬帶信號等分為寬度均為750Hz的32個子頻帶,屬于子頻帶編碼。32-384kb/sPCM信號MUSICAM信號MUSICAM編碼器原理圖(1)濾波器組多相濾波器組分析與綜合濾波器組總時(shí)延為11.6ms(48KHz取樣頻率)特殊的相位關(guān)系和相等的帶寬在同時(shí)進(jìn)行
2、混疊補(bǔ)償?shù)那闆r下,信號能完好地重建作用:寬帶的時(shí)域中的PCM信號變?yōu)?2個子頻帶,每個子頻帶為750Hz窄帶頻域中的數(shù)字信號。取樣頻率48KHz時(shí),分為32個子帶 每子帶帶寬: f=(fs / 2)/ 32 = 750Hz 每子帶的取樣頻率為: 2f = 1500Hz 每24ms(相當(dāng)于1個音頻幀長)內(nèi)每子帶有:15002410-3=36個樣值,32個子帶每24ms共有3632=1152個樣值子頻帶分割的理想情況:隨著頻率的增加,子頻帶的帶寬也增加。 增加信號處理的復(fù)雜度在子頻帶編碼方法中,通常各子頻帶寬度相等。子頻帶數(shù)量越多,在保持相同的聲音質(zhì)量下,編碼后的數(shù)據(jù)率越低;當(dāng)傳輸中出現(xiàn)比特差錯時(shí)
3、,影響越小,僅限制在很窄的子頻帶內(nèi),干擾作用大大減弱。(1)濾波器組(2)FFTFFT是離散傅里葉變換的快速算法。作用:為滿足掩蔽閾計(jì)算所需的精確的頻譜分析,主要提高低頻率范圍的頻率分辨率,與聽覺特性相適應(yīng)。濾波器組信號處理有一定的時(shí)延,為了進(jìn)行時(shí)延的均衡,在FFT之前,應(yīng)設(shè)置一個時(shí)延單元,延時(shí)時(shí)間為256個樣值,48kHz取樣頻率時(shí)相當(dāng)于5.3ms。FFT的輸出值送入心理聲學(xué)模型進(jìn)一步處理。(3)心理聲學(xué)模型心理聲學(xué)模型是模擬人耳聽覺掩蔽特性的數(shù)學(xué)模型。對應(yīng)于1152個輸入樣值的每一幀(24ms長)都要確定比特分配,32個子頻帶的比特分配均以各子頻帶的信號掩蔽比(SMR)為基礎(chǔ)進(jìn)行計(jì)算。因此
4、,對于每個子頻帶來說,確定用dB表示的最大信號聲級與最小掩蔽閾是必要的。任務(wù):利用FFT的輸出值,計(jì)算信號掩蔽比 (每8ms計(jì)算1次),從而形成比特分配運(yùn)算的相關(guān)輸入量。(4)比例因子的確定和編碼量化前,濾波器組的輸出值應(yīng)被歸一化。 比例因子比例因子是無量綱的系數(shù),一組數(shù)值在量化前是用比例因子標(biāo)定的,通過同時(shí)傳送相應(yīng)的比例因子,在解碼器就可以正確恢復(fù)出每個樣值相應(yīng)的幅度。每個子頻帶中12個彼此相繼的取樣值被歸并成一個塊(取樣頻率為48kHz時(shí)相當(dāng)于8ms)。每個塊中有一個最大的絕對值,隨著時(shí)間的變化,每8 ms可能出現(xiàn)不同的最大值。這些可能的不同最大值分成63個等級,即比例因子(SCF),級差
5、(分辨率)為2dB。63個比例因子,用6比特的字長來編碼 0- 編碼后“000000”, 62-“111110”比例因子的總的動態(tài)范圍超過120dB。分配到某子頻帶的比特?cái)?shù)不為零時(shí),才傳比例因子編碼數(shù)據(jù)(4)比例因子的確定和編碼(5)比例因子選擇信息及其編碼一個MPEG-1 Layer2音頻幀(24ms)相應(yīng)于每子帶36個子帶樣值,因此每個子帶每幀有3個比例因子。比例因子的統(tǒng)計(jì)試驗(yàn)表明,不僅每一時(shí)間塊的相鄰子帶比例因子有很大的依賴關(guān)系,而且在同一子帶中時(shí)間上彼此相繼的塊的比例因子也有很大的依賴關(guān)系??臻g依賴音頻信號的頻譜包絡(luò)曲線的特征:在較高頻率時(shí)頻譜能量分布是典型下降,比例因子從低頻子頻帶到
6、高頻子頻帶連續(xù)降低。時(shí)間依賴在一個子頻帶中彼此相繼的比例因子差別很小,出現(xiàn)大于2dB差別的概率小于10%(5)比例因子選擇信息及其編碼比例因子選擇信息(SCFSI):描述每子帶24ms(音頻幀長)傳送的比例因子的數(shù)量與位置的信息。原則上每子帶每8ms傳送1個比例因子,24ms應(yīng)傳送3個比例因子,根據(jù)聲音信號的特性,為降低用于傳送比例因子的數(shù)據(jù)率,每24ms可以傳送1個,2個或3個比例因子。SCFSI逐幀變化,2比特編碼。傳送比例因子所需的數(shù)據(jù)率可由22.5kb/s降低到7.5kb/s。SCFSI含義10傳送第1個比例因子對第1、2、3個8ms都有效11傳送第1、2個比例因子第1個比例因子對第1
7、個8ms有效第2個比例因子對第2、3個8ms有效SCFSI含義00傳送第1、2、3個比例因子分別對應(yīng)于第1、2、3個8ms01傳送第1、3個比例因子第1個比例因子對第1、2個8ms有效第2個比例因子對第3個8ms有效(6)動態(tài)比特分配信息及其編碼給每個子帶分配多少比特進(jìn)行量化,要同時(shí)滿足比特率和掩蔽要求,總的原則是使音頻幀期間的總的掩蔽噪聲比達(dá)到最小。動態(tài)比特分配(BAL):根據(jù)每個新的同聽閾的計(jì)算來變化子頻帶信號的分辨率(即量化的粗細(xì)),使音頻數(shù)據(jù)以相應(yīng)的比特分配進(jìn)行量化。動態(tài)比特分配的實(shí)驗(yàn)表明:該信息只需每24ms傳輸一次,該值正好與講話和音樂信號的停頓期相吻合。聲音信號在不斷隨時(shí)間變化。
8、比特分配不是一次性完成,是一個迭代過程。(7)子帶樣值的量化與編碼量化級數(shù)與子頻帶號有關(guān)3579153163.6553515個量化級7個量化級3個量化級低頻子頻帶中頻子頻帶高頻子頻帶低頻子帶(0-10),“動態(tài)比特分配信息”4比特,代表15種量化級,如4比特編碼為0001,1111,表明子帶樣值按3、,65535級量化。中頻子帶(11-22),3比特,7種量化級。高頻子帶(23-26),2比特,3種量化級。其它子帶“比特分配”信息為0,即無比特分配信息,對這些子帶的樣值不量化。當(dāng)要求的比特率較低時(shí),比特分配信息也有較大的變化。對單聲道32Kb/s和48kb/s而言,僅(0-1)子帶“比特分配”
9、信息4比特,(2-7)子帶為3比特,其它子帶“比特分配”信息為0,即無比特分配信息,對這些子帶的樣值不量化。量化系數(shù)根據(jù)“動態(tài)比特分配信息”,就有相應(yīng)的量化級,又有相應(yīng)的量化系數(shù)A和B。子頻帶樣值的量化和編碼步驟:每子頻帶12個連續(xù)的樣值每個都除以比例因子進(jìn)行歸一化,得到用X表示的值計(jì)算A*X+B(A和B是量化系數(shù),它與量化級相對應(yīng))取N個最高有效位(N是分配給樣值的比特?cái)?shù),如按63級量化,則N=6bit)反轉(zhuǎn)最高有效位(“0”變?yōu)椤?”,“1”變?yōu)椤?”)避免在數(shù)據(jù)流的該位置出現(xiàn)全1碼時(shí)與同步字相混淆。在解碼時(shí),最高有效位必須再反轉(zhuǎn)回來。(7)子帶樣值的量化與編碼(8)Layer2的幀結(jié)構(gòu)將
10、比特分配、比例因子選擇信息、比例因子、量化的子頻帶樣值與幀頭信息及一些用于差錯檢測的碼字組合在一起,形成了音頻幀。在取樣頻率為48kHz時(shí),每個音頻幀相當(dāng)1152個PCM音頻樣值,持續(xù)期為24ms。4.2 聯(lián)合立體聲編碼 聯(lián)合立體聲編碼是在MPEG Audio Layer1和Layer2中應(yīng)用的強(qiáng)度立體聲編碼。與普通左、右兩個聲道獨(dú)立的立體聲編碼相比:同碼率,提高音質(zhì)同音質(zhì),降低碼率解碼器附加復(fù)雜性可以忽略,編碼器的復(fù)雜性增加也很少,原有的時(shí)延不受影響。4.2 聯(lián)合立體聲編碼 聯(lián)合立體聲編碼是建立在人耳聽覺的心理聲學(xué)和生理聲學(xué)的基礎(chǔ)上。對水平方向上低頻率信號利用信號的相位進(jìn)聲源定位的。對水平方
11、向上高音頻頻率(2kHz以上)聲源的定位,利用了聲音信號的時(shí)間包絡(luò)。只要兩個信號的包絡(luò)正確,兩個聲道使用共同的信號,對高音頻率就可以實(shí)現(xiàn)相當(dāng)好的立體聲定位效果。編碼:不是同時(shí)傳送立體聲左、右聲道的比例因子以及所有子頻帶樣值,而是只傳送較高頻率子頻帶的左、右聲道取樣值之和,同時(shí)仍傳送相應(yīng)子頻帶左、右聲道的比例因子。解碼:利用左、右比例因子在解碼的立體聲信號的高音頻范圍,重建原始信號左、右聲道的包絡(luò)。聯(lián)合立體聲編、解碼系統(tǒng)在編碼器中,首先要對左、右兩個聲道所需的比特率進(jìn)行估算,如果所需的比特率超過了可用比特率,就通過設(shè)置一定數(shù)量的子頻帶,使之工作于聯(lián)合立體聲模式,以降低所需的比特率。根據(jù)所需的比特
12、率的不同,可設(shè)置子頻帶16-31或12-31或8-31或4-31工作于聯(lián)合立體聲模式。對于這些聯(lián)合子頻帶取樣值的量化,要使用較高的左、右聲道比特分配。在聯(lián)合立體聲工作模式中,左、右聲道子頻帶取樣值要相加,相加后的子頻帶樣值應(yīng)按正常方法確定出比例因子。但是,原來確定的左、右聲道子頻帶樣值的比例因子仍要傳輸。公共子頻帶樣值的量化和編碼以及公共比特分配的編碼,應(yīng)以與立體聲節(jié)目左、右聲道獨(dú)立編碼相同的方法來實(shí)現(xiàn)。4.2 聯(lián)合立體聲編碼 與以每聲道64kb/s碼率對左、右聲道獨(dú)立編碼的立體聲節(jié)目相比,以128kb/s碼率進(jìn)行聯(lián)合立體聲技術(shù)可大大提高Layer2的聲音質(zhì)量。在DAB中,使用192kb/s的
13、數(shù)據(jù)率結(jié)合聯(lián)合立體聲編碼技術(shù),以獲得足夠好的質(zhì)量。聯(lián)合立體聲編碼質(zhì)量4.3 低取樣頻率、低比特率編碼MPEG-1(在使用192kb/s以上數(shù)據(jù)率的情況下)可以編碼和傳送具有很好聲音質(zhì)量的立體聲信號。然而,如果使用低的數(shù)據(jù)率就可能聽得出信號決定的編碼噪聲。在設(shè)計(jì)低數(shù)據(jù)率的MPEG-1編碼器時(shí),經(jīng)常存在這樣的選擇,要么容忍較高的量化噪聲或者去限制信號的帶寬。低取樣頻率、低比特率編碼是 MPEG-2的音頻壓縮方法之一。取樣頻率折半,編碼算法保持不變,濾波器組的32個子頻帶相應(yīng)于半取樣頻率,現(xiàn)在提供一半的帶寬。能使編碼噪聲的可聽性減少,在很低的比特率有較好的質(zhì)量。全取樣頻率與半取樣頻率時(shí)的信號掩蔽比S
14、MR圖(a)第n個子頻帶中,SMR=33db,量化時(shí)要求的比特?cái)?shù)多圖(b)第m個子頻帶中,SMR=17db,量化時(shí)要求的比特?cái)?shù)少4.4 先進(jìn)音頻編碼(AAC)AAC:基于MPEG-2,諾基亞、蘋果等共同開發(fā),目的是取代MP3。與Mp3不同,它采用了全新的算法進(jìn)行編碼,更加高效,具有更高的“性價(jià)比”。利用AAC格式,可使人感覺聲音質(zhì)量沒有明顯降低的前提下,更加小巧。蘋果和諾基亞手機(jī)支持AAC格式。AAC是一種變換編碼。 AAC三層框架 為了提供應(yīng)用的靈活性,允許在質(zhì)量、存儲器和處理能力需求之間進(jìn)行折中,AAC系統(tǒng)提供了三層框架。主框架:在所給定的數(shù)據(jù)率范圍內(nèi),都能提供最好的質(zhì)量。該框架對存儲器和
15、處理能力的要求較高。按主框架構(gòu)成的AAC解碼器向下兼容,可以對用低復(fù)雜度框架編碼器編碼的數(shù)據(jù)流解碼。低復(fù)雜度(LC)框架:結(jié)構(gòu)比較簡單,它不包含預(yù)測和預(yù)處理模塊,時(shí)域噪聲整形的階數(shù)也有限。比主框架的聲音質(zhì)量低,但對計(jì)算機(jī)的存儲器和處理能力的要求可明顯減少。可分級取樣頻率(SSR)框架:結(jié)構(gòu)最簡單,能產(chǎn)生頻率可分級信號。適合于低采樣頻率的信號處理(fs: 8-96kHz)AAC編碼器方框圖濾波器組把輸入端的PCM時(shí)域信號變?yōu)橄到y(tǒng)內(nèi)部的頻域信號,由于頻域信號是每一時(shí)間塊計(jì)算一次,因此濾波器組輸出的信號是一種時(shí)間-頻率表現(xiàn)形式。解碼器中的濾波器組進(jìn)行相反的變化。在編碼器中,使用改良離散余弦變換(MD
16、CT),采用了時(shí)域混疊抵消(TDAC)技術(shù)。輸入信號在進(jìn)行頻域變換之前,要先進(jìn)行加窗處理,以降低邊界效應(yīng)影響頻譜分析,提高頻率選擇性。通過將相鄰塊的取樣值重疊50%,再通過TDAC技術(shù),在合成階段便可抵消邊界效應(yīng)。(1)濾波器組(2)時(shí)域噪聲整形(TNS)在感知聲音編碼中,TNS是用來控制量化噪聲的瞬時(shí)形狀的一種方法,解決掩蔽閾值和量化噪聲的錯誤匹配問題。作用:使編碼器對量化噪聲的細(xì)微時(shí)域結(jié)構(gòu)進(jìn)行控制,使之適應(yīng)掩蔽信號的結(jié)構(gòu),更充分利用掩蔽效應(yīng)。實(shí)現(xiàn):在部分頻譜數(shù)據(jù)上應(yīng)用濾波過程來實(shí)現(xiàn)的。對于相對平穩(wěn)的信號來說,采用預(yù)測可以進(jìn)一步有效減少冗余,從而提高編碼效率。預(yù)測只在長變換塊使用。在每聲道中
17、,都對由濾波器組進(jìn)行頻譜分析產(chǎn)生的頻譜分量進(jìn)行預(yù)測,每一頻譜分量(直到16kHz)都有一個相應(yīng)的預(yù)測器,每個預(yù)測器充分利用連續(xù)各幀的頻譜分量之間的自相關(guān)。在AAC中,每個頻譜分量使用一個二階后向自適應(yīng)預(yù)測器,工作時(shí)需要前兩幀的頻譜分量值。預(yù)測器的參數(shù)逐幀地自適應(yīng)于現(xiàn)實(shí)信號的統(tǒng)計(jì)特征。在預(yù)測器的作用下,量化器的輸入量僅是預(yù)測誤差,而不是原始的頻譜分量,因而編碼效率更高。(3)預(yù)測在音頻編碼器中,數(shù)據(jù)率的真正降低是通過量化處理的。對頻譜數(shù)據(jù)量化的準(zhǔn)則和之前介紹的方法相同。與量化相對應(yīng),對頻譜進(jìn)行編碼的比特?cái)?shù)既應(yīng)低于給定的限制,又要滿足心理聲學(xué)特性的要求。ACC中使用非線性量化。量化級數(shù)限制在819
18、1(即213-1)之間,可以以1.5dB的步長進(jìn)行調(diào)整。量化使用兩層迭代循環(huán)。內(nèi)層迭代循環(huán)的目的是調(diào)節(jié)量化器步長,外層迭代循環(huán)是用來放大比例系數(shù)頻段(或稱比例因子帶,簡稱SFBS)。把頻譜劃分為幾個頻譜組,每組共享一個比例因子(比例系數(shù)),這些頻譜組就稱為比例系數(shù)頻段。比例系數(shù)表示增益數(shù)值,用以改變比例系數(shù)頻段中所有的頻譜幅度。(4)量化(5)編碼AAC中,量化后的頻率值、差分比例系數(shù)、方向信息等使用Huffman編碼。為了對1個、2個或4個一組的頻譜值進(jìn)行編碼,共使用了12個編碼本。4.5 高效音頻編碼AAC在低數(shù)據(jù)率的情況下可以達(dá)到很好的立體聲音頻質(zhì)量,這對許多應(yīng)用來說遠(yuǎn)遠(yuǎn)不夠。數(shù)字廣播中,音頻比特率的減半意味著可提供的節(jié)目套數(shù)加倍。將比特率降低到臨界值以下,會以不同形式損傷音頻質(zhì)量。將AAC、SBR、PS技術(shù)結(jié)合,產(chǎn)生了高效音頻編碼方法。AAC-Pl
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024版城市基礎(chǔ)設(shè)施安裝施工協(xié)議版B版
- 2024年股權(quán)投資合同:風(fēng)險(xiǎn)投資
- 2024離婚冷靜期子女撫養(yǎng)權(quán)合同一
- 職業(yè)學(xué)院學(xué)生預(yù)警教育實(shí)施辦法
- 2024年銷售返聘合同3篇
- 2025年度能源企業(yè)打字員技術(shù)文檔合同范本3篇
- 2024年貨物進(jìn)出口合同(簡易版)
- 2025年度海外房產(chǎn)居間租賃代理協(xié)議3篇
- 2024年版企業(yè)房屋租賃合同綜合指南版B版
- 2024年離婚雙方債務(wù)確認(rèn)及解決方案3篇
- 基層管理者領(lǐng)導(dǎo)力培訓(xùn)課程
- 電除顫的并發(fā)癥預(yù)防及處理
- 《理想信念教育》課件
- 2023年高級EHS工程師年度總結(jié)及下年工作展望
- 《泰語基本用語》課件
- 學(xué)生成績通知書模板(寒假)
- 高中英語詞匯3500詞(必背)-excel版
- 劇本保密協(xié)議模板
- GB 4806.9-2023食品安全國家標(biāo)準(zhǔn)食品接觸用金屬材料及制品
- 寶馬Z4汽車說明書
- 物流管理與工程案例
評論
0/150
提交評論