版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
多媒體技術(shù)基礎(chǔ)1MPEG聲音一、MPEG-1Audio
二、MPEG-2Audio三、MPEG-2ACC四、MPEG-4Audio2MPEG-1Audio、MPEG-2Audio、MPEG-2ACC聲音數(shù)據(jù)壓縮編碼——感知聲音編碼(perceptualaudiocoding)利用人的聽覺系統(tǒng)的感知特性來達(dá)到壓縮聲音數(shù)據(jù)的目的不同于與波形聲音壓縮編碼(如ADPCM)和參數(shù)編碼(如LPC):依據(jù)波形本身的相關(guān)性和模擬人的發(fā)音器官的特性)MPEG聲音3對響度的感知
“聽閾—頻率”曲線MPEG聲音4對音高的感知“音高—頻率”曲線MPEG聲音5掩蔽效應(yīng)一種頻率的聲音阻礙聽覺系統(tǒng)感受另一種頻率的聲音的現(xiàn)象頻域掩蔽一個(gè)強(qiáng)純音會掩蔽在其附近同時(shí)發(fā)聲的弱純音,這種特性稱為頻域掩蔽,也稱同時(shí)掩蔽時(shí)域掩蔽在時(shí)間上相鄰的聲音之間的掩蔽現(xiàn)象。兩種時(shí)閾掩蔽:超前掩蔽和滯后掩蔽MPEG聲音6心理聲學(xué)模型(psychoacousticmodel)聽覺閾值電平聽覺閾值的大小隨聲音頻率的改變而改變,各個(gè)人的聽覺閾值也不同。(大多數(shù)人2kHz~5kHz)一個(gè)人是否能聽到聲音取決于聲音的頻率,以及聲音的幅度是否高于這種頻率下的聽覺閾值。聽覺掩飾特性聽覺閾值電平是自適應(yīng)的,即聽覺閾值電平會隨聽到的不同頻率的聲音而發(fā)生變化。MPEG聲音7MPEGAudio采用的兩種感知編碼:感知子帶編碼(perceptualsub-bandcoding)思想是首先把時(shí)域中的聲音數(shù)據(jù)變換到頻域,對頻域內(nèi)的子帶分量分別進(jìn)行量化和編碼,然后根據(jù)心理聲學(xué)模型確定樣本的精度,從而達(dá)到壓縮數(shù)據(jù)量的目的。不局限于只對話音進(jìn)行編碼,也不局限于哪一種聲源。DolbyAC-3編碼MPEG聲音8感知子帶編碼壓縮算法框圖MPEG-1Audio9DolbyAC-3壓縮編碼算法框圖MPEG-1Audio10MPEG聲音編碼器結(jié)構(gòu)圖MPEG-1Audio11MPEG聲音解碼器結(jié)構(gòu)圖MPEG-1Audio12ISO/MPEGaudio層1和層2編碼器和解碼器的結(jié)構(gòu)MPEG-1Audio13ISO/MPEGaudio層3編碼器和解碼器的結(jié)構(gòu)MPEG-1Audio14MPEG-1和-2的聲音數(shù)據(jù)規(guī)格參數(shù)名稱LinearPCMDolbyAC-3MPEG-2AudioMPEG-1Audio采用頻率48/96kHz32/44.1/48kHz16/22.05/24/32/44.1/48kHz32/44.1/48kHz樣本精度
(每個(gè)樣本的比特?cái)?shù))16/20/24壓縮(16bits)壓縮(16bits)16最大數(shù)據(jù)傳輸率6.144Mb/s448kb/s8~640kb/s32~448kb/s最大聲道數(shù)85.15.1/7.12MPEG-2Audio15MPEG-2AAC(Advancedaudiocoding)編碼思想:主要使用聽覺系統(tǒng)的掩蔽特性來減少聲音的數(shù)據(jù)量,并且通過把量化噪聲分散到各個(gè)子帶中,用全局信號把噪聲掩蔽掉。與MPEG-1聲音格式不兼容
適用范圍:AAC支持的采用頻率可從8kHz到96kHzAAC編碼器的音源可以是單聲道的、立體聲的和多聲道的聲音。(AAC標(biāo)準(zhǔn)可支持48個(gè)主聲道、16個(gè)低頻音效加強(qiáng)通道LFE(lowfrequencyeffects)、16個(gè)配音聲道(overdubchannel)或者叫做多語言聲道(multilingualchannel)和16個(gè)數(shù)據(jù)流。)MPEG-2AAC16MPEG-2AAC(Advancedaudiocoding)壓縮率:MPEG-2AAC壓縮比為11:1(即每個(gè)聲道的數(shù)據(jù)率為(44.1×16)/11=64kb/s)。在5個(gè)聲道的總數(shù)據(jù)率為320kb/s的情況下,很難區(qū)分還原后的聲音與原始聲音之間的差別。與MPEG的層2相比,MPEG-2AAC的壓縮率可提高1倍,而且質(zhì)量更高;與MPEG的層3相比,在質(zhì)量相同的條件下數(shù)據(jù)率是它的70%。MPEG-2AAC17MPEG-2AAC的配置開發(fā)MPEG-2AAC標(biāo)準(zhǔn)采用模塊化的方法:把整個(gè)AAC系統(tǒng)分解成一系列模塊,用標(biāo)準(zhǔn)化的AAC工具(advancedaudiocodingtools)對模塊進(jìn)行定義(MPEGAudio標(biāo)準(zhǔn)是對整個(gè)系統(tǒng)進(jìn)行標(biāo)準(zhǔn)化)AAC標(biāo)準(zhǔn)定義了三種配置:基本配置低復(fù)雜性配置可變采樣率配置MPEG-2AAC18MPEG-2AACMPEG-2AAC編碼器框圖19MPEG-2AAC解碼器框圖MPEG-2AAC20MPEG-4Audio標(biāo)準(zhǔn):集成從話音~高質(zhì)量的多通道聲音;從自然聲音~合成聲音編碼方法:參數(shù)編碼(parametriccoding)碼激勵(lì)線性預(yù)測(codeexcitedlinearpredictive,CELP)編碼時(shí)間/頻率T/F(time/frequency)編碼結(jié)構(gòu)化聲音SA(structuredaudio)編碼合成聲音:MIDI;TTSMPEG-4Audio21自然聲音
(naturalaudio)MPEG-4聲音編碼器支持?jǐn)?shù)據(jù)率2kb/s~64kb/s之間的自然聲音。三種類型聲音編碼器:
MPEG-4Audio221、參數(shù)編碼器
參數(shù)編碼提供了兩種編碼工具:HVXC和HILN。
諧音矢量激勵(lì)編碼HVXC(HarmonicVectorXcitationCoding)編碼工具允許對語言信號在2kbit/s和4kbit/s之間進(jìn)行可分級性編碼。
諧音和獨(dú)立線性加性噪聲HILN(HarmonicandIndividualLine
plus
Noise)編碼工具允許對非語言信號,例如音樂以4kbit/s和更高的碼率進(jìn)行編碼。HILN支持在速度、音調(diào)、碼率和復(fù)雜度上的可分級性??梢詫VXC和HILN聯(lián)合起來使用以獲得更寬范圍內(nèi)的信號和碼率??梢栽趦烧呔幋a器的輸出之間動態(tài)地切換或混合。MPEG-4Audio232、CELP編碼器
CELP的解碼器包括一個(gè)激勵(lì)源、一個(gè)合成濾波器和一個(gè)需要時(shí)添加的后置濾波器。
激勵(lì)源擁有兩種分量,一是由自適應(yīng)碼書產(chǎn)生的周期分量,另一個(gè)是由一個(gè)或多個(gè)固定碼書產(chǎn)生的隨機(jī)分量。在解碼器中,使用碼書索引和增益索引來重建激勵(lì)信號。激勵(lì)信號接著通過線性預(yù)測合成濾波器,最后,為了獲得增強(qiáng)的語言質(zhì)量,可以使用后置濾波器。CELP支持兩種采樣率:8kHz和16kHz輸出數(shù)據(jù)率6~24kb/sMPEG-4Audio243、T/F編碼器(時(shí)間-頻率(time-to-frequency,T/F)技術(shù))當(dāng)碼率為每聲道64kbit/s時(shí)就是MPEG-2
AAC編碼標(biāo)準(zhǔn),此時(shí)可以獲得極好的音頻質(zhì)量。
比特分片算述編碼BSAC(the
bit-sliced
arithmetic
coding),作為一種無噪聲編碼它能提供從16kbit/s至64kbit/s之間以1kbit/s的步率實(shí)現(xiàn)碼率的分可級性。變換域加權(quán)插入矢量量化TwinVQ作為一種無噪聲編碼和量化工具也是一種選擇,它使用線性預(yù)測編碼(LPC)模型來定義量化器步階,對插入和量化的頻譜系數(shù)進(jìn)行矢量量化,特別適用于需要碼率可分級性和強(qiáng)糾錯(cuò)的系統(tǒng)中。
MPEG-4Audio25MPEG-4Audio編碼方框圖MPEG-4Audio26文-語轉(zhuǎn)換TTS(tex
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 廣安職業(yè)技術(shù)學(xué)院《短片拍攝與剪輯》2023-2024學(xué)年第一學(xué)期期末試卷
- 三年級科學(xué)下冊第一單元土壤與生命3肥沃的土壤教案蘇教版
- 藥品知識培訓(xùn)課件
- 產(chǎn)品成本控制教學(xué)培訓(xùn)課件
- 《糖尿病足的預(yù)防》課件
- 確保培訓(xùn)課件內(nèi)容
- 《氧化硫滿意》課件
- 《漢字的演變過程》課件
- 培訓(xùn)課件專員
- 學(xué)校保衛(wèi)檢查考核獎(jiǎng)懲制度
- 樁基檢測選樁方案
- 腦梗塞老人的營養(yǎng)護(hù)理措施
- 電動汽車膠粘劑市場洞察報(bào)告
- 不銹鋼樓梯扶手安裝合同
- 開荒保潔物業(yè)管理開荒保潔服務(wù)實(shí)施方案
- GA/T 2015-2023芬太尼類藥物專用智能柜通用技術(shù)規(guī)范
- 新華DCS軟件2.0版使用教程-文檔資料
- 住所的承諾書范文
- 售前解決方案部門管理規(guī)章制度
- 幼兒園游戲活動材料投放與指導(dǎo)課件
- 《城市道路工程設(shè)計(jì)規(guī)范》宣貫
評論
0/150
提交評論