




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
MPEG聲音
一、
MPEG-1Audio
二、MPEG-2Audio三、MPEG-2ACC四、MPEG-4Audio
2002年10月28日MPEG聲音
MPEG-1Audio、MPEG-2Audio、MPEG-2ACC聲音數(shù)據(jù)壓縮編碼——感知聲音編碼(perceptualaudiocoding)
利用人的聽覺系統(tǒng)的感知特性來達(dá)到壓縮聲音數(shù)據(jù)的目的不同于與波形聲音壓縮編碼(如ADPCM)和參數(shù)編碼(如LPC):依據(jù)波形本身的相關(guān)性和模擬人的發(fā)音器官的特性)2002年10月28日MPEG聲音
對(duì)響度的感知
“聽閾—頻率”曲線2002年10月28日MPEG聲音
對(duì)音高的感知“音高—頻率”曲線2002年10月28日MPEG聲音
掩蔽效應(yīng)一種頻率的聲音阻礙聽覺系統(tǒng)感受另一種頻率的聲音的現(xiàn)象
頻域掩蔽一個(gè)強(qiáng)純音會(huì)掩蔽在其附近同時(shí)發(fā)聲的弱純音,這種特性稱為頻域掩蔽,也稱同時(shí)掩蔽時(shí)域掩蔽在時(shí)間上相鄰的聲音之間的掩蔽現(xiàn)象。兩種時(shí)閾掩蔽:超前掩蔽和滯后掩蔽2002年10月28日MPEG聲音
心理聲學(xué)模型(psychoacousticmodel)聽覺閾值電平聽覺閾值的大小隨聲音頻率的改變而改變,各個(gè)人的聽覺閾值也不同。(大多數(shù)人2kHz~5kHz)一個(gè)人是否能聽到聲音取決于聲音的頻率,以及聲音的幅度是否高于這種頻率下的聽覺閾值。聽覺掩飾特性聽覺閾值電平是自適應(yīng)的,即聽覺閾值電平會(huì)隨聽到的不同頻率的聲音而發(fā)生變化。
2002年10月28日MPEG聲音
MPEGAudio采用的兩種感知編碼:感知子帶編碼(perceptualsub-bandcoding)思想是首先把時(shí)域中的聲音數(shù)據(jù)變換到頻域,對(duì)頻域內(nèi)的子帶分量分別進(jìn)行量化和編碼,然后根據(jù)心理聲學(xué)模型確定樣本的精度,從而達(dá)到壓縮數(shù)據(jù)量的目的。不局限于只對(duì)話音進(jìn)行編碼,也不局限于哪一種聲源。DolbyAC-3編碼2002年10月28日MPEG-1Audio感知子帶編碼壓縮算法框圖
2002年10月28日MPEG-1AudioDolbyAC-3壓縮編碼算法框圖2002年10月28日MPEG-1AudioMPEG聲音編碼器結(jié)構(gòu)圖2002年10月28日MPEG-1AudioMPEG聲音解碼器結(jié)構(gòu)圖2002年10月28日MPEG-1AudioISO/MPEGaudio層1和層2編碼器和解碼器的結(jié)構(gòu)2002年10月28日MPEG-1AudioISO/MPEGaudio層3編碼器和解碼器的結(jié)構(gòu)2002年10月28日MPEG-2AudioMPEG-1和-2的聲音數(shù)據(jù)規(guī)格參數(shù)名稱LinearPCMDolbyAC-3MPEG-2AudioMPEG-1Audio采用頻率48/96kHz32/44.1/48kHz16/22.05/24/32/44.1/48kHz32/44.1/48kHz樣本精度
(每個(gè)樣本的比特?cái)?shù))16/20/24壓縮(16bits)壓縮(16bits)16最大數(shù)據(jù)傳輸率6.144Mb/s448kb/s8~640kb/s32~448kb/s最大聲道數(shù)85.15.1/7.122002年10月28日MPEG-2ACCMPEG-2AAC(Advancedaudiocoding)編碼思想:主要使用聽覺系統(tǒng)的掩蔽特性來減少聲音的數(shù)據(jù)量,并且通過把量化噪聲分散到各個(gè)子帶中,用全局信號(hào)把噪聲掩蔽掉。與MPEG-1聲音格式不兼容
適用范圍:AAC支持的采用頻率可從8kHz到96kHzAAC編碼器的音源可以是單聲道的、立體聲的和多聲道的聲音。(AAC標(biāo)準(zhǔn)可支持48個(gè)主聲道、16個(gè)低頻音效加強(qiáng)通道LFE(lowfrequencyeffects)、16個(gè)配音聲道(overdubchannel)或者叫做多語言聲道(multilingualchannel)和16個(gè)數(shù)據(jù)流。)2002年10月28日MPEG-2ACCMPEG-2AAC(Advancedaudiocoding)壓縮率:MPEG-2AAC壓縮比為11:1(即每個(gè)聲道的數(shù)據(jù)率為(44.1×16)/11=64kb/s)。在5個(gè)聲道的總數(shù)據(jù)率為320kb/s的情況下,很難區(qū)分還原后的聲音與原始聲音之間的差別。與MPEG的層2相比,MPEG-2AAC的壓縮率可提高1倍,而且質(zhì)量更高;與MPEG的層3相比,在質(zhì)量相同的條件下數(shù)據(jù)率是它的70%。2002年10月28日MPEG-2ACC
MPEG-2AAC的配置開發(fā)MPEG-2AAC標(biāo)準(zhǔn)采用模塊化的方法:把整個(gè)AAC系統(tǒng)分解成一系列模塊,用標(biāo)準(zhǔn)化的AAC工具(advancedaudiocodingtools)對(duì)模塊進(jìn)行定義(MPEGAudio標(biāo)準(zhǔn)是對(duì)整個(gè)系統(tǒng)進(jìn)行標(biāo)準(zhǔn)化)AAC標(biāo)準(zhǔn)定義了三種配置:基本配置低復(fù)雜性配置可變采樣率配置2002年10月28日MPEG-2AAC編碼器框圖2002年10月28日
MPEG-2AAC解碼器框圖2002年10月28日MPEG-4Audio
MPEG-4Audio標(biāo)準(zhǔn):集成從話音~高質(zhì)量的多通道聲音;從自然聲音~合成聲音編碼方法:參數(shù)編碼(parametriccoding)碼激勵(lì)線性預(yù)測(cè)(codeexcitedlinearpredictive,CELP)編碼時(shí)間/頻率T/F(time/frequency)編碼結(jié)構(gòu)化聲音SA(structuredaudio)編碼合成聲音:MIDI;TTS2002年10月28日MPEG-4Audio
自然聲音
(naturalaudio)MPEG-4聲音編碼器支持?jǐn)?shù)據(jù)率2kb/s~64kb/s之間的自然聲音。三種類型聲音編碼器:
2002年10月28日MPEG-4Audio
1、參數(shù)編碼器使用聲音參數(shù)編碼技術(shù)。采樣頻率為8kHz的話音(speech),輸出數(shù)據(jù)率為2~4kb/s;采樣頻率為8kHz或16kHz的聲音(audio),輸出數(shù)據(jù)率為4~16kb/s。2002年10月28日MPEG-4Audio
2、CELP編碼器使用CELP(codeexcitedlinearpredictive)技術(shù)。采樣頻率為8kHz的窄帶話音或16kHz的寬帶話音,輸出數(shù)據(jù)率6~24kb/s2002年10月28日MPEG-4Audio
3、T/F編碼器使用時(shí)間-頻率(time-to-frequency,T/F)技術(shù)。這是一種使用矢量量化(vectorquantization,VQ)和線性預(yù)測(cè)的編碼器,采樣頻率為8kHz的聲音信號(hào),輸出的數(shù)據(jù)率大于16kb/s。2002年10月28日MPEG-4Audio
MPEG-4Audio編碼方框圖2002年10月28日MPEG-4Audio
文-語轉(zhuǎn)換
TTS(text-to-speech)將文本形式的信息轉(zhuǎn)換成自然語
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025-2030年中國壁掛式變頻空調(diào)器市場(chǎng)投資規(guī)劃及未來發(fā)展研究報(bào)告
- 2025-2030年中國園林古建筑行業(yè)市場(chǎng)調(diào)查及未來發(fā)展趨勢(shì)預(yù)測(cè)研究報(bào)告
- 文明禮儀在校園廣播稿(15篇)
- 2025-2030年中國醫(yī)藥零售行業(yè)市場(chǎng)營銷決策及未來發(fā)展方向研究報(bào)告
- 2025-2030年中國動(dòng)力定位系統(tǒng)境外融資報(bào)告
- 2025-2030年中國中小企業(yè)IT行業(yè)運(yùn)行狀況及投資戰(zhàn)略研究報(bào)告
- 賓館消防考試試題及答案
- 大一心理考試題目及答案
- 履帶起重機(jī)q2考試試題及答案
- 日職面試題目及答案
- 新版2025心肺復(fù)蘇術(shù)指南
- DB45T 1056-2014 土地整治工程 第2部分:質(zhì)量檢驗(yàn)與評(píng)定規(guī)程
- 國有企業(yè)合規(guī)管理與風(fēng)險(xiǎn)控制
- 2025非開挖施工用球墨鑄鐵管第1部分:頂管法用
- TNXZX 031-2024 牛羊肉電商銷售質(zhì)量服務(wù)規(guī)范
- 調(diào)味品干貨供貨服務(wù)方案
- 花樣跳繩知到智慧樹章節(jié)測(cè)試課后答案2024年秋深圳信息職業(yè)技術(shù)學(xué)院
- 《霸王別姬》電影分享
- 國家開放大學(xué)-02154《數(shù)據(jù)庫應(yīng)用技術(shù)》期末考試題庫(含答案)
- 【初中物理】專項(xiàng)練習(xí):電學(xué)部分多選題30道(附答案)
- 2025江蘇省全日制勞動(dòng)合同書范本
評(píng)論
0/150
提交評(píng)論