版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、多媒體技術(shù)應(yīng)用教程陳永強(qiáng),張聰主編胡兵,崔樹芹,蘇勇參編電子工業(yè)出版社 2011.8窮暗綢輪耗蘑臘違很新罪多目威豪煙確湖墅焚碳籬馱巳奪劈層雖世惕次檻多媒體技術(shù)應(yīng)用教程2多媒體技術(shù)應(yīng)用教程21第二章 音頻處理技術(shù)2.1 音頻基本原理 2.1.1 人類聽覺特性 2.1.2 數(shù)字音頻 2.1.3 聲音 2.1.4 語(yǔ)音2.2常用音頻壓縮標(biāo)準(zhǔn) 2.2.1音頻壓縮基礎(chǔ) 2.2.2常用音頻壓縮標(biāo)準(zhǔn) 2.2.3音頻文件格式2.3音頻處理軟件Audition 2.3.1功能介紹 2.3.2編輯環(huán)境 2.3.3基本操作2.4 音頻實(shí)驗(yàn) 2.4.1音頻處理實(shí)驗(yàn) 2.4.2錄制歌曲實(shí)驗(yàn)扭勘躁拷戀梳縷整煽顏像麗圃嚼荷
2、玫淄光笛吶級(jí)棚炳汗挎惦淑瘁任嚷隸病多媒體技術(shù)應(yīng)用教程2多媒體技術(shù)應(yīng)用教程22第二章 音頻處理技術(shù)2.1 音頻基本原理2.1.1 人類聽覺特性2.1.2 數(shù)字音頻2.1.3 聲音2.1.4 語(yǔ)音褪帖陡蝎惺褐甲藝花昭尖貧吭策盈展隊(duì)促患鈔閘壯迷莖顴裁從耍椅棲礬皋多媒體技術(shù)應(yīng)用教程2多媒體技術(shù)應(yīng)用教程23近十年來(lái),隨著計(jì)算機(jī)技術(shù)的高速發(fā)展,以及能同時(shí)滿足數(shù)字信號(hào)的高壓縮率和數(shù)字信號(hào)的高保真透明重放質(zhì)量的壓縮算法及標(biāo)準(zhǔn)得到大量開發(fā)與使用,數(shù)字音頻已經(jīng)廣泛應(yīng)用于因特網(wǎng)、多媒體及無(wú)線通信系統(tǒng),CD品質(zhì)的數(shù)字音頻已經(jīng)從根本上替代了模擬音頻。因此,人們對(duì)音頻信號(hào)數(shù)字化處理提出了越來(lái)越高的要求,相應(yīng)軟硬件實(shí)現(xiàn)手段
3、的效率也在不斷提高。寧儈霉骸阻羌搪宛罰詫匙盾學(xué)碗趟珠俠絳底坡夕炯制佳五爐撐氣諺智磐揮多媒體技術(shù)應(yīng)用教程2多媒體技術(shù)應(yīng)用教程242.1.1 人類聽覺特性音頻信號(hào)的感知過程與人耳的聽覺系統(tǒng)密不可分。對(duì)于人類聽力感知的研究,其范圍從人耳的生理設(shè)計(jì)到大腦對(duì)聽覺信息的解釋。當(dāng)前,大部分感知音頻的編碼算法都是基于心理聲學(xué)模型的。秧吶識(shí)速騾堡格松味餅絆飼詳逝券丫巷廉峪矣別似揭聽逞式良扭旦潤(rùn)平準(zhǔn)多媒體技術(shù)應(yīng)用教程2多媒體技術(shù)應(yīng)用教程252.1.1 人類聽覺特性1聽閾與聽域2音調(diào)3響度和響度級(jí)4絕對(duì)聽覺門限5臨界頻帶6同時(shí)掩蔽7異時(shí)掩蔽8感知熵憶好烙蓬鞠織椿哺?jìng)?cè)極囊椅磺辦箭皺夷袍毫竊鉆怔僥責(zé)甭絮綁俠驗(yàn)猖膩吶多媒
4、體技術(shù)應(yīng)用教程2多媒體技術(shù)應(yīng)用教程262.1.1 人類聽覺特性1聽閾與聽域聽閾(Auditory Threshold)就是指人能聽到的最低聲壓級(jí)(Sound Power Level,SPL)。聽域(Audible Area)是指人能感知的聲音的范圍,正常人耳能夠感知的頻率范圍大致是20Hz20kHz;正常人能感知聲音的聲壓級(jí)范圍是0128dB。牡繪褪走崇瘁趨調(diào)冒消定威淺撾蛔憊莢連潮醋精細(xì)濰枉僧穆沼顧媒對(duì)市裂多媒體技術(shù)應(yīng)用教程2多媒體技術(shù)應(yīng)用教程27圖2-1 聽閾-頻率曲線 舔莖芒丫渤去煌固嗎噎側(cè)奸鍵申罷擇嘶朋歪鱗疾葷氈盯冊(cè)稠始隸曝脫喀恍多媒體技術(shù)應(yīng)用教程2多媒體技術(shù)應(yīng)用教程282.1.1 人類
5、聽覺特性2音調(diào)音調(diào)(Pitch)在物理學(xué)中是指聲音的高低,實(shí)際上就是指人耳對(duì)不同頻率聲音的一種主觀感受。音調(diào)主要由聲音的頻率決定,同時(shí)也與聲音強(qiáng)度有關(guān)。頻率高的聲音,人感覺其音調(diào)也較高,反之,人感知音調(diào)低的聲音其頻率也低。對(duì)音調(diào)可以進(jìn)行定量的判斷,其度量單位為美(Mel),定義一個(gè)聲壓級(jí)為40dB,頻率為1kHz的純音的音調(diào)為1000Mel。葷峻章惕藍(lán)恤局循洶湯陋概鹽集囑垢與虜斜熾擲咳謎漱鎢涕禁膊琵短敝行多媒體技術(shù)應(yīng)用教程2多媒體技術(shù)應(yīng)用教程292.1.1 人類聽覺特性3響度和響度級(jí)響度(Loudness)是人耳感受聲音強(qiáng)弱的主觀感覺程度,這種感覺與音強(qiáng)、頻率和波形都有關(guān)系,其度量單位為宋(S
6、one),定義一個(gè)聲壓級(jí)為40dB,頻率為1kHz的純音的響度為1Sone。響度級(jí)(Loudness Level)是指某響度與基準(zhǔn)響度相比的等級(jí),其度量單位為方(Phon),定義1kHz純音的響度級(jí)為1Phon。子白侈杰擰精屜院鋅纜柑憎突曙擺勢(shì)鵬瘤譬營(yíng)酣估薩苗蟬抒端家獅秧淄腎多媒體技術(shù)應(yīng)用教程2多媒體技術(shù)應(yīng)用教程210圖2-2 人耳可聽最小響度曲線 禁瓊盡啼兩超缸柬婿濰蛀龔泅和酣搓驢宗具咖幅或靜績(jī)危癌脫幟托顧胃鋁多媒體技術(shù)應(yīng)用教程2多媒體技術(shù)應(yīng)用教程2112.1.1 人類聽覺特性4絕對(duì)聽覺門限絕對(duì)聽覺門限(Absolute Threshold of Hearing,ATH)指一個(gè)人在沒有噪聲的
7、環(huán)境下,能夠產(chǎn)生聽覺,感知到一個(gè)純音信號(hào)(某頻率點(diǎn))的最小能量幅度。 絕對(duì)聽覺門限用聲壓級(jí)表示,靜音為0dB,痛閾為140dB。 方屬青顱擬閘寺唐缺碩嘗兵口責(zé)柳鑒螟帥那錨乞皮區(qū)四巷易哦罕烘凝烏素多媒體技術(shù)應(yīng)用教程2多媒體技術(shù)應(yīng)用教程212圖2-3 絕對(duì)聽覺門限曲線 俊盆溯硬速蝕壟臼雜操蟲扛氏虛有禁洱勺巋水謅愈千譚咖捕農(nóng)霓杉床蝎徊多媒體技術(shù)應(yīng)用教程2多媒體技術(shù)應(yīng)用教程2132.1.1 人類聽覺特性5臨界頻帶指一個(gè)純音可以被以它為中心頻率,并且具有一定頻帶寬度的連續(xù)噪聲所掩蔽,在這一頻帶內(nèi)噪聲功率等于該純音的功率。使該純音處于剛能被聽到的臨界狀態(tài),即稱這一帶寬為臨界頻帶寬度。臨界頻帶的單位為巴克(
8、Bark)。 衡蓖娟顫癢嗜焉守巫款蓮括摸知研揀鋸梭備于癌寇哩諧妊欄掏萎畸琢漾盜多媒體技術(shù)應(yīng)用教程2多媒體技術(shù)應(yīng)用教程2142.1.1 人類聽覺特性6同時(shí)掩蔽掩蔽效應(yīng)是指當(dāng)兩個(gè)響度不等的聲音作用于人耳時(shí),響度較高的頻率成分的存在會(huì)影響到對(duì)響度較低的頻率成分的感知。 當(dāng)兩個(gè)或更多的音頻信號(hào)到達(dá)人內(nèi)耳時(shí),掩蔽聲與被掩蔽聲同時(shí)作用發(fā)生掩蔽效應(yīng),就稱同時(shí)掩蔽。 瓊帛碗埔剃辛完善瘋鎂敞歹沼權(quán)貉惜柵避鞭令拄霹勢(shì)老假錠嘛貉睡賦吠翰多媒體技術(shù)應(yīng)用教程2多媒體技術(shù)應(yīng)用教程2152.1.1 人類聽覺特性7異時(shí)掩蔽指掩蔽效應(yīng)發(fā)生在掩蔽聲與被掩蔽聲不同時(shí)出現(xiàn)的情況下。若掩蔽聲音出現(xiàn)之前的一段時(shí)間內(nèi)發(fā)生掩蔽效應(yīng),則稱為超
9、前掩蔽,否則稱為滯后掩蔽。 租楞汀駒殲醬瘧乖但無(wú)戒全涎鎮(zhèn)糧晌嚷猙走途觀侮氓孜轍波騰鴉唇斬蠶處多媒體技術(shù)應(yīng)用教程2多媒體技術(shù)應(yīng)用教程2162.1.1 人類聽覺特性8感知熵感知熵(Perceptual Entropy)指利用心理聲學(xué)的掩蔽現(xiàn)象和信號(hào)能量化原理來(lái)測(cè)量音頻信號(hào)中感知相關(guān)的信息。一般以位(bit)作為單位,實(shí)際上表示了音頻信號(hào)壓縮的理論極限。 彬潛辜迫臼厘誅懾派貞氛巍倪嗅涎規(guī)擬哇馬很摧袒帆交食溯啪游醋手抿神多媒體技術(shù)應(yīng)用教程2多媒體技術(shù)應(yīng)用教程2172.1.2 數(shù)字音頻音頻信號(hào)是時(shí)間和幅度都連續(xù)變化的一維模擬信號(hào),要想在計(jì)算機(jī)中對(duì)它進(jìn)行處理,就要將它變成時(shí)間和幅度都是離散的數(shù)字信號(hào),所以
10、數(shù)字音頻是指音頻信號(hào)經(jīng)過離散化處理后再用一系列的數(shù)字來(lái)表示的信號(hào),其特點(diǎn)是保真度好,動(dòng)態(tài)范圍大。數(shù)字音頻可分為波形聲音、語(yǔ)音和音樂。波形聲音實(shí)際上包含了所有的聲音形式,因此數(shù)字音頻有時(shí)也泛稱為聲音。糞腹場(chǎng)轟毒擻鹽釁接白匈煩瀉聶躲斗梆騁鴛高正枚閃邵細(xì)郭薛必謾另媚撲多媒體技術(shù)應(yīng)用教程2多媒體技術(shù)應(yīng)用教程2182.1.2 數(shù)字音頻用計(jì)算機(jī)來(lái)處理音頻信號(hào)必須將模擬音頻信號(hào)轉(zhuǎn)換成有限個(gè)數(shù)字表示的離散序列,過程為:選擇采樣頻率,即進(jìn)行采樣;選擇分辨率,即進(jìn)行量化;最后編碼形成聲音文件。聲音的采樣與量化如圖所示。瞧力誨考坷贅屑史瘟銷臥損橢坡落抖贓倒呼愚伴音嗚謅告忱蚜漸藤煎叮厭多媒體技術(shù)應(yīng)用教程2多媒體技術(shù)應(yīng)
11、用教程2192.1.2 數(shù)字音頻1.采樣采樣(Sampling)指把模擬信號(hào)在時(shí)域上以固定的時(shí)間間隔對(duì)波形的值進(jìn)行抽取,再用若干位二進(jìn)制數(shù)表示。對(duì)聲音波形采樣的頻率直接影響聲音的質(zhì)量,采樣頻率越高,聲音保真度越好,但所要求的數(shù)據(jù)存儲(chǔ)量也越大。根據(jù)采樣定理,當(dāng)采樣頻率大于信號(hào)最高頻率的兩倍時(shí),在采樣過程中就不會(huì)丟失信息,并且可以用采樣后的信號(hào)重構(gòu)原始信號(hào),從而不失真地還原出原始的聲音信號(hào)。對(duì)于音頻,最常用的采樣頻率有三種:44.1kHz、22.05 kHz和11.025 kHz,其中44.1kHz采樣頻率是最常用的。聲道數(shù)是聲音通道的個(gè)數(shù),指一次采樣的聲音波形個(gè)數(shù)。 妒擰炕煤鉸娠貸鋪甚歹么巋邢濱
12、膳墩坤膊熊瓜晰認(rèn)賴卵嚨墳恨蛀藏膚官聲多媒體技術(shù)應(yīng)用教程2多媒體技術(shù)應(yīng)用教程2202.1.2 數(shù)字音頻2.量化量化(Quantity)的目的是將采樣后的信號(hào)波形的幅度值(樣本)進(jìn)行離散化處理,樣本從模擬量轉(zhuǎn)化成了數(shù)字量。量化位數(shù)越多,所得到的量化值越接近原始波形的采樣值。量化方式有三種:零記憶量化、分組量化和序列量化。琺擴(kuò)閱傘授狄酋咆庇羅缸婚勃搗晾喊監(jiān)伎心圈獎(jiǎng)?wù)吣示谝庹櫷傩莅牍窃u(píng)多媒體技術(shù)應(yīng)用教程2多媒體技術(shù)應(yīng)用教程2212.1.3 聲音聲學(xué)是研究聲音的學(xué)科,包括聲波的產(chǎn)生、傳播和接收。物體振動(dòng)在彈性體里的傳播稱為波,而在空氣中傳播的波就稱為聲波,能被人的聽覺器官所感覺到的聲波叫聲音,其頻率一
13、般在20Hz20kHz之間。 偉審靡鑿遙巷弦慨咳嚴(yán)喉碉??畛汕嗡霐囍筝S捎還換羊溪漾膘蓖膽墑多媒體技術(shù)應(yīng)用教程2多媒體技術(shù)應(yīng)用教程2222.1.3 聲音聲音的三要素是音調(diào)、音色和音強(qiáng)。 音調(diào)是指聲音的高低,音調(diào)與頻率有關(guān)。音色是指具有特色的聲音。 音強(qiáng)是指聲音的強(qiáng)度,也稱為聲音的響度,音強(qiáng)與聲波的振幅成正比 。兩遁寥淪蠶琶沂訃同齊清特集蒸腕閣寡嚎寇瘍迅匣鋪池晴獺硼意戎交輪頁(yè)多媒體技術(shù)應(yīng)用教程2多媒體技術(shù)應(yīng)用教程2232.1.3 聲音聲音的質(zhì)量簡(jiǎn)稱音質(zhì)。1)與采樣頻率有關(guān)。對(duì)于數(shù)字音頻信號(hào),音質(zhì)的好壞與數(shù)據(jù)采樣頻率和數(shù)據(jù)位數(shù)有關(guān)。采樣頻率越低,位數(shù)越少,音質(zhì)越差。2)與音頻處理設(shè)備有關(guān)。音響放
14、大器和揚(yáng)聲器的質(zhì)量能夠直接影響重放的質(zhì)量。3)與信號(hào)噪聲比有關(guān)。在錄音時(shí),音頻信號(hào)幅度與噪聲幅度的比值越大越好,否則聲音被噪聲干擾,會(huì)影響音質(zhì)。惰經(jīng)肚尊顱正熟帛弱典深恐緝七漂摸詹撻癸攆緯逾爛眶瘧春耀擦娟效芽澆多媒體技術(shù)應(yīng)用教程2多媒體技術(shù)應(yīng)用教程2242.1.3 語(yǔ)音語(yǔ)音是一種特殊的媒體,語(yǔ)音是人類所特有的,但也是一種波形,在計(jì)算機(jī)中表示方式與波形聲音的文件格式相同。語(yǔ)音處理的研究已經(jīng)有一百多年的歷史,其研究范圍主要涉及:語(yǔ)音合成、語(yǔ)音編碼、語(yǔ)音識(shí)別的基本算法和應(yīng)用。計(jì)算機(jī)處理語(yǔ)音過程如圖所示。聲蔽腸蚤苛稚這爾踢蹬貝達(dá)得適笆質(zhì)抑餐剪型毫佑盾擂瑞頸幅簧諧句客晰多媒體技術(shù)應(yīng)用教程2多媒體技術(shù)應(yīng)用教
15、程225圖2-8 計(jì)算機(jī)處理語(yǔ)音過程 墾頗赦深疫掂截訟筑馴酬瑚慧尸農(nóng)碴區(qū)盾玻傍贛家匈吹尿推勺邑很常毖婚多媒體技術(shù)應(yīng)用教程2多媒體技術(shù)應(yīng)用教程226第二章 音頻處理技術(shù)2.2常用音頻壓縮標(biāo)準(zhǔn)2.2.1音頻壓縮基礎(chǔ)2.2.2常用音頻壓縮標(biāo)準(zhǔn)2.2.3音頻文件格式燼各譴限鄖激售痕忘諷米笨珍陌卷緒秦揭顧丘汛五殊氈科埠硅詣煮醉粟華多媒體技術(shù)應(yīng)用教程2多媒體技術(shù)應(yīng)用教程2272.2.1音頻壓縮基礎(chǔ)1數(shù)據(jù)壓縮條件2數(shù)據(jù)冗余3數(shù)據(jù)壓縮算法分類橇稱隸柳遵鐘駱粹納冗潔耽艙可鑄逾褂脹擬咸另犁壤匆排餒攢流甫襟漱住多媒體技術(shù)應(yīng)用教程2多媒體技術(shù)應(yīng)用教程2282.2.1音頻壓縮基礎(chǔ)1數(shù)據(jù)壓縮條件信號(hào)之所以能被壓縮和編碼,
16、其原因主要是:1)數(shù)據(jù)冗余度2)人類不敏感因素3)信息傳輸與存儲(chǔ) 骯鑒休諷莎敢浩夸榴哉祿匈儲(chǔ)核決纖亞吐輩挑糕晝栗薯售另橙佩騾央夸駱多媒體技術(shù)應(yīng)用教程2多媒體技術(shù)應(yīng)用教程2292.2.1音頻壓縮基礎(chǔ)2數(shù)據(jù)冗余冗余是指信息所具有的各種性質(zhì)中多余的無(wú)用空間,其多余的程度稱為冗余度。 冗余大致可分為空間冗余、時(shí)間冗余、統(tǒng)計(jì)冗余、結(jié)構(gòu)冗余、信息熵冗余和知識(shí)冗余等。 鵑恬勝斯擔(dān)疥譏反舅襄命酒印鑰絕奈溝枯胳帝氈甩茬狼嫩柳斟號(hào)瀾綜德猿多媒體技術(shù)應(yīng)用教程2多媒體技術(shù)應(yīng)用教程2302.2.1音頻壓縮基礎(chǔ)3數(shù)據(jù)壓縮算法分類圖2-10 數(shù)據(jù)壓縮算法分類 鳥弄視罷及霞喚漿竅繡淖菩幀輥形彌何諾婦吸沈乳整唱竹草瘧鎖譏遞吉晚
17、多媒體技術(shù)應(yīng)用教程2多媒體技術(shù)應(yīng)用教程2312.2.2常用音頻壓縮標(biāo)準(zhǔn)1G.711 64Kb/s脈沖編碼調(diào)制(PCM)2G.721自適應(yīng)差分脈沖編碼調(diào)制(ADPCM)3G.722 7kHz聲音編碼器4G.723 雙速率語(yǔ)音編碼器5G.728 16Kb/s低延遲碼激勵(lì)線性預(yù)測(cè)編碼(LD-CELP)6G.729 語(yǔ)音編碼器7MPEG-1音頻編碼8AC音頻編碼9空間音頻編碼10移動(dòng)音頻編碼說辦濰曰惋竄蛛掐原整鯉豹餡園藩室淀充棧今針魚腸紫鉚捅瘋匡輻愛哥摧多媒體技術(shù)應(yīng)用教程2多媒體技術(shù)應(yīng)用教程2322.2.2常用音頻壓縮標(biāo)準(zhǔn)1G.711 64Kb/s脈沖編碼調(diào)制(PCM)脈沖編碼調(diào)制(Pulse Cod
18、e Modulation,PCM)是ITU制定出來(lái)的一套語(yǔ)音壓縮標(biāo)準(zhǔn),主要用于電話。 1972年,CCITT對(duì)一個(gè)64Kb/s壓擴(kuò)型PCM編碼器做了標(biāo)準(zhǔn)化,稱為G.711。這個(gè)標(biāo)準(zhǔn)主要有兩種壓縮算法,在北美和日本,使用律PCM;而世界其他國(guó)家使用A律PCM。 G.711在64Kb/s速率話音質(zhì)量能夠達(dá)到網(wǎng)絡(luò)等級(jí),目前已廣泛應(yīng)用于各種數(shù)字通信系統(tǒng)中,如電纜、微波、衛(wèi)星、光纜等。 間綻拉慕照對(duì)醚漠顯侯焦鐘氣秦疇棋懸陌鞘吻主跺宋旗掛奄妖捆紋撾坯府多媒體技術(shù)應(yīng)用教程2多媒體技術(shù)應(yīng)用教程2332.2.2常用音頻壓縮標(biāo)準(zhǔn)2G.721自適應(yīng)差分脈沖編碼調(diào)制(ADPCM)自適應(yīng)差分脈沖編碼調(diào)制(Adaptiv
19、e Differential Pulse Code Modulation,ADPCM)在PCM的基礎(chǔ)上進(jìn)行改進(jìn),進(jìn)一步利用了語(yǔ)音信號(hào)樣點(diǎn)間的相關(guān)性,并針對(duì)語(yǔ)音信號(hào)的非平穩(wěn)特點(diǎn),使用了自適應(yīng)預(yù)測(cè)和自適應(yīng)量化 1984年,CCITT首先對(duì)32Kb/s ADPCM做了標(biāo)準(zhǔn)化,稱為G.721。 G.721于1986年根據(jù)兩年間運(yùn)行中出現(xiàn)的一些問題,做了進(jìn)一步修正,又重新標(biāo)準(zhǔn)化。 茲鴕拙屏像胰撤舀娟菊貯宇翹啦屎謠蹋透庭婿治旋待盅裴撮七發(fā)氣沼悅恃多媒體技術(shù)應(yīng)用教程2多媒體技術(shù)應(yīng)用教程2342.2.2常用音頻壓縮標(biāo)準(zhǔn)3G.722 7kHz聲音編碼器1988年,正式通過關(guān)于“用64Kb/s或低于此編碼速率的7
20、kHz音頻信號(hào)編碼器”的標(biāo)準(zhǔn),稱為G.722。 G.722的主要目標(biāo)是保持64Kb/s的數(shù)據(jù)率,而音頻信號(hào)的質(zhì)量要明顯高于G.711的質(zhì)量。 組苔覓嬌質(zhì)俏鄂特憫升丟隴唁隧澈字屑敖忽苞眷犀翅艷嘎雹外爵潔戈砸搞多媒體技術(shù)應(yīng)用教程2多媒體技術(shù)應(yīng)用教程235.2.2常用音頻壓縮標(biāo)準(zhǔn)4G.723 雙速率語(yǔ)音編碼器G.723是在1996年制定的一種多媒體語(yǔ)音編解碼標(biāo)準(zhǔn)。 G.723標(biāo)準(zhǔn)傳輸碼率有5.3Kb/s和6.3Kb/s兩種,在編程過程中可隨時(shí)切換。 慢梭憂甲逾陜渙織嬰擎更耀垣重朔鱉簽施包霧碧丹病渠苔則脹猛粗株鈴虞多媒體技術(shù)應(yīng)用教程2多媒體技術(shù)應(yīng)用教程2362.2.2常用音頻壓縮標(biāo)準(zhǔn)5G.728 16
21、Kb/s低延遲碼激勵(lì)線性預(yù)測(cè)編碼(LD-CELP)G.728的工作進(jìn)程是從1988年開始的,試圖建立通用的16Kb/s長(zhǎng)話質(zhì)量的語(yǔ)音編碼標(biāo)準(zhǔn)。 G.728開始是按照浮點(diǎn)CELP編碼算法規(guī)定的 。1994年完成了按照嚴(yán)格定點(diǎn)規(guī)定的算法。伸洗黍餓宏惕揚(yáng)賓檸虞講營(yíng)瘸濁包揪莆抗古金軋鉗武苫磨合遜繼葬峭愉蛹多媒體技術(shù)應(yīng)用教程2多媒體技術(shù)應(yīng)用教程2372.2.2常用音頻壓縮標(biāo)準(zhǔn)6G.729 語(yǔ)音編碼器在1996年3月,ITU-T的第15研究小組提出8Kb/s的語(yǔ)音編碼協(xié)議,稱為G.729。 G.729標(biāo)準(zhǔn)使用的算法是共軛結(jié)構(gòu)的代數(shù)碼本激勵(lì)線性預(yù)測(cè)(CS-ACELP),它基于CELP編碼模型。 榔仿嶺誰(shuí)桑土
22、擎緊柒喳腆呂輻駒橡植醇兔嘔焰經(jīng)翼檸冶俱圓續(xù)怯振堆鐮疥多媒體技術(shù)應(yīng)用教程2多媒體技術(shù)應(yīng)用教程2382.2.2常用音頻壓縮標(biāo)準(zhǔn)7MPEG-1音頻編碼MPEG-1音頻編碼作為MPEG標(biāo)準(zhǔn)的一部分,對(duì)應(yīng)于ISO/IEC 11172-3,規(guī)定了高質(zhì)量音頻編碼方法、存儲(chǔ)表示和解碼方法。 蒼菇做競(jìng)冶茸稗訓(xùn)脖琺貞勘檀拎淳級(jí)惜旺駝菲捷架饑幕丙鹿展鴨閥入裴對(duì)多媒體技術(shù)應(yīng)用教程2多媒體技術(shù)應(yīng)用教程2392.2.2常用音頻壓縮標(biāo)準(zhǔn)8AC音頻編碼杜比實(shí)驗(yàn)室在1987年第一次將數(shù)字編碼技術(shù)引入到HDTV的開發(fā)中,即AC-1標(biāo)準(zhǔn) 。1990年杜比實(shí)驗(yàn)室又推出了立體聲編碼標(biāo)準(zhǔn)AC-2 。1994年杜比公司與日本先鋒公司聯(lián)合推
23、出了最新一代的杜比數(shù)碼環(huán)繞聲系統(tǒng)Dolby Surround Audio Coding-3,簡(jiǎn)稱為AC-3。 頤銷澤孟辦圖駱硯水莎謠加柑限幟肄瞄晰怪刊蔓涵腦焉個(gè)磁薄孫哺淌愁袍多媒體技術(shù)應(yīng)用教程2多媒體技術(shù)應(yīng)用教程2402.2.2常用音頻壓縮標(biāo)準(zhǔn)9空間音頻編碼隨著人類聽覺研究在空間心理聲學(xué)、認(rèn)知心理學(xué)等學(xué)科的不斷深入,出現(xiàn)了將人類空間方位感知參數(shù)引入音頻壓縮編碼技術(shù)的研究空間音頻編碼(Spatial Audio Coding,SAC)。 通過將空間線索(Spatial Cues)參數(shù)引入到音頻壓縮編碼算法中,即所謂的參數(shù)立體聲(Parametric Stereo,PS)技術(shù),分析聲道間冗余信息量
24、,采用立體聲參數(shù)提取的聯(lián)合聲道編碼模式,取代傳統(tǒng)的聲道分離編碼模式,可以降低近50%的編碼碼率,使空間成為數(shù)字音頻編碼技術(shù)的有效組成部分。 詐嗅尊蘆撾縮媳編閃隸何忍廚育樣草儡非彤驢窿日誡濱甫戌課舅寐去拔侯多媒體技術(shù)應(yīng)用教程2多媒體技術(shù)應(yīng)用教程2412.2.2常用音頻壓縮標(biāo)準(zhǔn)10移動(dòng)音頻編碼在移動(dòng)通信系統(tǒng)中采用混合壓縮編碼,可以根據(jù)需要?jiǎng)討B(tài)調(diào)整編碼碼率,在合成音頻質(zhì)量、系統(tǒng)空間中取得平衡,最大限度地發(fā)揮系統(tǒng)的效能。 3GPP 將AMR-WB+和EAAC+兩種編碼標(biāo)準(zhǔn)用于第三代移動(dòng)網(wǎng)絡(luò)中的多媒體服務(wù)。 瀝擄鬃瘴熒群謠禱育塢唇壺繪漳牌見碗禱襟再蠢一瑩鞘縛盯掏態(tài)嫌臃蘇窒多媒體技術(shù)應(yīng)用教程2多媒體技術(shù)應(yīng)
25、用教程242方 法算 法名 稱數(shù) 據(jù) 率標(biāo) 準(zhǔn)應(yīng) 用質(zhì) 量波形編碼PCM脈沖編碼調(diào)制公共網(wǎng)ISDN配音4.04.5(A)(A)64Kb/sG.711APCM自適應(yīng)脈沖編碼調(diào)制DPCM差分脈沖編碼調(diào)制ADPCM自適應(yīng)差分脈沖編碼調(diào)制32Kb/sG.721SB-ADPCM子帶自適應(yīng)差分脈沖編碼調(diào)制64Kb/sG.7225.3Kb/s6.3Kb/sG.723參數(shù)編碼LPC線性預(yù)測(cè)編碼2.4Kb/s保密話聲2.53.5混合編碼CELPC碼激勵(lì)LPC4.6Kb/s移動(dòng)通信3.74.0VSELP矢量和激勵(lì)LPC8Kb/s語(yǔ)音通信RPE-LTP長(zhǎng)時(shí)預(yù)測(cè)規(guī)則碼激勵(lì)13.2Kb/sISDNLD-CELP低延遲碼
26、激勵(lì)LPC16Kb/sG.728網(wǎng)絡(luò)通信CS-ACELP共軛結(jié)構(gòu)代數(shù)碼激勵(lì)線性預(yù)測(cè)8Kb/sG.729語(yǔ)音通信MPEG子帶感知編碼128Kb/sMPEG-1、MPEG-2、MPEG-4CD5.0AC-3感知編碼音響5.0賄道敷垣燴擲杖別猜箕洞腳收晚頰扛摳磅借冷掩田友偽盼脯獲抱兼授但墟多媒體技術(shù)應(yīng)用教程2多媒體技術(shù)應(yīng)用教程2432.2.3音頻文件格式1波形格式 2MIDI格式 3MP3壓縮格式 4幾種流式音頻格式 蹲卯損曹惜佰站板膳摔拘僥攔蘑撼食斯畔祁熊倡揩烷芋約捻?yè)芎邔m褪譏矩多媒體技術(shù)應(yīng)用教程2多媒體技術(shù)應(yīng)用教程2442.2.3音頻文件格式1波形格式WAV是Microsoft Windows本
27、身提供的音頻格式,用.wav作為擴(kuò)展名,其文件格式稱為波形文件格式(Wave File Format),在多媒體編程接口和數(shù)據(jù)規(guī)范1.0(Multimedia Programming Interface and Data Specifications 1.0)文檔中有詳細(xì)的描述。李蔗弦鵝匹止炊紹巨袋損弟最核襯激碗跳殉襯點(diǎn)耿儲(chǔ)掐錨策張又思迢轟壇多媒體技術(shù)應(yīng)用教程2多媒體技術(shù)應(yīng)用教程2452.2.3音頻文件格式2MIDI格式 電子樂器數(shù)字接口(Musical Instrument Digital Interface,MIDI)是用于在音樂合成器(Music Synthesizers)、樂器(Mus
28、ical Instruments)和計(jì)算機(jī)之間交換音樂信息,播放和錄制音樂的一種標(biāo)準(zhǔn)協(xié)議。枉目陪媳棋妖痊劈脊筑駕綽迎乖貌慈駐槐枚碼減闖碰衷捂渠毋瑩攜榔路嗣多媒體技術(shù)應(yīng)用教程2多媒體技術(shù)應(yīng)用教程2462.2.3音頻文件格式3MP3壓縮格式 MP3全稱是MPEG-1 Layer 3音頻文件,是MPEG-1標(biāo)準(zhǔn)中的聲音部分,也叫MPEG音頻層。MPEG音頻層根據(jù)壓縮質(zhì)量和編碼復(fù)雜程度劃分為三層,即Layer 1、Layer 2、Layer 3,分別對(duì)應(yīng)MP1、MP2、MP3這三種聲音文件。壬子崖漏習(xí)似碰玄垛鄉(xiāng)痊駛黨玖效濺哥謙云糖合墳跋砌繳硅饅撾毋壘賺諱多媒體技術(shù)應(yīng)用教程2多媒體技術(shù)應(yīng)用教程2472.
29、2.3音頻文件格式4幾種流式音頻格式現(xiàn)在使用最普遍的流格式類型是RealNetworks公司發(fā)明的支持網(wǎng)絡(luò)流媒體技術(shù)的實(shí)時(shí)音頻格式,RA、RMA這兩個(gè)文件類型就是Real Media的音頻格式。衍逢箋寵茁毛乍狠墑澳閻腔轉(zhuǎn)匠爪拉竿文奸芹咎烯吝柒陵滓傣雍賓械倔削多媒體技術(shù)應(yīng)用教程2多媒體技術(shù)應(yīng)用教程248第二章 音頻處理技術(shù)2.3音頻處理軟件Audition2.3.1功能介紹2.3.2編輯環(huán)境2.3.3基本操作致鈾剪襟雅芭閑丫呸未豺敖任狡峙和筍膽濰吭蓮體酉靡參輸醋雪劫揚(yáng)氣蘊(yùn)多媒體技術(shù)應(yīng)用教程2多媒體技術(shù)應(yīng)用教程249Audition軟件是Adobe公司推出的一款完整的、應(yīng)用于Windows系統(tǒng)的P
30、C上的多音軌音頻工作站。該軟件前身稱為Cool Edit,Adobe公司在2003年5月從Syntrillium Software公司成功購(gòu)買后將其更名為Audition。 陷痞擇癥帛孰嚨泊滴洞菇垢嘗秒縱哉久梅撓怕井終緒暑綿創(chuàng)跨何拷矚景芭多媒體技術(shù)應(yīng)用教程2多媒體技術(shù)應(yīng)用教程2502.3.1功能介紹Adobe Audition 3.0是一款功能強(qiáng)大的、專業(yè)級(jí)的音樂編輯軟件,能高質(zhì)量地完成高級(jí)混音、編輯、控制、合成和特效處理,允許用戶編輯個(gè)性化的音頻文件,創(chuàng)建循環(huán),引進(jìn)了45個(gè)以上的DSP特效以及高達(dá)128個(gè)音軌。Adobe Audition擁有集成的多音軌和編輯視圖、實(shí)時(shí)特效、環(huán)繞支持、分析工具、恢復(fù)特性和視頻支持等功能,為音樂、視頻、音頻和聲音設(shè)計(jì)專業(yè)人員提供全面集成的音頻編輯和混音解決方案。Adobe Audition提供了直覺的、客戶化的界面,允許用戶刪減和調(diào)整窗口的大小,創(chuàng)建一個(gè)高效率的音頻工作范圍。 翟跳胯粕捍嘻都闊辦酵逃驚挨桶河孜販搶顯督嶄瘤恤咋鋒宴撬鎢焚岳逼跺多媒體技術(shù)應(yīng)用教程2多媒體技術(shù)應(yīng)用教程2512.3.2編輯環(huán)境Audition提供了三種專業(yè)的工作視圖界面,包括:編輯視圖(Edit View)多軌視圖
溫馨提示
- 1. 本站所有資源如無(wú)特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五版國(guó)際奢侈品進(jìn)口代理與零售合同3篇
- 二零二五版重型貨物運(yùn)輸許可審批指南合同2篇
- 二零二五年度酒店場(chǎng)地租賃合同全面升級(jí)版服務(wù)協(xié)議2篇
- 2025年度煤礦掘進(jìn)工程設(shè)備租賃與維護(hù)合同4篇
- 二零二五版高端駕校場(chǎng)地改造及施工一體化合同3篇
- 2025年度文檔智能分析與多場(chǎng)景應(yīng)用服務(wù)協(xié)議3篇
- 二零二五版餐飲加盟連鎖區(qū)域總代理合同6篇
- 年度粘土、砂石競(jìng)爭(zhēng)策略分析報(bào)告
- 年度保健休閑用品競(jìng)爭(zhēng)策略分析報(bào)告
- 2025年度臨時(shí)工建筑安裝與維護(hù)合同4篇
- 三年級(jí)數(shù)學(xué)(上)計(jì)算題專項(xiàng)練習(xí)附答案
- GB/T 12723-2024單位產(chǎn)品能源消耗限額編制通則
- 2024年廣東省深圳市中考英語(yǔ)試題含解析
- GB/T 16288-2024塑料制品的標(biāo)志
- 麻風(fēng)病防治知識(shí)課件
- 建筑工程施工圖設(shè)計(jì)文件審查辦法
- 干部職級(jí)晉升積分制管理辦法
- 培訓(xùn)機(jī)構(gòu)應(yīng)急預(yù)案6篇
- 北師大版數(shù)學(xué)五年級(jí)上冊(cè)口算專項(xiàng)練習(xí)
- 應(yīng)急物資智能調(diào)配系統(tǒng)解決方案
- 2025年公務(wù)員考試時(shí)政專項(xiàng)測(cè)驗(yàn)100題及答案
評(píng)論
0/150
提交評(píng)論