版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
多媒體技術(shù)應(yīng)用數(shù)學(xué)與計(jì)算機(jī)學(xué)院陳永強(qiáng)2013-2014-2現(xiàn)在是1頁(yè)\一共有77頁(yè)\編輯于星期五第二章音頻處理技術(shù)2.1
音頻基本原理
人類聽(tīng)覺(jué)特性
數(shù)字音頻
聲音
語(yǔ)音2.2常用音頻壓縮標(biāo)準(zhǔn)
音頻壓縮基礎(chǔ)
常用音頻壓縮標(biāo)準(zhǔn)
音頻文件格式2.3音頻處理軟件Audition
功能介紹
編輯環(huán)境
基本操作現(xiàn)在是2頁(yè)\一共有77頁(yè)\編輯于星期五第二章音頻處理技術(shù)2.1
音頻基本原理
人類聽(tīng)覺(jué)特性
數(shù)字音頻
聲音
語(yǔ)音現(xiàn)在是3頁(yè)\一共有77頁(yè)\編輯于星期五近十年來(lái),隨著計(jì)算機(jī)技術(shù)的高速發(fā)展,以及能同時(shí)滿足數(shù)字信號(hào)的高壓縮率和數(shù)字信號(hào)的高保真透明重放質(zhì)量的壓縮算法及標(biāo)準(zhǔn)得到大量開(kāi)發(fā)與使用,數(shù)字音頻已經(jīng)廣泛應(yīng)用于因特網(wǎng)、多媒體及無(wú)線通信系統(tǒng),CD品質(zhì)的數(shù)字音頻已經(jīng)從根本上替代了模擬音頻。因此,人們對(duì)音頻信號(hào)數(shù)字化處理提出了越來(lái)越高的要求,相應(yīng)軟硬件實(shí)現(xiàn)手段的效率也在不斷提高?,F(xiàn)在是4頁(yè)\一共有77頁(yè)\編輯于星期五
人類聽(tīng)覺(jué)特性音頻信號(hào)的感知過(guò)程與人耳的聽(tīng)覺(jué)系統(tǒng)密不可分。對(duì)于人類聽(tīng)力感知的研究,其范圍從人耳的生理設(shè)計(jì)到大腦對(duì)聽(tīng)覺(jué)信息的解釋。當(dāng)前,大部分感知音頻的編碼算法都是基于心理聲學(xué)模型的?,F(xiàn)在是5頁(yè)\一共有77頁(yè)\編輯于星期五
人類聽(tīng)覺(jué)特性1.聽(tīng)閾與聽(tīng)域2.音調(diào)3.響度和響度級(jí)4.絕對(duì)聽(tīng)覺(jué)門(mén)限5.臨界頻帶6.同時(shí)掩蔽7.異時(shí)掩蔽8.感知熵現(xiàn)在是6頁(yè)\一共有77頁(yè)\編輯于星期五
人類聽(tīng)覺(jué)特性1.聽(tīng)閾與聽(tīng)域聽(tīng)閾(AuditoryThreshold)就是指人能聽(tīng)到的最低聲壓級(jí)(SoundPowerLevel,SPL)。聽(tīng)域(AudibleArea)是指人能感知的聲音的范圍,正常人耳能夠感知的頻率范圍大致是20Hz~20kHz;正常人能感知聲音的聲壓級(jí)范圍是0~128dB?,F(xiàn)在是7頁(yè)\一共有77頁(yè)\編輯于星期五圖2-1聽(tīng)閾-頻率曲線
現(xiàn)在是8頁(yè)\一共有77頁(yè)\編輯于星期五
人類聽(tīng)覺(jué)特性2.音調(diào)音調(diào)(Pitch)在物理學(xué)中是指聲音的高低,實(shí)際上就是指人耳對(duì)不同頻率聲音的一種主觀感受。音調(diào)主要由聲音的頻率決定,同時(shí)也與聲音強(qiáng)度有關(guān)。頻率高的聲音,人感覺(jué)其音調(diào)也較高,反之,人感知音調(diào)低的聲音其頻率也低。對(duì)音調(diào)可以進(jìn)行定量的判斷,其度量單位為美(Mel),定義一個(gè)聲壓級(jí)為40dB,頻率為1kHz的純音的音調(diào)為1000Mel?,F(xiàn)在是9頁(yè)\一共有77頁(yè)\編輯于星期五
人類聽(tīng)覺(jué)特性3.響度和響度級(jí)響度(Loudness)是人耳感受聲音強(qiáng)弱的主觀感覺(jué)程度,這種感覺(jué)與音強(qiáng)、頻率和波形都有關(guān)系,其度量單位為宋(Sone),定義一個(gè)聲壓級(jí)為40dB,頻率為1kHz的純音的響度為1Sone。響度級(jí)(LoudnessLevel)是指某響度與基準(zhǔn)響度相比的等級(jí),其度量單位為方(Phon),定義1kHz純音的響度級(jí)為1Phon?,F(xiàn)在是10頁(yè)\一共有77頁(yè)\編輯于星期五圖2-2人耳可聽(tīng)最小響度曲線
現(xiàn)在是11頁(yè)\一共有77頁(yè)\編輯于星期五
人類聽(tīng)覺(jué)特性4.絕對(duì)聽(tīng)覺(jué)門(mén)限絕對(duì)聽(tīng)覺(jué)門(mén)限(AbsoluteThresholdofHearing,ATH)指一個(gè)人在沒(méi)有噪聲的環(huán)境下,能夠產(chǎn)生聽(tīng)覺(jué),感知到一個(gè)純音信號(hào)(某頻率點(diǎn))的最小能量幅度。絕對(duì)聽(tīng)覺(jué)門(mén)限用聲壓級(jí)表示,靜音為0dB,痛閾為140dB。
現(xiàn)在是12頁(yè)\一共有77頁(yè)\編輯于星期五圖2-3絕對(duì)聽(tīng)覺(jué)門(mén)限曲線
現(xiàn)在是13頁(yè)\一共有77頁(yè)\編輯于星期五
人類聽(tīng)覺(jué)特性5.臨界頻帶指一個(gè)純音可以被以它為中心頻率,并且具有一定頻帶寬度的連續(xù)噪聲所掩蔽,在這一頻帶內(nèi)噪聲功率等于該純音的功率。使該純音處于剛能被聽(tīng)到的臨界狀態(tài),即稱這一帶寬為臨界頻帶寬度。臨界頻帶的單位為巴克(Bark)。
現(xiàn)在是14頁(yè)\一共有77頁(yè)\編輯于星期五
人類聽(tīng)覺(jué)特性6.同時(shí)掩蔽掩蔽效應(yīng)是指當(dāng)兩個(gè)響度不等的聲音作用于人耳時(shí),響度較高的頻率成分的存在會(huì)影響到對(duì)響度較低的頻率成分的感知。當(dāng)兩個(gè)或更多的音頻信號(hào)到達(dá)人內(nèi)耳時(shí),掩蔽聲與被掩蔽聲同時(shí)作用發(fā)生掩蔽效應(yīng),就稱同時(shí)掩蔽。
現(xiàn)在是15頁(yè)\一共有77頁(yè)\編輯于星期五
人類聽(tīng)覺(jué)特性7.異時(shí)掩蔽指掩蔽效應(yīng)發(fā)生在掩蔽聲與被掩蔽聲不同時(shí)出現(xiàn)的情況下。若掩蔽聲音出現(xiàn)之前的一段時(shí)間內(nèi)發(fā)生掩蔽效應(yīng),則稱為超前掩蔽,否則稱為滯后掩蔽。
現(xiàn)在是16頁(yè)\一共有77頁(yè)\編輯于星期五
人類聽(tīng)覺(jué)特性8.感知熵感知熵(PerceptualEntropy)指利用心理聲學(xué)的掩蔽現(xiàn)象和信號(hào)能量化原理來(lái)測(cè)量音頻信號(hào)中感知相關(guān)的信息。一般以位(bit)作為單位,實(shí)際上表示了音頻信號(hào)壓縮的理論極限。
現(xiàn)在是17頁(yè)\一共有77頁(yè)\編輯于星期五
數(shù)字音頻音頻信號(hào)是時(shí)間和幅度都連續(xù)變化的一維模擬信號(hào),要想在計(jì)算機(jī)中對(duì)它進(jìn)行處理,就要將它變成時(shí)間和幅度都是離散的數(shù)字信號(hào),所以數(shù)字音頻是指音頻信號(hào)經(jīng)過(guò)離散化處理后再用一系列的數(shù)字來(lái)表示的信號(hào),其特點(diǎn)是保真度好,動(dòng)態(tài)范圍大。數(shù)字音頻可分為波形聲音、語(yǔ)音和音樂(lè)。波形聲音實(shí)際上包含了所有的聲音形式,因此數(shù)字音頻有時(shí)也泛稱為聲音?,F(xiàn)在是18頁(yè)\一共有77頁(yè)\編輯于星期五
數(shù)字音頻用計(jì)算機(jī)來(lái)處理音頻信號(hào)必須將模擬音頻信號(hào)轉(zhuǎn)換成有限個(gè)數(shù)字表示的離散序列,過(guò)程為:選擇采樣頻率,即進(jìn)行采樣;選擇分辨率,即進(jìn)行量化;最后編碼形成聲音文件。聲音的采樣與量化如圖所示。現(xiàn)在是19頁(yè)\一共有77頁(yè)\編輯于星期五
數(shù)字音頻1.采樣采樣(Sampling)指把模擬信號(hào)在時(shí)域上以固定的時(shí)間間隔對(duì)波形的值進(jìn)行抽取,再用若干位二進(jìn)制數(shù)表示。對(duì)聲音波形采樣的頻率直接影響聲音的質(zhì)量,采樣頻率越高,聲音保真度越好,但所要求的數(shù)據(jù)存儲(chǔ)量也越大。根據(jù)采樣定理,當(dāng)采樣頻率大于信號(hào)最高頻率的兩倍時(shí),在采樣過(guò)程中就不會(huì)丟失信息,并且可以用采樣后的信號(hào)重構(gòu)原始信號(hào),從而不失真地還原出原始的聲音信號(hào)。對(duì)于音頻,最常用的采樣頻率有三種:44.1kHz、22.05kHz和11.025kHz,其中44.1kHz采樣頻率是最常用的。聲道數(shù)是聲音通道的個(gè)數(shù),指一次采樣的聲音波形個(gè)數(shù)?,F(xiàn)在是20頁(yè)\一共有77頁(yè)\編輯于星期五
數(shù)字音頻2.量化量化(Quantity)的目的是將采樣后的信號(hào)波形的幅度值(樣本)進(jìn)行離散化處理,樣本從模擬量轉(zhuǎn)化成了數(shù)字量。量化位數(shù)越多,所得到的量化值越接近原始波形的采樣值。量化方式有三種:零記憶量化、分組量化和序列量化?,F(xiàn)在是21頁(yè)\一共有77頁(yè)\編輯于星期五
聲音聲學(xué)是研究聲音的學(xué)科,包括聲波的產(chǎn)生、傳播和接收。物體振動(dòng)在彈性體里的傳播稱為波,而在空氣中傳播的波就稱為聲波,能被人的聽(tīng)覺(jué)器官所感覺(jué)到的聲波叫聲音,其頻率一般在20Hz~20kHz之間。
現(xiàn)在是22頁(yè)\一共有77頁(yè)\編輯于星期五
聲音聲音的三要素是音調(diào)、音色和音強(qiáng)。音調(diào)是指聲音的高低,音調(diào)與頻率有關(guān)。音色是指具有特色的聲音。音強(qiáng)是指聲音的強(qiáng)度,也稱為聲音的響度,音強(qiáng)與聲波的振幅成正比?,F(xiàn)在是23頁(yè)\一共有77頁(yè)\編輯于星期五
聲音聲音的質(zhì)量簡(jiǎn)稱音質(zhì)。1)與采樣頻率有關(guān)。對(duì)于數(shù)字音頻信號(hào),音質(zhì)的好壞與數(shù)據(jù)采樣頻率和數(shù)據(jù)位數(shù)有關(guān)。采樣頻率越低,位數(shù)越少,音質(zhì)越差。2)與音頻處理設(shè)備有關(guān)。音響放大器和揚(yáng)聲器的質(zhì)量能夠直接影響重放的質(zhì)量。3)與信號(hào)噪聲比有關(guān)。在錄音時(shí),音頻信號(hào)幅度與噪聲幅度的比值越大越好,否則聲音被噪聲干擾,會(huì)影響音質(zhì)?,F(xiàn)在是24頁(yè)\一共有77頁(yè)\編輯于星期五
語(yǔ)音語(yǔ)音是一種特殊的媒體,語(yǔ)音是人類所特有的,但也是一種波形,在計(jì)算機(jī)中表示方式與波形聲音的文件格式相同。語(yǔ)音處理的研究已經(jīng)有一百多年的歷史,其研究范圍主要涉及:語(yǔ)音合成、語(yǔ)音編碼、語(yǔ)音識(shí)別的基本算法和應(yīng)用。計(jì)算機(jī)處理語(yǔ)音過(guò)程如圖所示。現(xiàn)在是25頁(yè)\一共有77頁(yè)\編輯于星期五圖2-8計(jì)算機(jī)處理語(yǔ)音過(guò)程現(xiàn)在是26頁(yè)\一共有77頁(yè)\編輯于星期五第二章音頻處理技術(shù)2.2常用音頻壓縮標(biāo)準(zhǔn)音頻壓縮基礎(chǔ)常用音頻壓縮標(biāo)準(zhǔn)音頻文件格式現(xiàn)在是27頁(yè)\一共有77頁(yè)\編輯于星期五音頻壓縮基礎(chǔ)1.?dāng)?shù)據(jù)壓縮條件2.?dāng)?shù)據(jù)冗余3.?dāng)?shù)據(jù)壓縮算法分類現(xiàn)在是28頁(yè)\一共有77頁(yè)\編輯于星期五音頻壓縮基礎(chǔ)1.?dāng)?shù)據(jù)壓縮條件信號(hào)之所以能被壓縮和編碼,其原因主要是:1)數(shù)據(jù)冗余度2)人類不敏感因素3)信息傳輸與存儲(chǔ)現(xiàn)在是29頁(yè)\一共有77頁(yè)\編輯于星期五音頻壓縮基礎(chǔ)2.?dāng)?shù)據(jù)冗余冗余是指信息所具有的各種性質(zhì)中多余的無(wú)用空間,其多余的程度稱為冗余度。信息量、數(shù)據(jù)量和冗余量之間的關(guān)系如下:式中,I表示信息量,D表示數(shù)據(jù)量,du表示冗余量,冗余量應(yīng)在數(shù)據(jù)存儲(chǔ)和傳輸之前去掉。
現(xiàn)在是30頁(yè)\一共有77頁(yè)\編輯于星期五音頻壓縮基礎(chǔ)2.?dāng)?shù)據(jù)冗余空間冗余時(shí)間冗余統(tǒng)計(jì)冗余結(jié)構(gòu)冗余信息熵冗余知識(shí)冗余等?,F(xiàn)在是31頁(yè)\一共有77頁(yè)\編輯于星期五音頻壓縮基礎(chǔ)2.?dāng)?shù)據(jù)冗余空間冗余:一幅圖像表面上各采樣點(diǎn)的顏色之間往往存在著空間連貫性。圖像數(shù)據(jù)中經(jīng)常存在的一種冗余,如規(guī)則物體和規(guī)則背景(像素相關(guān)性強(qiáng))?,F(xiàn)在是32頁(yè)\一共有77頁(yè)\編輯于星期五音頻壓縮基礎(chǔ)2.?dāng)?shù)據(jù)冗余時(shí)間冗余:視頻和音頻中存在的、在時(shí)間尺度上相關(guān)的一種冗余,如相鄰幀之間像素的相關(guān)性;語(yǔ)音的連續(xù)和漸變過(guò)程??臻g冗余和時(shí)間冗余,存在大量的統(tǒng)計(jì)特征重復(fù),因此稱為統(tǒng)計(jì)冗余?,F(xiàn)在是33頁(yè)\一共有77頁(yè)\編輯于星期五音頻壓縮基礎(chǔ)2.?dāng)?shù)據(jù)冗余結(jié)構(gòu)冗余:有些圖像存在著非常強(qiáng)的紋理結(jié)構(gòu),我們稱它們?cè)诮Y(jié)構(gòu)上存在冗余。例如,布紋圖像和草席圖像?,F(xiàn)在是34頁(yè)\一共有77頁(yè)\編輯于星期五音頻壓縮基礎(chǔ)2.?dāng)?shù)據(jù)冗余信息熵冗余:也稱為編碼冗余,是指數(shù)據(jù)所攜帶的信息量少于數(shù)據(jù)本身而反映出來(lái)的數(shù)據(jù)冗余。例如:自然界的很多狀態(tài)不可能正好用2的整數(shù)次冪來(lái)表示,這樣就會(huì)造成編碼冗余?,F(xiàn)在是35頁(yè)\一共有77頁(yè)\編輯于星期五音頻壓縮基礎(chǔ)2.?dāng)?shù)據(jù)冗余知識(shí)冗余:舉例:成語(yǔ)、人臉的圖像有固定的結(jié)構(gòu)。這類規(guī)律性的結(jié)構(gòu)可由先驗(yàn)知識(shí)和背景知識(shí)得到,我們稱此類冗余為知識(shí)冗余。現(xiàn)在是36頁(yè)\一共有77頁(yè)\編輯于星期五音頻壓縮基礎(chǔ)3.?dāng)?shù)據(jù)壓縮算法分類圖2-10數(shù)據(jù)壓縮算法分類
現(xiàn)在是37頁(yè)\一共有77頁(yè)\編輯于星期五音頻壓縮基礎(chǔ)3.?dāng)?shù)據(jù)壓縮算法分類無(wú)損壓縮(冗余壓縮、熵編碼)法:無(wú)損壓縮法去掉或減少了數(shù)據(jù)中的冗余量,但這些冗余量是可以重新恢復(fù)的,因此,無(wú)損壓縮是可逆的過(guò)程。例如:壓縮軟件WinRAR應(yīng)用。注意:無(wú)損壓縮特點(diǎn)是壓縮比小。無(wú)損壓縮法不會(huì)產(chǎn)生失真,在多媒體技術(shù)中一般用于文本數(shù)據(jù)的壓縮。常見(jiàn)的例子是磁盤(pán)壓縮?,F(xiàn)在是38頁(yè)\一共有77頁(yè)\編輯于星期五音頻壓縮基礎(chǔ)3.?dāng)?shù)據(jù)壓縮算法分類有損壓縮(熵壓縮)法:有損壓縮減少了信息量,而這些損失信息量是不能再恢復(fù)的,因此,有損壓縮法是不可逆的。例如:視/聽(tīng)覺(jué)等冗余,由于人的感覺(jué)對(duì)某些失真不易覺(jué)察的生理特征,決定了在某些場(chǎng)合可以減少信息量。注意:有損壓縮特點(diǎn)是壓縮比大,但不可逆?,F(xiàn)在是39頁(yè)\一共有77頁(yè)\編輯于星期五常用音頻壓縮標(biāo)準(zhǔn)1.G.71164Kb/s脈沖編碼調(diào)制(PCM)2.G.721自適應(yīng)差分脈沖編碼調(diào)制(ADPCM)3.G.7227kHz聲音編碼器4.G.723雙速率語(yǔ)音編碼器5.G.72816Kb/s低延遲碼激勵(lì)線性預(yù)測(cè)編碼(LD-CELP)6.G.729語(yǔ)音編碼器7.MPEG-1音頻編碼8.AC音頻編碼9.空間音頻編碼10.移動(dòng)音頻編碼現(xiàn)在是40頁(yè)\一共有77頁(yè)\編輯于星期五常用音頻壓縮標(biāo)準(zhǔn)1.G.71164Kb/s脈沖編碼調(diào)制(PCM)脈沖編碼調(diào)制(PulseCodeModulation,PCM)是ITU制定出來(lái)的一套語(yǔ)音壓縮標(biāo)準(zhǔn),主要用于電話。1972年,CCITT對(duì)一個(gè)64Kb/s壓擴(kuò)型PCM編碼器做了標(biāo)準(zhǔn)化,稱為G.711。這個(gè)標(biāo)準(zhǔn)主要有兩種壓縮算法,在北美和日本,使用μ律PCM;而世界其他國(guó)家使用A律PCM。G.711在64Kb/s速率話音質(zhì)量能夠達(dá)到網(wǎng)絡(luò)等級(jí),目前已廣泛應(yīng)用于各種數(shù)字通信系統(tǒng)中,如電纜、微波、衛(wèi)星、光纜等。
現(xiàn)在是41頁(yè)\一共有77頁(yè)\編輯于星期五常用音頻壓縮標(biāo)準(zhǔn)2.G.721自適應(yīng)差分脈沖編碼調(diào)制(ADPCM)自適應(yīng)差分脈沖編碼調(diào)制(AdaptiveDifferentialPulseCodeModulation,ADPCM)在PCM的基礎(chǔ)上進(jìn)行改進(jìn),進(jìn)一步利用了語(yǔ)音信號(hào)樣點(diǎn)間的相關(guān)性,并針對(duì)語(yǔ)音信號(hào)的非平穩(wěn)特點(diǎn),使用了自適應(yīng)預(yù)測(cè)和自適應(yīng)量化1984年,CCITT首先對(duì)32Kb/sADPCM做了標(biāo)準(zhǔn)化,稱為G.721。G.721于1986年根據(jù)兩年間運(yùn)行中出現(xiàn)的一些問(wèn)題,做了進(jìn)一步修正,又重新標(biāo)準(zhǔn)化?,F(xiàn)在是42頁(yè)\一共有77頁(yè)\編輯于星期五常用音頻壓縮標(biāo)準(zhǔn)3.G.7227kHz聲音編碼器1988年,正式通過(guò)關(guān)于“用64Kb/s或低于此編碼速率的7kHz音頻信號(hào)編碼器”的標(biāo)準(zhǔn),稱為G.722。G.722的主要目標(biāo)是保持64Kb/s的數(shù)據(jù)率,而音頻信號(hào)的質(zhì)量要明顯高于G.711的質(zhì)量。
現(xiàn)在是43頁(yè)\一共有77頁(yè)\編輯于星期五.2.2常用音頻壓縮標(biāo)準(zhǔn)4.G.723雙速率語(yǔ)音編碼器G.723是在1996年制定的一種多媒體語(yǔ)音編解碼標(biāo)準(zhǔn)。G.723標(biāo)準(zhǔn)傳輸碼率有5.3Kb/s和6.3Kb/s兩種,在編程過(guò)程中可隨時(shí)切換。
現(xiàn)在是44頁(yè)\一共有77頁(yè)\編輯于星期五常用音頻壓縮標(biāo)準(zhǔn)5.G.72816Kb/s低延遲碼激勵(lì)線性預(yù)測(cè)編碼(LD-CELP)G.728的工作進(jìn)程是從1988年開(kāi)始的,試圖建立通用的16Kb/s長(zhǎng)話質(zhì)量的語(yǔ)音編碼標(biāo)準(zhǔn)。G.728開(kāi)始是按照浮點(diǎn)CELP編碼算法規(guī)定的。1994年完成了按照嚴(yán)格定點(diǎn)規(guī)定的算法?,F(xiàn)在是45頁(yè)\一共有77頁(yè)\編輯于星期五常用音頻壓縮標(biāo)準(zhǔn)6.G.729語(yǔ)音編碼器在1996年3月,ITU-T的第15研究小組提出8Kb/s的語(yǔ)音編碼協(xié)議,稱為G.729。G.729標(biāo)準(zhǔn)使用的算法是共軛結(jié)構(gòu)的代數(shù)碼本激勵(lì)線性預(yù)測(cè)(CS-ACELP),它基于CELP編碼模型。
現(xiàn)在是46頁(yè)\一共有77頁(yè)\編輯于星期五常用音頻壓縮標(biāo)準(zhǔn)7.MPEG-1音頻編碼MPEG-1音頻編碼作為MPEG標(biāo)準(zhǔn)的一部分,對(duì)應(yīng)于ISO/IEC11172-3,規(guī)定了高質(zhì)量音頻編碼方法、存儲(chǔ)表示和解碼方法。
現(xiàn)在是47頁(yè)\一共有77頁(yè)\編輯于星期五常用音頻壓縮標(biāo)準(zhǔn)8.AC音頻編碼杜比實(shí)驗(yàn)室在1987年第一次將數(shù)字編碼技術(shù)引入到HDTV的開(kāi)發(fā)中,即AC-1標(biāo)準(zhǔn)。1990年杜比實(shí)驗(yàn)室又推出了立體聲編碼標(biāo)準(zhǔn)AC-2。1994年杜比公司與日本先鋒公司聯(lián)合推出了最新一代的杜比數(shù)碼環(huán)繞聲系統(tǒng)DolbySurroundAudioCoding-3,簡(jiǎn)稱為AC-3。
現(xiàn)在是48頁(yè)\一共有77頁(yè)\編輯于星期五常用音頻壓縮標(biāo)準(zhǔn)9.空間音頻編碼隨著人類聽(tīng)覺(jué)研究在空間心理聲學(xué)、認(rèn)知心理學(xué)等學(xué)科的不斷深入,出現(xiàn)了將人類空間方位感知參數(shù)引入音頻壓縮編碼技術(shù)的研究——空間音頻編碼(SpatialAudioCoding,SAC)。通過(guò)將空間線索(SpatialCues)參數(shù)引入到音頻壓縮編碼算法中,即所謂的參數(shù)立體聲(ParametricStereo,PS)技術(shù),分析聲道間冗余信息量,采用立體聲參數(shù)提取的聯(lián)合聲道編碼模式,取代傳統(tǒng)的聲道分離編碼模式,可以降低近50%的編碼碼率,使空間成為數(shù)字音頻編碼技術(shù)的有效組成部分?,F(xiàn)在是49頁(yè)\一共有77頁(yè)\編輯于星期五常用音頻壓縮標(biāo)準(zhǔn)10.移動(dòng)音頻編碼在移動(dòng)通信系統(tǒng)中采用混合壓縮編碼,可以根據(jù)需要?jiǎng)討B(tài)調(diào)整編碼碼率,在合成音頻質(zhì)量、系統(tǒng)空間中取得平衡,最大限度地發(fā)揮系統(tǒng)的效能。3GPP將AMR-WB+和EAAC+兩種編碼標(biāo)準(zhǔn)用于第三代移動(dòng)網(wǎng)絡(luò)中的多媒體服務(wù)。
現(xiàn)在是50頁(yè)\一共有77頁(yè)\編輯于星期五方法算法名稱數(shù)據(jù)率標(biāo)準(zhǔn)應(yīng)用質(zhì)量波形編碼PCM脈沖編碼調(diào)制公共網(wǎng)ISDN配音4.0~4.5μ(A)μ(A)64Kb/sG.711APCM自適應(yīng)脈沖編碼調(diào)制DPCM差分脈沖編碼調(diào)制ADPCM自適應(yīng)差分脈沖編碼調(diào)制32Kb/sG.721SB-ADPCM子帶自適應(yīng)差分脈沖編碼調(diào)制64Kb/sG.7225.3Kb/s6.3Kb/sG.723參數(shù)編碼LPC線性預(yù)測(cè)編碼2.4Kb/s保密話聲2.5~3.5混合編碼CELPC碼激勵(lì)LPC4.6Kb/s移動(dòng)通信3.7~4.0VSELP矢量和激勵(lì)LPC8Kb/s語(yǔ)音通信RPE-LTP長(zhǎng)時(shí)預(yù)測(cè)規(guī)則碼激勵(lì)13.2Kb/sISDNLD-CELP低延遲碼激勵(lì)LPC16Kb/sG.728網(wǎng)絡(luò)通信CS-ACELP共軛結(jié)構(gòu)代數(shù)碼激勵(lì)線性預(yù)測(cè)8Kb/sG.729語(yǔ)音通信MPEG子帶感知編碼128Kb/sMPEG-1、MPEG-2、MPEG-4CD5.0AC-3感知編碼音響5.0現(xiàn)在是51頁(yè)\一共有77頁(yè)\編輯于星期五音頻文件格式1.波形格式2.MIDI格式3.MP3壓縮格式4.幾種流式音頻格式
現(xiàn)在是52頁(yè)\一共有77頁(yè)\編輯于星期五音頻文件格式1.波形格式WAV是MicrosoftWindows本身提供的音頻格式,用.wav作為擴(kuò)展名,其文件格式稱為波形文件格式(WaveFileFormat),在多媒體編程接口和數(shù)據(jù)規(guī)范1.0(MultimediaProgrammingInterfaceandDataSpecifications1.0)文檔中有詳細(xì)的描述。現(xiàn)在是53頁(yè)\一共有77頁(yè)\編輯于星期五音頻文件格式2.MIDI格式電子樂(lè)器數(shù)字接口(MusicalInstrumentDigitalInterface,MIDI)是用于在音樂(lè)合成器(MusicSynthesizers)、樂(lè)器(MusicalInstruments)和計(jì)算機(jī)之間交換音樂(lè)信息,播放和錄制音樂(lè)的一種標(biāo)準(zhǔn)協(xié)議?,F(xiàn)在是54頁(yè)\一共有77頁(yè)\編輯于星期五音頻文件格式3.MP3壓縮格式MP3全稱是MPEG-1Layer3音頻文件,是MPEG-1標(biāo)準(zhǔn)中的聲音部分,也叫MPEG音頻層。MPEG音頻層根據(jù)壓縮質(zhì)量和編碼復(fù)雜程度劃分為三層,即Layer1、Layer2、Layer3,分別對(duì)應(yīng)MP1、MP2、MP3這三種聲音文件?,F(xiàn)在是55頁(yè)\一共有77頁(yè)\編輯于星期五音頻文件格式4.幾種流式音頻格式現(xiàn)在使用最普遍的流格式類型是RealNetworks公司發(fā)明的支持網(wǎng)絡(luò)流媒體技術(shù)的實(shí)時(shí)音頻格式,RA、RMA這兩個(gè)文件類型就是RealMedia的音頻格式?,F(xiàn)在是56頁(yè)\一共有77頁(yè)\編輯于星期五第二章音頻處理技術(shù)2.3音頻處理軟件Audition功能介紹編輯環(huán)境基本操作現(xiàn)在是57頁(yè)\一共有77頁(yè)\編輯于星期五Audition軟件是Adobe公司推出的一款完整的、應(yīng)用于Windows系統(tǒng)的PC上的多音軌音頻工作站。該軟件前身稱為CoolEdit,Adobe公司在2003年5月從SyntrilliumSoftware公司成功購(gòu)買(mǎi)后將其更名為Audition。
現(xiàn)在是58頁(yè)\一共有77頁(yè)\編輯于星期五功能介紹AdobeAudition3.0是一款功能強(qiáng)大的、專業(yè)級(jí)的音樂(lè)編輯軟件,能高質(zhì)量地完成高級(jí)混音、編輯、控制、合成和特效處理,允許用戶編輯個(gè)性化的音頻文件,創(chuàng)建循環(huán),引進(jìn)了45個(gè)以上的DSP特效以及高達(dá)128個(gè)音軌。AdobeAudition擁有集成的多音軌和編輯視圖、實(shí)時(shí)特效、環(huán)繞支持、分析工具、恢復(fù)特性和視頻支持等功能,為音樂(lè)、視頻、音頻和聲音設(shè)計(jì)專業(yè)人員提供全面集成的音頻編輯和混音解決方案。AdobeAudition提供了直覺(jué)的、客戶化的界面,允許用戶刪減和調(diào)整窗口的大小,創(chuàng)建一個(gè)高效率的音頻工作范圍。
現(xiàn)在是59頁(yè)\一共有77頁(yè)\編輯于星期五編輯環(huán)境Audition提供了三種專業(yè)的工作視圖界面,包括:編輯視圖(EditView)多軌視圖(MultitrackView)CD視圖(CDView)現(xiàn)在是60頁(yè)\一共有77頁(yè)\編輯于星期五圖2-16多軌視圖界面
現(xiàn)在是61頁(yè)\一共有77頁(yè)\編輯于星期五圖2-17單軌視圖界面
現(xiàn)在是62頁(yè)\一共有77頁(yè)\編輯于星期五圖2-23CD視圖
現(xiàn)在是63頁(yè)\一共有77頁(yè)\編輯于星期五基本操作1.單軌視圖(1)打開(kāi)或創(chuàng)建一個(gè)音頻文件(2)編輯音頻(3)保存更改
現(xiàn)在是64頁(yè)\一共有77頁(yè)\編輯于星期五基本操作2.多軌視圖(1)打開(kāi)或創(chuàng)建一個(gè)音頻文件(2)插入或錄制音頻文件(3)施加效果(4)混合軌道(5)輸出
現(xiàn)在是65頁(yè)\一共有77頁(yè)\編輯于星期五推薦多媒體軟件認(rèn)證考試1.全國(guó)計(jì)算機(jī)信息高新技術(shù)考試(CITT)考試名稱:勞動(dòng)和社會(huì)保障部全國(guó)計(jì)算機(jī)信息高新技術(shù)考試(全稱)
國(guó)家計(jì)算機(jī)高新技術(shù)考試(簡(jiǎn)稱)證書(shū)名稱:全國(guó)計(jì)算機(jī)信息高新技術(shù)考試合格證書(shū)(全稱)
OSTA計(jì)算機(jī)認(rèn)證(簡(jiǎn)稱)發(fā)證部門(mén):人力資源和社會(huì)保障部職業(yè)技能鑒定中心網(wǎng)址:模塊化(12個(gè))分級(jí)考試(5級(jí)):相關(guān)模塊:計(jì)算機(jī)輔助設(shè)計(jì)(AutoCAD,Protel),圖形圖像處理(PhotoShop,3DMax,CorelDRAW,Illustrator),多媒體軟件制作(Director,Authorware),視頻編輯(Premiere,AfterEffects)級(jí)別:高級(jí)操作師級(jí),操作師級(jí),高級(jí)操作員級(jí),操作員級(jí),初級(jí)操作員級(jí)現(xiàn)在是66頁(yè)\一共有77頁(yè)\編輯于星期五現(xiàn)在是67頁(yè)\一共有77頁(yè)\編輯于星期五推薦多媒體軟件認(rèn)證考試2.全國(guó)計(jì)算
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年八年級(jí)物理下冊(cè) 第7章 第2節(jié) 彈力說(shuō)課稿 (新版)新人教版
- 2025最簡(jiǎn)單采購(gòu)合同協(xié)議樣本
- 2024-2025學(xué)年高中化學(xué) 第1章 有機(jī)化合物的結(jié)構(gòu)與性質(zhì) 烴 1.1.1 有機(jī)化學(xué)的發(fā)展 有機(jī)化合物的分類說(shuō)課稿 魯科版選修5
- 2025如何防范國(guó)際貿(mào)易合同中的風(fēng)險(xiǎn)店鋪轉(zhuǎn)讓合同協(xié)議書(shū)
- 農(nóng)村電商 合同范例
- 包裝食品采購(gòu)合同范例
- Unit 1 My school 單元整體分析(說(shuō)課稿)-2023-2024學(xué)年人教PEP版英語(yǔ)四年級(jí)下冊(cè)
- 2024-2025學(xué)年高中歷史 專題九 戊戌變法 一 醞釀中的變革(2)教學(xué)說(shuō)課稿 人民版選修1
- 13 導(dǎo)體和絕緣體 說(shuō)課稿-2024-2025學(xué)年科學(xué)四年級(jí)上冊(cè)蘇教版001
- JN造船廠合同管理改進(jìn)研究
- 青島中國(guó)(山東)自由貿(mào)易試驗(yàn)區(qū)青島片區(qū)(青島前灣綜合保稅區(qū))管理委員會(huì)選聘35人筆試歷年參考題庫(kù)附帶答案詳解
- 教育信息化背景下的學(xué)術(shù)研究趨勢(shì)
- 2023-2024學(xué)年四川省成都市小學(xué)數(shù)學(xué)一年級(jí)下冊(cè)期末提升試題
- GB/T 7462-1994表面活性劑發(fā)泡力的測(cè)定改進(jìn)Ross-Miles法
- GB/T 2934-2007聯(lián)運(yùn)通用平托盤(pán)主要尺寸及公差
- GB/T 21709.13-2013針灸技術(shù)操作規(guī)范第13部分:芒針
- 2022年青島職業(yè)技術(shù)學(xué)院?jiǎn)握姓Z(yǔ)文考試試題及答案解析
- 急診科進(jìn)修匯報(bào)課件
- 一年級(jí)家訪記錄表(常用)
- 信息技術(shù)基礎(chǔ)ppt課件(完整版)
- 電子課件-《飯店服務(wù)心理(第四版)》-A11-2549
評(píng)論
0/150
提交評(píng)論