音頻基礎(chǔ)知識(shí).doc_第1頁(yè)
音頻基礎(chǔ)知識(shí).doc_第2頁(yè)
音頻基礎(chǔ)知識(shí).doc_第3頁(yè)
音頻基礎(chǔ)知識(shí).doc_第4頁(yè)
音頻基礎(chǔ)知識(shí).doc_第5頁(yè)
已閱讀5頁(yè),還剩7頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

.音頻,英文是AUDIO,也許你會(huì)在錄像機(jī)或VCD的背板上看到過(guò)AUDIO輸出或輸入口。這樣我們可以很通俗地解釋音頻,只要是我們聽得見的聲音,就可以作為音頻信號(hào)進(jìn)行傳輸。有關(guān)音頻的物理屬性由于過(guò)于專業(yè),請(qǐng)大家參考其他資料。自然界中的聲音非常復(fù)雜,波形極其復(fù)雜,通常我們采用的是脈沖代碼調(diào)制編碼,即PCM編碼。PCM通過(guò)采樣、量化、編碼三個(gè)步驟將連續(xù)變化的模擬信號(hào)轉(zhuǎn)換為數(shù)字編碼。一、音頻基本概念1、 什么是采樣率和采樣大小(位/bit)。聲音其實(shí)是一種能量波,因此也有頻率和振幅的特征,頻率對(duì)應(yīng)于時(shí)間軸線,振幅對(duì)應(yīng)于電平軸線。波是無(wú)限光滑的,弦線可以看成由無(wú)數(shù)點(diǎn)組成,由于存儲(chǔ)空間是相對(duì)有限的,數(shù)字編碼過(guò)程中,必須對(duì)弦線的點(diǎn)進(jìn)行采樣。采樣的過(guò)程就是抽取某點(diǎn)的頻率值,很顯然,在一秒中內(nèi)抽取的點(diǎn)越多,獲取得頻率信息更豐富,為了復(fù)原波形,一次振動(dòng)中,必須有2個(gè)點(diǎn)的采樣,人耳能夠感覺(jué)到的最高頻率為20kHz,因此要滿足人耳的聽覺(jué)要求,則需要至少每秒進(jìn)行40k次采樣,用40kHz表達(dá),這個(gè)40kHz就是采樣率。我們常見的CD,采樣率為44.1kHz。光有頻率信息是不夠的,我們還必須獲得該頻率的能量值并量化,用于表示信號(hào)強(qiáng)度。量化電平數(shù)為2的整數(shù)次冪,我們常見的CD位16bit的采樣大小,即2的16次方。采樣大小相對(duì)采樣率更難理解,因?yàn)橐@得抽象點(diǎn),舉個(gè)簡(jiǎn)單例子:假設(shè)對(duì)一個(gè)波進(jìn)行8次采樣,采樣點(diǎn)分別對(duì)應(yīng)的能量值分別為A1-A8,但我們只使用2bit的采樣大小,結(jié)果我們只能保留A1-A8中4個(gè)點(diǎn)的值而舍棄另外4個(gè)。如果我們進(jìn)行3bit的采樣大小,則剛好記錄下8個(gè)點(diǎn)的所有信息。采樣率和采樣大小的值越大,記錄的波形更接近原始信號(hào)。2、有損和無(wú)損根據(jù)采樣率和采樣大小可以得知,相對(duì)自然界的信號(hào),音頻編碼最多只能做到無(wú)限接近,至少目前的技術(shù)只能這樣了,相對(duì)自然界的信號(hào),任何數(shù)字音頻編碼方案都是有損的,因?yàn)闊o(wú)法完全還原。在計(jì)算機(jī)應(yīng)用中,能夠達(dá)到最高保真水平的就是PCM編碼,被廣泛用于素材保存及音樂(lè)欣賞,CD、DVD以及我們常見的WAV文件中均有應(yīng)用。因此,PCM約定俗成了無(wú)損編碼,因?yàn)镻CM代表了數(shù)字音頻中最佳的保真水準(zhǔn),并不意味著PCM就能夠確保信號(hào)絕對(duì)保真,PCM也只能做到最大程度的無(wú)限接近。我們而習(xí)慣性的把MP3列入有損音頻編碼范疇,是相對(duì)PCM編碼的。強(qiáng)調(diào)編碼的相對(duì)性的有損和無(wú)損,是為了告訴大家,要做到真正的無(wú)損是困難的,就像用數(shù)字去表達(dá)圓周率,不管精度多高,也只是無(wú)限接近,而不是真正等于圓周率的值。3、為什么要使用音頻壓縮技術(shù)要算一個(gè)PCM音頻流的碼率是一件很輕松的事情,采樣率值采樣大小值聲道數(shù) bps。一個(gè)采樣率為44.1KHz,采樣大小為16bit,雙聲道的PCM編碼的WAV文件,它的數(shù)據(jù)速率則為 44.1K162 =1411.2 Kbps。我們常說(shuō)128K的MP3,對(duì)應(yīng)的WAV的參數(shù),就是這個(gè)1411.2 Kbps,這個(gè)參數(shù)也被稱為數(shù)據(jù)帶寬,它和ADSL中的帶寬是一個(gè)概念。將碼率除以8,就可以得到這個(gè)WAV的數(shù)據(jù)速率,即176.4KB/s。這表示存儲(chǔ)一秒鐘采樣率為44.1KHz,采樣大小為16bit,雙聲道的PCM編碼的音頻信號(hào),需要176.4KB的空間,1分鐘則約為10.34M,這對(duì)大部分用戶是不可接受的,尤其是喜歡在電腦上聽音樂(lè)的朋友,要降低磁盤占用,只有2種方法,降低采樣指標(biāo)或者壓縮。降低指標(biāo)是不可取的,因此專家們研發(fā)了各種壓縮方案。由于用途和針對(duì)的目標(biāo)市場(chǎng)不一樣,各種音頻壓縮編碼所達(dá)到的音質(zhì)和壓縮比都不一樣,在后面的文章中我們都會(huì)一一提到。有一點(diǎn)是可以肯定的,他們都?jí)嚎s過(guò)。4、頻率與采樣率的關(guān)系采樣率表示了每秒對(duì)原始信號(hào)采樣的次數(shù),我們常見到的音頻文件采樣率多為44.1KHz,這意味著什么呢?假設(shè)我們有2段正弦波信號(hào),分別為20Hz和20KHz,長(zhǎng)度均為一秒鐘,以對(duì)應(yīng)我們能聽到的最低頻和最高頻,分別對(duì)這兩段信號(hào)進(jìn)行40KHz的采樣,我們可以得到一個(gè)什么樣的結(jié)果呢?結(jié)果是:20Hz的信號(hào)每次振動(dòng)被采樣了40K/20=2000次,而20K的信號(hào)每次振動(dòng)只有2次采樣。顯然,在相同的采樣率下,記錄低頻的信息遠(yuǎn)比高頻的詳細(xì)。這也是為什么有些音響發(fā)燒友指責(zé)CD有數(shù)碼聲不夠真實(shí)的原因,CD的44.1KHz采樣也無(wú)法保證高頻信號(hào)被較好記錄。要較好的記錄高頻信號(hào),看來(lái)需要更高的采樣率,于是有些朋友在捕捉CD音軌的時(shí)候使用48KHz的采樣率,這是不可取的!這其實(shí)對(duì)音質(zhì)沒(méi)有任何好處,對(duì)抓軌軟件來(lái)說(shuō),保持和CD提供的44.1KHz一樣的采樣率才是最佳音質(zhì)的保證之一,而不是去提高它。較高的采樣率只有相對(duì)模擬信號(hào)的時(shí)候才有用,如果被采樣的信號(hào)是數(shù)字的,請(qǐng)不要去嘗試提高采樣率。5、流特征隨著網(wǎng)絡(luò)的發(fā)展,人們對(duì)在線收聽音樂(lè)提出了要求,因此也要求音頻文件能夠一邊讀一邊播放,而不需要把這個(gè)文件全部讀出后然后回放,這樣就可以做到不用下載就可以實(shí)現(xiàn)收聽了。也可以做到一邊編碼一邊播放,正是這種特征,可以實(shí)現(xiàn)在線的直播,架設(shè)自己的數(shù)字廣播電臺(tái)成為了現(xiàn)實(shí)。幾個(gè)補(bǔ)充概念:什么是分頻器?分頻器是指將不同頻段的聲音信號(hào)區(qū)分開來(lái),分別給于放大,然后送到相應(yīng)頻段的揚(yáng)聲器中再進(jìn)行重放。在高質(zhì)量聲音重放時(shí),需要進(jìn)行電子分頻處理。 它可分為兩種:(1)功率分頻器:位于功率放大器之后,設(shè)置在音箱內(nèi),通過(guò)LC濾波網(wǎng)絡(luò),將功率放大器輸出的功率音頻信號(hào)分為低音,中音和高音,分別送至各自揚(yáng)聲器。連接簡(jiǎn)單,使用方便,但消耗功率,出現(xiàn)音頻谷點(diǎn),產(chǎn)生交*失真,它的參數(shù)與揚(yáng)聲器阻抗有的直接關(guān)系,而揚(yáng)聲器的阻抗又是頻率的函數(shù),與標(biāo)稱值偏離較大,因此誤差也較大,不利于調(diào)整。(2)電子分頻器:將音頻弱信號(hào)進(jìn)行分頻的設(shè)備,位于功率放大器前,分頻后再用各自獨(dú)立的功率放大器,把每一個(gè)音頻頻段信號(hào)給予放大,然后分別送到相應(yīng)的揚(yáng)聲器單元。因電流較小故可用較小功率的電子有源濾波器實(shí)現(xiàn),調(diào)整較容易,減少功率損耗,及揚(yáng)聲器單元之間的干擾。使得信號(hào)損失小,音質(zhì)好。但此方式每路要用獨(dú)立的功率放大器,成本高,電路結(jié)構(gòu)復(fù)雜,運(yùn)用于專業(yè)擴(kuò)聲系統(tǒng)。(摘自av_world) 什么是激勵(lì)器?激勵(lì)器是一種諧波發(fā)生器,利用人的心理聲學(xué)特性,對(duì)聲音信號(hào)進(jìn)行修飾和美化的聲處理設(shè)備。通過(guò)給聲音增加高頻諧波成分等多種方法,可以改善音質(zhì)、音色、提高聲音的穿透力,增加聲音的空間感?,F(xiàn)代激勵(lì)器不僅可以創(chuàng)造出高頻諧波,而且還具有低頻擴(kuò)展和音樂(lè)風(fēng)格等功能,使低音效果更加完美、音樂(lè)更具表現(xiàn)力。使用激勵(lì)器提高聲音的清晰度,可懂性和表現(xiàn)力。使聲音更加悅耳動(dòng)聽,降低聽音疲勞,增加響度。雖然激勵(lì)器只給聲音增加了0.5dB左右的諧波成分,但實(shí)際聽起來(lái),音量好像增加了10dB左右。使聲音的聽覺(jué)響度明顯增加,聲音圖像的立體感,以及聲音的分離度的增加;改善了聲音的定位和層次感,還可以提高重放聲音的音質(zhì),磁帶的復(fù)制率。因?yàn)槁曅盘?hào)在傳送和錄制過(guò)程中會(huì)損失高頻諧波成分,出現(xiàn)高頻噪聲。此時(shí)前者用激勵(lì)器先對(duì)信號(hào)進(jìn)行補(bǔ)償,后者可用濾波器將高頻噪聲濾掉后,再營(yíng)造出高音成分,保證重放音質(zhì)。 激勵(lì)器的調(diào)節(jié)需要音響師對(duì)系統(tǒng)的音質(zhì)和音色進(jìn)行判別,再根據(jù)主觀聽音評(píng)價(jià)進(jìn)行調(diào)整。( 什么是均衡器?均衡器是一種可以分別調(diào)節(jié)各種頻率成分電信號(hào)放大量的電子設(shè)備,通過(guò)對(duì)各種不同頻率的電信號(hào)的調(diào)節(jié)來(lái)補(bǔ)償揚(yáng)聲器和聲場(chǎng)的缺陷,補(bǔ)償和修飾各種聲源及其它特殊作用,一般調(diào)音臺(tái)上的均衡器僅能對(duì)高頻、中頻、低頻三段頻率電信號(hào)分別進(jìn)行調(diào)節(jié)。均衡器分為三類:圖示均衡器,參量均衡器和房間均衡器。1圖示均衡器:亦稱圖表均衡器,通過(guò)面板上推拉鍵的分布,可直觀地反映出所調(diào)出的均衡補(bǔ)償曲線,各個(gè)頻率的提升和衰減情況一目了然,它采用恒定Q值技術(shù),每個(gè)頻點(diǎn)設(shè)有一個(gè)推拉電位器,無(wú)論提升或衰減某頻率,濾波器的頻帶寬始終不變。常用的專業(yè)圖示均衡器則是將20Hz20kHz的信號(hào)分成10段、15段、27段、31段來(lái)進(jìn)行調(diào)節(jié)。這樣人們根據(jù)不同的要求分別選擇不同段數(shù)的頻率均衡器。一般來(lái)說(shuō)10段均衡器的頻率點(diǎn)以倍頻程間隔分布,使用在一般場(chǎng)合下,15段均衡器是2/3倍頻程均衡器,使用在專業(yè)擴(kuò)聲上,31段均衡器是1/3倍頻程均衡器,多數(shù)有在比較重要的需要精細(xì)補(bǔ)償?shù)膱?chǎng)合下,圖示均衡器結(jié)構(gòu)簡(jiǎn)單,直觀明了,故在專業(yè)音響中應(yīng)用非常廣泛。2參量均衡器:亦稱參數(shù)均衡器,對(duì)均衡調(diào)節(jié)的各種參數(shù)都可細(xì)致調(diào)節(jié)的均衡器,多附設(shè)在調(diào)音臺(tái)上,但也有獨(dú)立的參量均衡器,調(diào)節(jié)的參數(shù)內(nèi)容包括頻段、頻點(diǎn)、增益和品質(zhì)因數(shù)Q值等,可以美化(包括丑化)和修飾聲音,使聲音(或音樂(lè))風(fēng)格更加鮮明突出,豐富多彩達(dá)到所需要的藝術(shù)效果。3房間均衡器,用于調(diào)整房間內(nèi)的頻率響應(yīng)特性曲線的均衡器,由于裝飾材料對(duì)不同頻率的吸收(或反射)量不同以及簡(jiǎn)正共振的影響造成聲染色,所以必須用房間均衡器對(duì)由于建聲方面的頻率缺陷加以客觀地補(bǔ)償調(diào)節(jié)。 頻段分得越細(xì),調(diào)節(jié)的峰越尖銳,即Q值(品質(zhì)因數(shù))越高,調(diào)節(jié)時(shí)補(bǔ)償?shù)迷郊?xì)致,頻段分的越粗則調(diào)節(jié)的峰就比較寬,當(dāng)聲場(chǎng)傳輸頻率特性曲線比較復(fù)雜時(shí)較難補(bǔ)償。( 什么是壓縮限幅器?壓縮限幅器是壓縮器和限幅器的統(tǒng)稱。它是音頻信號(hào)的一種處理設(shè)備,可以將音頻電信號(hào)的動(dòng)態(tài)進(jìn)行壓縮或進(jìn)行限制。壓縮器為可變?cè)鲆娣糯笃?,其放大倍?shù)(增益)可以隨輸入信號(hào)的強(qiáng)弱而自動(dòng)變化,是成反比的。當(dāng)輸入信號(hào)達(dá)到一定程度(閾值也稱臨界值)時(shí),輸出信號(hào)隨輸入信號(hào)的增加而增加,這種情況稱為壓縮(Compressor);不再增加則稱為限制(Limiter)。過(guò)去的壓限器采用硬拐點(diǎn)(Hard-knee)技術(shù),輸入信號(hào)一達(dá)到閾值。增益就立即減少,這樣就會(huì)出現(xiàn)信號(hào)在拐點(diǎn)(增益變化的轉(zhuǎn)折點(diǎn))處動(dòng)態(tài)突變現(xiàn)象,使人耳明顯地感覺(jué)到強(qiáng)信號(hào)被突然壓縮的現(xiàn)象。為了解決這一不足,現(xiàn)代新型壓限器采用了軟拐點(diǎn)(soft-knee)技術(shù),這種壓限器在閾值前后的壓縮比變化是平衡的,漸變的,使壓縮變化難以察覺(jué),音質(zhì)進(jìn)一步提高。壓限器在錄音過(guò)程中可以使樂(lè)器和歌唱者的音量保持一定的平衡;保證各種信號(hào)強(qiáng)度的均衡。有時(shí)也用來(lái)消除歌唱者的口齒聲,或利用改變壓縮和釋放時(shí)間,產(chǎn)生聲音由小變大的“反轉(zhuǎn)聲”特殊效果。在廣播系統(tǒng)中是用它來(lái)壓縮較大動(dòng)態(tài)范圍的節(jié)目信號(hào)在防止調(diào)制失真和防止發(fā)射機(jī)過(guò)載的前提下,提高平均發(fā)射電平。在歌舞廳的擴(kuò)聲系統(tǒng)中,壓限器是將信號(hào)通過(guò)壓縮在保持原節(jié)目的風(fēng)貌下,降低音樂(lè)的動(dòng)態(tài),以滿足擴(kuò)聲系統(tǒng)和藝術(shù)活動(dòng)的要求。雖然壓限器有多種用途,現(xiàn)代壓縮器普通采用了軟拐點(diǎn)等新技術(shù),可進(jìn)一步減小壓限器的壓縮器的副作用,但是并不意味著壓限器對(duì)音質(zhì)的破壞作用就已不復(fù)存在了。所以,在擴(kuò)聲系統(tǒng)中,不要濫用壓限器,即使要用也應(yīng)該慎用減少用壓限器對(duì)信號(hào)進(jìn)行處理。這不僅是保護(hù)功放、音箱的需要,也是對(duì)改善音質(zhì)的需要。 什么是信噪比(S/N)?信噪比指的是線路中某一參考點(diǎn)的信號(hào)功率與無(wú)信號(hào)時(shí)固有的噪音功率之比值,用分貝(dB)表示,其數(shù)值越高越好,表示雜音起少。什么是分貝分貝(dB)為表示相對(duì)功率或幅度電平的標(biāo)準(zhǔn)單位。用dB表示。 分貝數(shù)越大代表的所發(fā)出的聲音越大,分貝在計(jì)算上是每增加 10 分貝,則聲音大小約是原來(lái)的十倍。dB: deciBel分貝。用以表達(dá)兩個(gè)電壓、功率或聲音的相對(duì)水準(zhǔn)。dBm: 分貝的一個(gè)變種,0dB = 1mW into 600 OhmsdBv: 分貝的一個(gè)變種,0dB = 0.775 volts.dBV: 分貝的一個(gè)變種,0dB = 1 volt.dB/Octave: 分貝/八度。濾波器斜率的表達(dá)方式,每個(gè)八度的分貝數(shù)越大說(shuō)明斜線更陡直。這個(gè)概念相對(duì)較為復(fù)雜,我們用物理學(xué)計(jì)算來(lái)說(shuō)明:為了表示聲音的強(qiáng)弱程度,人們引入了“聲強(qiáng)”的概念,并用1秒內(nèi)垂直穿過(guò)單位面積的聲能多少來(lái)量度它的大小,聲強(qiáng)用字母“I”表示,它的單位是“瓦米2”。根據(jù)規(guī)定可知,如果1秒內(nèi)垂直穿過(guò)單位面積的聲能加倍,那么聲強(qiáng)的值也變?yōu)樵瓉?lái)的2倍。所以說(shuō)聲強(qiáng)是不隨人們感覺(jué)而轉(zhuǎn)移的客觀物理量。雖然聲強(qiáng)是個(gè)客觀物理量,但是聲強(qiáng)的大小和人們主觀感到的聲音強(qiáng)弱,卻有非常大的差異。為了符合人們對(duì)聲音強(qiáng)弱的主觀感覺(jué),物理學(xué)里又引入了“聲強(qiáng)級(jí)”的概念,分貝就是聲強(qiáng)級(jí)的一個(gè)單位,它是貝爾的十分之一。聲強(qiáng)級(jí)又是怎樣規(guī)定的呢?它和聲強(qiáng)有什么關(guān)系呢?測(cè)量證明,人耳對(duì)不同頻率的聲波,敏感程度是不同的。對(duì)于3000赫茲的聲波最敏感。只要這個(gè)頻率的聲強(qiáng)達(dá)到I01012瓦米2,就能引起人耳的聽覺(jué)。聲強(qiáng)級(jí)就是以人耳能聽到的這個(gè)最小聲強(qiáng)I0為基準(zhǔn)規(guī)定的,并把I01012瓦米2的聲強(qiáng)規(guī)定為零級(jí)聲強(qiáng),也就是說(shuō)這時(shí)的聲強(qiáng)級(jí)為零貝爾(也是零分貝)。當(dāng)聲強(qiáng)由I0加倍為2I0時(shí),人耳感到的聲音強(qiáng)弱并沒(méi)有加倍。只有當(dāng)聲強(qiáng)達(dá)到10I0時(shí),人耳感到的聲音強(qiáng)弱才增大一倍,這個(gè)聲強(qiáng)對(duì)應(yīng)的聲強(qiáng)級(jí)為1貝爾10分貝;當(dāng)聲強(qiáng)變?yōu)?00I0時(shí),人耳感到的聲音強(qiáng)弱增大2倍,對(duì)應(yīng)的聲強(qiáng)級(jí)為2貝爾20分貝;當(dāng)聲強(qiáng)變?yōu)?000I0時(shí),人耳感到的聲音強(qiáng)弱增大3倍,對(duì)應(yīng)的聲強(qiáng)級(jí)為3貝爾30分貝,依此類推。人耳能承受的最大聲強(qiáng)為1瓦米21012I0,它對(duì)應(yīng)的聲強(qiáng)級(jí)為12貝爾120分貝。公式:聲壓級(jí)(dB)=20Lg(測(cè)量到的聲壓/參考聲壓值)老魚注:當(dāng)測(cè)量到的和參考聲壓一樣大小時(shí),取對(duì)數(shù)后的計(jì)算結(jié)果就是0dB。在模擬的音頻設(shè)備上,是可以大于過(guò)0dB的,但數(shù)字設(shè)備沒(méi)有,數(shù)字計(jì)算需要一個(gè)量度,無(wú)限的值是沒(méi)有的。所以在我們用的數(shù)字設(shè)備和軟件中,0dB成了一個(gè)參考標(biāo)準(zhǔn)值。二、常見音頻格式及播放器介紹 主流音頻格式的特點(diǎn)及其適應(yīng)性各種各樣的音頻編碼都有其技術(shù)特征及不同場(chǎng)合的適用性,我們大致講解一下如何去靈活應(yīng)用這些音頻編碼。4-1 PCM編碼的WAV前面就提到過(guò),PCM編碼的WAV文件是音質(zhì)最好的格式,Windows平臺(tái)下,所有音頻軟件都能夠提供對(duì)她的支持。Windows提供的WinAPI中有不少函數(shù)可以直接播放wav,因此,在開發(fā)多媒體軟件時(shí),往往大量采用wav,用作事件聲效和背景音樂(lè)。PCM編碼的wav可以達(dá)到相同采樣率和采樣大小條件下的最好音質(zhì),因此,也被大量用于音頻編輯、非線性編輯等領(lǐng)域。特點(diǎn):音質(zhì)非常好,被大量軟件所支持。適用于:多媒體開發(fā)、保存音樂(lè)和音效素材。4-2 MP3MP3具有不錯(cuò)的壓縮比,使用LAME編碼的中高碼率的mp3,聽感上已經(jīng)非常接近源WAV文件。使用合適的參數(shù),LAME編碼的MP3很適合于音樂(lè)欣賞。由于MP3推出年代已久,加之還算不錯(cuò)的音質(zhì)及壓縮比,不少游戲也使用mp3做事件音效和背景音樂(lè)。幾乎所有著名的音頻編輯軟件也提供了對(duì)MP3的支持,可以將mp3象wav一樣使用,但由于mp3編碼是有損的,因此多次編輯后,音質(zhì)會(huì)急劇下降,mp3并不適合保存素材,但作為作品的demo確實(shí)相當(dāng)優(yōu)秀的。mp3長(zhǎng)遠(yuǎn)的歷史和不錯(cuò)的音質(zhì),使之成為應(yīng)用最廣的有損編碼之一,網(wǎng)絡(luò)上可以找到大量的mp3資源,mp3player日漸成為一種時(shí)尚。不少VCDPlayer、DVDPlayer甚至手機(jī)都可以播放mp3,mp3是被支持的最好的編碼之一。MP3也并非完美,在較低碼率下表現(xiàn)不好。MP3也具有流媒體的基本特征,可以做到在線播放。特點(diǎn):音質(zhì)好,壓縮比比較高,被大量軟件和硬件支持,應(yīng)用廣泛。適用于:適合用于比較高要求的音樂(lè)欣賞。4-3 OGGOgg是一種非常有潛力的編碼,在各種碼率下都有比較驚人的表現(xiàn),尤其中低碼率下。Ogg除了音質(zhì)好之外,她還是一個(gè)完全免費(fèi)的編碼,這對(duì)ogg被更多支持打好了基礎(chǔ)。Ogg有著非常出色的算法,可以用更小的碼率達(dá)到更好的音質(zhì),128kbps的Ogg比192kbps甚至更高碼率的mp3還要出色。Ogg的高音具有一定的金屬味道,因此在編碼一些高頻要求很高的樂(lè)器獨(dú)奏時(shí),Ogg的這個(gè)缺陷會(huì)暴露出來(lái)。OGG具有流媒體的基本特征,但現(xiàn)在還沒(méi)有媒體服務(wù)軟件支持,因此基于ogg的數(shù)字廣播還無(wú)法實(shí)現(xiàn)。Ogg目前的被支持的情況還不夠好,無(wú)論是軟件的還是硬件的,都無(wú)法和mp3相提并論。特點(diǎn):可以用比mp3更小的碼率實(shí)現(xiàn)比mp3更好的音質(zhì),高中低碼率下均具有良好的表現(xiàn)。適用于:用更小的存儲(chǔ)空間獲得更好的音質(zhì)(相對(duì)MP3)4-4 MPC和OGG一樣,MPC的競(jìng)爭(zhēng)對(duì)手也是mp3,在中高碼率下,MPC可以做到比競(jìng)爭(zhēng)對(duì)手更好音質(zhì),在中等碼率下,MPC的表現(xiàn)不遜色于Ogg,在高碼率下,MPC的表現(xiàn)更是獨(dú)孤求敗,MPC的音質(zhì)優(yōu)勢(shì)主要表現(xiàn)在高頻部分,MPC的高頻要比MP3細(xì)膩不少,也沒(méi)有Ogg那種金屬味道,是目前最適合用于音樂(lè)欣賞的有損編碼。由于都是新生的編碼,和Ogg際遇相似,也缺乏廣泛的軟件和硬件支持。MPC有不錯(cuò)的編碼效率,編碼時(shí)間要比OGG和LAME短不少。特點(diǎn):中高碼率下,具有有損編碼中最佳的音質(zhì)表現(xiàn),高碼率下,高頻表現(xiàn)極佳適用于:在節(jié)省大量空間的前提下獲得最佳音質(zhì)的音樂(lè)欣賞。4-6 WMA微軟開發(fā)的WMA同樣也是不少朋友所喜愛的,在低碼率下,有著好過(guò)mp3很多的音質(zhì)表現(xiàn),WMA的出現(xiàn),立刻淘汰了曾經(jīng)風(fēng)靡一時(shí)的VQF編碼。有微軟背景的WMA獲得了很好的軟件及硬件支持,Windows Media Player就能夠播放WMA,也能夠收聽基于WMA編碼技術(shù)的數(shù)字電臺(tái)。因?yàn)椴シ牌鲙缀醮嬖谟诿恳慌_(tái)PC上,越來(lái)越多的音樂(lè)網(wǎng)站都樂(lè)意使用WMA作為在線試聽的首選了。除了支持環(huán)境好之外,WMA在64-128kbps碼率下也具有相當(dāng)出色的表現(xiàn),雖然不少要求較高的朋友并不夠滿意,但更多要求不高的朋友接受了這種編碼,WMA很快的普及開了。特點(diǎn):低碼率下的音質(zhì)表現(xiàn)難有對(duì)手適用于:數(shù)字電臺(tái)架設(shè)、在線試聽、低要求下的音樂(lè)欣賞4-7 mp3PRO作為mp3的改良版本的mp3PRO表現(xiàn)出了相當(dāng)不錯(cuò)的素質(zhì),高音豐滿,雖然mp3PRO是通過(guò)SBR技術(shù)在播放過(guò)程中插入的,但實(shí)際聽感相當(dāng)不錯(cuò),雖然顯得有點(diǎn)單薄,但在64kbps的世界里已經(jīng)沒(méi)有對(duì)手了,甚至超過(guò)了128kbps的mp3,但很遺憾的是,mp3PRO的低頻表現(xiàn)也象mp3一樣的破,所幸的是,SBR的高頻插值可以或多或少的掩蓋掉這個(gè)缺陷,因此mp3PRO的低頻弱勢(shì)反而不如WMA那么明顯。大家可以在使用RCA mp3PRO Audio Player的PRO開關(guān)來(lái)切換PRO模式和普通模式時(shí)深深的感覺(jué)到。整體而言,64kbps的mp3PRO達(dá)到了128kbps的mp3的音質(zhì)水平,在高頻部分還略有勝出。特點(diǎn):低碼率下的音質(zhì)之王適用于:低要求下的音樂(lè)欣賞4-8 APE一種新興的無(wú)損音頻編碼,可以提供50-70%的壓縮比,雖然比起有損編碼來(lái)太不值得一提了,但對(duì)于追求完美注意的朋友簡(jiǎn)直是天大的福音。APE可以做到真正的無(wú)損,而不是聽起來(lái)無(wú)損,壓縮比也要比類似的無(wú)損格式要好。特點(diǎn):音質(zhì)非常好。適用于:最高品質(zhì)的音樂(lè)欣賞及收藏。 三、音頻信號(hào)的編碼處理1、PCM編碼PCM 脈沖編碼調(diào)制是Pulse Code Modulation的縮寫。前面的文字我們提到了PCM大致的工作流程,我們不需要關(guān)心PCM最終編碼采用的是什么計(jì)算方式,我們只需要知道PCM編碼的音頻流的優(yōu)點(diǎn)和缺點(diǎn)就可以了。PCM編碼的最大的優(yōu)點(diǎn)就是音質(zhì)好,最大的缺點(diǎn)就是體積大。我們常見的Audio CD就采用了PCM編碼,一張光盤的容量只能容納72分鐘的音樂(lè)信息。大家知道,無(wú)論現(xiàn)在的多媒體電腦功能如何強(qiáng)大,其內(nèi)部也只能處理數(shù)字信息。而我們聽到的聲音都是模擬信號(hào),怎樣才能讓電腦也能處理這些聲音數(shù)據(jù)呢?還有,究竟模擬音頻與數(shù)字音頻有什么不同呢?數(shù)字音頻究竟有些什么優(yōu)點(diǎn)呢?這些都是我們下面所要介紹的。把模擬音頻轉(zhuǎn)成數(shù)字音頻,在電腦音樂(lè)里就稱作采樣,其過(guò)程所用到的主要硬件設(shè)備便是模擬/數(shù)字轉(zhuǎn)換器(Analog to Digital Converter,即ADC)。采樣的過(guò)程實(shí)際上是將通常的模擬音頻信號(hào)的電信號(hào)轉(zhuǎn)換成許多稱作“比特(Bit)”的二進(jìn)制碼0和1,這些0和1便構(gòu)成了數(shù)字音頻文件。如下圖,圖中的正弦曲線代表原始音頻曲線;填了顏色的方格代表采樣后得到的結(jié)果,二者越吻合說(shuō)明采樣結(jié)果越好。 上圖中的橫坐標(biāo)便是采樣頻率;縱坐標(biāo)便是采樣分辨率。圖中的格子從左到右,逐漸加密,先是加大橫坐標(biāo)的密度,然后加大縱坐標(biāo)的密度。顯然,當(dāng)橫坐標(biāo)的單位越小即兩個(gè)采樣時(shí)刻的間隔越小,則越有利于保持原始聲音的真實(shí)情況,換句話說(shuō),采樣的頻率越大則音質(zhì)越有保證;同理,當(dāng)縱坐標(biāo)的單位越小則越有利于音質(zhì)的提高,即采樣的位數(shù)越大越好。有一點(diǎn)請(qǐng)大家注意,8位(8Bit)不是說(shuō)把縱坐標(biāo)分成8份,而是分成28256份;同理16位是把縱坐標(biāo)分成21665536份;而24位則分成224=16777216份?,F(xiàn)在我們來(lái)進(jìn)行一個(gè)計(jì)算,看看一個(gè)數(shù)字音頻文件的數(shù)據(jù)量到底有多大。假設(shè)我們是用44.1kHz、16bit來(lái)進(jìn)行立體聲(即兩個(gè)聲道) 2、WAVE這是一種古老的音頻文件格式,由微軟開發(fā)。WAV是一種文件格式,符合 PIFF Resource Interchange File Format規(guī)范。所有的WAV都有一個(gè)文件頭,這個(gè)文件頭音頻流的編碼參數(shù)。WAV對(duì)音頻流的編碼沒(méi)有硬性規(guī)定,除了PCM之外,還有幾乎所有支持ACM規(guī)范的編碼都可以為WAV的音頻流進(jìn)行編碼。很多朋友沒(méi)有這個(gè)概念,我們拿AVI做個(gè)示范,因?yàn)锳VI和WAV在文件結(jié)構(gòu)上是非常相似的,不過(guò)AVI多了一個(gè)視頻流而已。我們接觸到的AVI有很多種,因此我們經(jīng)常需要安裝一些Decode才能觀看一些AVI,我們接觸到比較多的DivX就是一種視頻編碼,AVI可以采用DivX編碼來(lái)壓縮視頻流,當(dāng)然也可以使用其他的編碼壓縮。同樣,WAV也可以使用多種音頻編碼來(lái)壓縮其音頻流,不過(guò)我們常見的都是音頻流被PCM編碼處理的WAV,但這不表示W(wǎng)AV只能使用PCM編碼,MP3編碼同樣也可以運(yùn)用在WAV中,和AVI一樣,只要安裝好了相應(yīng)的Decode,就可以欣賞這些WAV了。在Windows平臺(tái)下,基于PCM編碼的WAV是被支持得最好的音頻格式,所有音頻軟件都能完美支持,由于本身可以達(dá)到較高的音質(zhì)的要求,因此,WAV也是音樂(lè)編輯創(chuàng)作的首選格式,適合保存音樂(lè)素材。因此,基于PCM編碼的WAV被作為了一種中介的格式,常常使用在其他編碼的相互轉(zhuǎn)換之中,例如MP3轉(zhuǎn)換成WMA。3、MP3編碼MP3作為目前最為普及的音頻壓縮格式,為大家所大量接受,各種與MP3相關(guān)的軟件產(chǎn)品層出不窮,而且更多的硬件產(chǎn)品也開始支持MP3,我們能夠買到的VCD/DVD播放機(jī)都很多都能夠支持MP3,還有更多的便攜的MP3播放器等等,雖然幾大音樂(lè)商極其反感這種開放的格式,但也無(wú)法阻止這種音頻壓縮的格式的生存與流傳。MP3發(fā)展已經(jīng)有10個(gè)年頭了,他是MPEG(MPEG:Moving Picture Experts Group) Audio Layer-3的簡(jiǎn)稱,是MPEG1的衍生編碼方案,1993年由德國(guó)Fraunhofer IIS研究院和湯姆生公司合作發(fā)展成功。MP3可以做到12:1的驚人壓縮比并保持基本可聽的音質(zhì),在當(dāng)年硬盤天價(jià)的日子里,MP3迅速被用戶接受,隨著網(wǎng)絡(luò)的普及,MP3被數(shù)以億計(jì)的用戶接受。MP3編碼技術(shù)的發(fā)布之初其實(shí)是非常不完善的,由于缺乏對(duì)聲音和人耳聽覺(jué)的研究,早期的mp3編碼器幾乎全是以粗暴方式來(lái)編碼,音質(zhì)破壞嚴(yán)重。隨著新技術(shù)的不斷導(dǎo)入,mp3編碼技術(shù)一次一次的被改良,其中有2次重大技術(shù)上的改進(jìn)。VBR:MP3格式的文件有一個(gè)有意思的特征,就是可以邊讀邊放,這也符合流媒體的最基本特征。也就是說(shuō)播放器可以不用預(yù)讀文件的全部?jī)?nèi)容就可以播放,讀到哪里播放到哪里,即使是文件有部分損壞。雖然mp3可以有文件頭,但對(duì)于mp3格式的文件卻不是很重要,正因?yàn)檫@種特性,決定了MP3文件的每一段每一幀都可以單獨(dú)的平均數(shù)據(jù)速率,而無(wú)需特別的解碼方案。于是出現(xiàn)了一種叫VBR(Variable bitrate,動(dòng)態(tài)數(shù)據(jù)速率)的技術(shù),可以讓MP3文件的每一段甚至每一幀都可以有單獨(dú)的bitrate,這樣做的好處就是在保證音質(zhì)的前提下最大程度的限制了文件的大小。這種技術(shù)的優(yōu)越性是顯而易見的,但要運(yùn)用確實(shí)是一件難事,因?yàn)檫@要求編碼器知道如何為每一段分配bitrate,這對(duì)沒(méi)有波形分析的編碼器而言,這種技術(shù)如同虛設(shè)。正是如此,VBR技術(shù)并沒(méi)有一出現(xiàn)就顯得光彩奪目。專家們通過(guò)長(zhǎng)期的聲學(xué)研究,發(fā)現(xiàn)人耳存在遮蔽效應(yīng)。聲音信號(hào)實(shí)際是一種能量波,在空氣或其他媒介中傳播,人耳對(duì)聲音能量的多少即響度或聲壓最直接的反應(yīng)就是聽到這個(gè)聲音的大小,我們稱它為響度,表示響度這種能量的單位為分貝(dB)。即使是同樣響度的聲音,人們也會(huì)因?yàn)樗鼈冾l率不同而感覺(jué)到聲音大小不同。人耳最容易聽到的就是4000Hz的頻率,不管頻率是否增高或降低,即使是響度在相同的情況下,大家都會(huì)覺(jué)得聲音在變小。但響度降到一定程度時(shí),人耳就聽不到了,每一個(gè)頻率都有著不同的值。 可以看到這條曲線基本成一個(gè)V字型,當(dāng)頻率超過(guò)15000Hz時(shí),人耳的會(huì)感覺(jué)到聲音很小,很多聽覺(jué)不是很好的人,根本就聽不到20000Hz的頻率,不管響度有多大。當(dāng)人耳同時(shí)聽到兩個(gè)不同頻率、不同響度的聲音時(shí),響度較小的那個(gè)也會(huì)被忽略,例如:在白天我們很難聽到電腦中散熱風(fēng)扇的聲音,晚上卻成了噪聲源,根據(jù)這種原理,編碼器可以過(guò)濾掉很多聽不到的聲音,以簡(jiǎn)化信息復(fù)雜度,增加壓縮比,而不明顯的降低音質(zhì)。這種遮蔽被稱為同時(shí)遮蔽效應(yīng)。但聲音A被聲音B遮蔽,如果A處于B為中心的遮蔽范圍內(nèi),遮蔽會(huì)更明顯,這個(gè)范圍叫臨界帶寬。每一種頻率的臨界帶寬都不一樣,頻率越高的臨界帶寬越寬。根據(jù)這種效應(yīng),專家們?cè)O(shè)計(jì)出人耳聽覺(jué)心理模型,這個(gè)模型被導(dǎo)入到mp3編碼中后,導(dǎo)致了一場(chǎng)翻天覆地的音質(zhì)革命,mp3編碼技術(shù)一直背負(fù)著音質(zhì)差的惡名,但這個(gè)惡名現(xiàn)在已經(jīng)逐漸被洗脫。到了此時(shí),一直被埋沒(méi)的VBR技術(shù)光彩四射,配合心理模型的運(yùn)用便現(xiàn)實(shí)出強(qiáng)大的誘惑力與殺傷力。長(zhǎng)期來(lái),很多人對(duì)MP3印象不好,更多人認(rèn)為WMA的最佳音質(zhì)要好過(guò)MP3,這種說(shuō)法是不正確的,在中高碼率下,編碼得當(dāng)?shù)腗P3要比WMA優(yōu)秀很多,可以非常接近CD音質(zhì),在不太好的硬件設(shè)備支持下,沒(méi)有多少人可以區(qū)分兩者的差異,這不是神話故事,盡管你以前盲聽就可以很輕松區(qū)分MP3和CD,但現(xiàn)在你難保證你可以分辨正確。因?yàn)镸P3是優(yōu)秀的編碼,以前被埋沒(méi)了。4、OGG編碼網(wǎng)絡(luò)上出現(xiàn)了一種叫Ogg Vorbis的音頻編碼,號(hào)稱MP3殺手!Ogg Vorbis究竟什么來(lái)頭呢?OGG是一個(gè)龐大的多媒體開發(fā)計(jì)劃的項(xiàng)目名稱,將涉及視頻音頻等方面的編碼開發(fā)。整個(gè)OGG項(xiàng)目計(jì)劃的目的就是向任何人提供完全免費(fèi)多媒體編碼方案!OGG的信念就是:OPEN!FREE!Vorbis這個(gè)詞匯是特里普拉特柴特的幻想小說(shuō)Small Gods中的一個(gè)花花公子人物名。這個(gè)詞匯成為了OGG項(xiàng)目中音頻編碼的正式命名。目前Vorbis已經(jīng)開發(fā)成功,并且開發(fā)出了編碼器。Ogg Vorbis是高質(zhì)量的音頻編碼方案,官方數(shù)據(jù)顯示:Ogg Vorbis可以在相對(duì)較低的數(shù)據(jù)速率下實(shí)現(xiàn)比MP3更好的音質(zhì)!Ogg Vorbis這種編碼也遠(yuǎn)比90年代開發(fā)成功的MP3先進(jìn),她可以支持多聲道,這意味著什么?這意味著Ogg Vorbis在SACD、DTSCD、DVD AUDIO抓軌軟件(目前這種軟件還沒(méi)有)的支持下,可以對(duì)所有的聲道進(jìn)行編碼,而不是MP3只能編碼2個(gè)聲道。多聲道音樂(lè)的興起,給音樂(lè)欣賞帶來(lái)了革命性的變化,尤其在欣賞交響時(shí),會(huì)帶來(lái)更多臨場(chǎng)感。這場(chǎng)革命性的變化是MP3無(wú)法適應(yīng)的。和MP3一樣,Ogg Vorbis是一種靈活開放的音頻編碼,能夠在編碼方案已經(jīng)固定下來(lái)后還能對(duì)音質(zhì)進(jìn)行明顯的調(diào)節(jié)和新算法的改良。因此,它的聲音質(zhì)量將會(huì)越來(lái)越好,和MP3相似,Ogg Vorbis更像一個(gè)音頻編碼框架,可以不斷導(dǎo)入新技術(shù)逐步完善。和MP3一樣,OGG也支持VBR。5、MPC 編碼MPC是又是另外一個(gè)令人刮目相看的實(shí)力派選手,它的普及過(guò)程非常低調(diào),也沒(méi)有什么復(fù)雜的背景故事,她的出現(xiàn)目的就只有一個(gè),更小的體積更好的音質(zhì)!MPC以前被稱作MP+,很顯然,可以看出她針對(duì)的競(jìng)爭(zhēng)對(duì)手是誰(shuí)。但是,只要用過(guò)這種編碼的人都會(huì)有個(gè)深刻的印象,就是她出眾的音質(zhì)。6、mp3PRO 編碼2001年6月14日,美國(guó)湯姆森多媒體公司(Thomson Multimedia SA)與佛朗赫弗協(xié)會(huì)(Fraunhofer Institute)于6月14日發(fā)布了一種新的音樂(lè)格式版本,名稱為mp3PRO,這是一種基于mp3編碼技術(shù)的改良方案,從官方公布的特征看來(lái)確實(shí)相當(dāng)吸引人。從各方面的資料顯示,mp3PRO并不是一種全新的格式,完全是基于傳統(tǒng)mp3編碼技術(shù)的一種改良,本身最大的技術(shù)亮點(diǎn)就在于SBR(Sp

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論