音頻編輯與處理要點課件_第1頁
音頻編輯與處理要點課件_第2頁
音頻編輯與處理要點課件_第3頁
音頻編輯與處理要點課件_第4頁
音頻編輯與處理要點課件_第5頁
已閱讀5頁,還剩37頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

音頻編輯與處理音頻編輯與處理1學(xué)習(xí)參考書《數(shù)字音頻原理及應(yīng)用》機械工業(yè)出版社盧官明主著《MIDI技巧與數(shù)字音頻》清華大學(xué)出版社顏東成主編《多媒體技術(shù)基礎(chǔ)》清華大學(xué)出版社林福宗編著《音頻視頻編緝與制作》中國水利水電出版社韓雪濤主編學(xué)習(xí)參考書《數(shù)字音頻原理及應(yīng)用》機械工業(yè)出版社盧官2第一章音頻理論基礎(chǔ)知識第一章音頻理論基礎(chǔ)知識3第一節(jié)聲音聽覺理論一、聲波傳播特點聲音是以聲波的形式進行傳遞和存在的。聲波是一種機械波,具有縱波一般的波動特性,例如,反射、折射、繞射、干涉等。聲波在傳播中遇到障礙物時,它的能量一部分會被障礙物吸收,另一部分會被反射回來。若在一個封閉的室內(nèi),產(chǎn)生的反射聲波會被周圍的墻壁、天花板和其它障礙物所吸收和反射,形成一系列逐漸衰減的反射聲波。第一節(jié)聲音聽覺理論一、聲波傳播特點聲音是以聲波的形式進4第一節(jié)聲音聽覺理論一、聲波傳播特點從聲音的發(fā)出到衰減60分貝(至原來的百萬分之一)所需要的時間稱為混響時間。一般,常用混響時間的長短來表明封閉室的混響衰減速度。房間混響時間的長短對聽音效果有很大影響。第一節(jié)聲音聽覺理論一、聲波傳播特點從聲音的發(fā)出到衰減65第一節(jié)聲音聽覺理論二、聲音的三要素自然界里,幾乎所有聲源發(fā)出的聲音都不是只有一種頻率和強度的“純音”,而是包含了許多頻率不同、強度不等的聲音分量,組合成的復(fù)合音響,而且在發(fā)聲過程中,其頻率和強度不斷地變化著。在音響中,頻率最低的分量稱為基音或基頻,其它頻率中,凡比基頻高的分量統(tǒng)稱泛音。在很多情況下,泛音的頻率呈基音頻率的整數(shù)倍形式,所以泛音也稱為高次諧波分量或諧音。第一節(jié)聲音聽覺理論二、聲音的三要素自然界里6第一節(jié)聲音聽覺理論二、聲音的三要素1、音調(diào)

音調(diào)是人耳對聲音調(diào)子高低的主觀感受。人耳的音調(diào)感覺與聲音的頻率相對應(yīng)。頻率高,音調(diào)高,聲音聽起來“尖”;頻率低,音調(diào)低,聲音聽起來“低沉”。在復(fù)合音中,音調(diào)決定于基頻頻率。但是,音調(diào)的高低感覺與聲音頻率之間不存在線性的對應(yīng)關(guān)系,而是呈一種對數(shù)曲線的對應(yīng)關(guān)系。第一節(jié)聲音聽覺理論二、聲音的三要素1、音調(diào)7音樂中音階的劃分是在頻率的對數(shù)坐標(20×log)上取等分而得的:音階CDEFGAB簡譜符號1234567頻率(Hz)261293330349392440494頻率(對數(shù))48.349.350.350.851.852.853.8示例1:不同音調(diào)示例2:正常

改變

音樂中音階的劃分是在頻率的對數(shù)坐標(20×log)上取等分而8第一節(jié)聲音聽覺理論二、聲音的三要素2、音色音色是人耳聽覺的一種感受特性,代表人耳區(qū)別相同響度和音調(diào)的兩類不同聲音的主觀感覺。人耳對音色的感覺決定于聲音中泛音各分量的數(shù)量、相對強度關(guān)系和分布。第一節(jié)聲音聽覺理論二、聲音的三要素2、音色9當許多不同樂器同奏一曲時,盡管它們所發(fā)出聲音的基頻頻率相同,人們還是能分辨出各種樂器的不同聲音特色,這正是由于其它頻率分量的多少和大小比例不同的緣故。音色與聲音信號的頻譜相對應(yīng)。每一種聲音都有一基本頻率,稱為基頻或基音,同時還有與基頻成倍數(shù)關(guān)系的許多不同倍頻的頻率,稱為諧波或泛音?;绢l率決定了聲音的音調(diào),而諧波成分則決定著聲音的音色。當許多不同樂器同奏一曲時,盡管它們所發(fā)出聲音的10音色是由混入基音的泛音所決定的,高次諧波越豐富,音色就越有明亮感和穿透力。不同的諧波具有不同的幅值A(chǔ)n和相位偏移ψn,由此產(chǎn)生各種音色效果。示例1:不同樂器示例2:正常

改變

音色是由混入基音的泛音所決定的,高次諧波越豐富11第一節(jié)聲音聽覺理論二、聲音的三要素3、響度人耳對聲音強弱的主觀感覺稱為響度,主要取決于聲波振幅的大小,但并非是線性關(guān)系。人耳可以聽到的聲強范圍最小和最大之間的差別可達1013倍。聲音的響度一般用聲壓與基準聲壓比值的對數(shù)值(稱為聲壓級),單位是分貝(dB)。(聲壓級=20lgP/P。,一般以1kHz純音為準進行測量,人耳剛能聽到的聲壓為0dB)第一節(jié)聲音聽覺理論二、聲音的三要素3、響度12通常認為,對于1kHz純音,0dB—20dB為寧靜聲,30dB--40dB為微弱聲,50dB—70dB為正常聲,80dB—100dB為響音聲,110dB—130dB為極響聲。通常認為,對于1kHz純音,0dB—20dB為13分貝是用來表示聲音或電信號的功率增減程度的一種計算單位。它是測量和比較一個系統(tǒng)的功率,電壓和電流大小的相對單位。后來認識到人類對聲音的響應(yīng)是按對數(shù)規(guī)律變化的,于是有了一個單位就是貝爾(Bel),是電話的發(fā)明人的名字。實際中發(fā)現(xiàn)Bel太大了,于是取其十分之一作為一個新單位,就是分貝(dB)。L=lgI/I0

(貝爾)

I和I0分別表示待測聲強和標準聲強,L表示人耳感覺到的聲音大小,I0是人耳能聽到的最小聲強,為10-23瓦/米2。分貝是用來表示聲音或電信號的功率增減程度的一種14第一節(jié)聲音聽覺理論三、音頻信號的指標1、頻帶寬度頻帶寬度或稱為帶寬,它是描述組成復(fù)合信號的頻率范圍。音頻信號的頻帶越寬,所包含的音頻信號分量越豐富,音質(zhì)越好。在自然界聲音的頻率范圍很寬,有些是人類聽不見的。第一節(jié)聲音聽覺理論三、音頻信號的指標1、頻帶寬度15音頻編輯與處理要點課件16聲源種類頻率范圍下限頻率上限頻率男性語音100HZ9000HZ女性語音150HZ10000HZ電話語音200HZ3400HZ調(diào)幅廣播50HZ7000HZ調(diào)頻廣播20HZ15000HZ專業(yè)音響10HZ40000HZ聲源種類頻率范圍下限頻率上限頻率男性語音100HZ9000H17音頻編輯與處理要點課件18第一節(jié)聲音聽覺理論三、音頻信號的指標2、動態(tài)范圍動態(tài)范圍越大,信號強度的相對變化范圍越大,音響效果越好。動態(tài)范圍=20×log(信號的最大強度/信號的最小強度)第一節(jié)聲音聽覺理論三、音頻信號的指標2、動態(tài)范圍19第一節(jié)聲音聽覺理論三、音頻信號的指標3、信噪比信噪比SNR(SignaltoNoiseRatio)是有用信號與噪聲之比的簡稱。噪音可分為環(huán)境噪音和設(shè)備噪音。信噪比越大,聲音質(zhì)量越好。第一節(jié)聲音聽覺理論三、音頻信號的指標3、信噪比20第一節(jié)聲音聽覺理論四、聽覺的方位感和立體聲立體聲是指具有空間感的聲音,立體聲技術(shù)是利用聽覺的方位感,在放音時重現(xiàn)各種聲源的方向及相對位置的技術(shù)。第一節(jié)聲音聽覺理論四、聽覺的方位感和立體聲立體聲21第一節(jié)聲音聽覺理論1、雙耳效應(yīng)

人們是用兩只耳朵同時聽聲音的,當某一聲源至兩只耳朵的距離不同時,此時兩只耳朵雖然聽到的是同一聲波,但卻存在著時間差(相位差)和強度差(聲級差),由于到達兩耳處的聲波狀態(tài)的不同,造成了聽覺的方位感和深度感。這就是常說的“雙耳效應(yīng)”。人們設(shè)法特意地在兩耳處制造出與實際聲源所能夠產(chǎn)生的相同的聲波狀態(tài),就應(yīng)該可以造成某個方向上有一個對應(yīng)的聲源幻象(聲像)感覺,這正是立體聲技術(shù)的生理基礎(chǔ)。四、聽覺的方位感和立體聲第一節(jié)聲音聽覺理論1、雙耳效應(yīng)四、聽覺的方位感和立體聲22第一節(jié)聲音聽覺理論2、立體聲系統(tǒng)雙聲道的立體聲系統(tǒng)是最基本的能給人的雙耳造成立體聲像的系統(tǒng)。在雙聲道立體聲系統(tǒng)中,為了正確重現(xiàn)真實聲源的方位,錄音時必須用兩只配對的傳聲器,信號傳輸通道也需獨立分開,而且每條信道的放大率、頻響特性等都必須相同,任何差異都會明顯改變聲像的位置,影響立體聲效果。四、聽覺的方位感和立體聲示例:單聲道

雙聲道第一節(jié)聲音聽覺理論2、立體聲系統(tǒng)四、聽覺的方位感和立體聲23第二節(jié)數(shù)字音頻原理由于音頻信號是一種連續(xù)變化的模擬信號,而計算機只能處理和記錄二進制的數(shù)字信號,因此,由自然音源而得的音頻信號必須經(jīng)過一定的變化和處理,變成二進制數(shù)據(jù)后才能送到計算機進行再編輯和存貯。第二節(jié)數(shù)字音頻原理由于音頻信號是一種連續(xù)變化的模24第二節(jié)數(shù)字音頻原理把模擬信號轉(zhuǎn)換成數(shù)字信號的過程稱為模/數(shù)轉(zhuǎn)換,它主要包括:采樣:在時間軸上對信號數(shù)字化;量化:在幅度軸上對信號數(shù)字化;編碼:按一定格式記錄采樣和量化后的數(shù)字數(shù)據(jù)。脈沖編碼調(diào)制PCM(PulseCodeModulation)是一種模數(shù)轉(zhuǎn)換的最基本編碼方法。CD--DA采用的就是這種編碼方式。一、PCM編碼原理第二節(jié)數(shù)字音頻原理把模擬信號轉(zhuǎn)換成數(shù)字信號的過程稱為模/25動畫演示

動畫演示26第二節(jié)數(shù)字音頻原理二、數(shù)字音頻的技術(shù)指標1、采樣頻率采樣頻率是指一秒鐘內(nèi)采樣的次數(shù)。采樣頻率的選擇應(yīng)該遵循奈奎斯特(HarryNyquist)采樣理論:如果對某一模擬信號進行采樣,則采樣后可還原的最高信號頻率只有采樣頻率的一半,或者說只要采樣頻率高于輸入信號最高頻率的兩倍,就能從采樣信號系列重構(gòu)原始信號。第二節(jié)數(shù)字音頻原理二、數(shù)字音頻的技術(shù)指標1、采樣頻率27根據(jù)該采樣理論,CD激光唱盤采樣頻率為44KHz,可記錄的最高音頻為22KHz,這樣的音質(zhì)與原始聲音相差無幾,也就是我們常說的超級高保真音質(zhì)。采樣的三個標準頻率分別為:44.1KHz,22.05KHz和11.025KHz。根據(jù)該采樣理論,CD激光唱盤采樣頻率為44K28第二節(jié)數(shù)字音頻原理二、數(shù)字音頻的技術(shù)指標2、量化位數(shù)量化位是對模擬音頻信號的幅度軸進行數(shù)字化,它決定了模擬信號數(shù)字化以后的動態(tài)范圍。由于計算機按字節(jié)運算,一般的量化位數(shù)為8位和16位。量化位越高,信號的動態(tài)范圍越大,數(shù)字化后的音頻信號就越可能接近原始信號,但所需要的存貯空間也越大。第二節(jié)數(shù)字音頻原理二、數(shù)字音頻的技術(shù)指標2、量化位數(shù)29音頻編輯與處理要點課件30第二節(jié)數(shù)字音頻原理二、數(shù)字音頻的技術(shù)指標3、聲道數(shù)有單聲道和雙聲道之分。雙聲道又稱為立體聲,在硬件中要占兩條線路,音質(zhì)、音色好,但立體聲數(shù)字化后所占空間比單聲道多一倍。第二節(jié)數(shù)字音頻原理二、數(shù)字音頻的技術(shù)指標3、聲道數(shù)31第二節(jié)數(shù)字音頻原理二、數(shù)字音頻的技術(shù)指標4、數(shù)據(jù)率數(shù)據(jù)率為每秒bit數(shù),它與信息在計算機中的實時傳輸有直接關(guān)系,其大小與采樣指標和壓縮方法有關(guān)。未經(jīng)壓縮的數(shù)字音頻數(shù)據(jù)率可按下式計算:數(shù)據(jù)率=采樣頻率(Hz)×量化位數(shù)(bit)×聲道數(shù)(bit/s)第二節(jié)數(shù)字音頻原理二、數(shù)字音頻的技術(shù)指標4、數(shù)據(jù)率32采樣率(KHz)量化位(bit)聲道數(shù)容量(MB/min)等效音質(zhì)11.0258單0.66語音22.0516雙5.292FM廣播44.116雙10.584CD唱盤采樣率(KHz)量化位(bit)聲道數(shù)容量(MB/min)等33第二節(jié)數(shù)字音頻原理二、數(shù)字音頻的技術(shù)指標5、編碼算法數(shù)據(jù)文件格式編碼的作用其一是采用一定的格式來記錄數(shù)字數(shù)據(jù),其二是采用一定的算法來壓縮數(shù)字數(shù)據(jù)以減少存貯空間和提高傳輸效率。壓縮算法包括有損壓縮和無損壓縮;有損壓縮指解壓后數(shù)據(jù)不能完全復(fù)原,要丟失一部分信息。壓縮編碼的基本指標之一就是壓縮比,它通常小于1。壓縮越多,信息丟失越多、信號還原后失真越大。根據(jù)不同的應(yīng)用,應(yīng)該選用不同的壓縮編碼算法。第二節(jié)數(shù)字音頻原理二、數(shù)字音頻的技術(shù)指標5、編碼算法數(shù)據(jù)34音頻信號的壓縮編碼算法一、PCM編碼這是一種最通用的無壓縮編碼。特點是保真度高,解碼速度快,但編碼后的數(shù)據(jù)量大。CD-DA就是采用的這種編碼方式。音頻信號的壓縮編碼算法一、PCM編碼35音頻信號的壓縮編碼算法二、ADPCM編碼ADPCM(AdaptiveDifferentialPulseCodeModulation),稱為自適應(yīng)差分脈沖編碼。這是一種有損壓縮,它丟掉了部分信息。由于人耳對聲音的不敏感性,適當?shù)挠袚p壓縮對視聽播放效果影響不大。ADPCM記錄的量化值不是每個采樣點的幅值,而是該點的幅值與前一個采樣點幅值之差。這樣,每個采樣點的量化位就不需要16bit,由此可減少信號的容量??蛇x的幅度差的量化比特位為8bit、4bit和2bit。SB16的ADPCM編碼采用4bit量化位,對CD音質(zhì)信號壓縮,其壓縮比為1:4,壓縮后基本上分辨不出失真。音頻信號的壓縮編碼算法二、ADPCM編碼36音頻信號的壓縮編碼算法三、MP3編碼MP3是利用MPEGAudioLayer3的技術(shù),將音頻信息用1:10甚至1:12的壓縮率,變成容量較小的數(shù)據(jù)文件。當然這是一種有損壓縮,但是人耳卻基本不能分辨出失真來。按照這種算法,十張CD-DA的內(nèi)容可以壓縮到一張CD-ROM中,而且視聽效果相當。由于MP3的高壓縮比和優(yōu)秀的壓縮質(zhì)量,目前已廣泛應(yīng)用于網(wǎng)絡(luò)中,而且很可能是被盜版商利用的工具。因此,有關(guān)MP3的標準性和合理性目前還在爭議之中。音頻信號的壓縮編碼算法三、MP3編碼37音頻信號的壓縮編碼算法四、RealAudio編碼RealAudio時Realnetworks推出的一種音樂壓縮格式,它的壓縮比可達到1:96,因此在網(wǎng)上比較流行。經(jīng)過壓縮的音樂文件可以在通過速率為14.4kbps的Modem上網(wǎng)的計算機中流暢回放,其最大特點是可以實現(xiàn)網(wǎng)上實時回訪,也就是說邊下載邊播放。音頻信號的壓縮編碼算法四、RealAudio編碼38音頻信號的壓縮編碼算法五、Mpeg壓縮編碼

MPEG提供三種音頻壓縮編碼的等級,分別為I,II和III級(LevelI、LevelII、LevelIII)。I級最簡單,其目標是壓縮后每聲道位數(shù)據(jù)率為192Kb/s。II級比I級精度高一些,壓縮后每聲道位數(shù)據(jù)率為128Kb/s。III級增加了不定長編碼、霍夫曼編碼等一些先進的算法,可獲得非常低的數(shù)據(jù)率和較高的保

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論