《音頻信息處理技術(shù)》_第1頁
《音頻信息處理技術(shù)》_第2頁
《音頻信息處理技術(shù)》_第3頁
《音頻信息處理技術(shù)》_第4頁
《音頻信息處理技術(shù)》_第5頁
已閱讀5頁,還剩63頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

音頻信息處理技術(shù)://hd8go://hd88go://sj93://oemgc://189288://hzp580://yjoem://oemdg://xcdnpx://skfjk://oemdg://zhongtezc://yanjigz://zg-nsk://ygcooper://skf-zt://nsk-zt://fag-zt://zhongtezc://ntn-zt://189286://xcdnpx://dgxcdn://dgxcpx://xcwxpx://xunchi-px://0759mz://lczx188://189287://oemfy://jnxrt://topbrightness://ort-zc/本章導(dǎo)讀音頻信息處理技術(shù)是多媒體信息處理的主要技術(shù)之一,它使計(jì)算機(jī)具備了錄音、聲音編輯、語音合成、聲音播放等功能。在MPC中,可以通過聲音傳遞信息、制造效果、營(yíng)造氣氛及演奏音樂等。目前的音頻信息處理技術(shù)主要包括模擬聲音信號(hào)的數(shù)字化、數(shù)據(jù)壓縮編碼、數(shù)字音效處理、音頻文件存儲(chǔ)、傳輸、播放等內(nèi)容。本章主要介紹聲音信號(hào)及其數(shù)字化的根本概念、音頻卡的組成及其工作原理、數(shù)字音頻的采集與編輯、MIDI音樂以及幾個(gè)常用的音頻處理軟件等內(nèi)容,并以AdobeAudition3.0版本為例,詳細(xì)介紹音頻信息編輯處理的具體方法。://hd8go://hd88go://sj93://oemgc://189288://hzp580://yjoem://oemdg://xcdnpx://skfjk://oemdg://zhongtezc://yanjigz://zg-nsk://ygcooper://skf-zt://nsk-zt://fag-zt://zhongtezc://ntn-zt://189286://xcdnpx://dgxcdn://dgxcpx://xcwxpx://xunchi-px://0759mz://lczx188://189287://oemfy://jnxrt://topbrightness://ort-zc/本章主要內(nèi)容4.1音頻根底知識(shí)4.2音質(zhì)標(biāo)準(zhǔn)與評(píng)價(jià)4.3音頻的數(shù)字化與編碼4.4音頻卡4.5數(shù)字音頻的采集與編輯4.6MIDI音樂4.1音頻根底知識(shí)4.1.1聲音的物理特征

聲音是由物體振動(dòng)產(chǎn)生的,并以聲波形式通過介質(zhì)〔如空氣、水、金屬等〕傳播。物理上,聲音可以用一條連續(xù)曲線來表示,,如圖4-1。物體振動(dòng)的最大位移稱為振幅A,聲波中兩個(gè)連續(xù)波峰〔或波谷〕之間的距離稱為周期T,周期的倒數(shù)1/T即為頻率f,以赫茲〔Hz〕為單位,頻率反映了單位時(shí)間〔1秒〕物體振動(dòng)的次數(shù)。圖4-1聲波的振幅與頻率TAt0

聲音按頻率可分為三類:音頻、次聲、超聲

低于20Hz的聲音稱為次聲頻率范圍在20Hz~20kHz范圍的可聽聲音稱為音頻,其中人說話發(fā)出的語音信號(hào)的頻率范圍是300Hz~3kHz頻率高于20kHz的稱為超音頻〔或超聲〕15203003k20k50kf(Hz)音頻信號(hào)語音信號(hào)超聲信號(hào)次聲信號(hào)圖4-2不同聲音信號(hào)的頻率范圍可聽的音頻聲音又可分為語音、樂音、效果音、合成音、噪音〔聲〕等五種。4.1.2音頻三要素

音頻有三個(gè)主要屬性,分別是音調(diào)、音強(qiáng)和音色,它們既反映了音頻信號(hào)的根本特征,也是人感受聲音信號(hào)的三個(gè)主要因素,因此又被稱為音頻三要素。音調(diào):又稱音高,反映聲音的上下程度,由聲音信號(hào)的頻率大小所決定。頻率越大,音調(diào)越高;頻率越小,音調(diào)越低。音強(qiáng):又稱響度,反映聲音的大小或強(qiáng)弱,由振幅和聲源距離共同決定。振幅越大,距離越小,音強(qiáng)〔響度〕越大。音色:又稱音質(zhì),反映聲音的品質(zhì),它由振動(dòng)物體〔聲源〕的材料、結(jié)構(gòu)、狀態(tài)等自身因素決定,表現(xiàn)為聲源的頻帶寬度。4.1.3數(shù)字音頻的三種形式音頻〔Audio〕是指頻率在20Hz~20kHz范圍內(nèi)的可聽聲音,是多媒體信息中的一種媒體類型——聽覺類媒體。目前多媒體計(jì)算機(jī)中的音頻主要有波形音頻、CD音頻和MIDI音樂3種形式。1、波形音頻:是由外部聲音源通過數(shù)字化過程采集到多媒體計(jì)算機(jī)中的所有聲音形式??赏ㄟ^編輯〔裁剪、合成、效果等〕、編碼壓縮、存儲(chǔ)、傳輸以及復(fù)原播放等方式進(jìn)行處理。在波形音頻中,有一類特殊的聲音需要特別提到,即人的語音。語音是波形聲音中人的說話聲音,具有內(nèi)在的語言學(xué)、語音學(xué)的內(nèi)涵。2、CD音頻CD-音頻〔CD-Audio〕是存儲(chǔ)在音樂CD光盤中的數(shù)字音頻,可以通過CD-ROM驅(qū)動(dòng)器讀取并采集到多媒體計(jì)算機(jī)系統(tǒng)中,并以波形音頻的相應(yīng)形式存儲(chǔ)、傳輸和處理。3、MIDI音樂也稱MIDI音頻。它將音樂符號(hào)化并保存在MIDI文件中,并通過音樂合成器產(chǎn)生相應(yīng)的聲音波形來復(fù)原播放。音頻是時(shí)間的函數(shù),具有很強(qiáng)的前后相關(guān)性,所以實(shí)時(shí)性是音頻處理的根本要求。4.1.4數(shù)字音頻的文件格式音頻文件通常分為兩大類:聲音文件和MIDI文件下表介紹幾種常用的音頻文件格式及后綴名:序號(hào)音頻文件名稱后綴名1Wave文件.WAV2AIFF文件.AIF/.AIFF3Audio文件.AU4Sound文件.SND5Voice文件.VOC6Mpeg音頻文件.MP1/.MP2/.MP37RealAudio文件.RA/.RM/.RAM8WindowsMediaAudio文件.WMA/.ASF/.ASX/.WAX9MIDI文件.MID/.RMI/.CMI/.CMF10Module文件.MOD/.S3M/.XM/.MTM/.FAR/.KAR/4.1.5音頻處理工具軟件簡(jiǎn)介

音頻工具軟件在內(nèi)容上主要指處理數(shù)字音頻和MIDI樂譜的各種工具軟件,在功能上包括音頻采集、編輯、合成、編碼壓縮以及MIDI樂譜的創(chuàng)作、編輯、發(fā)布等環(huán)節(jié)。按照音頻處理的根本過程,通??砂岩纛l工具軟件分為:1、MIDI制作軟件2、音頻處理軟件3、音頻壓縮軟件4、音樂CD刻錄軟件4.2音質(zhì)標(biāo)準(zhǔn)與評(píng)價(jià)4.2.1音質(zhì)等級(jí)標(biāo)準(zhǔn)音質(zhì)是指音頻信號(hào)經(jīng)傳輸、處理后所再現(xiàn)的聲音質(zhì)量〔保真度〕。等級(jí)頻率范圍音質(zhì)高端DVD0~48kHz頂級(jí)標(biāo)準(zhǔn)DVD0~24kHzCD-DA音質(zhì)10Hz~20kHz高FM廣播音質(zhì)20Hz~15kHz較高AM廣播音質(zhì)50Hz~7kHz中電話音質(zhì)200Hz~3.4kHz低4.2.2音質(zhì)客觀評(píng)價(jià)

客觀評(píng)價(jià)是指通過檢測(cè)儀器測(cè)量音頻信號(hào)的技術(shù)指標(biāo)來進(jìn)行聲音質(zhì)量評(píng)價(jià),主要技術(shù)指標(biāo)有:頻帶寬度、動(dòng)態(tài)范圍和信噪比等。理論上,聲音信號(hào)是由許多頻率不同的分量信號(hào)組合而成的復(fù)合信號(hào),因此,聲音的頻帶寬度特指復(fù)合聲音信號(hào)的頻率范圍,范圍越大,頻帶越寬,可包含的音頻信號(hào)〔諧波〕越豐富,因而聲音質(zhì)量就越高。實(shí)際上,再現(xiàn)聲音〔特別是樂音〕的質(zhì)量與所用的播放設(shè)備和場(chǎng)地條件有關(guān)。高質(zhì)量的音頻信號(hào)要通過高品質(zhì)的音響設(shè)備在較好的音響環(huán)境中,才能再現(xiàn)出高質(zhì)量的音響效果。對(duì)于音響設(shè)備而言,主要關(guān)注失真度、頻響、瞬態(tài)響應(yīng)、信噪比、聲道別離度、聲道平衡度等指標(biāo)。4.2.3音質(zhì)主觀評(píng)價(jià)主觀評(píng)價(jià)是指通過人聆聽各種聲音而產(chǎn)生的好反感覺來進(jìn)行聲音質(zhì)量評(píng)價(jià)。1、語音質(zhì)量評(píng)價(jià)方法常用的主觀評(píng)價(jià)方法有:平均主觀分法,失真平均主觀分法,判斷滿意度測(cè)量法等。ITU-TP800標(biāo)準(zhǔn)中定義的MOS,它將語音質(zhì)量分為5級(jí),如表所示:等級(jí)音質(zhì)主觀感覺5優(yōu)未察覺失真4良剛察覺失真,但不討厭3中察覺失真,稍微討厭2差討厭,但不令人反感1劣極其討厭,令人反感

2、樂音質(zhì)量評(píng)價(jià)

樂音音質(zhì)的優(yōu)劣取決于多種因素,如聲源特性、音響器材的信號(hào)特性、聲場(chǎng)特性、聽覺特性等。因此,對(duì)音響設(shè)備再現(xiàn)的樂音音質(zhì)的準(zhǔn)確評(píng)價(jià)難度較大。

主觀評(píng)價(jià)樂音音質(zhì),一般是通過再現(xiàn)樂音的響度、音調(diào)和音色的變化及其組合來評(píng)價(jià)音質(zhì)的,

幾種典型的聽感:定位感,空間感,層次感,厚度感,立體感。除此之外,還有力度感、亮度感、臨場(chǎng)感、軟硬感、松緊感、寬窄感等許多評(píng)價(jià)音質(zhì)的聽感。4.3音頻的數(shù)字化與編碼

計(jì)算機(jī)在處理音頻信號(hào)之前,必須將模擬的聲音信號(hào)數(shù)字化,形成數(shù)字音頻。具體過程包括:采樣、量化、編碼。4.3.1采樣與采樣頻率

采樣是每間隔一段時(shí)間讀取一次聲音信號(hào)幅度,使聲音信號(hào)在時(shí)間上被離散化,如圖4-2所示。采樣的主要參數(shù)是采樣頻率。

采樣頻率:是指將模擬聲音波形數(shù)字化時(shí),每秒鐘所抽取聲波幅度樣本的次數(shù),其計(jì)算單位是kHz(千赫茲)。如圖4-3是模擬聲音信號(hào)數(shù)字化時(shí)的采樣圖示。一般來講,采樣頻率越高聲音失真越小,用于存儲(chǔ)數(shù)字音頻的數(shù)據(jù)量也越大。采樣頻率的上下是根據(jù)聲音信號(hào)本身的最高頻率和采樣定理決定的。圖4-3聲音信號(hào)采樣采樣定理:在進(jìn)行模擬/數(shù)字信號(hào)的轉(zhuǎn)換過程中,當(dāng)采樣頻率fs大于信號(hào)中最高頻率fmax的2倍時(shí),即fs>=2fmax,采樣之后的數(shù)字信號(hào)完整地保存了原始信號(hào)中的信息。采樣定理又叫奈奎斯特定理〔Nyquisttheory〕。表4-4不同音質(zhì)數(shù)字音頻的常用采樣率采樣率音質(zhì)頻率范圍8,000Hz電話0–4,000Hz11,025Hz低于AM廣播0–5,512Hz22,050Hz接近FM廣播0–11,025Hz32,000Hz優(yōu)于FM廣播0–16,000Hz44,100HzCD-DA0–22,050Hz48,000Hz標(biāo)準(zhǔn)DVD0–24,000Hz96,000Hz高端DVD0–48,000Hz4.3.2量化與量化位數(shù)量化就是把采樣得到的聲音信號(hào)幅度轉(zhuǎn)換為數(shù)字值,是聲音信號(hào)在幅度上被離散化。量化位數(shù)n定義了每個(gè)采樣點(diǎn)的數(shù)據(jù)范圍〔0~2n-1〕,也叫量化等級(jí),量化等級(jí)的多少?zèng)Q定了聲音的動(dòng)態(tài)范圍。圖4-4量化位數(shù)與動(dòng)態(tài)范圍4.3.2量化與量化位數(shù)表4-5不同音質(zhì)的量化位數(shù)、量化范圍、動(dòng)態(tài)范圍量化位數(shù)音質(zhì)量化等級(jí)動(dòng)態(tài)范圍8位電話25648dB16位CD65,53696dB24位DVD16,777,216144dB32位頂級(jí)4,294,967,296192dB4.3.3聲道聲道個(gè)數(shù)是反映音頻數(shù)字化質(zhì)量的另一個(gè)因素。單聲道:采集聲音數(shù)據(jù)時(shí),僅采集一個(gè)聲波的數(shù)據(jù)雙聲道〔立體聲〕:采集兩個(gè)聲波數(shù)據(jù)多聲道〔環(huán)繞立體聲〕:采集兩個(gè)以上聲波數(shù)據(jù)聲道數(shù)越多,再現(xiàn)出的音響效果就越好。4.3.4音頻采樣的數(shù)據(jù)量數(shù)字音頻的數(shù)據(jù)量主要取決于兩個(gè)因素:音質(zhì)因素:由采樣頻率、量化位數(shù)和聲道數(shù)3個(gè)參數(shù)決定。時(shí)間因素:?jiǎn)挝粫r(shí)間的數(shù)據(jù)量可用下式表示:

fc·b·s8v=v:為單位時(shí)間的數(shù)據(jù)量〔Kbps〕fc:為采樣頻率〔kHz〕b:為量化位數(shù)〔bit〕s:為聲道數(shù)4.3.5音頻數(shù)據(jù)編碼音頻數(shù)據(jù)壓縮方法分類PCM為脈沖調(diào)制編碼,DPCM為差分脈沖調(diào)制編碼,ADPCM為自適應(yīng)差分脈沖調(diào)制編碼,VSELP為矢量和鼓勵(lì)線性預(yù)測(cè)編碼,MPLPC為多脈沖鼓勵(lì)線性預(yù)測(cè)編碼,CELP為碼本鼓勵(lì)線性預(yù)測(cè)編碼。4.3.6音頻編碼標(biāo)準(zhǔn)

1、一般語音音質(zhì)的音頻壓縮標(biāo)準(zhǔn)特點(diǎn):音質(zhì)低,能聽到聲音就可以應(yīng)用:各類提示音壓縮標(biāo)準(zhǔn):

CCITTALawCCITTμLaw

低采樣率或低量化位數(shù)的PCM2、音質(zhì)的音頻壓縮標(biāo)準(zhǔn)頻率范圍:300Hz~3.4kHz,用標(biāo)準(zhǔn)的PCM編碼。壓縮標(biāo)準(zhǔn):G系列音頻壓縮標(biāo)準(zhǔn)G系列音頻壓縮標(biāo)準(zhǔn)利用的技術(shù):線性預(yù)測(cè)技術(shù)矢量量化技術(shù)綜合分析技術(shù)典型的算法:ADPCMCELPLD-CELP〔短時(shí)延碼本鼓勵(lì)線性預(yù)測(cè)編碼〕RPE-LTP〔長(zhǎng)時(shí)線性預(yù)測(cè)規(guī)那么碼鼓勵(lì)〕VSELP〔矢量和鼓勵(lì)線性預(yù)測(cè)編碼〕標(biāo)準(zhǔn)參數(shù)說明G.711PCM編碼,采樣速率8kHz,量化位數(shù)8Bit,比特流速率為64kb/s。使用非線性量化技術(shù)G.721ADPCM編碼:每個(gè)數(shù)值差分用4位編碼,采樣率為8kHz,比特流被轉(zhuǎn)換為32kbpsG.723SB-ADPCM編碼(有損壓縮),比特流被轉(zhuǎn)換為5.3~

6.3kbps之間G.728LD-CELP編碼,比特流被轉(zhuǎn)換為16kbps,帶寬限于3.4kHz;音質(zhì)與G.721標(biāo)準(zhǔn)相當(dāng)表4-6音質(zhì)的音頻編碼標(biāo)準(zhǔn)3、AM播送音質(zhì)的音頻壓縮標(biāo)準(zhǔn)頻率范圍:50Hz~7kHz壓縮標(biāo)準(zhǔn):ITU制定的G.722標(biāo)準(zhǔn)G.722標(biāo)準(zhǔn)采用的算法:SB-ADPCM〔子帶ADPCM〕SB-ADPCM算法:將現(xiàn)有的帶寬分成兩個(gè)獨(dú)立的子帶信道,使輸入信號(hào)進(jìn)入濾波器組分成高子帶信號(hào)和低子帶信號(hào),然后分別進(jìn)行ADPCM編碼,最后進(jìn)入混合器形成輸出碼流4、高保真立體聲音頻壓縮標(biāo)準(zhǔn)包括:CD-DA以上音質(zhì)、FM播送音質(zhì)FM播送音質(zhì)頻率范圍:20Hz~15kHzCD-DA音頻信號(hào)的頻率范圍:50Hz~20kHz壓縮標(biāo)準(zhǔn):1〕MPEG1,MPEG2的layer1、2、3,MPEG4AAC音頻編碼,杜比AC-3等。用于數(shù)字播送、數(shù)字電視播送、消費(fèi)電子產(chǎn)品、音頻信息的存儲(chǔ)和下載等。2〕ITU-TG.722.1、3GPPAMR-WB+和3GPP24GV-WB。用于像3G通信這樣的高音質(zhì)低碼率應(yīng)用場(chǎng)合。4.4音頻卡

4.4.1音頻卡的功能

錄制和播放數(shù)字聲音文件控制音量和混音效果聲音文件的壓縮與解壓縮

MIDI接口與音樂合成

4.4.2音頻卡的組成與工作原理圖4-6音頻卡的一般組成與結(jié)構(gòu)示意圖DSP音頻輸出放大器麥克風(fēng)Mic線路輸入Linein音樂合成器系統(tǒng)總線接口CD輸入混合信號(hào)處理器MIDI與游戲接口系統(tǒng)總線放大器

音頻卡的主要功能部件:功率放大器、混合信號(hào)處理器、DSP數(shù)字信號(hào)處理器、音樂合成器以及相關(guān)的外圍接口等。聲音的合成與處理:由DSP數(shù)字聲音處理器、音樂合成器及MIDI接口控制器組成,主要任務(wù)是完成聲波信號(hào)的模/數(shù)、數(shù)/模轉(zhuǎn)換,利用調(diào)頻技術(shù)控制聲音的音調(diào)、音色和幅度。

混合信號(hào)處理器及功率放大器:內(nèi)置數(shù)字/模擬混音器,混音器的聲源可以是MIDI信號(hào)、CD音頻、線性輸入、話筒以及PC機(jī)的揚(yáng)聲器等,可以選擇輸入一個(gè)聲源或?qū)讉€(gè)不同聲源進(jìn)行混合錄音。4.4.3音頻卡的I/O接口圖4-7音頻卡的外圍接口連接示意圖4.4.3音頻卡的I/O接口圖4-8支持5.1環(huán)繞的聲卡插口4.5數(shù)字音頻的采集與編輯

一般的數(shù)字音頻采集首先需要選擇和設(shè)置恰當(dāng)?shù)牟蓸訁?shù),然后再開始錄音采集,最后再使用相應(yīng)的編輯軟件對(duì)錄制的音頻數(shù)據(jù)進(jìn)行剪輯和效果處理。

4.5.1錄音采集選擇采樣參數(shù)調(diào)整輸入音頻的頻響檢測(cè)輸入音頻的強(qiáng)度開始錄音圖4-9設(shè)置錄音參數(shù)1、選擇采樣參數(shù)首先要根據(jù)實(shí)際情況選擇最正確的采樣參數(shù),做到音質(zhì)與數(shù)據(jù)量的折中考慮,防止采樣過程中出現(xiàn)存儲(chǔ)空間缺乏的現(xiàn)象發(fā)生。CD音質(zhì)、質(zhì)量收音質(zhì)量DefaultQuality2.調(diào)整輸入音頻的頻響

表4-7各頻段參數(shù)對(duì)音質(zhì)的影響頻段頻率范圍音質(zhì)影響低頻20~60Hz空間感。提升低頻共振(嗡),降落空虛;60~100Hz渾厚感。提升轟鳴(轟),降落無力;100~150Hz豐滿度。提升渾濁、降落單??;中頻低段150~300Hz聲音力度、男聲力度。提升聲音硬、無特色,降落軟、飄;中頻300~500Hz語音主要音區(qū),提升語音單調(diào)、降落語音空洞;500~1KHz人聲基音、聲音廓,提升語音前凸、降落語音收縮感;1k~2kHz通透感、順暢感,提升有跳躍感、降落松散;中頻上段2k~3kHz對(duì)明亮度最敏感,提升聲音硬,不自然;3k~4kHz穿透力,提升咳音;4k~5kHz樂器表面響度,提升樂器距離近、降落樂器距離遠(yuǎn);高頻5k~6kHz語言的清晰度,提升聲音鋒利、易疲勞;6k~8kHz明亮度、透明度,提升齒音重、降落聲音黯淡;8k~10kHzS音,影響音色的清晰度和透明度;極高頻10k~12kHz高頻泛音,光澤;12k~16kHz高頻泛音,光彩;16k~20kHz色彩提升有神秘感;3、檢測(cè)輸入音頻的強(qiáng)度在Win2K環(huán)境下,可通過“音量控制〞對(duì)話框來檢測(cè)、調(diào)節(jié)進(jìn)入計(jì)算機(jī)的音源強(qiáng)度。①翻開Windows下的音量控制臺(tái),選擇菜單欄中的“選項(xiàng)〞→“屬性〞命令翻開“屬性〞對(duì)話框。圖4-10音量控制臺(tái)②在“屬性“對(duì)話框中的音量調(diào)節(jié)選項(xiàng)中選擇“錄音〞,在顯示音量控制欄中選中麥克風(fēng)等選項(xiàng),如圖4-11所示。③在彈出的錄音控制臺(tái)中選中麥克風(fēng)或線路輸入或CD音頻,使相應(yīng)的音源有效,如圖4-12所示。圖4-11“屬性〞對(duì)話框圖4-12錄音控制對(duì)話框4、開始錄音圖4-11錄音機(jī)操作面板4.5.2抓取CD、VCD和DVD音軌獲取數(shù)字音頻的另一個(gè)快捷途徑就是從不同的多媒體產(chǎn)品中直接抓取音軌信息,并轉(zhuǎn)換壓縮成所需的音頻格式。WaveLab5.0版:抓取音樂CD、DVD中的音軌“豪杰超級(jí)解霸〞軟件:抓取音樂CD、VCD或DVD光盤等格式音軌豪杰超級(jí)解霸9.0版:可從DVD、VCD、RM/RMVB、AVI、MPG、MV等音視頻混合的媒體中提取音頻信息,并保存為一種稱為DAC高音質(zhì)壓縮格式或WAV、MP3格式的聲音文件注意:在使用抓取音軌來采集數(shù)字音頻時(shí),應(yīng)該遵守有關(guān)法律規(guī)定,取得相應(yīng)的使用權(quán),防止以后出現(xiàn)知識(shí)產(chǎn)權(quán)糾紛。4.5.3編輯數(shù)字音頻

音頻編輯一般包括音頻內(nèi)容剪切、合成以及音質(zhì)和效果的編輯等方面。

①多音軌〔MultipleTracks〕②切邊〔Trimming〕③拼接和組合〔SplicingandAssembly〕④音量調(diào)節(jié)〔VolumeAdjustments〕⑤格式轉(zhuǎn)換〔FormatConversion〕⑥重采樣或降低采樣率〔ResamplingorDownsampling〕⑦淡進(jìn)淡出〔Fade-insandFade-outs〕⑧均衡〔Equalization〕⑨時(shí)間拉伸〔TimeStretching〕⑩數(shù)字信號(hào)處理〔DigitalSignalProcessing-DSP〕4.6MIDI音樂4.6.1什么是MIDIMIDI〔MusicalInstrumentDigitalInterface〕樂器數(shù)字接口。它是由Yamaha、Roland等公司在1983年聯(lián)合提出并不斷開展確定的數(shù)字音樂的國(guó)際標(biāo)準(zhǔn),它規(guī)定了電子樂器和多媒體計(jì)算機(jī)之間進(jìn)行連接的硬件及數(shù)據(jù)通信協(xié)議,是多媒體計(jì)算機(jī)所支持的又一種聲音產(chǎn)生方法——MIDI方法。MIDI方法就是將數(shù)字式電子樂器的彈奏過程記錄下來,如選的是什么樂器,彈下哪一個(gè)鍵,用了多大力氣,持續(xù)了多長(zhǎng)時(shí)間等。MIDI格式的數(shù)字化文件可以看作是樂譜的數(shù)字化描述,它記錄的不再是聲音的波形,而是樂器的種類以及音階的上下、長(zhǎng)短、強(qiáng)弱、速度等因素,這些被稱為MIDI消息,存儲(chǔ)為MIDI文件。4.6.2MIDI設(shè)備的配置與連接

一件樂器只要包含了能處理MIDI信息的微處理器以及相關(guān)的硬件接口,就可以認(rèn)為是一臺(tái)MIDI設(shè)備。兩臺(tái)MIDI設(shè)備之間可以通過接口發(fā)送信息而進(jìn)行相互通信。

一臺(tái)MIDI設(shè)備可以有1~3個(gè)端口:MIDIIn接口:接收來自其它MIDI設(shè)備上的MIDI信息;MIDIOut接口:用來輸出本設(shè)備生成的MIDI信息;

MIDIThru接口:將從MIDIIn端口傳來的信息發(fā)送到另一臺(tái)相聯(lián)的MIDI設(shè)備上。

接收設(shè)備的MIDIIn連接器內(nèi)常采用光電耦合器實(shí)現(xiàn)收、發(fā)設(shè)備之間的電氣隔離。

MIDI信息采用異步串行方式傳輸,傳輸速率為31.25

Kbps。

在進(jìn)行MIDI通信時(shí),用戶可以通過標(biāo)準(zhǔn)的MIDI電纜來相互連接各端口。如圖4-14所示。圖4-14MIDI與游戲接口電纜MIDI接口游戲接口In和Out圖4-14多媒體計(jì)算機(jī)與MIDI設(shè)備連接示意圖MIDI軟件〔音序器〕是用于記錄、編輯和播放MIDI文件的一種軟件,其作用相當(dāng)于是MIDI樂器的一臺(tái)多軌磁帶錄音機(jī)。MIDI設(shè)備可以配備電子鍵盤、合成器、音序器〔MIDI軟件〕以及揚(yáng)聲器或音箱等。MIDI鍵盤主要用于產(chǎn)生MIDI信息MIDI合成器是一種電子設(shè)備,使用數(shù)字信號(hào)處理器或其他類型的芯片產(chǎn)生音樂或聲音。4.6.3播放MIDI音樂聲卡播放MIDI音樂最常用的方法有兩種:FM合成與波表〔WaveTable〕合成。FM是運(yùn)用聲音振蕩的原理對(duì)MIDI進(jìn)行合成處理的。波表合成,效果較好。它是將各種真實(shí)樂器所能發(fā)出的所有聲音(包括各個(gè)音域、聲調(diào))錄制下來,存儲(chǔ)在聲卡的ROM中,稱為硬波表。4.6.4制作MIDI音樂制作MIDI音樂,需要按圖4-14的示意構(gòu)成系統(tǒng)。樂譜創(chuàng)作軟件能夠錄制、編輯、打印MIDI樂譜并播放MIDI音樂。有些樂譜創(chuàng)作軟件還能對(duì)樂譜進(jìn)行量化來調(diào)節(jié)節(jié)拍的不一致問題。MIDI編輯中很重要的是選擇MIDI樂器,MIDI標(biāo)準(zhǔn)規(guī)定了不同的演奏樂器并用編號(hào)加以區(qū)分,范圍在0~127之間,見附錄三。在MIDI樂譜中,樂器ID用來決定以何種樂器來播放樂曲,為改變樂器,只需改變?cè)摂?shù)值即可。MIDI是為多媒體工程創(chuàng)立原始音樂素材的最正確途徑。準(zhǔn)備發(fā)布時(shí)應(yīng)將其轉(zhuǎn)換成數(shù)字音頻數(shù)據(jù)。創(chuàng)作MIDI樂譜的軟件:Cakewalk〔Cakewalk9.0x版〕4.6.5樂譜的掃描與識(shí)別除了通過MIDI方法創(chuàng)作樂譜〔MIDI音樂〕以外,還可以利用掃描-識(shí)別技術(shù),快速將印刷樂譜數(shù)字化,保存為MIDI樂譜。SmartScore軟件掃描識(shí)別過程:首先,通過掃描儀將樂譜以圖像的方式掃描成數(shù)字圖像,掃描參數(shù)的選擇與設(shè)置:分辨率:一般選擇150~300

dpi,圖像類型:黑白二值或OCR,掃描后的圖片存儲(chǔ)格式:TIF格式;然后,通過樂譜識(shí)別功能識(shí)別出可編輯的數(shù)字樂譜并進(jìn)行校對(duì)、編輯。識(shí)別后的樂譜識(shí)別前的樂譜圖片圖4-16SmartScore軟件的樂譜識(shí)別畫面SmartScore也可以翻開事先存儲(chǔ)好的樂譜圖片并進(jìn)行識(shí)別,識(shí)別完成后會(huì)提示將識(shí)別的結(jié)果保存為SmartScore專用格式的.enf文件。4.6.6MIDI與數(shù)字音頻的比較MIDI數(shù)字音頻是樂譜是一段錄音取決于音樂設(shè)備的質(zhì)量和音響系統(tǒng)的性能取決于音響系統(tǒng)的性能文件小數(shù)字化波形文件大與設(shè)備有關(guān)與播放設(shè)備無關(guān)依賴于特定的回放設(shè)備與回放的設(shè)備關(guān)系不大,播放效果幾乎一樣。較小的數(shù)據(jù)存儲(chǔ)空間需要較大的數(shù)據(jù)存儲(chǔ)空間MIDI文件多用于CD和MP3文件

MIDI具有以下幾個(gè)優(yōu)點(diǎn):①M(fèi)IDI文件比數(shù)字音頻文件尺寸更小,MIDI文檔的大小與播放質(zhì)量完全無關(guān)。②由于MIDI文件非常小,可以嵌入到網(wǎng)頁中,因此下載和播放要比相當(dāng)?shù)臄?shù)字音頻速度快。③在有些情況下,如果使用的MIDI聲源質(zhì)量很高,MIDI將會(huì)比數(shù)字音頻文件聽起來更好。④MIDI數(shù)據(jù)是完全可編輯的,可對(duì)MIDI音樂的音符、音高、輸出設(shè)備等很小的樂譜單元作精確編輯和修改。MIDI也有以下幾方面的缺乏:①由于MIDI數(shù)據(jù)并不表示實(shí)際的聲音,而是音樂設(shè)備的聲音,因此只要MIDI的播放設(shè)備與制作MIDI時(shí)使用的設(shè)備不一樣,就無法保證播放的最正確效果完全無誤。②采用MIDI無法表示語音信號(hào)。采用數(shù)字音頻還有兩個(gè),而且經(jīng)常起決定性作用的原因:Macintosh和Windows平臺(tái)為數(shù)字音頻提供了更多的應(yīng)用軟件和系統(tǒng)支持。創(chuàng)立數(shù)字音頻的準(zhǔn)備和編程并不需要具備音樂理論的專業(yè)知識(shí),但是處理MIDI數(shù)據(jù)不但需要了解音頻制作,而且需要對(duì)音樂樂譜、鍵盤和音符有所了解。4.7音頻工具軟件

AdobeAudition是Adobe公司的音頻處理產(chǎn)品,簡(jiǎn)稱Au,是一款集音頻錄制、混合、編輯和控制于一身的音頻處理工具軟件??梢凿浿?、混合、編輯和控制數(shù)字音頻文件,也可輕松創(chuàng)立音樂、制作播送短片、修復(fù)錄制缺陷等,以獲得所需的音頻處理效果。

Au3.0是Adobe公司2007年11月8發(fā)布的新版音頻處理軟件,其擴(kuò)充或增強(qiáng)的新功能包括:4.7.1Au3.0的新特性

支持VSTi虛擬樂器;增強(qiáng)的頻譜編輯器。增強(qiáng)的多軌編輯:新效果:包括卷積混響、模擬延遲、母帶處理系列工具、電子管建模壓縮;iZotope授權(quán)的Radius時(shí)間伸縮工具;新增吉他系列效果器;可快速縮放波形頭部和尾部;增強(qiáng)的降噪工具和聲相修復(fù)工具;更強(qiáng)的性能:對(duì)多核心CPU進(jìn)行優(yōu)化;波形編輯工具:4.7.2Au3.0的工作模式Au3.0的工作模式:編輯模式:編輯模式提供強(qiáng)有力的單軌編輯能力,具體操作和編輯處理在“編輯視圖〞中完成。多軌模式:多軌模式提供最多128個(gè)音軌的多音軌混合能力,具體操作和處理在“多軌視圖〞中完成。CD模式:CD模式提供CD光盤刻錄所需的操作功能,具體操作和處理在“CD視圖〞中完成。利用Au3.0的集成處理環(huán)境,使用者可以在不同模式之間“無縫〞切換,同時(shí)進(jìn)行單軌編輯、多軌混合和制作CD光盤等工作,制作出專業(yè)水準(zhǔn)的音頻。4.7.3編輯視圖預(yù)覽區(qū)域滾動(dòng)條動(dòng)態(tài)范圍時(shí)間線4.7.3編輯視圖主菜單:包括“文件〞、“編輯〞、“視圖〞、“效果〞、“生成〞、“收藏〞、“選項(xiàng)〞、“窗口〞、“幫助〞等9個(gè)菜單項(xiàng)。視圖切換按鈕:位于“文件〞主菜單下方,包括“編輯〞、“多軌〞和“CD〞三個(gè)按鈕傳送器面板:定義了單軌和多軌視圖下的音頻播放和錄音操作,包括停止、播放、暫停、從指針處播放、循環(huán)播放、快進(jìn)、快倒、轉(zhuǎn)到開始或上一個(gè)標(biāo)記、轉(zhuǎn)到結(jié)尾或下一個(gè)標(biāo)記、錄音等。時(shí)間面板:用于顯示操作過程中音頻時(shí)間線指針的具體時(shí)間。縮放面板:定義了編輯音軌的橫向〔時(shí)間線或采樣率〕、縱向〔幅度〕的放大、縮小操作。圖4-18音頻波形的橫向放大效果圖示選擇/查看面板:定義了顯示了音軌窗口目前可看到的音頻信號(hào)的起始時(shí)間位置、結(jié)束時(shí)間為止以及時(shí)間長(zhǎng)度。如圖4-17中的選擇/查看面板。電平面板:顯示播放音頻時(shí)的信號(hào)電平。其他面板:視圖中的文件面板、效果面板、收藏夾面板等與主菜單中的“文件〞、“效果〞、“收藏夾〞根本對(duì)應(yīng)。4.7.4多軌視圖多軌視圖與編輯視圖不同的內(nèi)容主要表現(xiàn)在主菜單、主群組、混音器三個(gè)方面,其他內(nèi)容與編輯視圖的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論