音頻信息處理技術(shù)_第1頁
音頻信息處理技術(shù)_第2頁
音頻信息處理技術(shù)_第3頁
音頻信息處理技術(shù)_第4頁
音頻信息處理技術(shù)_第5頁
已閱讀5頁,還剩63頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、http:/ http:/ http:/ http:/ http:/ http:/ http:/ http:/ http:/ http:/ http:/ http:/ http:/ http:/www.zg- http:/ http:/www.skf- http:/www.nsk- http:/www.fag- http:/ http:/www.ntn- http:/ http:/ http:/ http:/ http:/ http:/www.xunchi- http:/ http:/ http:/ http:/ http:/ http:/ http:/www.ort- 第第2 2頁頁/ /共

2、共6868頁頁本章導(dǎo)讀 音頻信息處理技術(shù)是多媒體信息處理的主要技術(shù)之一,音頻信息處理技術(shù)是多媒體信息處理的主要技術(shù)之一,它使計(jì)算機(jī)具備了錄音、聲音編輯、語音合成、聲音播放它使計(jì)算機(jī)具備了錄音、聲音編輯、語音合成、聲音播放等功能。在等功能。在mpc中,可以通過聲音傳遞信息、制造效果、中,可以通過聲音傳遞信息、制造效果、營造氣氛及演奏音樂等。目前的音頻信息處理技術(shù)主要包營造氣氛及演奏音樂等。目前的音頻信息處理技術(shù)主要包括模擬聲音信號(hào)的數(shù)字化、數(shù)據(jù)壓縮編碼、數(shù)字音效處理、括模擬聲音信號(hào)的數(shù)字化、數(shù)據(jù)壓縮編碼、數(shù)字音效處理、音頻文件存儲(chǔ)、傳輸、播放等內(nèi)容。音頻文件存儲(chǔ)、傳輸、播放等內(nèi)容。本章主要介紹聲

3、音信本章主要介紹聲音信號(hào)及其數(shù)字化的基本概念、音頻卡的組成及其工作原理、號(hào)及其數(shù)字化的基本概念、音頻卡的組成及其工作原理、數(shù)字音頻的采集與編輯、數(shù)字音頻的采集與編輯、midi音樂以及幾個(gè)常用的音頻處音樂以及幾個(gè)常用的音頻處理軟件等內(nèi)容,理軟件等內(nèi)容,并以并以adobe audition3.0版本為例,詳細(xì)版本為例,詳細(xì)介紹音頻信息編輯處理的具體方法。介紹音頻信息編輯處理的具體方法。http:/ http:/ http:/ http:/ http:/ http:/ http:/ http:/ http:/ http:/ http:/ http:/ http:/ http:/www.zg- htt

4、p:/ http:/www.skf- http:/www.nsk- http:/www.fag- http:/ http:/www.ntn- http:/ http:/ http:/ http:/ http:/ http:/www.xunchi- http:/ http:/ http:/ http:/ http:/ http:/ http:/www.ort- 第第3 3頁頁/ /共共6868頁頁本章主要內(nèi)容本章主要內(nèi)容4.1 4.1 音頻基礎(chǔ)知識(shí)音頻基礎(chǔ)知識(shí) 4.2 4.2 音質(zhì)標(biāo)準(zhǔn)與評(píng)價(jià)音質(zhì)標(biāo)準(zhǔn)與評(píng)價(jià)4.3 4.3 音頻的數(shù)字化與編碼音頻的數(shù)字化與編碼4.4 4.4 音頻卡音頻卡4.5 4.

5、5 數(shù)字音頻的采集與編輯數(shù)字音頻的采集與編輯4.6 midi4.6 midi音樂音樂第第4 4頁頁/ /共共6868頁頁4.1 4.1 音頻基礎(chǔ)知識(shí)音頻基礎(chǔ)知識(shí)4.1.1 4.1.1 聲音的物理特征聲音的物理特征 聲音聲音是由物體振動(dòng)產(chǎn)生的,并以是由物體振動(dòng)產(chǎn)生的,并以聲波形式聲波形式通過介質(zhì)(如通過介質(zhì)(如空氣、水、金屬等)傳播。物理上,聲音可以用空氣、水、金屬等)傳播。物理上,聲音可以用一條連續(xù)曲一條連續(xù)曲線線來表示,來表示,, ,如圖如圖4-1 4-1 。物體振動(dòng)的最大位移稱為。物體振動(dòng)的最大位移稱為振幅振幅a a,聲,聲波中兩個(gè)連續(xù)波峰(或波谷)之間的距離稱為波中兩個(gè)連續(xù)波峰(或波谷)

6、之間的距離稱為周期周期t t,周期,周期的倒數(shù)的倒數(shù)1/t1/t即為即為頻率頻率f f,以,以赫茲(赫茲(hzhz)為單位,頻率為單位,頻率反映了單位時(shí)間(反映了單位時(shí)間(1 1秒)物秒)物體振動(dòng)的次數(shù)。體振動(dòng)的次數(shù)。圖圖4-1 4-1 聲波的振幅與頻率聲波的振幅與頻率tat0第第5 5頁頁/ /共共6868頁頁 聲音按頻率可分為三類:聲音按頻率可分為三類:音頻、次聲、超聲音頻、次聲、超聲 l 低于低于20hz20hz的聲音稱為次聲的聲音稱為次聲l 頻率范圍在頻率范圍在20hz20hz20khz20khz范范圍的可聽聲音稱為音頻,圍的可聽聲音稱為音頻, 其中人說話發(fā)出的語音信號(hào)的其中人說話發(fā)出

7、的語音信號(hào)的頻率范圍是頻率范圍是300hz300hz3khz3khzl 頻率高于頻率高于20khz20khz的稱為超音的稱為超音頻(或超聲)頻(或超聲)15 20 300 3k 20k 50k f(hz)音頻信號(hào)音頻信號(hào)語音信號(hào)語音信號(hào)超聲信號(hào)超聲信號(hào)次聲信號(hào)次聲信號(hào)圖圖4-2 4-2 不同聲音信號(hào)的頻率范圍不同聲音信號(hào)的頻率范圍 可聽的音頻聲音又可分為可聽的音頻聲音又可分為語音、樂音、效果音、合語音、樂音、效果音、合成音、噪音(聲)成音、噪音(聲)等五種。等五種。 第第6 6頁頁/ /共共6868頁頁4.1.2 4.1.2 音頻三要素音頻三要素 音頻有三個(gè)主要屬性,分別是音頻有三個(gè)主要屬性,

8、分別是音調(diào)、音強(qiáng)音調(diào)、音強(qiáng)和和音色音色,它們,它們既反映了音頻信號(hào)的基本特征,也是人感受聲音信號(hào)的三個(gè)既反映了音頻信號(hào)的基本特征,也是人感受聲音信號(hào)的三個(gè)主要因素,因此又被稱為音頻三要素。主要因素,因此又被稱為音頻三要素。 音調(diào)音調(diào):又稱音高,反映聲音的高低程度,由聲音信號(hào)的:又稱音高,反映聲音的高低程度,由聲音信號(hào)的頻率大小所決定。頻率越大,音調(diào)越高;頻率越小,音調(diào)越頻率大小所決定。頻率越大,音調(diào)越高;頻率越小,音調(diào)越低。低。 音強(qiáng)音強(qiáng):又稱響度,反映聲音的大小或強(qiáng)弱,由振幅和聲:又稱響度,反映聲音的大小或強(qiáng)弱,由振幅和聲源距離共同決定。振幅越大,距離越小,音強(qiáng)(響度)越大。源距離共同決定。

9、振幅越大,距離越小,音強(qiáng)(響度)越大。 音色音色:又稱音質(zhì),反映聲音的品質(zhì),它由振動(dòng)物體(聲:又稱音質(zhì),反映聲音的品質(zhì),它由振動(dòng)物體(聲源)的材料、結(jié)構(gòu)、狀態(tài)等自身因素決定,表現(xiàn)為聲源的頻源)的材料、結(jié)構(gòu)、狀態(tài)等自身因素決定,表現(xiàn)為聲源的頻帶寬度。帶寬度。第第7 7頁頁/ /共共6868頁頁4.1.3 4.1.3 數(shù)字音頻的三種形式數(shù)字音頻的三種形式 音頻(音頻(audioaudio)是指頻率在)是指頻率在20hz20hz20khz20khz范圍內(nèi)的可聽聲范圍內(nèi)的可聽聲音,是多媒體信息中的一種媒體類型音,是多媒體信息中的一種媒體類型聽覺類媒體。聽覺類媒體。 目前多媒體計(jì)算機(jī)中的音頻主要有目前多

10、媒體計(jì)算機(jī)中的音頻主要有波形音頻、波形音頻、cdcd音頻和音頻和midimidi音樂音樂3 3種形式。種形式。1 1、波形音頻:、波形音頻: 是由外部聲音源通過數(shù)字化過程采集到多媒體計(jì)算機(jī)中是由外部聲音源通過數(shù)字化過程采集到多媒體計(jì)算機(jī)中的所有聲音形式??赏ㄟ^編輯(裁剪、合成、效果等)、編的所有聲音形式??赏ㄟ^編輯(裁剪、合成、效果等)、編碼壓縮、存儲(chǔ)、傳輸以及還原播放等方式進(jìn)行處理。在波形碼壓縮、存儲(chǔ)、傳輸以及還原播放等方式進(jìn)行處理。在波形音頻中,有一類特殊的聲音需要特別提到,即人的語音。語音頻中,有一類特殊的聲音需要特別提到,即人的語音。語音是波形聲音中人的說話聲音,具有內(nèi)在的語言學(xué)、語音

11、學(xué)音是波形聲音中人的說話聲音,具有內(nèi)在的語言學(xué)、語音學(xué)的內(nèi)涵。的內(nèi)涵。第第8 8頁頁/ /共共6868頁頁2 2、cdcd音頻音頻 cd-cd-音頻(音頻(cd-audiocd-audio)是存儲(chǔ)在音樂)是存儲(chǔ)在音樂cdcd光盤中的數(shù)字音光盤中的數(shù)字音頻,可以通過頻,可以通過cd-romcd-rom驅(qū)動(dòng)器讀取并采集到多媒體計(jì)算機(jī)系驅(qū)動(dòng)器讀取并采集到多媒體計(jì)算機(jī)系統(tǒng)中,并以波形音頻的相應(yīng)形式存儲(chǔ)、傳輸和處理。統(tǒng)中,并以波形音頻的相應(yīng)形式存儲(chǔ)、傳輸和處理。3 3、midimidi音樂音樂 也稱也稱midimidi音頻。它將音樂符號(hào)化并保存在音頻。它將音樂符號(hào)化并保存在midimidi文件中,文件中

12、,并通過音樂合成器產(chǎn)生相應(yīng)的聲音波形來還原播放。并通過音樂合成器產(chǎn)生相應(yīng)的聲音波形來還原播放。 音頻是時(shí)間的函數(shù),具有很強(qiáng)的前后相關(guān)性,所以實(shí)音頻是時(shí)間的函數(shù),具有很強(qiáng)的前后相關(guān)性,所以實(shí)時(shí)性是音頻處理的基本要求。時(shí)性是音頻處理的基本要求。第第9 9頁頁/ /共共6868頁頁4.1.4 4.1.4 數(shù)字音頻的文件格式數(shù)字音頻的文件格式音頻文件通常分為兩大類:音頻文件通常分為兩大類:聲音文件聲音文件 和和 midimidi文件文件下表介紹幾種常用的音頻文件格式及后綴名:下表介紹幾種常用的音頻文件格式及后綴名:序號(hào)序號(hào)音頻文件名稱音頻文件名稱后綴名后綴名1 1wavewave文件文件 .wav .

13、wav 2 2aiffaiff文件文件 .aif/.aiff .aif/.aiff 3 3audioaudio文件文件 .au .au 4 4 sound sound文件文件 .snd .snd 5 5voicevoice文件文件 .voc .voc 6 6 mpeg mpeg音頻文件音頻文件 .mp1/.mp2/.mp3 .mp1/.mp2/.mp3 7 7realaudiorealaudio文件文件 .ra/.rm/.ram .ra/.rm/.ram 8 8windows media audiowindows media audio文件文件 .wma/.asf/.asx/.wax .wma

14、/.asf/.asx/.wax 9 9midimidi文件文件 .mid/.rmi/.cmi/.cmf .mid/.rmi/.cmi/.cmf 1010modulemodule文件文件 .mod/.s3m/.xm/.mtm/.far/.kar/ .mod/.s3m/.xm/.mtm/.far/.kar/ 第第1010頁頁/ /共共6868頁頁4.1.5 4.1.5 音頻處理工具軟件簡(jiǎn)介音頻處理工具軟件簡(jiǎn)介 音頻工具軟件在內(nèi)容上主要指處理數(shù)字音頻和音頻工具軟件在內(nèi)容上主要指處理數(shù)字音頻和midimidi樂譜樂譜的各種工具軟件,在功能上包括的各種工具軟件,在功能上包括音頻采集、編輯、合成、編音頻采

15、集、編輯、合成、編碼壓縮以及碼壓縮以及midimidi樂譜的創(chuàng)作、編輯、發(fā)布等環(huán)節(jié)樂譜的創(chuàng)作、編輯、發(fā)布等環(huán)節(jié)。 按照音頻處理的基本過程,通??砂岩纛l工具軟件分為:按照音頻處理的基本過程,通??砂岩纛l工具軟件分為: 1 1、midimidi制作軟件制作軟件 2 2、音頻處理軟件、音頻處理軟件 3 3、音頻壓縮軟件、音頻壓縮軟件 4 4、音樂、音樂cdcd刻錄軟件刻錄軟件第第1111頁頁/ /共共6868頁頁4.2 4.2 音質(zhì)標(biāo)準(zhǔn)與評(píng)價(jià)音質(zhì)標(biāo)準(zhǔn)與評(píng)價(jià)4.2.1 4.2.1 音質(zhì)等級(jí)標(biāo)準(zhǔn)音質(zhì)等級(jí)標(biāo)準(zhǔn) 音質(zhì)音質(zhì)是指音頻信號(hào)經(jīng)傳輸、處理后所再現(xiàn)的聲音質(zhì)量是指音頻信號(hào)經(jīng)傳輸、處理后所再現(xiàn)的聲音質(zhì)量(保

16、真度)。(保真度)。等級(jí)等級(jí)頻率范圍頻率范圍音質(zhì)音質(zhì)高端高端dvddvd0 048khz48khz頂級(jí)頂級(jí)標(biāo)準(zhǔn)標(biāo)準(zhǔn)dvddvd0 024khz24khzcd-dacd-da音質(zhì)音質(zhì)10hz10hz20khz20khz高高fmfm廣播音質(zhì)廣播音質(zhì)20hz20hz15khz15khz較高較高amam廣播音質(zhì)廣播音質(zhì)50hz50hz7khz7khz中中電話音質(zhì)電話音質(zhì)200hz200hz3.4khz3.4khz低低第第1212頁頁/ /共共6868頁頁4.2.2 4.2.2 音質(zhì)客觀評(píng)價(jià)音質(zhì)客觀評(píng)價(jià) 客觀評(píng)價(jià)客觀評(píng)價(jià)是指通過檢測(cè)儀器測(cè)量音頻信號(hào)的技術(shù)指標(biāo)來進(jìn)是指通過檢測(cè)儀器測(cè)量音頻信號(hào)的技術(shù)指標(biāo)來進(jìn)

17、行聲音質(zhì)量評(píng)價(jià),主要技術(shù)指標(biāo)有:頻帶寬度、動(dòng)態(tài)范圍和信行聲音質(zhì)量評(píng)價(jià),主要技術(shù)指標(biāo)有:頻帶寬度、動(dòng)態(tài)范圍和信噪比等。噪比等。 理論上,理論上,聲音信號(hào)是由許多頻率不同的分量信號(hào)組合而聲音信號(hào)是由許多頻率不同的分量信號(hào)組合而成的復(fù)合信號(hào),因此,聲音的頻帶寬度特指復(fù)合聲音信號(hào)的成的復(fù)合信號(hào),因此,聲音的頻帶寬度特指復(fù)合聲音信號(hào)的頻率范圍,范圍越大,頻帶越寬,可包含的音頻信號(hào)(諧波)頻率范圍,范圍越大,頻帶越寬,可包含的音頻信號(hào)(諧波)越豐富,因而聲音質(zhì)量就越高。越豐富,因而聲音質(zhì)量就越高。 實(shí)際上實(shí)際上,再現(xiàn)聲音(特別是樂音)的質(zhì)量與所用的播放,再現(xiàn)聲音(特別是樂音)的質(zhì)量與所用的播放設(shè)備和場(chǎng)地條

18、件有關(guān)。高質(zhì)量的音頻信號(hào)要通過高品質(zhì)的音設(shè)備和場(chǎng)地條件有關(guān)。高質(zhì)量的音頻信號(hào)要通過高品質(zhì)的音響設(shè)備在較好的音響環(huán)境中,才能再現(xiàn)出高質(zhì)量的音響效果。響設(shè)備在較好的音響環(huán)境中,才能再現(xiàn)出高質(zhì)量的音響效果。對(duì)于音響設(shè)備而言,主要關(guān)注對(duì)于音響設(shè)備而言,主要關(guān)注失真度、頻響、瞬態(tài)響應(yīng)、信失真度、頻響、瞬態(tài)響應(yīng)、信噪比、聲道分離度、聲道平衡度噪比、聲道分離度、聲道平衡度等指標(biāo)。等指標(biāo)。 第第1313頁頁/ /共共6868頁頁4.2.3 4.2.3 音質(zhì)主觀評(píng)價(jià)音質(zhì)主觀評(píng)價(jià) 主觀評(píng)價(jià)是指通過人聆聽各種聲音而產(chǎn)生的好惡感覺來進(jìn)主觀評(píng)價(jià)是指通過人聆聽各種聲音而產(chǎn)生的好惡感覺來進(jìn)行聲音質(zhì)量評(píng)價(jià)。行聲音質(zhì)量評(píng)價(jià)。

19、1 1、語音質(zhì)量評(píng)價(jià)方法、語音質(zhì)量評(píng)價(jià)方法 常用的主觀評(píng)價(jià)方法有:常用的主觀評(píng)價(jià)方法有:平均主觀分法,失真平均主觀分平均主觀分法,失真平均主觀分法,判斷滿意度測(cè)量法法,判斷滿意度測(cè)量法等。等。 itu-tp800itu-tp800標(biāo)準(zhǔn)中定義的標(biāo)準(zhǔn)中定義的mosmos,它將語音質(zhì)量分為,它將語音質(zhì)量分為5 5級(jí),如級(jí),如表所示:表所示:等級(jí)等級(jí)音質(zhì)音質(zhì)主觀感覺主觀感覺5 5優(yōu)優(yōu)未察覺失真未察覺失真4 4良良剛察覺失真,但不討厭剛察覺失真,但不討厭3 3中中察覺失真,稍微討厭察覺失真,稍微討厭2 2差差討厭,但不令人反感討厭,但不令人反感1 1劣劣極其討厭,令人反感極其討厭,令人反感第第1414頁

20、頁/ /共共6868頁頁 2 2、樂音質(zhì)量評(píng)價(jià)、樂音質(zhì)量評(píng)價(jià) 樂音音質(zhì)的優(yōu)劣取決于多種因素,如樂音音質(zhì)的優(yōu)劣取決于多種因素,如聲源特性、音響器聲源特性、音響器材的信號(hào)特性、聲場(chǎng)特性、聽覺特性材的信號(hào)特性、聲場(chǎng)特性、聽覺特性等。因此,對(duì)音響設(shè)等。因此,對(duì)音響設(shè)備再現(xiàn)的樂音音質(zhì)的準(zhǔn)確評(píng)價(jià)難度較大。備再現(xiàn)的樂音音質(zhì)的準(zhǔn)確評(píng)價(jià)難度較大。 主觀評(píng)價(jià)樂音音質(zhì),一般是通過再現(xiàn)樂音的響度、音調(diào)主觀評(píng)價(jià)樂音音質(zhì),一般是通過再現(xiàn)樂音的響度、音調(diào)和音色的變化及其組合來評(píng)價(jià)音質(zhì)的,和音色的變化及其組合來評(píng)價(jià)音質(zhì)的, 幾種典型的聽感:幾種典型的聽感:定位感定位感 ,空間感,空間感 ,層次感,層次感 ,厚度,厚度感感 ,

21、立體感,立體感 。除此之外,還有力度感、亮度感、臨場(chǎng)感、。除此之外,還有力度感、亮度感、臨場(chǎng)感、軟硬感、松緊感、寬窄感等許多評(píng)價(jià)音質(zhì)的聽感。軟硬感、松緊感、寬窄感等許多評(píng)價(jià)音質(zhì)的聽感。 第第1515頁頁/ /共共6868頁頁4.3 4.3 音頻的數(shù)字化與編碼音頻的數(shù)字化與編碼 計(jì)算機(jī)在處理音頻信號(hào)之前,計(jì)算機(jī)在處理音頻信號(hào)之前,必須將模擬的聲音信號(hào)數(shù)字化,必須將模擬的聲音信號(hào)數(shù)字化,形成數(shù)字音頻。具體過程包括:形成數(shù)字音頻。具體過程包括:采樣、量化、編碼采樣、量化、編碼。4.3.1 4.3.1 采樣與采樣頻率采樣與采樣頻率 采樣是每間隔一段時(shí)間讀采樣是每間隔一段時(shí)間讀取一次聲音信號(hào)幅度,使聲音

22、取一次聲音信號(hào)幅度,使聲音信號(hào)在時(shí)間上被離散化,如圖信號(hào)在時(shí)間上被離散化,如圖4-24-2所示。采樣的主要參數(shù)是所示。采樣的主要參數(shù)是采樣頻率采樣頻率 。第第1616頁頁/ /共共6868頁頁 采樣頻率采樣頻率:是指將模擬聲音波形數(shù)字化時(shí),每秒鐘所抽:是指將模擬聲音波形數(shù)字化時(shí),每秒鐘所抽取聲波幅度樣本的次數(shù),其計(jì)算單位是取聲波幅度樣本的次數(shù),其計(jì)算單位是khz(khz(千赫茲千赫茲) )。如圖。如圖4-34-3是模擬聲音信號(hào)數(shù)字化時(shí)的采樣圖示。是模擬聲音信號(hào)數(shù)字化時(shí)的采樣圖示。 一般來講,采樣頻率一般來講,采樣頻率越高聲音失真越小,用于越高聲音失真越小,用于存儲(chǔ)數(shù)字音頻的數(shù)據(jù)量也存儲(chǔ)數(shù)字音頻

23、的數(shù)據(jù)量也越大。越大。 采樣頻率的高低是根采樣頻率的高低是根據(jù)據(jù)聲音信號(hào)本身的最高頻聲音信號(hào)本身的最高頻率和采樣定理率和采樣定理決定的。決定的。圖圖4-3 4-3 聲音信號(hào)采樣聲音信號(hào)采樣第第1717頁頁/ /共共6868頁頁 采樣定理采樣定理:在進(jìn)行模擬:在進(jìn)行模擬/ /數(shù)字信號(hào)的轉(zhuǎn)換過程中,當(dāng)采數(shù)字信號(hào)的轉(zhuǎn)換過程中,當(dāng)采樣頻率樣頻率f fs s大于信號(hào)中最高頻率大于信號(hào)中最高頻率f fmaxmax的的2 2倍時(shí),即倍時(shí),即f fs s=2f=2fmaxmax,采,采樣之后的數(shù)字信號(hào)完整地保留了原始信號(hào)中的信息。采樣定樣之后的數(shù)字信號(hào)完整地保留了原始信號(hào)中的信息。采樣定理又叫奈奎斯特定理(理

24、又叫奈奎斯特定理(nyquist theorynyquist theory)。)。表表4-4 4-4 不同音質(zhì)數(shù)字音頻的常用采樣率不同音質(zhì)數(shù)字音頻的常用采樣率采樣率采樣率音質(zhì)音質(zhì)頻率范圍頻率范圍8,000 hz8,000 hz電話電話0 04,000 hz4,000 hz11,025 hz11,025 hz低于低于amam廣播廣播0 05,512 hz5,512 hz22,050 hz22,050 hz接近接近fmfm廣播廣播0 011,025 hz11,025 hz32,000 hz32,000 hz優(yōu)于優(yōu)于fmfm廣播廣播0 016,000 hz16,000 hz44,100 hz44,1

25、00 hzcd-dacd-da0 022,050 hz22,050 hz48,000 hz48,000 hz標(biāo)準(zhǔn)標(biāo)準(zhǔn)dvddvd0 024,000 hz24,000 hz96,000 hz96,000 hz高端高端dvddvd0 048,000 hz48,000 hz第第1818頁頁/ /共共6868頁頁4.3.2 4.3.2 量化與量化位數(shù)量化與量化位數(shù) 量化量化就是把采樣得到的聲音信號(hào)幅度轉(zhuǎn)換為數(shù)字值,就是把采樣得到的聲音信號(hào)幅度轉(zhuǎn)換為數(shù)字值,是聲音信號(hào)在幅度上被離散化。是聲音信號(hào)在幅度上被離散化。 量化位數(shù)量化位數(shù)n n定義了每個(gè)采樣點(diǎn)的數(shù)據(jù)范圍(定義了每個(gè)采樣點(diǎn)的數(shù)據(jù)范圍(0 02 2

26、n n-1-1),),也叫量化等級(jí),量化等級(jí)的多少?zèng)Q定了聲音的動(dòng)態(tài)范圍。也叫量化等級(jí),量化等級(jí)的多少?zèng)Q定了聲音的動(dòng)態(tài)范圍。圖圖4-4 4-4 量化位數(shù)與動(dòng)態(tài)范圍量化位數(shù)與動(dòng)態(tài)范圍 第第1919頁頁/ /共共6868頁頁4.3.2 4.3.2 量化與量化位數(shù)量化與量化位數(shù)表表4-5 4-5 不同音質(zhì)的量化位數(shù)、量化范圍、動(dòng)態(tài)范圍不同音質(zhì)的量化位數(shù)、量化范圍、動(dòng)態(tài)范圍量化位數(shù)量化位數(shù)音質(zhì)音質(zhì)量化等級(jí)量化等級(jí)動(dòng)態(tài)范圍動(dòng)態(tài)范圍8 8位位電話電話25625648 db48 db1616位位cdcd65,53665,53696 db96 db2424位位dvddvd16,777,21616,777,216

27、144 db144 db3232位位頂級(jí)頂級(jí)4,294,967,2964,294,967,296192 db192 db第第2020頁頁/ /共共6868頁頁4.3.3 4.3.3 聲道聲道聲道個(gè)數(shù)是聲道個(gè)數(shù)是反映音頻數(shù)字化質(zhì)量的另一個(gè)因素。反映音頻數(shù)字化質(zhì)量的另一個(gè)因素。單聲道:?jiǎn)温暤溃翰杉曇魯?shù)據(jù)時(shí),僅采集一個(gè)聲波的數(shù)據(jù)采集聲音數(shù)據(jù)時(shí),僅采集一個(gè)聲波的數(shù)據(jù)雙聲道(立體聲)雙聲道(立體聲):采集兩個(gè)聲波數(shù)據(jù):采集兩個(gè)聲波數(shù)據(jù)多聲道(環(huán)繞立體聲)多聲道(環(huán)繞立體聲):采集兩個(gè)以上聲波數(shù)據(jù):采集兩個(gè)以上聲波數(shù)據(jù)聲道數(shù)越多,再現(xiàn)出的音響效果就越好。聲道數(shù)越多,再現(xiàn)出的音響效果就越好。第第2121頁

28、頁/ /共共6868頁頁4.3.4 4.3.4 音頻采樣的數(shù)據(jù)量音頻采樣的數(shù)據(jù)量數(shù)字音頻的數(shù)據(jù)量主要取決于兩個(gè)因素:數(shù)字音頻的數(shù)據(jù)量主要取決于兩個(gè)因素:u音質(zhì)因素音質(zhì)因素:由采樣頻率、量化位數(shù)和聲道數(shù):由采樣頻率、量化位數(shù)和聲道數(shù)3 3個(gè)個(gè)參數(shù)決定。參數(shù)決定。u時(shí)間因素:時(shí)間因素:?jiǎn)挝粫r(shí)間的數(shù)據(jù)量可用下式表示:?jiǎn)挝粫r(shí)間的數(shù)據(jù)量可用下式表示: fcbs8v= v= v v:為單位時(shí)間的數(shù)據(jù)量(:為單位時(shí)間的數(shù)據(jù)量(kbpskbps)fc:為采樣頻率(:為采樣頻率(khzkhz)b b:為量化位數(shù)(:為量化位數(shù)(bitbit)s s:為聲道數(shù):為聲道數(shù)4.3.5 4.3.5 音頻數(shù)據(jù)編碼音頻數(shù)據(jù)編

29、碼音頻數(shù)據(jù)壓縮方法分類音頻數(shù)據(jù)壓縮方法分類pcmpcm為脈沖調(diào)制編碼,為脈沖調(diào)制編碼,dpcmdpcm為差分脈沖調(diào)制編碼,為差分脈沖調(diào)制編碼,adpcmadpcm為自適應(yīng)差分脈沖調(diào)制編碼為自適應(yīng)差分脈沖調(diào)制編碼, ,vselpvselp為矢量和激勵(lì)線性預(yù)測(cè)編碼,為矢量和激勵(lì)線性預(yù)測(cè)編碼,mplpcmplpc為多脈沖激勵(lì)線性預(yù)測(cè)編碼,為多脈沖激勵(lì)線性預(yù)測(cè)編碼,celpcelp為碼本激勵(lì)線性預(yù)測(cè)編碼。為碼本激勵(lì)線性預(yù)測(cè)編碼。第第2323頁頁/ /共共6868頁頁4.3.6 4.3.6 音頻編碼標(biāo)準(zhǔn)音頻編碼標(biāo)準(zhǔn) 1 1、一般語音音質(zhì)的音頻壓縮標(biāo)準(zhǔn)、一般語音音質(zhì)的音頻壓縮標(biāo)準(zhǔn)u特點(diǎn):特點(diǎn):音質(zhì)低,能聽

30、到聲音就可以音質(zhì)低,能聽到聲音就可以u(píng)應(yīng)用:應(yīng)用:各類提示音各類提示音u壓縮標(biāo)準(zhǔn):壓縮標(biāo)準(zhǔn): ccitt a lawccitt a law ccitt law ccitt law 低采樣率或低量化位數(shù)的低采樣率或低量化位數(shù)的pcm pcm 第第2424頁頁/ /共共6868頁頁2 2、電話音質(zhì)的音頻壓縮標(biāo)準(zhǔn)、電話音質(zhì)的音頻壓縮標(biāo)準(zhǔn)u頻率范圍頻率范圍:300hz:300hz3.4khz3.4khz,用標(biāo)準(zhǔn)的,用標(biāo)準(zhǔn)的pcmpcm編碼。編碼。u壓縮標(biāo)準(zhǔn):壓縮標(biāo)準(zhǔn): g g系列音頻壓縮標(biāo)準(zhǔn)系列音頻壓縮標(biāo)準(zhǔn)ug g系列音頻壓縮標(biāo)準(zhǔn)利用的技術(shù)系列音頻壓縮標(biāo)準(zhǔn)利用的技術(shù): 線性預(yù)測(cè)技術(shù)線性預(yù)測(cè)技術(shù) 矢量量

31、化技術(shù)矢量量化技術(shù) 綜合分析技術(shù)綜合分析技術(shù)u典型的算法典型的算法: adpcmadpcm celp celp ld-celp ld-celp(短時(shí)延碼本激勵(lì)線性預(yù)測(cè)編碼)(短時(shí)延碼本激勵(lì)線性預(yù)測(cè)編碼) rpe-ltprpe-ltp(長時(shí)線性預(yù)測(cè)規(guī)則碼激勵(lì))(長時(shí)線性預(yù)測(cè)規(guī)則碼激勵(lì)) vselpvselp(矢量和激勵(lì)線性預(yù)測(cè)編碼)(矢量和激勵(lì)線性預(yù)測(cè)編碼)第第2525頁頁/ /共共6868頁頁標(biāo)準(zhǔn)標(biāo)準(zhǔn)參數(shù)說明參數(shù)說明g.711g.711pcmpcm編碼,采樣速率編碼,采樣速率8khz8khz,量化位數(shù),量化位數(shù)8bit8bit,比特流速率,比特流速率為為64kb/s64kb/s。使用非線性量化

32、技術(shù)。使用非線性量化技術(shù)g.721g.721adpcmadpcm編碼:每個(gè)數(shù)值差分用編碼:每個(gè)數(shù)值差分用4 4位編碼,采樣率為位編碼,采樣率為8khz8khz,比特流被轉(zhuǎn)換為比特流被轉(zhuǎn)換為32kbps32kbpsg.723g.723sb-adpcmsb-adpcm編碼(編碼(有損壓縮),比特流被轉(zhuǎn)換為有損壓縮),比特流被轉(zhuǎn)換為5.35.3 6.3kbps6.3kbps之間之間g.728g.728ld-celpld-celp編碼,比特流被轉(zhuǎn)換為編碼,比特流被轉(zhuǎn)換為16kbps16kbps,帶寬限于,帶寬限于3.4khz3.4khz;音質(zhì)與;音質(zhì)與g.721g.721標(biāo)準(zhǔn)相當(dāng)標(biāo)準(zhǔn)相當(dāng)表表4-6 4

33、-6 電話音質(zhì)的音頻編碼標(biāo)準(zhǔn)電話音質(zhì)的音頻編碼標(biāo)準(zhǔn)第第2626頁頁/ /共共6868頁頁3 3、 amam廣播音質(zhì)的音頻壓縮標(biāo)準(zhǔn)廣播音質(zhì)的音頻壓縮標(biāo)準(zhǔn)u頻率范圍頻率范圍:50hz:50hz7khz 7khz u壓縮標(biāo)準(zhǔn):壓縮標(biāo)準(zhǔn):ituitu制定的制定的g.722g.722標(biāo)準(zhǔn)標(biāo)準(zhǔn) ug.722g.722標(biāo)準(zhǔn)采用的算法:標(biāo)準(zhǔn)采用的算法:sb-adpcmsb-adpcm(子帶(子帶adpcmadpcm)usb-adpcmsb-adpcm算法:算法:將現(xiàn)有的帶寬分成兩個(gè)獨(dú)立的子帶將現(xiàn)有的帶寬分成兩個(gè)獨(dú)立的子帶信道,使輸入信號(hào)進(jìn)入濾波器組分成高子帶信號(hào)和低信道,使輸入信號(hào)進(jìn)入濾波器組分成高子帶信號(hào)和

34、低子帶信號(hào),然后分別進(jìn)行子帶信號(hào),然后分別進(jìn)行adpcmadpcm編碼,最后進(jìn)入混合器編碼,最后進(jìn)入混合器形成輸出碼流形成輸出碼流 第第2727頁頁/ /共共6868頁頁4 4、高保真立體聲音頻壓縮標(biāo)準(zhǔn)、高保真立體聲音頻壓縮標(biāo)準(zhǔn)u包括包括: :cd-dacd-da以上音質(zhì)、以上音質(zhì)、fmfm廣播音質(zhì)廣播音質(zhì)ufmfm廣播音質(zhì)頻率范圍廣播音質(zhì)頻率范圍: :20hz20hz15khz15khz ucd-dacd-da音頻信號(hào)的頻率范圍:音頻信號(hào)的頻率范圍:50hz50hz20khz20khz u壓縮標(biāo)準(zhǔn):壓縮標(biāo)準(zhǔn): 1 1)mpeg1mpeg1,mpeg2mpeg2的的layer1layer1、2

35、 2、3 3,mpeg 4 aacmpeg 4 aac音頻編碼,杜比音頻編碼,杜比ac-3ac-3等等。用于數(shù)字廣播、數(shù)字電視廣。用于數(shù)字廣播、數(shù)字電視廣播、消費(fèi)電子產(chǎn)品、音頻信息的存儲(chǔ)和下載等。播、消費(fèi)電子產(chǎn)品、音頻信息的存儲(chǔ)和下載等。 2 2)itu-t g.722.1itu-t g.722.1、3gpp amr-wb+3gpp amr-wb+和和3gpp 2 3gpp 2 4gv-wb 4gv-wb 。用于像用于像3g3g通信這樣的高音質(zhì)低碼率應(yīng)用場(chǎng)合。通信這樣的高音質(zhì)低碼率應(yīng)用場(chǎng)合。第第2828頁頁/ /共共6868頁頁4.4 4.4 音頻卡音頻卡 4.4.1 4.4.1 音頻卡的功能

36、音頻卡的功能u 錄制和播放數(shù)字聲音文件錄制和播放數(shù)字聲音文件u 控制音量和混音效果控制音量和混音效果u 聲音文件的壓縮與解壓縮聲音文件的壓縮與解壓縮u midimidi接口與音樂合成接口與音樂合成 第第2929頁頁/ /共共6868頁頁4.4.2 4.4.2 音頻卡的組成與工作原理音頻卡的組成與工作原理圖圖4-6 4-6 音頻卡的一般組成與結(jié)構(gòu)示意圖音頻卡的一般組成與結(jié)構(gòu)示意圖dspdsp音頻輸出音頻輸出放大器放大器麥克風(fēng)麥克風(fēng)micmic線路輸入線路輸入line inline in音樂合成器音樂合成器系統(tǒng)總系統(tǒng)總線接口線接口cdcd輸入輸入混合信號(hào)混合信號(hào)處理器處理器midimidi與游與游

37、戲接口戲接口系統(tǒng)總線系統(tǒng)總線放大器放大器第第3030頁頁/ /共共6868頁頁 音頻卡的主要功能部件音頻卡的主要功能部件:功率放大器、混合信號(hào)處理:功率放大器、混合信號(hào)處理器、器、dspdsp數(shù)字信號(hào)處理器、音樂合成器以及相關(guān)的外圍接口數(shù)字信號(hào)處理器、音樂合成器以及相關(guān)的外圍接口等。等。 聲音的合成與處理聲音的合成與處理:由:由dspdsp數(shù)字聲音處理器、音樂合成數(shù)字聲音處理器、音樂合成器及器及midimidi接口控制器組成接口控制器組成, ,主要任務(wù)是完成聲波信號(hào)的模主要任務(wù)是完成聲波信號(hào)的模/ /數(shù)、數(shù)數(shù)、數(shù)/ /模轉(zhuǎn)換,利用調(diào)頻技術(shù)控制聲音的音調(diào)、音色和幅模轉(zhuǎn)換,利用調(diào)頻技術(shù)控制聲音的音

38、調(diào)、音色和幅度。度。 混合信號(hào)處理器及功率放大器混合信號(hào)處理器及功率放大器:內(nèi)置數(shù)字:內(nèi)置數(shù)字/ /模擬混音器,模擬混音器,混音器的聲源可以是混音器的聲源可以是midimidi信號(hào)、信號(hào)、cdcd音頻、線性輸入、話筒音頻、線性輸入、話筒以及以及pcpc機(jī)的揚(yáng)聲器等,可以選擇輸入一個(gè)聲源或?qū)讉€(gè)不機(jī)的揚(yáng)聲器等,可以選擇輸入一個(gè)聲源或?qū)讉€(gè)不同聲源進(jìn)行混合錄音。同聲源進(jìn)行混合錄音。 4.4.3 4.4.3 音頻卡的音頻卡的i/oi/o接口接口圖圖4-7 音頻卡的外圍接口連接示意圖音頻卡的外圍接口連接示意圖第第3232頁頁/ /共共6868頁頁4.4.3 4.4.3 音頻卡的音頻卡的i/oi/o接口

39、接口圖圖4-8 支持支持5.1環(huán)繞的聲卡插口環(huán)繞的聲卡插口第第3333頁頁/ /共共6868頁頁4.5 4.5 數(shù)字音頻的采集與編輯數(shù)字音頻的采集與編輯 一般的數(shù)字音頻采集首先需要選擇和設(shè)置恰當(dāng)?shù)牟蓸訁⒁话愕臄?shù)字音頻采集首先需要選擇和設(shè)置恰當(dāng)?shù)牟蓸訁?shù),然后再開始錄音采集,最后再使用相應(yīng)的編輯軟件對(duì)錄數(shù),然后再開始錄音采集,最后再使用相應(yīng)的編輯軟件對(duì)錄制的音頻數(shù)據(jù)進(jìn)行剪輯和效果處理。制的音頻數(shù)據(jù)進(jìn)行剪輯和效果處理。 4.5.1 4.5.1 錄音采集錄音采集u 選擇采樣參數(shù)選擇采樣參數(shù)u 調(diào)整輸入音頻的頻響調(diào)整輸入音頻的頻響u 檢測(cè)輸入音頻的強(qiáng)度檢測(cè)輸入音頻的強(qiáng)度 u 開始錄音開始錄音第第343

40、4頁頁/ /共共6868頁頁圖圖4-9 4-9 設(shè)置錄音參數(shù)設(shè)置錄音參數(shù)1 1、選擇采樣參數(shù)、選擇采樣參數(shù) 首先要根據(jù)實(shí)際情況選擇最佳的采樣參數(shù),做到音質(zhì)與首先要根據(jù)實(shí)際情況選擇最佳的采樣參數(shù),做到音質(zhì)與數(shù)據(jù)量的折中考慮,避免采樣過程中出現(xiàn)存儲(chǔ)空間不足的現(xiàn)數(shù)據(jù)量的折中考慮,避免采樣過程中出現(xiàn)存儲(chǔ)空間不足的現(xiàn)象發(fā)生。象發(fā)生。 cdcd音質(zhì)、音質(zhì)、電話質(zhì)量電話質(zhì)量收音質(zhì)量收音質(zhì)量default quality default quality 第第3535頁頁/ /共共6868頁頁2 2調(diào)整輸入音頻的頻響調(diào)整輸入音頻的頻響 表表4-7 各頻段參數(shù)對(duì)音質(zhì)的影響各頻段參數(shù)對(duì)音質(zhì)的影響頻段頻段頻率范圍頻率

41、范圍音質(zhì)影響音質(zhì)影響低頻低頻20206060hzhz空間感。提升低頻共振(嗡),降落空虛;空間感。提升低頻共振(嗡),降落空虛;6060100100hzhz渾厚感。提升轟鳴渾厚感。提升轟鳴( (轟轟) ),降落無力;,降落無力;100100150hz150hz豐滿度。提升渾濁、降落單??;豐滿度。提升渾濁、降落單??;中頻低段中頻低段150150300300hzhz聲音力度、男聲力度。提升聲音硬、無特色,降落軟、飄;聲音力度、男聲力度。提升聲音硬、無特色,降落軟、飄;中頻中頻300300500500hzhz語音主要音區(qū),提升語音單調(diào)、降落語音空洞;語音主要音區(qū),提升語音單調(diào)、降落語音空洞;5005

42、001k1khzhz人聲基音、聲音廓,提升語音前凸、降落語音收縮感;人聲基音、聲音廓,提升語音前凸、降落語音收縮感; 1k1k2k2khzhz通透感、順暢感,提升有跳躍感、降落通透感、順暢感,提升有跳躍感、降落 松散;松散; 中頻上段中頻上段2k2k3k3khzhz對(duì)明亮度最敏感,提升聲音硬,不自然;對(duì)明亮度最敏感,提升聲音硬,不自然;3k3k4k4khzhz穿透力,提升穿透力,提升 咳音;咳音;4k4k5k5khzhz樂器表面響度,提升樂器距離近、降落樂器表面響度,提升樂器距離近、降落 樂器距離遠(yuǎn);樂器距離遠(yuǎn);高頻高頻5k5k6k6khzhz語言的清晰度,提升聲音鋒利、易疲勞;語言的清晰度,

43、提升聲音鋒利、易疲勞;6k6k8k8khzhz明亮度、透明度,明亮度、透明度, 提升齒音重、降落提升齒音重、降落 聲音黯淡;聲音黯淡;8k8k10k10khzhzs s音,影響音色的清晰度和透明度;音,影響音色的清晰度和透明度;第第3636頁頁/ /共共6868頁頁3 3、檢測(cè)輸入音頻的強(qiáng)度、檢測(cè)輸入音頻的強(qiáng)度 在在win2kwin2k環(huán)境下,可通過環(huán)境下,可通過“音量控制音量控制”對(duì)話框來檢測(cè)、調(diào)對(duì)話框來檢測(cè)、調(diào)節(jié)進(jìn)入計(jì)算機(jī)的音源強(qiáng)度。節(jié)進(jìn)入計(jì)算機(jī)的音源強(qiáng)度。 打開打開windowswindows下的音量控制臺(tái),選擇菜單欄中的下的音量控制臺(tái),選擇菜單欄中的“選選項(xiàng)項(xiàng)”“屬性屬性”命令打開命令

44、打開“屬性屬性”對(duì)話框。對(duì)話框。 圖圖4-10 4-10 音量控制臺(tái)音量控制臺(tái)第第3737頁頁/ /共共6868頁頁 在在“屬性屬性“對(duì)話框中的音量調(diào)節(jié)選項(xiàng)中選擇對(duì)話框中的音量調(diào)節(jié)選項(xiàng)中選擇“錄錄音音”,在顯示音量控制欄中選中麥克風(fēng)等選項(xiàng),如圖,在顯示音量控制欄中選中麥克風(fēng)等選項(xiàng),如圖4-114-11所所示。示。 在彈出的錄音控制臺(tái)中選中麥克風(fēng)或線路輸入或在彈出的錄音控制臺(tái)中選中麥克風(fēng)或線路輸入或cdcd音頻,使相應(yīng)的音源有效,如圖音頻,使相應(yīng)的音源有效,如圖4-124-12所示。所示。 圖圖4-11 “屬性屬性”對(duì)話框?qū)υ捒?圖圖4-12 錄音控制對(duì)話框錄音控制對(duì)話框第第3838頁頁/ /共

45、共6868頁頁4 4、開始錄音、開始錄音圖圖4-11 錄音機(jī)操作面板錄音機(jī)操作面板第第3939頁頁/ /共共6868頁頁4.5.2 4.5.2 抓取抓取cdcd、vcdvcd和和dvddvd音軌音軌 獲取數(shù)字音頻的另一個(gè)快捷途徑就是從不同的多媒體產(chǎn)品獲取數(shù)字音頻的另一個(gè)快捷途徑就是從不同的多媒體產(chǎn)品中直接抓取音軌信息,并轉(zhuǎn)換壓縮成所需的音頻格式。中直接抓取音軌信息,并轉(zhuǎn)換壓縮成所需的音頻格式。 wavelab 5.0版版 :抓取音樂抓取音樂cd、dvd中的音軌中的音軌 “豪杰超級(jí)解霸豪杰超級(jí)解霸”軟件軟件:抓取音樂:抓取音樂cd、vcd或或dvd光盤等光盤等格式音軌格式音軌 豪杰超級(jí)解霸豪杰超

46、級(jí)解霸9.0版版 :可從:可從dvd、vcd、rm/rmvb、avi、mpg、mv等音視頻混合的媒體中提取音頻信息,并保存為一種等音視頻混合的媒體中提取音頻信息,并保存為一種稱為稱為dac高音質(zhì)壓縮格式或高音質(zhì)壓縮格式或wav、mp3格式的聲音文件格式的聲音文件 注意:在使用抓取音軌來采集數(shù)字音頻時(shí),應(yīng)該遵守有關(guān)注意:在使用抓取音軌來采集數(shù)字音頻時(shí),應(yīng)該遵守有關(guān)法律規(guī)定,取得相應(yīng)的使用權(quán),避免以后出現(xiàn)知識(shí)產(chǎn)權(quán)糾紛。法律規(guī)定,取得相應(yīng)的使用權(quán),避免以后出現(xiàn)知識(shí)產(chǎn)權(quán)糾紛。 第第4040頁頁/ /共共6868頁頁4.5.3 4.5.3 編輯數(shù)字音頻編輯數(shù)字音頻 音頻編輯一般包括音頻編輯一般包括音頻內(nèi)

47、容剪切音頻內(nèi)容剪切、合成合成以及以及音質(zhì)和效音質(zhì)和效果的編輯果的編輯等方面。等方面。 多音軌(多音軌(multiple tracksmultiple tracks) 切邊(切邊(trimmingtrimming) 拼接和組合(拼接和組合(splicing and assemblysplicing and assembly) 音量調(diào)節(jié)(音量調(diào)節(jié)(volume adjustmentsvolume adjustments) 格式轉(zhuǎn)換(格式轉(zhuǎn)換(format conversionformat conversion) 重采樣或降低采樣率(重采樣或降低采樣率(resampling or down samp

48、lingresampling or down sampling) 淡進(jìn)淡出(淡進(jìn)淡出(fade-ins and fade-outsfade-ins and fade-outs) 均衡(均衡(equalizationequalization) 時(shí)間拉伸(時(shí)間拉伸(time stretchingtime stretching) 數(shù)字信號(hào)處理(數(shù)字信號(hào)處理(digital signal processing-dspdigital signal processing-dsp)第第4141頁頁/ /共共6868頁頁4.6 midi4.6 midi音樂音樂4.6.1 4.6.1 什么是什么是midimid

49、i midi midi(musical instrument digital interfacemusical instrument digital interface)樂器數(shù))樂器數(shù)字接口字接口。它是由。它是由yamahayamaha、rolandroland等公司在等公司在19831983年聯(lián)合提出并不年聯(lián)合提出并不斷發(fā)展確定的數(shù)字音樂的國際標(biāo)準(zhǔn),它規(guī)定了電子樂器和多媒斷發(fā)展確定的數(shù)字音樂的國際標(biāo)準(zhǔn),它規(guī)定了電子樂器和多媒體計(jì)算機(jī)之間進(jìn)行連接的硬件及數(shù)據(jù)通信協(xié)議,是多媒體計(jì)算體計(jì)算機(jī)之間進(jìn)行連接的硬件及數(shù)據(jù)通信協(xié)議,是多媒體計(jì)算機(jī)所支持的又一種聲音產(chǎn)生方法機(jī)所支持的又一種聲音產(chǎn)生方法mid

50、imidi方法。方法。 midimidi方法方法就是將數(shù)字式電子樂器的彈奏過程記錄下來,如就是將數(shù)字式電子樂器的彈奏過程記錄下來,如選的是什么樂器,彈下哪一個(gè)鍵,用了多大力氣,持續(xù)了多長選的是什么樂器,彈下哪一個(gè)鍵,用了多大力氣,持續(xù)了多長時(shí)間等。時(shí)間等。 midimidi格式的數(shù)字化文件格式的數(shù)字化文件可以看作是樂譜的數(shù)字化描述,它可以看作是樂譜的數(shù)字化描述,它記錄的不再是聲音的波形,而是樂器的種類以及音階的高低、記錄的不再是聲音的波形,而是樂器的種類以及音階的高低、長短、強(qiáng)弱、速度等因素,這些被稱為長短、強(qiáng)弱、速度等因素,這些被稱為midimidi消息,存儲(chǔ)為消息,存儲(chǔ)為midimidi文

51、件。文件。 第第4242頁頁/ /共共6868頁頁4.6.2 midi4.6.2 midi設(shè)備的配置與連接設(shè)備的配置與連接 一件樂器只要包含了能處理一件樂器只要包含了能處理midimidi信息的微處理器以及信息的微處理器以及相關(guān)的硬件接口,就可以認(rèn)為是一臺(tái)相關(guān)的硬件接口,就可以認(rèn)為是一臺(tái)midimidi設(shè)備設(shè)備。 兩臺(tái)兩臺(tái)midimidi設(shè)備之間可以通過設(shè)備之間可以通過接口發(fā)送信息接口發(fā)送信息而進(jìn)行相互而進(jìn)行相互通信。通信。 一臺(tái)一臺(tái)midimidi設(shè)備可以有設(shè)備可以有1 13 3個(gè)端口個(gè)端口:umidi in midi in 接口接口:接收來自其它:接收來自其它midimidi設(shè)備上的設(shè)備上

52、的midimidi信息;信息;umidi outmidi out接口接口:用來輸出本設(shè)備生成的:用來輸出本設(shè)備生成的midimidi信息;信息;u midi thrumidi thru接口:接口:將從將從midi inmidi in端口傳來的信息發(fā)送到另端口傳來的信息發(fā)送到另一臺(tái)相聯(lián)的一臺(tái)相聯(lián)的midimidi設(shè)備上。設(shè)備上。第第4343頁頁/ /共共6868頁頁 接收設(shè)備的接收設(shè)備的midi inmidi in連接器內(nèi)常采用連接器內(nèi)常采用光電耦合器光電耦合器實(shí)現(xiàn)收、發(fā)實(shí)現(xiàn)收、發(fā)設(shè)備之間的電氣隔離。設(shè)備之間的電氣隔離。 midimidi信息采用信息采用異步串行方式傳輸異步串行方式傳輸,傳輸速率

53、為,傳輸速率為31.2531.25 kbpskbps。 在進(jìn)行在進(jìn)行midimidi通信時(shí),用戶可以通過標(biāo)準(zhǔn)的通信時(shí),用戶可以通過標(biāo)準(zhǔn)的midimidi電纜電纜來相互連來相互連接各端口。如圖接各端口。如圖4-144-14所示。所示。圖圖4-14 midi4-14 midi與游戲接口電纜與游戲接口電纜midimidi接口接口游戲接口游戲接口inin和和outout第第4444頁頁/ /共共6868頁頁圖圖4-14 4-14 多媒體計(jì)算機(jī)與多媒體計(jì)算機(jī)與midimidi設(shè)備連接示意圖設(shè)備連接示意圖 midimidi軟件軟件(音(音序器)是用于記錄、序器)是用于記錄、編輯和播放編輯和播放midimi

54、di文文件的一種軟件,其件的一種軟件,其作用相當(dāng)于是作用相當(dāng)于是midimidi樂器的一臺(tái)多軌磁樂器的一臺(tái)多軌磁帶錄音機(jī)。帶錄音機(jī)。 midi midi設(shè)備可以配備設(shè)備可以配備電子鍵盤、合成器、音序器(電子鍵盤、合成器、音序器(midimidi軟軟件)以及揚(yáng)聲器或音箱件)以及揚(yáng)聲器或音箱等。等。 midimidi鍵盤鍵盤主要用于產(chǎn)生主要用于產(chǎn)生midimidi信息信息 midimidi合成器合成器是一種電子設(shè)備,使用數(shù)字信號(hào)處理器或其是一種電子設(shè)備,使用數(shù)字信號(hào)處理器或其他類型的芯片產(chǎn)生音樂或聲音。他類型的芯片產(chǎn)生音樂或聲音。 第第4545頁頁/ /共共6868頁頁4.6.3 4.6.3 播放

55、播放midimidi音樂音樂 聲卡播放聲卡播放midimidi音樂最常用的方法有兩種:音樂最常用的方法有兩種:fmfm合成合成與與波波表(表(wavetablewavetable)合成)合成。 fmfm是運(yùn)用聲音振蕩的原理對(duì)是運(yùn)用聲音振蕩的原理對(duì)midimidi進(jìn)行合成處理的。進(jìn)行合成處理的。 波表合成波表合成,效果較好。它是將各種真實(shí)樂器所能發(fā)出,效果較好。它是將各種真實(shí)樂器所能發(fā)出的所有聲音的所有聲音( (包括各個(gè)音域、聲調(diào)包括各個(gè)音域、聲調(diào)) )錄制下來,存儲(chǔ)在聲卡錄制下來,存儲(chǔ)在聲卡的的romrom中,稱為硬波表。中,稱為硬波表。第第4646頁頁/ /共共6868頁頁4.6.4 4.6

56、.4 制作制作midimidi音樂音樂 制作制作midimidi音樂,需要按音樂,需要按圖圖4-144-14的示意構(gòu)成系統(tǒng)。的示意構(gòu)成系統(tǒng)。 樂譜創(chuàng)作軟件樂譜創(chuàng)作軟件能夠能夠錄制、編輯、打印錄制、編輯、打印midimidi樂譜樂譜并并播放播放midimidi音樂音樂。有些樂譜創(chuàng)作軟件還能對(duì)。有些樂譜創(chuàng)作軟件還能對(duì)樂譜進(jìn)行量化來調(diào)節(jié)節(jié)拍的不樂譜進(jìn)行量化來調(diào)節(jié)節(jié)拍的不一致問題。一致問題。 midimidi編輯編輯中很重要的是中很重要的是選擇選擇midimidi樂器樂器,midimidi標(biāo)準(zhǔn)標(biāo)準(zhǔn)規(guī)定了不規(guī)定了不同的演奏樂器并用編號(hào)加以區(qū)分,范圍在同的演奏樂器并用編號(hào)加以區(qū)分,范圍在0 0127127

57、之間,之間,見附錄見附錄三。三。 在在midimidi樂譜中,樂譜中,樂器樂器idid用來決定以何種樂器來播放樂曲,用來決定以何種樂器來播放樂曲,為改變樂器,只需改變?cè)摂?shù)值即可。為改變樂器,只需改變?cè)摂?shù)值即可。 midimidi是為多媒體項(xiàng)目創(chuàng)建原始音樂素材的最佳途徑。準(zhǔn)備是為多媒體項(xiàng)目創(chuàng)建原始音樂素材的最佳途徑。準(zhǔn)備發(fā)布時(shí)應(yīng)將其轉(zhuǎn)換成數(shù)字音頻數(shù)據(jù)。發(fā)布時(shí)應(yīng)將其轉(zhuǎn)換成數(shù)字音頻數(shù)據(jù)。 創(chuàng)作創(chuàng)作midimidi樂譜的軟件樂譜的軟件:cakewalkcakewalk(cakewalk 9.0 xcakewalk 9.0 x版)版)第第4747頁頁/ /共共6868頁頁4.6.5 4.6.5 樂譜的掃

58、描與識(shí)別樂譜的掃描與識(shí)別 除了通過除了通過midimidi方法創(chuàng)作樂譜方法創(chuàng)作樂譜(midimidi音樂)以外,還可以利音樂)以外,還可以利用用掃描掃描- -識(shí)別技術(shù)識(shí)別技術(shù),快速將印刷樂譜數(shù)字化,保存為,快速將印刷樂譜數(shù)字化,保存為midimidi樂譜。樂譜。 smartscoresmartscore軟件掃描識(shí)別過程:軟件掃描識(shí)別過程: 首先,通過掃描儀將樂譜以圖像的方式掃描成數(shù)字圖像首先,通過掃描儀將樂譜以圖像的方式掃描成數(shù)字圖像, ,掃描參數(shù)的選擇與設(shè)置掃描參數(shù)的選擇與設(shè)置: :u 分辨率分辨率: :一般選擇一般選擇150150300300 dpidpi,u 圖像類型圖像類型: :黑白二

59、值或黑白二值或ocrocr,u 掃描后的掃描后的圖片存儲(chǔ)格式圖片存儲(chǔ)格式:tif:tif格式格式; 然后,通過樂譜識(shí)別功能識(shí)別出可編輯的數(shù)字樂譜并進(jìn)行然后,通過樂譜識(shí)別功能識(shí)別出可編輯的數(shù)字樂譜并進(jìn)行校對(duì)、編輯。校對(duì)、編輯。第第4848頁頁/ /共共6868頁頁識(shí)別后的樂譜識(shí)別后的樂譜識(shí)別前的樂譜圖片識(shí)別前的樂譜圖片圖圖4-16 smartscore4-16 smartscore軟件的樂譜識(shí)別畫面軟件的樂譜識(shí)別畫面 smartscoresmartscore也可以打開事先存儲(chǔ)好的樂譜圖片并進(jìn)行也可以打開事先存儲(chǔ)好的樂譜圖片并進(jìn)行識(shí)別,識(shí)別完成后會(huì)提示將識(shí)別的結(jié)果保存為識(shí)別,識(shí)別完成后會(huì)提示將識(shí)別

60、的結(jié)果保存為smartscoresmartscore專專用格式的用格式的.enf.enf文件。文件。 第第4949頁頁/ /共共6868頁頁4.6.6 midi4.6.6 midi與數(shù)字音頻的比較與數(shù)字音頻的比較 midimidi數(shù)字音頻數(shù)字音頻是樂譜是樂譜是一段錄音是一段錄音取決于音樂設(shè)備的質(zhì)量和音響取決于音樂設(shè)備的質(zhì)量和音響系統(tǒng)的性能系統(tǒng)的性能取決于音響系統(tǒng)的性能取決于音響系統(tǒng)的性能文件小文件小數(shù)字化波形文件大數(shù)字化波形文件大與設(shè)備有關(guān)與設(shè)備有關(guān)與播放設(shè)備無關(guān)與播放設(shè)備無關(guān)依賴于特定的回放設(shè)備依賴于特定的回放設(shè)備與回放的設(shè)備關(guān)系不大,與回放的設(shè)備關(guān)系不大,播放效果幾乎一樣。播放效果幾乎一樣

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論