音頻技術(shù)基礎(chǔ)_第1頁
音頻技術(shù)基礎(chǔ)_第2頁
音頻技術(shù)基礎(chǔ)_第3頁
音頻技術(shù)基礎(chǔ)_第4頁
音頻技術(shù)基礎(chǔ)_第5頁
已閱讀5頁,還剩93頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

音頻技術(shù)基礎(chǔ)

人類從外界獲得的信息大約有16%是從耳朵得到的。在多媒體技術(shù)中,音頻信息占有很重要的地位,比如在視頻會(huì)議系統(tǒng)中,音頻信息的優(yōu)先級最高。了解音頻信息的相關(guān)知識對更進(jìn)一步掌握多媒體技術(shù)是很重要的。第2頁,共98頁,2024年2月25日,星期天一切能發(fā)出聲音的物體稱為聲源。聲音是由于聲源的振動(dòng)而產(chǎn)生的,由于聲源的振動(dòng),借助于它們周圍的介質(zhì),把這種振動(dòng)以機(jī)械波的形式由近及遠(yuǎn)地傳向遠(yuǎn)方,這就是聲波。聲波傳入人耳,致使耳膜也產(chǎn)生振動(dòng),這種振動(dòng)被傳導(dǎo)到聽覺神經(jīng),人們就產(chǎn)生了“聲音”的感覺。我們?nèi)粘B牭降穆曇羰且环N模擬信號.聲學(xué)基礎(chǔ)知識●聲音定義聲音是振動(dòng)波,具有振幅、周期和頻率.●聲音的質(zhì)量簡稱音質(zhì)。音質(zhì)與頻率范圍成正比,頻率范圍越寬音質(zhì)越好.聲音具有連續(xù)性和過程性,數(shù)據(jù)前后相關(guān),數(shù)據(jù)量大,具有實(shí)時(shí)性.●聲音的連續(xù)時(shí)基性●聲音三要素(1)音調(diào)—(高低)(2)音強(qiáng)—(強(qiáng)弱)(3)音色—(特質(zhì))第3頁,共98頁,2024年2月25日,星期天聲音的三要素音調(diào):(高低)與聲音的頻率有關(guān),頻率快則聲音高,頻率慢則聲音低。音強(qiáng):(強(qiáng)弱)又稱響度,取決于聲音的振幅,也即振幅的大小和強(qiáng)弱。音色:(特質(zhì))由混入基音的諧音決定。每個(gè)基音都有其固定頻率,和不同音強(qiáng)的諧音混合,使得每個(gè)聲音具有特殊的音色效果。第4頁,共98頁,2024年2月25日,星期天聲音的頻率范圍第5頁,共98頁,2024年2月25日,星期天模擬波信號有三個(gè)要素:基線、周期和振幅。振幅即波形的最高點(diǎn)(或最低點(diǎn))與基線間的距離,它表示了聲音音量的大小。周期是波形中兩個(gè)相鄰波峰之間的距離,它表示完成一次振動(dòng)過程所需的時(shí)間,其大小體現(xiàn)了振動(dòng)的速度。頻率是周期的倒數(shù),周期越短,頻率越高。頻率的單位為赫茲(Hz)。人的耳朵只能感覺到振動(dòng)頻率在20Hz到20000Hz之間的聲波,超出此范圍的振動(dòng)波不能引起聽覺器官的感覺。其中,人耳對400-4000HZ的聲波最敏感。

次聲波人耳可聽域超聲波<20Hz20~20,000Hz>20,000Hz女性語音150Hz~10,000Hz電話語音200Hz~3,400Hz調(diào)幅廣播(AM)50Hz~7,000Hz調(diào)頻廣播(FM)20Hz~15,000Hz高級音響10Hz~40,000Hz男性語音100Hz~9,000Hz聲源種類頻帶寬度第6頁,共98頁,2024年2月25日,星期天頻帶寬度

聲音質(zhì)量等級與信號帶寬的關(guān)系電話AM廣播FM廣播CD-DA1020502003.4K7K15K22Kf(Hz)第7頁,共98頁,2024年2月25日,星期天音頻信號特性分析●時(shí)域特性起始——穩(wěn)定——結(jié)束●頻域特性聲音信號由正弦分量組成——周期、非周期頻譜分析——線狀譜、連續(xù)譜聲音信號的描述——聲波頻率、聲壓、聲強(qiáng)人耳對聲音的感覺通過聲壓或聲壓級描述——非線性聽閾(1kHz):2×10-5Pa——

0dB痛閾:20Pa——

120dB第8頁,共98頁,2024年2月25日,星期天聲音的強(qiáng)度在1kHz頻率的正弦波中,能被人耳察覺的最弱聲壓大約是2Х10-5Pa,這個(gè)最弱音已經(jīng)作為國際標(biāo)準(zhǔn)的參照聲。描述聲音強(qiáng)度的量值是采用分貝表示:分貝是指兩個(gè)相同的物理量(例A1和A0)之比,取以10為底的對數(shù)并乘以10(或20)。N=10*lg(A1/A0)分貝符號為“dB”。N是被量度量的“級”,也被稱為聲壓級。A1是被量度量。A0是基準(zhǔn)量,第9頁,共98頁,2024年2月25日,星期天如果2Х10-5Pa被看作0dB(聲壓級)那么在特別安靜的環(huán)境中,單獨(dú)檢測:動(dòng)物的呼吸聲大約20dB人們正常的談話聲約60dB汽車的喇叭聲約100dB飛機(jī)起飛的聲音約120dB120dB以上的強(qiáng)度可使人產(chǎn)生痛苦的感覺。第10頁,共98頁,2024年2月25日,星期天人耳聽覺特性●人耳對聲音強(qiáng)弱的感覺特性人耳對聲音強(qiáng)弱的感覺不與聲壓成正比,而與聲壓級成正比。安靜的環(huán)境和嘈雜的環(huán)境中人耳可以分辨的聲音不同。掩蔽:一個(gè)頻率聲音的聽閾由于另一個(gè)聲音的存在而上升的現(xiàn)象。掩蔽效應(yīng):復(fù)合聲音信號中,響度較低的聲音頻率分量被高者淹沒。響度是聽覺判斷聲音強(qiáng)弱的屬性——主觀,響度與聲壓級有一定關(guān)系:聲壓級每增加10dB,響度增加1倍?!耥懚群晚懚燃墶袢硕犛X的掩蔽效應(yīng)第11頁,共98頁,2024年2月25日,星期天●聲音質(zhì)量評價(jià)◆我們經(jīng)常會(huì)對某一位歌手的歌聲發(fā)表意見,并與其他歌手進(jìn)行比較,這其實(shí)是在對聲音的質(zhì)量進(jìn)行評價(jià)?!袈曇糍|(zhì)量的度量有兩種基本方法:客觀質(zhì)量度量、主觀質(zhì)量的度量。

聲波的測量與分析傳統(tǒng)的方法是先用機(jī)電換能器把聲波轉(zhuǎn)換為相應(yīng)的電信號,然后用電子儀表放大到一定的電壓級進(jìn)行測量與分析。由于計(jì)算技術(shù)的發(fā)展,使許多計(jì)算和測量工作都使用了計(jì)算機(jī)或程序?qū)崿F(xiàn)。這些帶計(jì)算機(jī)處理系統(tǒng)的高級聲學(xué)測量儀器,能完成下列一些測量工作:●評價(jià)值的測量——響度和響度級,噪音級,清晰度指數(shù),噪音評價(jià)數(shù)?!衤曉吹臏y量——頻譜的時(shí)間變化,聲功率,指向性,效率,頻譜特征,幅值分布等?!褚糍|(zhì)的測量——混響時(shí)間,隔音量,吸音量。

●聲音客觀質(zhì)量的度量方法第12頁,共98頁,2024年2月25日,星期天聲測量的基本儀器是聲級計(jì)。聲級計(jì)是一種能對聲音作出類似人耳的反應(yīng)的儀器,同時(shí),它能進(jìn)行客觀而可重復(fù)的聲壓和聲級測量。聲壓測量的好處很多:它能幫助音樂廳提高音響效果;能對煩擾聲音進(jìn)行精密的、科學(xué)的分析。聲級測量還能明確地告訴我們什么聲音會(huì)引起聽力損害,并提醒人們采用適當(dāng)?shù)穆犃ΡWo(hù)措施。因此,聲測量是不可少的。度量聲音客觀質(zhì)量的一個(gè)主要指標(biāo)是信噪比SNR(SignaltoNoiseRation)。其單位是分貝(dB)。第13頁,共98頁,2024年2月25日,星期天●聲音主觀質(zhì)量的度量

采用客觀標(biāo)準(zhǔn)方法很難真正評定某種編碼器的質(zhì)量,在實(shí)際評價(jià)中,主觀的質(zhì)量度量比客觀質(zhì)量的度量更為恰當(dāng)和合理。通常是對某編碼器的輸出的聲音質(zhì)量進(jìn)行評價(jià),例如播放一段音樂,記錄一段話,然后重放給實(shí)驗(yàn)者聽,再由實(shí)驗(yàn)者進(jìn)行綜合評定。可以說,人的感覺機(jī)理最具有決定意義。當(dāng)然,可靠的主觀度量值是較難獲得的。第14頁,共98頁,2024年2月25日,星期天

平均判分(MeanOpinionScore-MOS)過程是召集一批實(shí)驗(yàn)者,請每個(gè)實(shí)驗(yàn)者對某個(gè)編解碼器的輸出進(jìn)行質(zhì)量判分,采用類似于考試的五級分制,不同的MOS分對應(yīng)的質(zhì)量級別和失真級別見下表?!衤曇糁饔^質(zhì)量的度量方法MOS質(zhì)量級別失真級別5優(yōu)(Excellent)不察覺4良(Good)剛察覺但不可厭3中(Fair)察覺及稍微可厭2差(Poor)可厭(但不令人反感)1劣(Unacceptable)極可厭(令人反感)第15頁,共98頁,2024年2月25日,星期天數(shù)字化聲音用聲音錄制軟件記錄的英文單詞“Hello”的語音實(shí)際波形第16頁,共98頁,2024年2月25日,星期天模擬信號很容易受到電子干擾,因此隨著技術(shù)的發(fā)展,聲音信號就逐漸過渡到了數(shù)字存儲(chǔ)階段,A/D轉(zhuǎn)換和D/A轉(zhuǎn)換技術(shù)便應(yīng)運(yùn)而生。A:“Analog”(類比、模擬)D:“Digital”(數(shù)字、數(shù)碼)A/D轉(zhuǎn)換就是把模擬信號轉(zhuǎn)換成數(shù)字信號的過程,模擬電信號變?yōu)榱擞伞?”和“1”組成的Bit信號。這樣做的好處是顯而易見的,聲音存儲(chǔ)質(zhì)量得到了加強(qiáng),數(shù)字化的聲音信息使計(jì)算機(jī)能夠進(jìn)行識別、處理和壓縮,這也就是為什么如今磁帶逐漸被淘汰,CD唱片卻趨于流行的原因。

A/D轉(zhuǎn)換的一個(gè)關(guān)鍵步驟是聲音的采樣和量化,得到數(shù)字音頻信號,它在時(shí)間上是不連續(xù)的離散信號。第17頁,共98頁,2024年2月25日,星期天借助于A/D或D/A轉(zhuǎn)換器,模擬信號和數(shù)字信號可以互相轉(zhuǎn)換

8位可編程A/D轉(zhuǎn)換芯片第18頁,共98頁,2024年2月25日,星期天●

聲音采樣——聲音數(shù)字化(模/數(shù)轉(zhuǎn)換)聲音采樣1101110011001101把聲音(模擬量)按照固定時(shí)間間隔,轉(zhuǎn)換成有限個(gè)數(shù)字表示的離散序列●

聲音重放——聲音模擬化(數(shù)/模轉(zhuǎn)換)聲音重放11011100把數(shù)字化聲音轉(zhuǎn)換成模擬量,經(jīng)過音響單元重放出來●

設(shè)備和軟件(1)聲音適配器(聲卡)8bit、16bit、…128bit¥80.00~3800.00(2)聲卡驅(qū)動(dòng)軟件以及各種聲音處理軟件人耳聽到的聲音是一種具有振幅、周期(頻率)的聲波,計(jì)算機(jī)要處理這種聲波,可以通過話筒把機(jī)械振動(dòng)轉(zhuǎn)變成相應(yīng)的電信號,這也是一種連續(xù)的模擬信號。模擬信號的幅度,表示聲音的強(qiáng)弱。計(jì)算機(jī)只能處理數(shù)字量,不能處理這種模擬量,只有把這種模擬量轉(zhuǎn)換成數(shù)字量,計(jì)算機(jī)才有可能處理聲音,這種轉(zhuǎn)換就是模/數(shù)轉(zhuǎn)換(A/D轉(zhuǎn)換),它是由模/數(shù)轉(zhuǎn)換電路實(shí)現(xiàn)的。聲音經(jīng)A/D轉(zhuǎn)換后得到的數(shù)字聲音信號交給計(jì)算機(jī)處理,處理后的數(shù)據(jù)需經(jīng)過數(shù)/模(D/A)轉(zhuǎn)換電路,還原成模擬信號,再進(jìn)行放大輸出到喇叭或耳機(jī),變成人耳能夠聽到的聲音。第19頁,共98頁,2024年2月25日,星期天從模擬到數(shù)字聲源聲波傳聲器模擬電信號數(shù)字聲音第20頁,共98頁,2024年2月25日,星期天聲音的數(shù)字化原理模擬聲音信號是個(gè)連續(xù)量,可能由許多具有不同振幅和頻率的正弦波組成。計(jì)算機(jī)獲取實(shí)際聲音信號的過程就是聲音的數(shù)字化的處理過程。右圖表示了模擬聲音數(shù)字化的三個(gè)步驟:采樣、量化和編碼。第21頁,共98頁,2024年2月25日,星期天數(shù)字音頻的處理●采樣(Sampling)

、采樣頻率采樣是將連續(xù)變化的模擬音頻信號變成計(jì)算機(jī)能處理的離散化數(shù)字信號的第一步。每隔一定時(shí)間,對模擬音頻信號的幅值進(jìn)行采樣測試,得到離散的幅值,并用該值表示兩次采樣之間的模擬幅值。單位時(shí)間采樣的次數(shù)稱為采樣頻率。采樣頻率越高,所得到的離散幅值的數(shù)據(jù)點(diǎn)就越逼近于連續(xù)音頻信號,同時(shí)采樣所得到的數(shù)據(jù)量也越大。多媒體電腦中支持的采樣頻率通常為44.1kHz、22.05kHz及11.025kHz,8kHz。第22頁,共98頁,2024年2月25日,星期天t模擬輸入t0t0采樣時(shí)鐘量化,編碼0tX(0)X(1)…X(n)…第23頁,共98頁,2024年2月25日,星期天聲音的采樣聲音在數(shù)字化后的波形圖第24頁,共98頁,2024年2月25日,星期天標(biāo)準(zhǔn)采樣頻率采樣頻率采樣次數(shù)/s聲音質(zhì)量8KHz8000電話音質(zhì)11.025KHz11025AM音質(zhì)22.05KHz22050FM音質(zhì)44.1KHz44100CD音質(zhì)48KHz48000DAT音質(zhì)說明:DAT指數(shù)字錄音帶格式(Digitalaudiotype)第25頁,共98頁,2024年2月25日,星期天采樣定理:

奈奎斯特理論認(rèn)為:數(shù)字采樣頻率的大小由聲音信號本身的最高頻率決定。指出:進(jìn)行無損的數(shù)字化轉(zhuǎn)換,采樣頻率至少是所采信號所含最高頻率的2倍。fs>=2f聲音類型帶寬采樣頻率(kHz)電話語音200Hz-3.4kHz8調(diào)幅廣播50Hz-7kHz11.025調(diào)頻廣播20Hz-15kHz22.050CD20Hz-20kHz44.1第26頁,共98頁,2024年2月25日,星期天●量化(Quantization)

采樣所得到的數(shù)據(jù)是一定的離散值,將這些離散值用若干二進(jìn)制的位來表示,這一過程稱為量化。用8位二進(jìn)制表示十進(jìn)制整數(shù),只能表示出0~255之間的整數(shù)值。也就是256個(gè)量化級。量化級對應(yīng)的二進(jìn)制位數(shù)稱為量化位數(shù)。雖然量化位數(shù)越多,對原始波形的模擬越細(xì)膩,聲音的音質(zhì)就越好,但數(shù)據(jù)量也越大。量化即是將采樣所得到的信號振幅值用一組二進(jìn)制脈沖序列來表示。離散化的數(shù)據(jù)經(jīng)量化變成二進(jìn)制表示一般會(huì)損失一些精度,這主要是因?yàn)橛?jì)算機(jī)只能表示有限的數(shù)值。第27頁,共98頁,2024年2月25日,星期天均勻量化如果采用相等的量化間隔對采樣得到的信號作量化,那么這種量化稱為均勻量化。均勻量化就是采用相同的“等分尺”來度量采樣得到的幅度,也稱為線性量化。第28頁,共98頁,2024年2月25日,星期天非均勻量化--非線性量化的基本想法是,對輸入信號進(jìn)行量化時(shí),大的輸入信號采用大的量化間隔,小的輸入信號采用小的量化間隔,如圖所示。這樣就可以在滿足精度要求的情況下用較少的位數(shù)來表示。聲音數(shù)據(jù)還原時(shí),采用相同的規(guī)則。第29頁,共98頁,2024年2月25日,星期天

在非線性量化中,采樣輸入信號幅度和量化輸出數(shù)據(jù)之間定義了兩種對應(yīng)關(guān)系,一種稱為m律壓擴(kuò)(companding)算法,另一種稱為A律壓擴(kuò)算法。

m律壓擴(kuò)

m律(m-Law)壓擴(kuò)(G.711)主要用在北美和日本等地區(qū)的數(shù)字電話通信中

A律壓擴(kuò)

A律(A-Law)壓擴(kuò)(G.711)主要用在歐洲和中國大陸等地區(qū)的數(shù)字電話通信中

第30頁,共98頁,2024年2月25日,星期天量化噪聲:量化誤差,隨階距變大而增加。量化位數(shù)/采樣精度(字長):表示采樣值的二進(jìn)制位數(shù)(比特?cái)?shù)),決定了采樣值的精度。例如:量化位數(shù)16bit,可以表示65536個(gè)不同量化值,精度(階距)1/65536。量化位數(shù)8bit,可以表示256個(gè)不同量化值,精度(階距)1/256。第31頁,共98頁,2024年2月25日,星期天動(dòng)態(tài)范圍(DynamicRange)20×lg(信號的最大強(qiáng)度/最小強(qiáng)度)(dB)信噪比(SignaltoNoiseRatio,SNR)-有用信號的能量和噪聲能量的比。-常用單位:dB

衡量信號質(zhì)量的標(biāo)準(zhǔn):第32頁,共98頁,2024年2月25日,星期天量化位數(shù)幅值動(dòng)態(tài)范圍(dB)效果825648數(shù)字電話1664K96CD-DA60FM廣播40AM廣播量化位與動(dòng)態(tài)范圍第33頁,共98頁,2024年2月25日,星期天根據(jù)抽樣理論可知,一個(gè)數(shù)字信源的信噪比大約等于采樣精度乘以6分貝。 8位的數(shù)字系統(tǒng)其信噪比只有48分貝, 16位的數(shù)字系統(tǒng)的信噪比可達(dá)96分貝,信噪比低會(huì)出現(xiàn)背景噪聲以及失真。 因此,量化位數(shù)越多,保真度越好。量化位與信噪比第34頁,共98頁,2024年2月25日,星期天在多媒體電腦中,要對音頻進(jìn)行處理,必須在PC機(jī)上添加一塊聲卡。聲卡是多媒體升級套件中的核心部件之一,其外形與插在計(jì)算機(jī)主機(jī)箱內(nèi)的其他硬件插板相仿,也是一塊可以插在擴(kuò)展槽內(nèi)的電路板,但包含有完成音頻處理功能的電子元件。聲卡通過一秒內(nèi)對聲音進(jìn)行上千次的采樣、閱讀,把模擬聲波轉(zhuǎn)換成數(shù)字信息、數(shù)字化的聲音存儲(chǔ)在波形文件中。當(dāng)聲音被記錄時(shí),聲卡中的模/數(shù)轉(zhuǎn)換器把模擬聲波轉(zhuǎn)換成數(shù)字?jǐn)?shù)據(jù);當(dāng)聲音重放時(shí),聲卡中的數(shù)/模轉(zhuǎn)換器把波形文件里的數(shù)字?jǐn)?shù)據(jù)變成模擬波形輸出。聲音的壓縮第35頁,共98頁,2024年2月25日,星期天第36頁,共98頁,2024年2月25日,星期天聲音文件數(shù)據(jù)量的計(jì)算影響數(shù)字化聲音質(zhì)量的因素主要有三個(gè),即

采樣頻率,量化精度和聲道個(gè)數(shù)。聲道數(shù):指一次采樣所記錄產(chǎn)生的聲音波形個(gè)數(shù)。單聲道只有一個(gè)數(shù)據(jù)流,立體聲的數(shù)據(jù)流至少在兩個(gè)以上。由于立體聲聲音具有多聲道、多方向的特征,因此,聲音的播放在時(shí)間和空間性能方面都能顯示更好的效果,但相應(yīng)數(shù)據(jù)量將成倍增加。

第37頁,共98頁,2024年2月25日,星期天數(shù)字聲音相關(guān)的參數(shù)質(zhì)量采樣頻率(kHz)量化精度單道聲/立體聲數(shù)據(jù)率(kb/s)頻率范圍(kHz)電話88單道聲64200~3400AM11.0258單道聲8850~7000FM22.05016立體聲705.620~15000CD44.116立體聲1411.220~20000DAT4816立體聲153620~20000第38頁,共98頁,2024年2月25日,星期天聲音文件所需的存儲(chǔ)空間可用下式來計(jì)算:采樣率越大,數(shù)字信號越接近模擬信號,但所要求的存儲(chǔ)空間也越大。

量化位數(shù)越多,所得的量化值越接近原始波形采樣值,但所要求的信息存儲(chǔ)量也越大。雙聲道立體聲比單聲道的聲音逼真豐富,但需要成倍于單聲道的信息容量。以16位、22.05kHz的頻率錄制1分鐘的立體聲,所需存儲(chǔ)空間為5.047MB。如果錄制1小時(shí)的立體聲。其所要求的存儲(chǔ)空間為60×5.047=302.81MB。第39頁,共98頁,2024年2月25日,星期天計(jì)算:一張CD唱盤容量為640MB,問最多能存儲(chǔ)多長時(shí)間的CD音質(zhì),采樣字長為16bit的雙聲道立體聲歌曲?每秒:(44.1K*16*2/8)=176400Byte(640*1024*1024)/176400=3804s=1h3min24s第40頁,共98頁,2024年2月25日,星期天聲音壓縮通常采用有損壓縮的方式進(jìn)行,主要用在重構(gòu)的信號不必要與原始信號完全相同的場合。這種壓縮采取在壓縮的過程中丟掉某些不致對原始數(shù)據(jù)產(chǎn)生誤解的信息,以大大提高壓縮比。

從第一個(gè)音頻編碼方法產(chǎn)生到現(xiàn)在,出現(xiàn)了很多的壓縮編碼方法??梢詫⑺麄兎譃槿悾翰ㄐ尉幋a、參數(shù)編碼和混合編碼。第41頁,共98頁,2024年2月25日,星期天波形編碼基于對語音信號波形的數(shù)字化處理,試圖使處理后重建的語音信號波形與原語音信號波形保持一致。優(yōu)點(diǎn):實(shí)現(xiàn)簡單(計(jì)算量不大)、語音質(zhì)量(保真度)好、適應(yīng)性強(qiáng),有成熟的技術(shù)實(shí)現(xiàn)方法;缺點(diǎn):壓縮程度不高、實(shí)現(xiàn)的碼速率較高,碼率低于32kbit/s時(shí)音質(zhì)降低明顯,16kbit/s時(shí)音質(zhì)就非常差了。常見方法:脈沖編碼調(diào)制(PCM)、增量調(diào)制(DM)、差值脈沖編碼調(diào)制(DPCM)、自適應(yīng)差分脈沖編碼調(diào)制(ADPCM)、子帶編碼(SBC)和矢量量化編碼(VQ)等。編碼信號的速率計(jì)算:編碼速率=采樣頻率×編碼比特?cái)?shù)播放某音頻信號所需存儲(chǔ)量=播放時(shí)間×速率÷8(字節(jié))第42頁,共98頁,2024年2月25日,星期天參數(shù)編碼(聲源編碼)通過構(gòu)造發(fā)聲模型作為基礎(chǔ),用一套模擬聲帶頻譜特性的濾波器系數(shù)和若干聲源參數(shù)來描述這個(gè)模型,在發(fā)送端從模擬語音信號中提取各個(gè)特征參量并進(jìn)行量化編碼,以實(shí)現(xiàn)語音信息的數(shù)字化。優(yōu)點(diǎn):語音編碼速率較低(2~9.6kbit/s),壓縮比特率低;缺點(diǎn):合成語音質(zhì)量較差(保真度欠佳),實(shí)現(xiàn)的復(fù)雜度高。典型代表:線性預(yù)測編碼器(LPC)語聲信號產(chǎn)生模型周期性信號隨機(jī)性信號基音周期Tp濁音清音線性時(shí)變?yōu)V波器合成語音信號輸出C(n)u(n)v(n)G增益控制時(shí)變參數(shù)ai第43頁,共98頁,2024年2月25日,星期天混和編碼波形編碼:保真度好,計(jì)算量小,但編碼后速率高;參數(shù)編碼:碼速率較低,但保真度欠佳,計(jì)算復(fù)雜。波形編碼與參數(shù)編碼結(jié)合——混和編碼:克服弱點(diǎn),結(jié)合優(yōu)點(diǎn)壓縮比特率:4~16kbit/s編碼器:多脈沖激勵(lì)線性預(yù)測編碼器(MPE-LPC)、規(guī)則脈沖激勵(lì)線性預(yù)測編碼器(RPE-LPC)、碼激勵(lì)線性預(yù)測編碼器(CELP)、矢量和激勵(lì)線性預(yù)測編碼器(VSELP)和多帶激勵(lì)線性預(yù)測編碼器。與參數(shù)編碼的差別:信號激勵(lì)源的選取更加精細(xì)——通過調(diào)整激勵(lì)信號使語音輸入信號與重構(gòu)的語音信號誤差最小(合成分析法AbS-analysisbysynthesis)。第44頁,共98頁,2024年2月25日,星期天三種壓縮編碼的性能比較24616832kbit/s

主觀音質(zhì)評價(jià)混和法參數(shù)法波形法54321第45頁,共98頁,2024年2月25日,星期天差分脈沖編碼調(diào)制DPCM出發(fā)點(diǎn):對相鄰樣值的差值進(jìn)行量化編碼實(shí)現(xiàn):對樣值與其對應(yīng)的預(yù)測值的差值進(jìn)行量化編碼

預(yù)測表達(dá)式預(yù)測編碼

關(guān)鍵:預(yù)測系數(shù)的獲得——使預(yù)測估值的均方差為最小的預(yù)測系數(shù)自適應(yīng)差值脈沖編碼調(diào)制ADPCM自適應(yīng)量化:使量化間隔的變化與輸入語聲信號的方差相匹配

自適應(yīng)預(yù)測預(yù)測系數(shù)隨輸入信號而變化2.線性預(yù)測編碼LPC語聲激勵(lì)信號:濁音信號(準(zhǔn)周期脈沖序列)+清音信號(白色隨機(jī)噪聲)雖然碼速率低,但在噪聲環(huán)境下語音質(zhì)量不好,現(xiàn)已被淘汰。常用壓縮編碼方法第46頁,共98頁,2024年2月25日,星期天預(yù)測編碼基本思想預(yù)測表達(dá)式預(yù)測系數(shù)的求取第47頁,共98頁,2024年2月25日,星期天圖DPCM系統(tǒng)原理框圖DPCM預(yù)測器量化器編碼器解碼器預(yù)測器信道接收端輸出XN’+++XNe’NXNeNe’NXN’++輸入^XN^發(fā)送端+-預(yù)測值抽樣值eN=XN-XN^存在量化誤差第48頁,共98頁,2024年2月25日,星期天3.矢量量化編碼:將輸入信號樣值按某種方式分組(矢量),并量化理論基礎(chǔ):香農(nóng)率失真理論基本原理:用碼書中與輸入矢量最匹配的碼字的索引(下標(biāo))代替輸入矢量進(jìn)行傳輸和存儲(chǔ),解碼時(shí)只需簡單的查表操作。關(guān)鍵技術(shù):碼書設(shè)計(jì)、碼字搜索、碼字(下標(biāo))索引分配。應(yīng)用:中速率和低速率語音編碼——G.723.1、G.728、G.729待續(xù)4.子帶編碼基本思想:將輸入信號分解為若干子頻帶,然后對各子帶分量根據(jù)其不同的統(tǒng)計(jì)特性采取不同的壓縮策略,以降低碼率。子帶劃分依據(jù):話音信號自身特性優(yōu)點(diǎn):不僅可以很好地控制各個(gè)子帶的量化電平數(shù),還可以很好地控制在重建信號時(shí)的量化誤差方差值,進(jìn)而獲得更好的主觀聽音質(zhì)量。相對獨(dú)立的量化噪聲被束縛在各自子帶內(nèi),互不影響。各個(gè)子帶的采樣頻率大大降低。第49頁,共98頁,2024年2月25日,星期天矢量量化數(shù)據(jù)分組,每個(gè)組有K個(gè)數(shù)據(jù),一組數(shù)據(jù)構(gòu)成一個(gè)K維矢量;每個(gè)矢量有對應(yīng)的下標(biāo);每個(gè)矢量視為一個(gè)碼字;所有碼字排列形成一個(gè)表即為碼本或(碼書);設(shè)計(jì)一個(gè)良好的碼本C(具有N個(gè)K維矢量的集合)C={yi};yi為碼字,下標(biāo)i=1,2,3,,N。

第50頁,共98頁,2024年2月25日,星期天矢量量化編碼矢量量化編碼原理框圖矢量量化編碼中,不傳輸對應(yīng)的矢量;發(fā)送端和接收端都有相同的碼本,只需傳送每個(gè)矢量的下標(biāo)i。下標(biāo)數(shù)據(jù)比矢量本身數(shù)據(jù)小得多,實(shí)現(xiàn)了壓縮。第51頁,共98頁,2024年2月25日,星期天5.感知編碼基本原理:以人類聽覺系統(tǒng)的心理聲學(xué)為基礎(chǔ),只記錄能夠被人耳感覺到的聲音,從而達(dá)到壓縮數(shù)據(jù)量的目的。理論基礎(chǔ):基于人耳的聞閾、臨界頻段和掩蔽效應(yīng)。人耳對不同頻段聲音的反應(yīng)靈敏度有差異,在編碼時(shí),對被掩蔽的弱音不進(jìn)行編碼,從而達(dá)數(shù)據(jù)壓縮的目的。應(yīng)用:在音頻壓縮編碼中,感知編碼比較成功,如MPEG-1、MPEG-2、AC-3第52頁,共98頁,2024年2月25日,星期天音頻信息壓縮編碼標(biāo)準(zhǔn)標(biāo)準(zhǔn)的描述對象:編碼速率、編碼的壓縮算法、編碼器結(jié)構(gòu)、話音質(zhì)量以及彼此的關(guān)系。目標(biāo):用盡可能低的數(shù)碼率來獲得盡可能好的合成語音質(zhì)量。G.711、G.721、G.722●波形編碼標(biāo)準(zhǔn)第53頁,共98頁,2024年2月25日,星期天G.711針對50Hz到3.2kHz的語音信號進(jìn)行A律和

律PCM編碼,屬于非均勻量化。式中:x為輸入信號幅度,規(guī)格化成-1x

1;

律主要用在北美和日本等地區(qū)的數(shù)字電話通信中,按下面的式子確定量化輸入和輸出的關(guān)系:A律主要用在歐洲和中國大陸等地區(qū)的數(shù)字電話通信中,按下面的式子確定量化輸入和輸出的關(guān)系:0

|x|1/A1/A

|x|1式中:x為輸入信號幅度,規(guī)格化成-1x

1;

第54頁,共98頁,2024年2月25日,星期天G.721一個(gè)代碼轉(zhuǎn)換系統(tǒng)。它使用ADPCM轉(zhuǎn)換技術(shù),實(shí)現(xiàn)64kb/s(A律或μ律壓擴(kuò)技術(shù))PCM速率和32kb/s速率的ADPCM之間的相互轉(zhuǎn)換。ADPCM編碼器第55頁,共98頁,2024年2月25日,星期天G.722一種高質(zhì)量語音信號的壓縮標(biāo)準(zhǔn)。取樣頻率為16kHz,每個(gè)樣值量化到14b,采用子帶編碼和ADPCM進(jìn)行壓縮編碼。7kHz音頻信號64kb/s數(shù)據(jù)率的編譯碼方塊圖第56頁,共98頁,2024年2月25日,星期天G.728該標(biāo)準(zhǔn)利用低延時(shí)碼本激勵(lì)線性預(yù)測LD-CELP方法將一般語音信號壓縮至16Kb/s。CELP編碼綜合了波形編碼和參數(shù)編碼,還采用矢量量化的壓縮算法。CELP實(shí)際上是一個(gè)閉環(huán)LPC系統(tǒng),由輸入語音信號確定最佳參數(shù),再根據(jù)某種最小誤差準(zhǔn)則從碼本中找出最佳激勵(lì)碼本矢量。CELP具有較強(qiáng)的抗干擾能力,在4~16kbit/s傳輸速率下,即可獲得較高質(zhì)量的語音信號。G.728、G.729、G.723.1●混和編碼標(biāo)準(zhǔn)第57頁,共98頁,2024年2月25日,星期天G.729低碼率的語音壓縮標(biāo)準(zhǔn),采用共軛結(jié)構(gòu)代數(shù)碼本激勵(lì)線性預(yù)測CS-ACELP,將語音信號壓縮至8Kb/s。G.723.1采用ACELP(代數(shù)碼激勵(lì)線性預(yù)測)算法,根據(jù)激勵(lì)碼本的不同可以將一般語音信號壓縮至5.3Kb/s和6.3Kb/s。在6.3Kb/s編碼器內(nèi)采用了多脈沖激勵(lì),可以得到較高的音質(zhì)。第58頁,共98頁,2024年2月25日,星期天MPEG-1、MPEG-2BC●MPEG音頻編碼標(biāo)準(zhǔn)●MPEG-2AAC編碼標(biāo)準(zhǔn)●MPEG-4音頻標(biāo)準(zhǔn)第59頁,共98頁,2024年2月25日,星期天MPEG1音頻壓縮標(biāo)準(zhǔn)包括3種壓縮模式:層次1、2、3;向下兼容;壓縮算法主要由子帶劃分和變換編碼構(gòu)成,主要步驟為:(1)音頻信號通過濾波器組分成為32個(gè)子帶;

(2)用FFT將子帶變換到頻率域;

(3)利用生理聲學(xué)模型對能感知的噪聲閾值進(jìn)行估計(jì);

(4)根據(jù)對噪聲閾值的估計(jì)進(jìn)行比特分配和量化。編碼器解碼器第60頁,共98頁,2024年2月25日,星期天其音頻編碼分為3層:Layer-1、Layer-2和Layer-3。Layer-1的壓縮比為1:4,編碼速率為384kb/s;Layer-2的壓縮比為1:6~1:8之間,編碼速率為192~256kb/s;Layer-3的壓縮比為1:10~1:12,壓縮碼率可以達(dá)到64kb/s。Layer-1的編碼器最為簡單,主要用于小型數(shù)字盒式磁帶;Layer-2編碼器的復(fù)雜程度是中等,主要用于數(shù)字廣播音頻、數(shù)字音樂、只讀光盤交互系統(tǒng)和視盤;Layer-3的編碼器最為復(fù)雜,主要用于ISDN上的聲音傳輸。第61頁,共98頁,2024年2月25日,星期天表MPEG1Audio音頻文件壓縮比率和播放媒體最低位率Layer大約壓縮比率播放媒體最低位率11:4348Kbit/s21:6~1:8256Kbit/s~192Kbit/s31:10~1:12128Kbit/s~112Kbit/sMP3(Layer3)編碼是MPEG1Audio音頻壓縮標(biāo)準(zhǔn)之一。第62頁,共98頁,2024年2月25日,星期天 MPEG-2BC聲音標(biāo)準(zhǔn)是在MPEG-1的基礎(chǔ)上發(fā)展來的,是MPEG為多聲道聲音開發(fā)的低碼率編碼方案,并與MPEG-1的聲音標(biāo)準(zhǔn)保持后向兼容。與MPEG-1相比主要增加了下面幾個(gè)方面的內(nèi)容:MPEG-2BC聲音壓縮標(biāo)準(zhǔn)支持5.1多路環(huán)繞立體聲:5個(gè)全帶寬聲道,分為左、右、中、和兩個(gè)環(huán)繞聲道,另加一個(gè)低頻效果增強(qiáng)聲道擴(kuò)展了編碼器的輸出范圍,從32~384kb/s擴(kuò)展到8~640kb/s。增加了更低的取樣頻率和低碼率:在保持MPEG-1原有的取樣頻率的基礎(chǔ)上,又增加了三種取樣頻率,新增的取樣頻率為16kHz、22.05kHz和24kHz,是將原有MPEG-1的取樣頻率降低了一半,以便提高碼率低于64kb/s時(shí)的每個(gè)聲道的聲音質(zhì)量。第63頁,共98頁,2024年2月25日,星期天AC-3音頻壓縮標(biāo)準(zhǔn)DOLBY5.1聲道音頻壓縮標(biāo)準(zhǔn):左(L)、中(C)、右(R)、左環(huán)繞(LS)、右環(huán)繞(RS)和低頻增強(qiáng)。前5聲道帶寬20Hz~20kHz;0.1聲道,提供100Hz以下的超低音聲道,彌補(bǔ)低音的不足。AC-3將六個(gè)聲道進(jìn)行數(shù)字編碼,并將它們壓縮成一個(gè)通道,而比特率僅是320kb/s。美國HDTV的音頻標(biāo)準(zhǔn)第64頁,共98頁,2024年2月25日,星期天 MPEG-2AAC(AdvancedAudioCoding)是MPEG-2標(biāo)準(zhǔn)中一種非常靈活的編碼標(biāo)準(zhǔn),采用感知編碼方法,主要是利用聽覺系統(tǒng)的掩蔽特性來減少聲音編碼的數(shù)據(jù)量;并且通過子帶編碼將量化噪聲分散到各個(gè)子帶中,用全局的聲音信號將噪聲掩蔽掉。MPEG-2AAC編碼標(biāo)準(zhǔn)AAC定義了3種配置:

基本配置在三種配置中提供最好的聲音質(zhì)量,除沒有使用增益控制模塊外,其余模塊都使用。

低復(fù)雜性配置沒有使用預(yù)測模塊和預(yù)處理模塊,使用的瞬時(shí)噪聲定形濾波器模塊的級數(shù)也有限,聲音質(zhì)量低于基本配置。

可變采用率配置使用增益控制作預(yù)處理,沒有使用預(yù)測模塊,對TNS(瞬時(shí)噪聲定性)濾波器的級數(shù)和帶寬也有限制,是最簡單的一種配置。第65頁,共98頁,2024年2月25日,星期天音頻編碼算法和標(biāo)準(zhǔn)算法名稱

數(shù)據(jù)率標(biāo)準(zhǔn)應(yīng)用波形編碼PCM脈沖編碼調(diào)制

公共網(wǎng)ISDN配音μ-law,A-lawμ-律,A-律

64kbpsG.711APCM自適應(yīng)脈沖編碼調(diào)制

DPCM差分脈沖編碼調(diào)制

ADPCM自適應(yīng)差分脈沖編碼調(diào)制

32kbpsG.721SB-ADPCM子帶-自適應(yīng)差分脈沖編碼調(diào)制

64kbpsG.7225.3kbps6.3kbpsG.723參數(shù)編碼LPC線性預(yù)測編碼

2.4kbps保密話聲混合編碼CELPC碼激勵(lì)LPC4.6kbps移動(dòng)通信VSELP矢量和激勵(lì)LPC8kbps語音郵件RPE-LTP規(guī)則碼激勵(lì)長時(shí)預(yù)測

13.2kbpsISDNLD-CELP低延時(shí)碼激勵(lì)LPC16kbpsG.728G.729MPEG多子帶,感知編碼

128kbPsCDDolbyAC-3感知編碼

音響第66頁,共98頁,2024年2月25日,星期天聲音的合成數(shù)字化的聲音首先要轉(zhuǎn)換成模擬信號,才能播放。對于存儲(chǔ)的采樣音頻,有兩種處理方法:FM頻率調(diào)制合成波形表(Wavetable)合成第67頁,共98頁,2024年2月25日,星期天頻率調(diào)制(FM)合成法數(shù)字式頻率調(diào)制合成法,簡稱為FM合成法。FM電子合成器先由震蕩器產(chǎn)生一個(gè)載波作為基音,然后再產(chǎn)生若干個(gè)調(diào)制波帶著許多泛音加在載波之上,可以對這個(gè)組合加以任意調(diào)整,然后加上典型的聲音包絡(luò)線(ADSR),再通過數(shù)控濾波器和數(shù)控放大器送往數(shù)字/模擬轉(zhuǎn)換器,從而形成最后的聲音。第68頁,共98頁,2024年2月25日,星期天由于一個(gè)物體不可能總是一成不變的振動(dòng),所以它的頻率和振幅都會(huì)隨著時(shí)間的改變而改變,并最終趨于靜止。我們把一聲音的發(fā)展過程分為四個(gè)階段,分別是觸發(fā)、衰減、保持和消失。這四個(gè)階段我們統(tǒng)稱為“包絡(luò)”。包絡(luò)的發(fā)生時(shí)間,也決定了一個(gè)樂音的時(shí)值。第69頁,共98頁,2024年2月25日,星期天FM聲音合成器的工作原理由以下五部分組成:數(shù)字載波器調(diào)制器聲音包絡(luò)發(fā)生器數(shù)字運(yùn)算器數(shù)模轉(zhuǎn)換器第70頁,共98頁,2024年2月25日,星期天波形表合成(Wavetablesynthesis)也叫樂音樣本合成法,就是把各種真實(shí)樂器發(fā)出的聲音以數(shù)字的形式記錄下來,形成波形表,播放時(shí)調(diào)用相應(yīng)樂器的波形記錄,改變播放速度,從而改變音調(diào)周期,生成各種音階的音符。

專業(yè)聲卡采用此方式。波形表一般存儲(chǔ)在聲卡的ROM中。ROM存儲(chǔ)器的容量越大,合成的效果越好,開銷更大。產(chǎn)生豐富、逼真的音頻和音樂

第71頁,共98頁,2024年2月25日,星期天CoolEditPro2.0一款非常出色的音頻錄制、編輯、處理、混縮軟件第72頁,共98頁,2024年2月25日,星期天CoolEditPro2.0的中文界面標(biāo)題欄菜單欄工具欄狀態(tài)欄多軌編輯模式第73頁,共98頁,2024年2月25日,星期天CoolEditPro2.0的功能特點(diǎn)

CoolEditPro2.0軟件提供32-bit高精度音頻處理,支持視頻、CD、MIDI等設(shè)備。能方便地抓取CD音軌,也能抽取并編輯視頻文件中的音頻。

播放控制縮放控制當(dāng)前時(shí)間音節(jié)屬性所選部分和視圖中音頻屬性文件管理窗口調(diào)音窗口工具欄第74頁,共98頁,2024年2月25日,星期天CoolEditPro2.0支持單軌或多軌編輯模式,編輯時(shí)可互相切換。同時(shí)具有強(qiáng)大的音頻編輯功能,支持可選的插件、崩潰恢復(fù)、自動(dòng)靜音檢測和刪除、自動(dòng)節(jié)拍查找、錄制等??梢詣?chuàng)建音調(diào)、歌曲、聲音、弦樂、顫音、噪音。并在單軌和多軌編輯模式下,分別提供了不同的編輯功能。軟件還提供了音頻分析器和相位分析器。第75頁,共98頁,2024年2月25日,星期天多媒體音頻信號文件格式.wav●WAVE(WaveformAudio)波形音頻文件

多媒體系統(tǒng)、音樂光盤制作,記錄物理波形,數(shù)據(jù)量大WAV文件來源于對聲音模擬波形的采樣。用不同的采樣頻率對聲音的模擬波形進(jìn)行采樣,可以得到一系列離散的采樣點(diǎn);以不同的精度(8位或16位)把這些采樣點(diǎn)的值轉(zhuǎn)換成二進(jìn)制碼,然后存磁盤,就產(chǎn)生了聲音的WAV文件,即波形文件。

WAV文件是由采樣數(shù)據(jù)組成的,所以它需要的存儲(chǔ)容量很大。一般情況下,WAV文件是不可能壓縮的。這是因?yàn)閃AV文件所記錄的音頻數(shù)字信息中很少有像圖像中存在的大量數(shù)據(jù)重復(fù)現(xiàn)象,一般數(shù)據(jù)壓縮算法很難有所作為,即使經(jīng)過壓縮,壓縮比也不高,壓縮結(jié)果也仍然需要很大的存儲(chǔ)空間。第76頁,共98頁,2024年2月25日,星期天MIDI(MusicalInstrumentDigitalInterface)樂器數(shù)字化接口,是數(shù)字音樂的工業(yè)標(biāo)準(zhǔn),是用于音樂合成器、樂器和計(jì)算機(jī)之間交換音樂信息的一種硬件和軟件國際標(biāo)準(zhǔn)。MIDI文件并沒有記錄任何聲音信息,而只是記載了用于描述樂曲演奏過程中的一系列指令,這些指令包含了音高、音長、通道號等主要信息,并以擴(kuò)展名為.MID的文件格式存儲(chǔ)起來。MIDI文件只是將樂器彈奏的每個(gè)音符記錄為一連串?dāng)?shù)字,然后用聲卡上的合成器根據(jù)這個(gè)數(shù)字所代表的含義進(jìn)行合成,最后通過揚(yáng)聲器播放音樂。.mid●

MIDI(MusicalInstrument

Digital

Interface)樂器數(shù)字化接口。用于合成、游戲音樂,記錄音符時(shí)值、頻率、音色特征,數(shù)據(jù)量小。WAV文件的優(yōu)點(diǎn)是可以從任何聲源錄制聲音,且可以保證它仍在任意一臺計(jì)算機(jī)上播放的效果大致相同,而MIDI文件則要受合成器中樂器組合的限制,其聲音質(zhì)量很大程度上取決于聲卡重新合成樂器聲音功能的強(qiáng)弱。相比之下,MIDI文件的錄制較復(fù)雜,這需要掌握一些使用MIDI創(chuàng)作編輯作業(yè)的專業(yè)知識,并且還須有專門的工具。第77頁,共98頁,2024年2月25日,星期天MIDI消息,是指樂譜的數(shù)字描述,包括電子樂器鍵盤的彈奏的鍵名、力度、時(shí)值長短等參數(shù)。任何電子樂器,只要有處理MIDI消息的微處理器和合適的硬件接口,就構(gòu)成了一個(gè)MIDI設(shè)備。當(dāng)一組MIDI消息通過音樂合成芯片處理時(shí),合成器能解釋這些符號并且產(chǎn)生音樂。第78頁,共98頁,2024年2月25日,星期天計(jì)算機(jī)上處理MIDI音樂的基本過程計(jì)算機(jī)中的MIDI文件通常來自于音樂創(chuàng)作軟件或合成音樂設(shè)備。許多播放器都能播放MIDI音樂,播放時(shí)(如圖所示)需要從相應(yīng)的MIDI文件或設(shè)備中讀出MIDI指令,接著由MIDI文件系統(tǒng)解釋指令,然后通過MIDI播放器輸出和轉(zhuǎn)換信號,再經(jīng)過聲音合成器生成對應(yīng)的聲音波形,最后經(jīng)放大后由揚(yáng)聲器輸出。圖5-8計(jì)算機(jī)中MIDI音樂的處理

圖計(jì)算機(jī)中MIDI音樂的處理過程第79頁,共98頁,2024年2月25日,星期天MIDI術(shù)語MIDI文件通道Channels音序器Sequencer合成器Synthesizer樂器Instrument通道映象ChannelMapping復(fù)音Polyphony音色Timbre音軌Track合成音色映射程序PatchMapper第80頁,共98頁,2024年2月25日,星期天MIDI的通道單個(gè)物理MIDI通道分為16個(gè)邏輯通道,每個(gè)邏輯通道可指定一種樂器。在MIDI消息中,用4個(gè)二進(jìn)制位來表示這16個(gè)邏輯通道。MIDI鍵盤可設(shè)置在16個(gè)通道中任何一個(gè),MIDI合成器可以被設(shè)置在指定的通道上接受。

第81頁,共98頁,2024年2月25日,星期天MIDI的物理接口標(biāo)準(zhǔn)MIDIIn(輸入口)接收從其他MIDI設(shè)備傳來的消息。MIDIOut(輸出口)發(fā)送某設(shè)備生成的原始MIDI消息。向其他設(shè)備發(fā)送MIDI消息。MIDIThru(轉(zhuǎn)發(fā)口)傳送從輸入口接收的消息到其他MIDI設(shè)備。在MIDI設(shè)備之間傳送消息。第82頁,共98頁,2024年2月25日,星期天各個(gè)MIDI設(shè)備通過專用的串行電纜(MIDI線)連接,并以31.25kbps(每字節(jié)10位-1位開始位,8位數(shù)據(jù)位和1位停止位)的速度傳送著數(shù)字音樂信息。MIDIThruOutInMIDI1.0規(guī)范中,使用的MIDI接頭是一個(gè)5針DIN接頭。第83頁,共98頁,2024年2月25日,星期天MIDI是樂器和計(jì)算機(jī)使用的標(biāo)準(zhǔn)語言,是一套指令(命令/消息)的約定,它指示合成器(MIDI設(shè)備)要做什么,怎么做,如演奏音符、加大音量、生成音響效果等。MIDI不是聲音信號,在MIDI電纜上傳送的不是聲音,而是動(dòng)作指令。第84頁,共98頁,2024年2月25日,星期天第85頁,共98頁,2024年2月25日,星期天MIDI設(shè)備的連接不妨把MIDI理解成一種局域網(wǎng),網(wǎng)絡(luò)的各個(gè)部分通過專用的串行電纜(MIDI線)連接,并以31.25kbps的速度傳送著數(shù)字音樂信息。第86頁,共98頁,2024年2月25日,星期天第87頁,共98頁,2024年2月25日,星期天Cakewalk

ProAudio

V9.03最著名和老牌的MIDI工具軟件,功能強(qiáng)大,可編輯、創(chuàng)作、調(diào)試MIDI音樂。第88頁,共98頁,2024年2月25日,星期天TT作曲大師TT作曲家1.2標(biāo)準(zhǔn)版是一個(gè)集簡譜編曲、自動(dòng)伴奏和打印功能為一體的作曲軟件。

可以利用直觀的簡譜方式進(jìn)行音樂編配,還可以選擇內(nèi)置的100種具有中國特色的伴奏風(fēng)格,迅速制作出音樂成品。通過導(dǎo)入和導(dǎo)出MIDI文件的功能,您可以方便的與其它音樂軟件相互配合,將樂曲進(jìn)行精細(xì)的再加工。智能的歌詞輸入功能,讓您輕松制作和打印中文歌曲。

第89頁,共98頁,2024年2月25日,星期天MIDI文件實(shí)際上是一張表格,就好比是一張樂譜,它描述了各種音符以及這些音符的播放及延時(shí),所以MIDI文件比WAV文件要小得多。例如,一段持續(xù)10余秒的立體聲音樂,若用MIDI格式只需2KB的存儲(chǔ)空間,而以WAV格式存放則需2MB左右。由于MIDI文件比WAV文件要小得多,所以預(yù)先裝入MIDI文件比裝入WAV文件容易,這為設(shè)計(jì)多媒體項(xiàng)目和指定何時(shí)播放音樂帶來很大的靈活性。MIDI文件的主要缺點(diǎn)是處理語音能力差,缺乏重現(xiàn)自然語言的能力

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論