多媒體技術(shù)和應(yīng)用02_第1頁(yè)
多媒體技術(shù)和應(yīng)用02_第2頁(yè)
多媒體技術(shù)和應(yīng)用02_第3頁(yè)
多媒體技術(shù)和應(yīng)用02_第4頁(yè)
多媒體技術(shù)和應(yīng)用02_第5頁(yè)
已閱讀5頁(yè),還剩55頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、多媒體音頻技術(shù)第二章 數(shù)字音頻技術(shù)2.1 2.1 數(shù)字音頻基礎(chǔ)數(shù)字音頻基礎(chǔ)2.2 2.2 數(shù)字音頻壓縮標(biāo)準(zhǔn)數(shù)字音頻壓縮標(biāo)準(zhǔn)2.3 2.3 聲卡與電聲設(shè)備聲卡與電聲設(shè)備2.4 MIDI2.4 MIDI與音樂合成與音樂合成2.5 2.5 音頻編輯軟件音頻編輯軟件2.6 2.6 語音識(shí)別技術(shù)語音識(shí)別技術(shù)本章小結(jié)本章小結(jié)多媒體音頻技術(shù)2-3一、聲音的基本概念一、聲音的基本概念 聲音是通過一定介質(zhì)傳播的連續(xù)的波。聲音是通過一定介質(zhì)傳播的連續(xù)的波。t振幅周期A振幅:音量的大小振幅:音量的大小周期:重復(fù)出現(xiàn)的時(shí)間間隔周期:重復(fù)出現(xiàn)的時(shí)間間隔頻率:指信號(hào)每秒鐘變化的次數(shù)頻率:指信號(hào)每秒鐘變化的次數(shù)多媒體音頻技

2、術(shù)2-4 聲音按頻率分類:聲音按頻率分類:次聲波次聲波可聽聲波可聽聲波超聲波超聲波20Hz20kHzf(Hz)語音信號(hào)頻率范圍:語音信號(hào)頻率范圍:300300Hz-3kHzHz-3kHz10 20 50 200 3.4k 7k 15k 20kCD-DAFM廣播廣播AM廣播廣播電話電話f(Hz)聲音質(zhì)量的頻率范圍:聲音質(zhì)量的頻率范圍:多媒體音頻技術(shù)2-5 聲音的傳播攜帶了信息,它是人類傳播聲音的傳播攜帶了信息,它是人類傳播信息的一種主要媒體。信息的一種主要媒體。 聲音的三種類型聲音的三種類型: 波形聲音波形聲音:包含了所有聲音形式:包含了所有聲音形式 語音語音:不僅是波形聲音,而且還有豐富:不僅

3、是波形聲音,而且還有豐富的語言內(nèi)涵的語言內(nèi)涵( (抽象抽象提取特征提取特征意義理解意義理解) ) 音樂音樂:與語音相比,形式更規(guī)范。:與語音相比,形式更規(guī)范。音樂是符號(hào)化的聲音。音樂是符號(hào)化的聲音。多媒體音頻技術(shù)2-6二、聲音的數(shù)字化二、聲音的數(shù)字化 1.1.聲音信號(hào)的類型聲音信號(hào)的類型 模擬信號(hào)模擬信號(hào)( (自然界、物理自然界、物理) ) 數(shù)字信號(hào)數(shù)字信號(hào)( (計(jì)算機(jī)計(jì)算機(jī)) ) 2.2.聲音數(shù)字化過程聲音數(shù)字化過程采樣采樣量化量化編碼編碼模擬信號(hào)模擬信號(hào)數(shù)字信號(hào)數(shù)字信號(hào)模擬信號(hào)模擬信號(hào)數(shù)字信號(hào)數(shù)字信號(hào)A/D ADCD/A DAC多媒體音頻技術(shù)2-7 3. 3.聲音數(shù)字化過程聲音數(shù)字化過程連

4、續(xù)的模擬聲音信號(hào)連續(xù)的模擬聲音信號(hào)聲音信號(hào)的采樣聲音信號(hào)的采樣離散的音頻信號(hào)離散的音頻信號(hào)示意示意多媒體音頻技術(shù)2-8 4. 4.聲音數(shù)字化三要素聲音數(shù)字化三要素每秒鐘抽取聲每秒鐘抽取聲波幅度樣本的波幅度樣本的次數(shù)次數(shù)每個(gè)采樣點(diǎn)用每個(gè)采樣點(diǎn)用多少二進(jìn)制位多少二進(jìn)制位表示數(shù)據(jù)范圍表示數(shù)據(jù)范圍使用聲音通道的使用聲音通道的個(gè)數(shù)個(gè)數(shù)采樣頻率越高采樣頻率越高聲音質(zhì)量越好聲音質(zhì)量越好數(shù)據(jù)量也越大數(shù)據(jù)量也越大量化位數(shù)越多量化位數(shù)越多音質(zhì)越好音質(zhì)越好數(shù)據(jù)量也越大數(shù)據(jù)量也越大立體聲比單聲道立體聲比單聲道的表現(xiàn)力豐富,的表現(xiàn)力豐富,但數(shù)據(jù)量翻倍但數(shù)據(jù)量翻倍11.02511.025kHzkHz22.05 kHz22

5、.05 kHz44.1 kHz44.1 kHz 8 8位位2562561616位位6553665536單聲道單聲道立體聲立體聲多媒體音頻技術(shù)2-9 5.5.聲音數(shù)字化的數(shù)據(jù)量聲音數(shù)字化的數(shù)據(jù)量 音頻數(shù)據(jù)量采樣頻率量化位數(shù)音頻數(shù)據(jù)量采樣頻率量化位數(shù) 聲道數(shù)聲道數(shù)/8/8( (字節(jié)字節(jié)/ /秒秒) )11.02511.0258 810.7710.7721.5321.53161621.5321.5343.0743.0722.0522.058 821.5321.5343.0743.07161643.0743.0786.1386.1344.144.18 843.0743.0786.1386.131616

6、86.1386.13172.27172.27多媒體音頻技術(shù)2-10三、音頻的文件格式三、音頻的文件格式 1.1.WAVWAV文件文件 WAVWAV是是Microsoft/IBMMicrosoft/IBM共同開發(fā)的共同開發(fā)的PCPC波形波形文件。因未經(jīng)壓縮,文件數(shù)據(jù)量很大。文件。因未經(jīng)壓縮,文件數(shù)據(jù)量很大。 特點(diǎn)特點(diǎn):聲音層次豐富,還原音質(zhì)好:聲音層次豐富,還原音質(zhì)好 2. 2.MP3MP3文件文件 MP3(MPEG Audio layer3)MP3(MPEG Audio layer3)是一種按是一種按MPEGMPEG標(biāo)準(zhǔn)的音頻壓縮技術(shù)制作的音頻文件。標(biāo)準(zhǔn)的音頻壓縮技術(shù)制作的音頻文件。 特點(diǎn)特點(diǎn)

7、:高壓縮比:高壓縮比(11:1)(11:1),優(yōu)美音質(zhì),優(yōu)美音質(zhì)多媒體音頻技術(shù)2-11 3. 3.RARA文件文件 RA(RealAudioRA(RealAudio,即時(shí)播音系統(tǒng))新型流,即時(shí)播音系統(tǒng))新型流式音頻,式音頻,RARA、RMRM、RMXRMX。 特點(diǎn)特點(diǎn):在低速的廣域網(wǎng)上實(shí)時(shí)傳輸音頻:在低速的廣域網(wǎng)上實(shí)時(shí)傳輸音頻 4. 4. WMAWMA文件文件 WMA(Windows Media Audio)WMA(Windows Media Audio)是是Windows Windows MediaMedia格式中的一個(gè)子集格式中的一個(gè)子集( (音頻格式音頻格式) )。 特點(diǎn)特點(diǎn):壓縮到:壓

8、縮到MP3MP3一半一半多媒體音頻技術(shù)2-12 5. MIDI5. MIDI和和RMIRMI文件文件 MIDI(MIDI(樂器數(shù)字接口樂器數(shù)字接口) )是由一組音樂、樂是由一組音樂、樂譜或樂器符號(hào)的數(shù)字集合。譜或樂器符號(hào)的數(shù)字集合。 特點(diǎn)特點(diǎn):播放效果與硬件相關(guān),數(shù)據(jù)量很:播放效果與硬件相關(guān),數(shù)據(jù)量很小,音質(zhì)不高、音色單調(diào)等小,音質(zhì)不高、音色單調(diào)等 6.VOC6.VOC文件文件 創(chuàng)新公司開發(fā)的聲音文件格式,由文件創(chuàng)新公司開發(fā)的聲音文件格式,由文件頭塊和音頻數(shù)據(jù)塊組成。頭塊和音頻數(shù)據(jù)塊組成。 多媒體音頻技術(shù)2-13四、音頻的采集與處理四、音頻的采集與處理 1.1.聲音的采集聲音的采集l錄音軟件錄

9、音軟件l專業(yè)錄音棚專業(yè)錄音棚l唱盤活錄音帶轉(zhuǎn)錄唱盤活錄音帶轉(zhuǎn)錄l數(shù)字音頻庫(kù)數(shù)字音頻庫(kù) 2. 2.聲音的處理聲音的處理 剪接、降噪、均衡、效果、動(dòng)態(tài)處理、剪接、降噪、均衡、效果、動(dòng)態(tài)處理、格式轉(zhuǎn)換。格式轉(zhuǎn)換。多媒體音頻技術(shù)2-14一、音頻壓縮方法概述一、音頻壓縮方法概述編碼器編碼器傳輸傳輸/ /存儲(chǔ)存儲(chǔ)解碼器解碼器輸入音頻信號(hào)輸入音頻信號(hào)輸出音頻信號(hào)輸出音頻信號(hào)壓縮編碼技術(shù)是指用某種方法使壓縮編碼技術(shù)是指用某種方法使數(shù)字化信息的編碼率降低的技術(shù)數(shù)字化信息的編碼率降低的技術(shù) 音頻信號(hào)能壓縮的基本依據(jù)音頻信號(hào)能壓縮的基本依據(jù):聲音信號(hào)中存在大量的冗余度;聲音信號(hào)中存在大量的冗余度;人的聽覺具有強(qiáng)音抑

10、制弱音的現(xiàn)象;人的聽覺具有強(qiáng)音抑制弱音的現(xiàn)象;低頻段敏感、高頻段不敏感。低頻段敏感、高頻段不敏感。多媒體音頻技術(shù)2-15 音頻信號(hào)壓縮編碼的分類音頻信號(hào)壓縮編碼的分類: 無損壓縮無損壓縮( (熵編碼熵編碼) ) 霍夫曼編碼、算術(shù)編碼、行程編碼霍夫曼編碼、算術(shù)編碼、行程編碼 有損壓縮有損壓縮 波形編碼波形編碼-PCM-PCM、DPCMDPCM、ADPCMADPCM 子帶編碼、矢量量化子帶編碼、矢量量化 參數(shù)編碼參數(shù)編碼-LPC-LPC 混合編碼混合編碼-MPLPC-MPLPC、CELPCELP多媒體音頻技術(shù)2-16二、音頻壓縮技術(shù)標(biāo)準(zhǔn)二、音頻壓縮技術(shù)標(biāo)準(zhǔn)電話語電話語音質(zhì)量音質(zhì)量G.711G.71

11、1采樣采樣8 8kHzkHz,量化量化8 8bitbit,碼率碼率6464kbpskbpsG.721G.721采用采用ADPCMADPCM編碼,碼率編碼,碼率3232kbpskbpsG.723G.723采用采用ADPCMADPCM有損壓縮,碼率有損壓縮,碼率2424kbpskbpsG.728G.728采用采用LD-CELPLD-CELP壓縮技術(shù),碼率壓縮技術(shù),碼率1616kbpskbps調(diào)幅廣調(diào)幅廣播質(zhì)量播質(zhì)量G.722G.722采樣采樣1616kHzkHz,量化量化1414bitbit,碼率碼率224(64)224(64)kbpskbps高保真高保真立體聲立體聲MPEGMPEG音頻音頻采樣采

12、樣44.144.1kHzkHz,量化量化1616bitbit,碼率碼率705705kbps (MPEGkbps (MPEG三個(gè)壓縮層次,三個(gè)壓縮層次,384-384-6464kbps)kbps)多媒體音頻技術(shù)2-17三、音頻壓縮工具三、音頻壓縮工具 音頻文件轉(zhuǎn)換:音頻文件轉(zhuǎn)換:Audio ConverterAudio Converter、另存為、另存為 MP3MP3壓縮工具:壓縮工具:MP3ResizerMP3Resizer多媒體音頻技術(shù)2-18一、聲卡一、聲卡( (聲音卡、音頻卡聲音卡、音頻卡) ) 1. 1.聲卡的主要功能聲卡的主要功能 聲卡是負(fù)責(zé)錄音、播音和聲音合成的一聲卡是負(fù)責(zé)錄音、播

13、音和聲音合成的一種多媒體板卡。其功能包括:種多媒體板卡。其功能包括:錄制、編輯和回放數(shù)字音頻文件錄制、編輯和回放數(shù)字音頻文件控制和混合各聲源的音量控制和混合各聲源的音量記錄和回放時(shí)進(jìn)行壓縮和解壓縮記錄和回放時(shí)進(jìn)行壓縮和解壓縮語音合成技術(shù)語音合成技術(shù)( (朗讀文本朗讀文本) )語音識(shí)別技術(shù)語音識(shí)別技術(shù)具有具有MIDIMIDI接口接口( (樂器數(shù)字接口樂器數(shù)字接口) )多媒體音頻技術(shù)2-19 2. 2.聲卡的組成原理聲卡的組成原理線性輸出線性輸出總線接口芯片總線接口芯片數(shù)字音頻處理芯片數(shù)字音頻處理芯片音樂合成器音樂合成器A/DA/D和和D/AD/AMIDIMIDI接口接口混音器混音器CDCD接口接

14、口計(jì)算機(jī)總線計(jì)算機(jī)總線話筒輸入話筒輸入線性輸入線性輸入揚(yáng)聲器輸出揚(yáng)聲器輸出A/DA/D數(shù)據(jù)處理數(shù)據(jù)處理D/AD/A聲波聲波喇叭喇叭多媒體音頻技術(shù)2-20 3. 3.聲卡的性能指標(biāo)聲卡的性能指標(biāo) 采樣和量化能力采樣和量化能力 衡量音響器材音質(zhì)好壞。衡量音響器材音質(zhì)好壞。 采樣頻率采樣頻率:11.02511.025kHz (kHz (語音效果語音效果) ) 22.05 22.05 kHz (kHz (音樂效果音樂效果) ) 44.1 44.1 kHz (kHz (高保真效果高保真效果) ) 量化等級(jí)量化等級(jí): 8 8位位/256/256級(jí)級(jí) ( (語音質(zhì)量語音質(zhì)量) ) 16 16位位/65536

15、/65536級(jí)級(jí)( (高保真質(zhì)量高保真質(zhì)量) )多媒體音頻技術(shù)2-21 芯片類型芯片類型 CODECCODEC芯片芯片( (依賴依賴CPUCPU,價(jià)格便宜價(jià)格便宜) ) 數(shù)字信號(hào)處理器數(shù)字信號(hào)處理器DSP(DSP(不依賴不依賴CPU)CPU) 總線類型總線類型 ISAISA總線、總線、PCIPCI總線、總線、USBUSB接口接口 輸出聲道數(shù)輸出聲道數(shù) 2 2聲道聲道( (立體聲立體聲) )、2.1/4.1/5.12.1/4.1/5.1聲道聲道 多通道聲卡多通道聲卡( (營(yíng)造杜比環(huán)繞立體聲營(yíng)造杜比環(huán)繞立體聲) )多媒體音頻技術(shù)2-22 4. 4.聲卡的外部接口聲卡的外部接口多媒體音頻技術(shù)2-23

16、用來連接外部音頻設(shè)備以便進(jìn)行錄音,如用來連接外部音頻設(shè)備以便進(jìn)行錄音,如錄音機(jī)、錄音機(jī)、CDCD唱機(jī)和音響等唱機(jī)和音響等用來連接話筒,直接輸入現(xiàn)場(chǎng)的聲音信號(hào)用來連接話筒,直接輸入現(xiàn)場(chǎng)的聲音信號(hào)用來連接外部音頻設(shè)備的輸入口,也可連用來連接外部音頻設(shè)備的輸入口,也可連接大功率有源音響等接大功率有源音響等用來連接揚(yáng)聲器,從聲卡的內(nèi)置功率放大用來連接揚(yáng)聲器,從聲卡的內(nèi)置功率放大器向揚(yáng)聲器輸出聲音器向揚(yáng)聲器輸出聲音用來連接游戲桿或用來連接游戲桿或MIDIMIDI設(shè)備。設(shè)備。用來連接用來連接CD-ROMCD-ROM驅(qū)動(dòng)器,可以直接播放驅(qū)動(dòng)器,可以直接播放CDCD音樂,而不占用音樂,而不占用CPUCPU時(shí)間

17、時(shí)間多媒體音頻技術(shù)2-24二、電聲設(shè)備二、電聲設(shè)備 1.1.傳聲器傳聲器 傳聲器是一種將聲信號(hào)轉(zhuǎn)換成相應(yīng)電傳聲器是一種將聲信號(hào)轉(zhuǎn)換成相應(yīng)電信號(hào)的能量轉(zhuǎn)換器件(話筒、麥克風(fēng))。信號(hào)的能量轉(zhuǎn)換器件(話筒、麥克風(fēng))。 傳聲器的分類傳聲器的分類: 換能原理、聲學(xué)原理、指向性、用途、換能原理、聲學(xué)原理、指向性、用途、使用方式、有線無線使用方式、有線無線多媒體音頻技術(shù)傳聲器的工作原理傳聲器的工作原理:聲:聲 能能(1 1)電動(dòng)式傳聲器,包括動(dòng)圈式傳聲器)電動(dòng)式傳聲器,包括動(dòng)圈式傳聲器和帶式傳聲器兩種,電磁換能原理。和帶式傳聲器兩種,電磁換能原理。優(yōu)點(diǎn)優(yōu)點(diǎn):簡(jiǎn)單方便、無需放大器、性能穩(wěn)定:簡(jiǎn)單方便、無需放大

18、器、性能穩(wěn)定、價(jià)格低廉、價(jià)格低廉(2 2)電容式傳聲器,振膜震動(dòng)引起電容)電容式傳聲器,振膜震動(dòng)引起電容量變化實(shí)現(xiàn)換能。量變化實(shí)現(xiàn)換能。優(yōu)點(diǎn)優(yōu)點(diǎn):靈敏度高、動(dòng)態(tài)范圍大、瞬態(tài)特性:靈敏度高、動(dòng)態(tài)范圍大、瞬態(tài)特性好、失真度低好、失真度低缺點(diǎn)缺點(diǎn):振膜受潮會(huì)導(dǎo)致變形:振膜受潮會(huì)導(dǎo)致變形多媒體音頻技術(shù)(3 3)駐極體式傳聲器,利用駐極體材料)駐極體式傳聲器,利用駐極體材料制作的電容傳聲器。制作的電容傳聲器。優(yōu)點(diǎn)優(yōu)點(diǎn):簡(jiǎn)單、體積小、耐振動(dòng)、價(jià)格低:簡(jiǎn)單、體積小、耐振動(dòng)、價(jià)格低(4 4)無線傳聲器,聲音信號(hào)轉(zhuǎn)變?yōu)殡娦牛o線傳聲器,聲音信號(hào)轉(zhuǎn)變?yōu)殡娦盘?hào),形成超高頻信號(hào)。號(hào),形成超高頻信號(hào)。無線傳聲器不是指?jìng)?/p>

19、聲器的結(jié)構(gòu)原理,而無線傳聲器不是指?jìng)髀暺鞯慕Y(jié)構(gòu)原理,而是指信號(hào)的傳輸方法。是指信號(hào)的傳輸方法。優(yōu)點(diǎn)優(yōu)點(diǎn):可隨身攜帶、無需電纜:可隨身攜帶、無需電纜缺點(diǎn)缺點(diǎn):時(shí)遠(yuǎn)時(shí)近,影響拾音效果:時(shí)遠(yuǎn)時(shí)近,影響拾音效果多媒體音頻技術(shù)傳聲器的性能指標(biāo)傳聲器的性能指標(biāo):(1 1)靈敏度,傳聲器的聲電轉(zhuǎn)換效率。)靈敏度,傳聲器的聲電轉(zhuǎn)換效率。動(dòng)圈式:動(dòng)圈式:-60-60-70dB-70dB;電容式:;電容式:-40-40-50dB-50dB(2 2)頻率響應(yīng),輸出電平與頻率的關(guān)系。)頻率響應(yīng),輸出電平與頻率的關(guān)系。(3 3)指向性,某頻率下聲波入射方向?qū)?yīng))指向性,某頻率下聲波入射方向?qū)?yīng)靈敏度的變化特性。靈敏度的

20、變化特性。(4 4)輸出阻抗,兩根輸出線之間在)輸出阻抗,兩根輸出線之間在1kHZ1kHZ時(shí)時(shí)的阻抗。的阻抗。(5 5)動(dòng)態(tài)閾,規(guī)定諧波失真條件下,傳聲)動(dòng)態(tài)閾,規(guī)定諧波失真條件下,傳聲器承受最大壓級(jí)與安靜時(shí)等效噪聲級(jí)之差。器承受最大壓級(jí)與安靜時(shí)等效噪聲級(jí)之差。多媒體音頻技術(shù)2-28 2.2.揚(yáng)聲器揚(yáng)聲器 將電信號(hào)轉(zhuǎn)換成聲音信號(hào)的電聲器件。將電信號(hào)轉(zhuǎn)換成聲音信號(hào)的電聲器件。(1 1)磁路系統(tǒng),磁鐵、導(dǎo)磁板、心柱)磁路系統(tǒng),磁鐵、導(dǎo)磁板、心柱(2 2)振動(dòng)系統(tǒng),紙盆、音圈)振動(dòng)系統(tǒng),紙盆、音圈(3 3)輔助系統(tǒng),紙架、鐵架、防塵蓋)輔助系統(tǒng),紙架、鐵架、防塵蓋 電流電流音圈音圈磁力振動(dòng)磁力振動(dòng)

21、紙盆振動(dòng)紙盆振動(dòng)聲音聲音多媒體音頻技術(shù)揚(yáng)聲器的分類揚(yáng)聲器的分類:(1 1)按工作原理分類,電動(dòng)式、電磁式)按工作原理分類,電動(dòng)式、電磁式、靜電式、壓電式等。、靜電式、壓電式等。(2 2)按放聲頻率分類,低音、中音、高)按放聲頻率分類,低音、中音、高音、全頻帶等。音、全頻帶等。性能指標(biāo)性能指標(biāo):輸出功率、頻率特性、信噪比、諧波失真輸出功率、頻率特性、信噪比、諧波失真、靈敏度和額定阻抗。、靈敏度和額定阻抗。多媒體音頻技術(shù)2-30 3.3.音箱音箱 音箱是一種電聲轉(zhuǎn)換的發(fā)音設(shè)備。音箱是一種電聲轉(zhuǎn)換的發(fā)音設(shè)備。將高、中、低音揚(yáng)聲器組裝在專門設(shè)計(jì)將高、中、低音揚(yáng)聲器組裝在專門設(shè)計(jì)的箱體內(nèi),經(jīng)過分頻網(wǎng)絡(luò)將

22、高、中、低頻信的箱體內(nèi),經(jīng)過分頻網(wǎng)絡(luò)將高、中、低頻信號(hào)分別送至相應(yīng)的揚(yáng)聲器進(jìn)行重放。號(hào)分別送至相應(yīng)的揚(yáng)聲器進(jìn)行重放。音箱是揚(yáng)聲器系統(tǒng)音箱是揚(yáng)聲器系統(tǒng)多媒體音頻技術(shù)2-31音箱的分類:音箱的分類:使用場(chǎng)合:家用音箱、專用音箱使用場(chǎng)合:家用音箱、專用音箱功率放大器:有源音箱、無源音箱功率放大器:有源音箱、無源音箱聲道:聲道:2.02.0雙聲道立體聲雙聲道立體聲 2.1 2.1雙聲道超重低音聲道雙聲道超重低音聲道 4.1/5.1/7.1 4.1/5.1/7.1 5.1 5.1五聲道超重低音聲道五聲道超重低音聲道多媒體音頻技術(shù)2-32 音箱的性能指標(biāo):音箱的性能指標(biāo): (1 1)輸出功率:額定、最大峰

23、值。)輸出功率:額定、最大峰值。 (2 2)頻率范圍:指音箱最低有效回放)頻率范圍:指音箱最低有效回放頻率和最高有效回放頻率之間的范圍。頻率和最高有效回放頻率之間的范圍。 (3 3)信噪比:音箱回放的有效信號(hào)與)信噪比:音箱回放的有效信號(hào)與噪聲信號(hào)的比值。信噪比較低時(shí),噪聲嚴(yán)重。噪聲信號(hào)的比值。信噪比較低時(shí),噪聲嚴(yán)重。信噪比信噪比70-80dB70-80dB普通音箱普通音箱信噪比信噪比80-90dB80-90dB高檔音箱高檔音箱信噪比信噪比95dB 95dB 專業(yè)音箱專業(yè)音箱多媒體音頻技術(shù)(4 4)失真度:諧波失真、互調(diào)失真、瞬)失真度:諧波失真、互調(diào)失真、瞬態(tài)失真。態(tài)失真。其中,瞬態(tài)失真直接

24、影響到音質(zhì)音色還原其中,瞬態(tài)失真直接影響到音質(zhì)音色還原程度。程度。(5 5)靈敏度:指音箱產(chǎn)生全功率輸出時(shí))靈敏度:指音箱產(chǎn)生全功率輸出時(shí)的輸入信號(hào)。的輸入信號(hào)。輸入信號(hào)越低,靈敏度越高,性能越好輸入信號(hào)越低,靈敏度越高,性能越好(6 6)阻抗:揚(yáng)聲器輸入信號(hào)的電壓與電)阻抗:揚(yáng)聲器輸入信號(hào)的電壓與電流比值。高阻抗、低阻抗。流比值。高阻抗、低阻抗。多媒體音頻技術(shù)2-34一、一、MIDIMIDI技術(shù)概述技術(shù)概述 1.1.什么是什么是MIDIMIDI MIDI(Musical Instrument Digital MIDI(Musical Instrument Digital InterfaceI

25、nterface,樂器數(shù)字接口,樂器數(shù)字接口) )是一種利用合成是一種利用合成器產(chǎn)生的音樂技術(shù)。器產(chǎn)生的音樂技術(shù)。 采用數(shù)字信號(hào)處理技術(shù)合成的音效采用數(shù)字信號(hào)處理技術(shù)合成的音效: 模仿鋼琴、小提琴、吉他等音色模仿鋼琴、小提琴、吉他等音色 超越時(shí)空的太空音樂超越時(shí)空的太空音樂多媒體音頻技術(shù)2-35 2.MIDI2.MIDI標(biāo)準(zhǔn)標(biāo)準(zhǔn) MIDI MIDI是各種電子音樂設(shè)備之間以及與計(jì)是各種電子音樂設(shè)備之間以及與計(jì)算機(jī)之間交換信息的國(guó)際標(biāo)準(zhǔn)。算機(jī)之間交換信息的國(guó)際標(biāo)準(zhǔn)。 MIDIMIDI硬件規(guī)范硬件規(guī)范:硬件接口標(biāo)準(zhǔn)和信號(hào)傳:硬件接口標(biāo)準(zhǔn)和信號(hào)傳輸機(jī)制輸機(jī)制( (I/OI/O通道、連接電纜和插座形式通

26、道、連接電纜和插座形式) )。 MIDIMIDI軟件規(guī)范軟件規(guī)范:音樂信息數(shù)字化編碼方:音樂信息數(shù)字化編碼方式式( (音符、音符長(zhǎng)短、音調(diào)和音量等音符、音符長(zhǎng)短、音調(diào)和音量等) )。原聲鋼琴原聲鋼琴8 8分音符的分音符的C3C3音:音:00 00 6000 00 60音色音色PianoPiano編號(hào)編號(hào) 音符音符C3C3編號(hào)編號(hào) 8 8分音符編號(hào)分音符編號(hào)多媒體音頻技術(shù)2-36二、二、MIDIMIDI合成方式合成方式 1.1.調(diào)頻合成法調(diào)頻合成法-FM-FM 原理原理:MIDIMIDI合成器接收到合成器接收到MIDIMIDI音樂信息音樂信息后,利用后,利用傅立葉級(jí)數(shù)傅立葉級(jí)數(shù)原理將其分解為若干

27、個(gè)原理將其分解為若干個(gè)不同頻率的正弦波,然后生成不同頻率的正弦波,然后生成MIDIMIDI音樂信息音樂信息中指定樂器的各個(gè)正弦波分量,最后將這些中指定樂器的各個(gè)正弦波分量,最后將這些分量合成起來送至揚(yáng)聲器播放。分量合成起來送至揚(yáng)聲器播放。 特點(diǎn)特點(diǎn):系統(tǒng)開銷小,聲音清脆:系統(tǒng)開銷小,聲音清脆 聲音音色少,音質(zhì)較差聲音音色少,音質(zhì)較差多媒體音頻技術(shù)2-37 2. 2.波形表合成法波形表合成法-WT-WT 原理原理:在:在MIDIMIDI合成器的合成器的ROMROM中預(yù)先存放中預(yù)先存放各種實(shí)際樂器的各種實(shí)際樂器的聲音樣本聲音樣本,在進(jìn)行音樂合成,在進(jìn)行音樂合成時(shí)以查表的方式調(diào)用這些樣本,使其與時(shí)以

28、查表的方式調(diào)用這些樣本,使其與MIDIMIDI音樂信息的要求完全相配,然后合成器將這音樂信息的要求完全相配,然后合成器將這些分段合成的樣本送至揚(yáng)聲器播放。些分段合成的樣本送至揚(yáng)聲器播放。 特點(diǎn)特點(diǎn):音樂真實(shí)感強(qiáng),音色自然:音樂真實(shí)感強(qiáng),音色自然 硬波形表,軟波形表。硬波形表,軟波形表。多媒體音頻技術(shù)2-38三、三、MIDIMIDI的工作過程的工作過程MIDI輸入輸入設(shè)備設(shè)備MIDI接口接口MIDI文件文件音序器音序器合成器合成器揚(yáng)聲器揚(yáng)聲器音頻卡PC機(jī) 音序器是音序器是MIDIMIDI音樂音樂創(chuàng)作的核心控制部件。創(chuàng)作的核心控制部件。多媒體音頻技術(shù)2-39四、音樂制作系統(tǒng)四、音樂制作系統(tǒng) 1.1

29、.基本設(shè)備基本設(shè)備 音源音源:聲卡:聲卡( (模擬樂器發(fā)聲的設(shè)備模擬樂器發(fā)聲的設(shè)備) ) 音序器音序器:硬件音序器、軟件音序器:硬件音序器、軟件音序器 Cakewalk, Logic AudioCakewalk, Logic Audio 輸入設(shè)備輸入設(shè)備:電子琴:電子琴( (MIDI In,MIDI Out)MIDI In,MIDI Out) MIDIMIDI鍵盤鍵盤( (省去音源省去音源) ) CakewalkCakewalk虛擬鍵盤虛擬鍵盤多媒體音頻技術(shù)2-40 2.2.音樂軟件分類音樂軟件分類 音序軟件音序軟件:CakewalkCakewalk、MusicatorWin3Musicato

30、rWin3、Logic AudioLogic Audio、Cubase VSTCubase VST 樂譜打印軟件樂譜打印軟件:MIDI ScanMIDI Scan、EncoreEncore 音樂教育軟件音樂教育軟件:EarnasterEarnaster、TonicaTonica 音頻編輯軟件音頻編輯軟件:Cool EditCool Edit、AuditionAudition、Sound ForgeSound Forge、wavelabwavelab 效果器軟件效果器軟件:TC NativeTC Native、VSTVST多媒體音頻技術(shù)2-41 語音識(shí)別語音識(shí)別:利用計(jì)算機(jī)自動(dòng)識(shí)別語音的:利用計(jì)

31、算機(jī)自動(dòng)識(shí)別語音的技術(shù)。如將語音轉(zhuǎn)換成其所對(duì)應(yīng)的文字,技術(shù)。如將語音轉(zhuǎn)換成其所對(duì)應(yīng)的文字,利用語音信號(hào)中所包含的特定人的信息進(jìn)利用語音信號(hào)中所包含的特定人的信息進(jìn)行說話人身份辨認(rèn)的說話人識(shí)別技術(shù)。行說話人身份辨認(rèn)的說話人識(shí)別技術(shù)。一、語音識(shí)別的發(fā)展歷史一、語音識(shí)別的發(fā)展歷史 19521952:BellBell實(shí)驗(yàn)室研制出可識(shí)別實(shí)驗(yàn)室研制出可識(shí)別1010個(gè)英個(gè)英文數(shù)字的語音識(shí)別器文數(shù)字的語音識(shí)別器(Audry(Audry系統(tǒng)系統(tǒng)) )。 19881988:卡內(nèi)基卡內(nèi)基梅隆大學(xué)研制梅隆大學(xué)研制SPHINXSPHINX識(shí)別識(shí)別系統(tǒng)系統(tǒng)( (非特定人、大詞匯量、連續(xù)語音非特定人、大詞匯量、連續(xù)語音)

32、)。多媒體音頻技術(shù)2-42二、語音識(shí)別基本原理二、語音識(shí)別基本原理 語音識(shí)別本質(zhì)上是一種模式識(shí)別過程,語音識(shí)別本質(zhì)上是一種模式識(shí)別過程,主要包括語音信號(hào)預(yù)處理、特征提取、特征主要包括語音信號(hào)預(yù)處理、特征提取、特征建模建模( (建立參考模式庫(kù)建立參考模式庫(kù)) )、相似性度量、相似性度量( (模式模式匹配匹配) )和后處理等幾個(gè)功能模塊。和后處理等幾個(gè)功能模塊。多媒體音頻技術(shù)2-43三、語音識(shí)別系統(tǒng)的分類三、語音識(shí)別系統(tǒng)的分類 1.1.根據(jù)詞匯量大小根據(jù)詞匯量大小 小詞匯量小詞匯量:100100詞詞 中詞匯量中詞匯量:100-1000100-1000詞詞 大詞匯量大詞匯量:10001000詞以上詞

33、以上 2.2.根據(jù)對(duì)說話人依賴程度根據(jù)對(duì)說話人依賴程度 特定人特定人:針對(duì)某個(gè)用戶進(jìn)行識(shí)別工作:針對(duì)某個(gè)用戶進(jìn)行識(shí)別工作 非特定人非特定人:針對(duì)任何人進(jìn)行識(shí)別工作:針對(duì)任何人進(jìn)行識(shí)別工作 限定人限定人:針對(duì)特定一組人進(jìn)行識(shí)別工作:針對(duì)特定一組人進(jìn)行識(shí)別工作 多媒體音頻技術(shù)2-44 3. 3.根據(jù)對(duì)說話人說話方式根據(jù)對(duì)說話人說話方式 孤立詞識(shí)別孤立詞識(shí)別:每次只含詞匯表中的一個(gè):每次只含詞匯表中的一個(gè)詞條,如一個(gè)詞、一個(gè)詞組或一條命令。詞條,如一個(gè)詞、一個(gè)詞組或一條命令。 連接詞識(shí)別連接詞識(shí)別:每次說詞匯表中若干個(gè)詞:每次說詞匯表中若干個(gè)詞條來進(jìn)行識(shí)別,該若干詞條以慢速連續(xù)的方條來進(jìn)行識(shí)別,該若

34、干詞條以慢速連續(xù)的方式連續(xù)說出,一般指十個(gè)數(shù)字連接而成的多式連續(xù)說出,一般指十個(gè)數(shù)字連接而成的多位數(shù)字的識(shí)別。位數(shù)字的識(shí)別。 連續(xù)語音識(shí)別連續(xù)語音識(shí)別:指說話人以日常自然的:指說話人以日常自然的方式講述并進(jìn)行識(shí)別。方式講述并進(jìn)行識(shí)別。多媒體音頻技術(shù)2-45四、語音識(shí)別軟件四、語音識(shí)別軟件 中文聽寫中文聽寫 語音識(shí)別軟件語音識(shí)別軟件 語音命令語音命令 語音合成語音合成 IBM ViaVoice 8.0IBM ViaVoice 8.0中文語音識(shí)別系統(tǒng)中文語音識(shí)別系統(tǒng)多媒體音頻技術(shù)2-46五、文本五、文本- -語音轉(zhuǎn)換技術(shù)語音轉(zhuǎn)換技術(shù)基于聲音合成技術(shù)的聲音產(chǎn)生技術(shù)。能基于聲音合成技術(shù)的聲音產(chǎn)生技術(shù)。

35、能將計(jì)算機(jī)內(nèi)的文本轉(zhuǎn)換成連續(xù)自然的語言流。將計(jì)算機(jī)內(nèi)的文本轉(zhuǎn)換成連續(xù)自然的語言流。包含兩種類型:包含兩種類型:(1 1)有效詞匯的計(jì)算機(jī)語音輸出。)有效詞匯的計(jì)算機(jī)語音輸出。 用于語音報(bào)時(shí)、汽車報(bào)站用于語音報(bào)時(shí)、汽車報(bào)站(2 2)基于語音合成技術(shù)的文本)基于語音合成技術(shù)的文本- -語音轉(zhuǎn)語音轉(zhuǎn)換器換器TTSTTS。 包括對(duì)語言的理解和語音的聲韻處理包括對(duì)語言的理解和語音的聲韻處理 多媒體音頻技術(shù)2-47專業(yè)音樂軟件專業(yè)音樂軟件Cakewalk 1.0-9.0Sonar 1.0-4.xCakewalk 1.0-9.0Sonar 1.0-4.xCubase VSI 5.xCubase SX 2.1

36、Cubase VSI 5.xCubase SX 2.1Logic Audio(PCLogic Audio(PC版、版、AppleApple版版) )(MIDI/(MIDI/音頻音頻/ /合成器一體化合成器一體化) )CoolEditCoolEdit (Syntrillium) (Syntrillium)Audition (Adobe)Audition (Adobe)GoldWare (GoldWare Inc.)GoldWare (GoldWare Inc.)Waves Native Gold Bundle(20Waves Native Gold Bundle(20以上以上) )TC Nati

37、ve Bundle(4)TC Native Bundle(4)Ultrafunk Sonltus fx(7)Ultrafunk Sonltus fx(7)多媒體音頻技術(shù)2-48一、一、AuditionAudition概述概述 1.Audition1.Audition的發(fā)展歷史的發(fā)展歷史19971997年年 syntrilliumsyntrillium公司公司 CoolCool EditEdit pro1.0pro1.0、 19991999年年(1.2)(1.2)、20022002年(年(2.02.0) 20032003年年 AdobeAdobe公司公司 Audition 1.0Audition

38、 1.0、 20042004年年(1.5)(1.5)、 2006 2006年年(2.0)(2.0)、2007(3.0)2007(3.0) 2.Audition2.Audition的主要功能的主要功能 Adobe Adobe Audition 3.0Audition 3.0是集聲音錄制、音頻是集聲音錄制、音頻混合和編輯于一體的數(shù)字音頻處理軟件。混合和編輯于一體的數(shù)字音頻處理軟件。主要功能主要功能:錄音、混音、音頻編輯、效果處理、降:錄音、混音、音頻編輯、效果處理、降噪、音頻壓縮、刻錄音樂噪、音頻壓縮、刻錄音樂CDCD等等多媒體音頻技術(shù)2-49 3.Audition3.Audition的啟動(dòng)和退出

39、的啟動(dòng)和退出 開始開始/ /程序程序/Adobe Audition/Adobe Audition、圖標(biāo)、啟動(dòng)欄、圖標(biāo)、啟動(dòng)欄 4.Audition4.Audition的窗口組成的窗口組成多媒體音頻技術(shù)(1 1)標(biāo)題欄:顯示應(yīng)用程序名稱和正在)標(biāo)題欄:顯示應(yīng)用程序名稱和正在處理的音頻文件名;處理的音頻文件名;(2 2)菜單欄:完成對(duì)音頻文件的讀取、)菜單欄:完成對(duì)音頻文件的讀取、修改、存儲(chǔ)和軟件設(shè)置等;修改、存儲(chǔ)和軟件設(shè)置等;(3 3)工具欄:)工具欄:編輯視圖:編輯視圖:多軌視圖:多軌視圖:CDCD視圖:視圖:工作區(qū):工作區(qū):多媒體音頻技術(shù)(4 4)“文件文件”和和“效果效果”列表框:列表框:(5 5)波形顯示區(qū):顯示音頻文件的波形)波形顯示區(qū):顯示音頻文件的波形(6 6)控制面板:)控制面板:多媒體音頻技術(shù)(7 7)“電平電平”指示條:當(dāng)前音頻電平大指示條:當(dāng)前音頻電平大小?。? 8)狀態(tài)欄:狀態(tài)信息。)狀態(tài)欄:狀態(tài)信息。5.5.編輯視圖和多軌視圖編輯視圖和多軌視圖編輯視圖:編輯獨(dú)立的音頻文件。編輯視圖:編輯獨(dú)立的音頻文件。多軌視圖:混合多軌文件或混合多軌視圖:混合多軌文件或混合MIDIMIDI音樂音樂及視頻。及視頻。采用破壞性編輯方法采用破壞性編輯方法采用非破壞性編輯方法采用非破壞性編輯方法多媒體音頻技術(shù)2-53二、音頻的基本操作二、音頻的基本操作 1.1.導(dǎo)入、錄音與播

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論