音頻信號(hào)的獲取與處理

上傳人：5*** IP屬地：湖北上傳時(shí)間：2021-11-25 格式：DOC 頁數(shù)：10 大小：901KB 積分：30 舉報(bào) 版權(quán)申訴

已閱讀5頁，還剩5頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、多媒體技術(shù)實(shí)驗(yàn)指導(dǎo)書莆田學(xué)院通信工程系2014年9月實(shí)驗(yàn)一音頻信號(hào)的獲取與處理【目的與要求】1、了解音頻數(shù)據(jù)的獲取和處理方法；2、學(xué)會(huì)使用簡單的聲音編輯工具進(jìn)行音頻數(shù)據(jù)的錄制、編輯和播放；3、了解不同的音頻文件在質(zhì)量上和數(shù)據(jù)量上的差異。【實(shí)驗(yàn)儀器與器件】硬件：計(jì)算機(jī)、聲卡、話筒、音箱或耳機(jī)軟件：聲音播放軟件（如千千靜聽、暴風(fēng)影音等）、音頻處理軟件cool edit pro【實(shí)驗(yàn)內(nèi)容】【基礎(chǔ)知識(shí)】1. 聲音媒體是較早引入計(jì)算機(jī)系統(tǒng)的多媒體信息之一，從早期的利用PC機(jī)內(nèi)置喇叭發(fā)聲，發(fā)展到利用聲卡在網(wǎng)上實(shí)現(xiàn)可視電話，聲音一直是多媒體計(jì)算機(jī)中重要的媒體信息。在軟件或多媒體作品中使用數(shù)字化聲

2、音是多媒體應(yīng)用最基本、最常用的手段。在多媒體作品中可以通過聲音直接表達(dá)信息、制造某種效果和氣氛、演奏音樂等。逼真的數(shù)字聲音和悅耳的音樂，拉近了計(jì)算機(jī)與人的距離，使計(jì)算機(jī)不僅能播放聲音而且"聽懂"人的聲音是實(shí)現(xiàn)人機(jī)自然交流的重要方面之一。2.數(shù)字音頻和模擬音頻模擬音頻和數(shù)字音頻在聲音的錄制和播放方面有很大不同。模擬聲音的錄制是將代表聲音波形的電信號(hào)轉(zhuǎn)換到適當(dāng)?shù)拿襟w上，如磁帶或唱片。播放時(shí)將紀(jì)錄在媒體上的信號(hào)還原為波形。模擬音頻技術(shù)應(yīng)用廣泛，使用方便。但模擬的聲音信號(hào)在多次重復(fù)轉(zhuǎn)錄后，會(huì)使模擬信號(hào)衰弱，造成失真。數(shù)字音頻就是將模擬的(連續(xù)的)聲音波形數(shù)字化(離散化)，以便利用

3、數(shù)字計(jì)算機(jī)進(jìn)行處理，主要包括采樣和量化兩個(gè)方面。3. 數(shù)字音頻的質(zhì)量數(shù)字音頻的質(zhì)量取決于采樣頻率和量化位數(shù)這兩個(gè)重要參數(shù)。采樣頻率是對聲音波形每秒鐘進(jìn)行采樣的次數(shù)。人耳聽覺的頻率上限在2OkHz左右，根據(jù)采樣理論，為了保證聲音不失真，采樣頻率應(yīng)在4OkHz左右。經(jīng)常使用的采樣頻率有11.025kHz、22.05kHz和44.lkHz等。采樣頻率越高，聲音失真越小、音頻數(shù)據(jù)量越大。量化位數(shù)(也稱量化級(jí))是每個(gè)采樣點(diǎn)的幅度量化時(shí)采用的二進(jìn)制數(shù)的位數(shù)，常用的量化標(biāo)準(zhǔn)有8位、16位和32位。例如，8位量化級(jí)表示每個(gè)采樣點(diǎn)可以表示256個(gè)(0-255)不同量化值，而16位量化級(jí)則可表示65536個(gè)不同量

4、化值。量化位數(shù)越高音質(zhì)越好，數(shù)據(jù)量也越大。反映數(shù)字音頻質(zhì)量的另一個(gè)因素是通道(或聲道)個(gè)數(shù)。單聲道是比較原始的聲音復(fù)制形式, 每次只能生成一個(gè)聲波數(shù)據(jù)。立體聲(雙聲道)技術(shù)是每次生成兩個(gè)聲波數(shù)據(jù)，并在錄制過程中分別分配到兩個(gè)獨(dú)立的聲道輸出，從而達(dá)到了很好的聲音定位效果。四聲道環(huán)繞（4.1聲道）是為了適應(yīng)三維音效技術(shù)而產(chǎn)生的，四聲道環(huán)繞規(guī)定了4個(gè)發(fā)音點(diǎn)：前左、前右，后左、后右，并建議增加一個(gè)低音音箱，以加強(qiáng)對低頻信號(hào)的回放處理。Dolby AC-3音效（5.1聲道）是由5個(gè)全頻聲道和一個(gè)超重低音聲道組成的環(huán)繞立體聲。在多媒體音頻技術(shù)中，存儲(chǔ)聲音信息的文件有多種格式，如Wav、Midi、Mp3、R

5、m、VQF等等。 1）Wav格式Wav格式的文件又稱波形文件，是用不同的采樣率對聲音的模擬波形進(jìn)行采樣得到的一系列離散的采樣點(diǎn)，以不同的量化位數(shù)（16位、32位或64位）把這些采樣點(diǎn)的值轉(zhuǎn)換成二進(jìn)制數(shù)得到的。Wav是數(shù)字音頻技術(shù)中最常用的格式，它還原的音質(zhì)較好，但所需存儲(chǔ)空間較大。 2）Midi格式Midi是Musical Instrument Digital Interface（樂器數(shù)字接口）的縮寫。它是由世界上主要電子樂器制造廠商建立起來的一個(gè)通信標(biāo)準(zhǔn)，并于 1988年正式提交給MIDI制造商協(xié)會(huì)，便成為數(shù)字音樂的一個(gè)國際標(biāo)準(zhǔn)。MIDI標(biāo)準(zhǔn)規(guī)定了電子樂器與計(jì)算機(jī)連接的電纜硬件以及電子樂器之

6、間、樂器與計(jì)算機(jī)之間傳送數(shù)據(jù)的通信協(xié)議等規(guī)范。 MIDI標(biāo)準(zhǔn)使不同廠家生產(chǎn)的電子合成樂器可以互相發(fā)送和接收音樂數(shù)據(jù)。Midi文件紀(jì)錄的是一系列指令而不是數(shù)字化后的波形數(shù)據(jù)，所以它占用存儲(chǔ)空間比Wav文件要小很多。 3）MP3格式MP3是對MPEG Layer 3的簡稱，是目前最熱門的音樂文件。其技術(shù)采用MPEG Layer 3標(biāo)準(zhǔn)對WAVE音頻文件進(jìn)行壓縮而成，特點(diǎn)是能以較小的比特率、較大的壓縮率達(dá)到近乎CD音質(zhì)。其壓縮率可達(dá)1:12，每分鐘CD音樂大約需要1兆的磁盤空間。 4）Rm格式Rm是RealMedia文件的簡稱。 Real Networks公司所制定的音頻視頻壓縮規(guī)范稱為RealMe

7、dia，是目前在Internet上相當(dāng)流行的跨平臺(tái)的客戶/服務(wù)器結(jié)構(gòu)多媒體應(yīng)用標(biāo)準(zhǔn)，它采用音頻/視頻流和同步回放技術(shù)來實(shí)現(xiàn)在Intranet上全帶寬地提供最優(yōu)質(zhì)的多媒體，同時(shí)也能夠在Internet上以28.8Kbps的傳輸速率提供立體聲和連續(xù)視頻。4. 硬件準(zhǔn)備目前，多媒體計(jì)算機(jī)中的音頻處理工作主要借助聲卡，從對聲音信息的采集、編輯加工，直到聲音媒體文件的回放這一整個(gè)過程都離不開聲卡。聲卡在計(jì)算機(jī)系統(tǒng)中的主要作用是聲音文件的處理、音調(diào)的控制、語音處理和提供MIDI接口功能等。進(jìn)行錄制音頻信號(hào)所需的硬件除了聲卡，還有麥克風(fēng)、音箱以及外界的音源信號(hào)設(shè)備（如CD唱機(jī)、錄音機(jī)等），把麥克風(fēng)、音箱、外

8、界音源信號(hào)設(shè)備與聲卡正確連接完成硬件準(zhǔn)備工作，如圖1.1所示。圖1.1 外部設(shè)備與聲卡連接示意圖硬件連接好后，為了使聲卡能正常工作還要進(jìn)行音頻設(shè)置，設(shè)置方法如下：1）右擊桌面右下角的小喇叭，選擇“調(diào)整音頻屬性” ，選擇“音頻”面板。2）單擊“聲音播放”中的“音量”按鈕，設(shè)置播放的音量。其中，“主音量” 是輸出的總音量；“波形”是指我們播放的WAV文件和MP3文件的音量；“軟件合成器”（MIDI）是管MIDI音樂文件的音量；“CD唱機(jī)”是負(fù)責(zé)播放CD；“線性輸入”是指聲卡上的LINEIN輸入。3）設(shè)置錄音的音量：單擊“錄音”中的“音量”按鈕； “選項(xiàng)”菜單，打開“屬性” 框，；勾選 “麥克風(fēng)”（

9、英文是MIC），調(diào)整音量大小。音量的大小調(diào)節(jié)，需要根據(jù)自己的情況來決定，嗓音大的可以把音量調(diào)小一點(diǎn)，嗓音小的把音量調(diào)到最大。【cool edit操作基礎(chǔ)】1）使用Cool Edit錄制聲音運(yùn)行用Cool Edit，打開主界面窗口，如圖1.2所示圖1.2 cool edit主界面右擊音軌1的空白處，插入伴奏音樂，如圖1.3所示。圖1.3 伴奏音樂的插入按下音軌2的R鍵及左下方的紅色錄音鍵，跟隨伴奏音樂開始演唱（或朗誦）和錄制。如圖4所示。圖1.3 聲音格式的設(shè)置結(jié)束錄音可按“停止”按鈕。點(diǎn)左下方播音鍵進(jìn)行試聽，看有無嚴(yán)重的出錯(cuò)，無誤后雙擊音軌 2 進(jìn)入波形編輯界面，把錄制的聲音存儲(chǔ)為無壓

10、縮的.wav文件。“保存類型”可選擇為“Windows PCM”。（也可以另存為其他格式）2）用Cool Edit編輯音頻文件降噪處理：在波形編輯界面，找出一段適合用來作噪聲采樣波形，打開“效果-噪聲消除-降噪器”準(zhǔn)備進(jìn)行噪聲采樣，如圖1.4和圖1.5所示。在按默認(rèn)參數(shù)值進(jìn)行噪聲采樣后，關(guān)閉降噪器，回到波形編輯界面，全選錄制的聲音波形，進(jìn)入降噪器并點(diǎn)擊確定，完成降噪處理。圖1.4 噪聲選擇示意圖圖1.5 噪聲采樣示意圖混響處理：打開【效果】|【常用效果器】|【混響】，調(diào)節(jié)混響長度、起始緩沖、高頻吸收時(shí)間、干濕聲比例等值，如圖1.6所示，反復(fù)調(diào)節(jié)試聽，達(dá)到最佳效果為止。圖1.6 設(shè)置混響效果

11、淡入淡出：選取背景音樂波形的開頭一部分或結(jié)束的一段，執(zhí)行【效果】|【波形振幅】|【漸變】，打開波形振幅對話框，選中淡入/出選項(xiàng)卡，設(shè)置好初始音量值和結(jié)束音量值，點(diǎn)擊確定完成淡入淡出處理，如圖1.7所示。圖1.7 淡入淡出處理混縮合成：點(diǎn)“編輯-混縮到文件-全部波形”便可將伴奏和處理過的人聲混縮合成在一起，最后點(diǎn) “ 文件 - 另存為 ” 將混縮合成后的文件保存為需要的格式?！緦?shí)驗(yàn)內(nèi)容及步驟】錄制一首自己的歌曲（伴奏可在網(wǎng)上下載）或進(jìn)行詩歌朗誦（自行選擇合適的背景音樂）。要求：1、盡可能多的練習(xí)使用cool edit軟件的各項(xiàng)功能，除以上介紹外，其他功能參考“cool_edit2.1教程.doc”文件； 2、使用“另存為”命令分別將音頻文件以A/mu-Law Wave、Microsoft ADPCM、MP3格式進(jìn)行保存。將各種格式的語音文件的聲音參數(shù)（如采樣頻率、量化精度、壓縮算法、壓縮前后的數(shù)據(jù)量等

人人文庫> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

音頻信號(hào)的獲取與處理

文檔簡介

溫馨提示

最新文檔

評(píng)論

音頻信號(hào)的獲取與處理

文檔簡介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔