音頻信號的獲取與處理_第1頁
音頻信號的獲取與處理_第2頁
音頻信號的獲取與處理_第3頁
音頻信號的獲取與處理_第4頁
音頻信號的獲取與處理_第5頁
已閱讀5頁,還剩5頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、多媒體技術(shù)實驗指導(dǎo)書莆田學(xué)院 通信工程系2014年9月 實驗一 音頻信號的獲取與處理【目的與要求】1、 了解音頻數(shù)據(jù)的獲取和處理方法;2、 學(xué)會使用簡單的聲音編輯工具進行音頻數(shù)據(jù)的錄制、編輯和播放;3、 了解不同的音頻文件在質(zhì)量上和數(shù)據(jù)量上的差異?!緦嶒瀮x器與器件】硬件:計算機、聲卡、話筒、音箱或耳機軟件:聲音播放軟件(如千千靜聽、暴風(fēng)影音等)、音頻處理軟件cool edit pro【實驗內(nèi)容】【基礎(chǔ)知識】1. 聲音媒體是較早引入計算機系統(tǒng)的多媒體信息之一,從早期的利用PC機內(nèi)置喇叭發(fā)聲,發(fā)展到利用聲卡在網(wǎng)上實現(xiàn)可視電話,聲音一直是多媒體計算機中重要的媒體信息。在軟件或多媒體作品中使用數(shù)字化聲

2、音是多媒體應(yīng)用最基本、最常用的手段。在多媒體作品中可以通過聲音直接表達(dá)信息、制造某種效果和氣氛、演奏音樂等。逼真的數(shù)字聲音和悅耳的音樂,拉近了計算機與人的距離,使計算機不僅能播放聲音而且"聽懂"人的聲音是實現(xiàn)人機自然交流的重要方面之一。2.數(shù)字音頻和模擬音頻模擬音頻和數(shù)字音頻在聲音的錄制和播放方面有很大不同。模擬聲音的錄制是將代表聲音波形的電信號轉(zhuǎn)換到適當(dāng)?shù)拿襟w上,如磁帶或唱片。播放時將紀(jì)錄在媒體上的信號還原為波形。模擬音頻技術(shù)應(yīng)用廣泛,使用方便。但模擬的聲音信號在多次重復(fù)轉(zhuǎn)錄后,會使模擬信號衰弱,造成失真。 數(shù)字音頻就是將模擬的(連續(xù)的)聲音波形數(shù)字化(離散化),以便利用

3、數(shù)字計算機進行處理,主要包括采樣和量化兩個方面。3. 數(shù)字音頻的質(zhì)量數(shù)字音頻的質(zhì)量取決于采樣頻率和量化位數(shù)這兩個重要參數(shù)。采樣頻率是對聲音波形每秒鐘進行采樣的次數(shù)。人耳聽覺的頻率上限在2OkHz左右,根據(jù)采樣理論,為了保證聲音不失真,采樣頻率應(yīng)在4OkHz左右。經(jīng)常使用的采樣頻率有11.025kHz、22.05kHz和44.lkHz等。采樣頻率越高,聲音失真越小、音頻數(shù)據(jù)量越大。量化位數(shù)(也稱量化級)是每個采樣點的幅度量化時采用的二進制數(shù)的位數(shù),常用的量化標(biāo)準(zhǔn)有8位、16位和32位。例如,8位量化級表示每個采樣點可以表示256個(0-255)不同量化值,而16位量化級則可表示65536個不同量

4、化值。量化位數(shù)越高音質(zhì)越好,數(shù)據(jù)量也越大。反映數(shù)字音頻質(zhì)量的另一個因素是通道(或聲道)個數(shù)。單聲道是比較原始的聲音復(fù)制形式, 每次只能生成一個聲波數(shù)據(jù)。立體聲(雙聲道)技術(shù)是每次生成兩個聲波數(shù)據(jù),并在錄制過程中分別分配到兩個獨立的聲道輸出,從而達(dá)到了很好的聲音定位效果。四聲道環(huán)繞(4.1聲道)是為了適應(yīng)三維音效技術(shù)而產(chǎn)生的,四聲道環(huán)繞規(guī)定了4個發(fā)音點:前左、前右,后左、后右,并建議增加一個低音音箱,以加強對低頻信號的回放處理。Dolby AC-3音效(5.1聲道)是由5個全頻聲道和一個超重低音聲道組成的環(huán)繞立體聲。在多媒體音頻技術(shù)中,存儲聲音信息的文件有多種格式,如Wav、Midi、Mp3、R

5、m、VQF等等。 1)Wav格式Wav格式的文件又稱波形文件,是用不同的采樣率對聲音的模擬波形進行采樣得到的一系列離散的采樣點,以不同的量化位數(shù)(16位、32位或64位)把這些采樣點的值轉(zhuǎn)換成二進制數(shù)得到的。Wav是數(shù)字音頻技術(shù)中最常用的格式,它還原的音質(zhì)較好,但所需存儲空間較大。 2)Midi格式Midi是Musical Instrument Digital Interface(樂器數(shù)字接口)的縮寫。它是由世界上主要電子樂器制造廠商建立起來的一個通信標(biāo)準(zhǔn),并于 1988年正式提交給MIDI制造商協(xié)會,便成為數(shù)字音樂的一個國際標(biāo)準(zhǔn)。MIDI標(biāo)準(zhǔn)規(guī)定了電子樂器與計算機連接的電纜硬件以及電子樂器之

6、間、樂器與計算機之間傳送數(shù)據(jù)的通信協(xié)議等規(guī)范。 MIDI標(biāo)準(zhǔn)使不同廠家生產(chǎn)的電子合成樂器可以互相發(fā)送和接收音樂數(shù)據(jù)。Midi文件紀(jì)錄的是一系列指令而不是數(shù)字化后的波形數(shù)據(jù),所以它占用存儲空間比Wav文件要小很多。 3)MP3格式MP3是對MPEG Layer 3的簡稱,是目前最熱門的音樂文件。其技術(shù)采用MPEG Layer 3標(biāo)準(zhǔn)對WAVE音頻文件進行壓縮而成,特點是能以較小的比特率、較大的壓縮率達(dá)到近乎CD音質(zhì)。其壓縮率可達(dá)1:12,每分鐘CD音樂大約需要1兆的磁盤空間。 4)Rm格式Rm是RealMedia文件的簡稱。 Real Networks公司所制定的音頻視頻壓縮規(guī)范稱為RealMe

7、dia,是目前在Internet上相當(dāng)流行的跨平臺的客戶/服務(wù)器結(jié)構(gòu)多媒體應(yīng)用標(biāo)準(zhǔn),它采用音頻/視頻流和同步回放技術(shù)來實現(xiàn)在Intranet上全帶寬地提供最優(yōu)質(zhì)的多媒體,同時也能夠在Internet上以28.8Kbps的傳輸速率提供立體聲和連續(xù)視頻。4. 硬件準(zhǔn)備目前,多媒體計算機中的音頻處理工作主要借助聲卡,從對聲音信息的采集、編輯加工,直到聲音媒體文件的回放這一整個過程都離不開聲卡。聲卡在計算機系統(tǒng)中的主要作用是聲音文件的處理、音調(diào)的控制、語音處理和提供MIDI接口功能等。進行錄制音頻信號所需的硬件除了聲卡,還有麥克風(fēng)、音箱以及外界的音源信號設(shè)備(如CD唱機、錄音機等),把麥克風(fēng)、音箱、外

8、界音源信號設(shè)備與聲卡正確連接完成硬件準(zhǔn)備工作,如圖1.1所示。圖1.1 外部設(shè)備與聲卡連接示意圖硬件連接好后,為了使聲卡能正常工作還要進行音頻設(shè)置,設(shè)置方法如下:1)右擊桌面右下角的小喇叭,選擇“調(diào)整音頻屬性” ,選擇“音頻”面板。2)單擊“聲音播放”中的“音量”按鈕,設(shè)置播放的音量。其中,“主音量” 是輸出的總音量;“波形”是指我們播放的WAV文件和MP3文件的音量;“軟件合成器”(MIDI)是管MIDI音樂文件的音量;“CD唱機”是負(fù)責(zé)播放CD;“線性輸入”是指聲卡上的LINEIN輸入。3)設(shè)置錄音的音量:單擊“錄音”中的“音量”按鈕; “選項”菜單,打開“屬性” 框,;勾選 “麥克風(fēng)”(

9、英文是MIC),調(diào)整音量大小。音量的大小調(diào)節(jié),需要根據(jù)自己的情況來決定,嗓音大的可以把音量調(diào)小一點,嗓音小的把音量調(diào)到最大?!綾ool edit操作基礎(chǔ)】1)使用Cool Edit錄制聲音 運行用Cool Edit,打開主界面窗口,如圖1.2所示圖1.2 cool edit主界面 右擊音軌1的空白處,插入伴奏音樂,如圖1.3所示。圖1.3 伴奏音樂的插入 按下音軌2的R鍵及左下方的紅色錄音鍵,跟隨伴奏音樂開始演唱(或朗誦)和錄制。如圖4所示。圖1.3 聲音格式的設(shè)置 結(jié)束錄音可按“停止”按鈕。點左下方播音鍵進行試聽,看有無嚴(yán)重的出錯,無誤后雙擊音軌 2 進入波形編輯界面,把錄制的聲音存儲為無壓

10、縮的.wav文件?!氨4骖愋汀笨蛇x擇為“Windows PCM”。(也可以另存為其他格式)2)用Cool Edit編輯音頻文件 降噪處理: 在波形編輯界面,找出一段適合用來作噪聲采樣波形,打開“效果-噪聲消除-降噪器”準(zhǔn)備進行噪聲采樣,如圖1.4和圖1.5所示。在按默認(rèn)參數(shù)值進行噪聲采樣后,關(guān)閉降噪器,回到波形編輯界面,全選錄制的聲音波形,進入降噪器并點擊確定,完成降噪處理。圖1.4 噪聲選擇示意圖圖1.5 噪聲采樣示意圖混響處理:打開【效果】|【常用效果器】|【混響】,調(diào)節(jié)混響長度、起始緩沖、高頻吸收時間、干濕聲比例等值,如圖1.6所示,反復(fù)調(diào)節(jié)試聽,達(dá)到最佳效果為止。圖1.6 設(shè)置混響效果

11、 淡入淡出:選取背景音樂波形的開頭一部分或結(jié)束的一段,執(zhí)行【效果】|【波形振幅】|【漸變】,打開波形振幅對話框,選中淡入/出選項卡,設(shè)置好初始音量值和結(jié)束音量值,點擊確定完成淡入淡出處理,如圖1.7所示。圖1.7 淡入淡出處理混縮合成:點“編輯-混縮到文件-全部波形”便可將伴奏和處理過的人聲混縮合成在一起,最后點 “ 文件 - 另存為 ” 將混縮合成后的文件保存為需要的格式?!緦嶒瀮?nèi)容及步驟】錄制一首自己的歌曲(伴奏可在網(wǎng)上下載)或進行詩歌朗誦(自行選擇合適的背景音樂)。要求:1、盡可能多的練習(xí)使用cool edit軟件的各項功能,除以上介紹外,其他功能參考“cool_edit2.1教程.doc”文件; 2、使用“另存為”命令分別將音頻文件以A/mu-Law Wave、Microsoft ADPCM、MP3格式進行保存。將各種格式的語音文件的聲音參數(shù)(如采樣頻率、量化精度、壓縮算法、壓縮前后的數(shù)據(jù)量等

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論