版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
10六月2023多媒體技術-音頻基礎1本章內(nèi)容音頻的聲學基礎聲音的數(shù)字化聲音的存儲格式MIDI音樂語音信號、非語音信號10六月2023多媒體技術-音頻基礎2音頻媒體音頻(audio)或聲音(sound)攜帶信息的極其重要的媒體多媒體技術研究中的一個重要內(nèi)容與視覺媒體相比具有特殊性不同場合下的重要性不同Passiveviewing(e.g.film,video,etc.)Videoconferencing10六月2023多媒體技術-音頻基礎3聲音的概念聲音是一種機械振動狀態(tài)的傳播現(xiàn)象,它表現(xiàn)為一種機械被即聲波。產(chǎn)生聲波的條件有作機械振動的物體:聲源有能傳播機械振功的彈性介質(zhì)聲波在介質(zhì)中傳播有一定速度,稱之為聲波的傳播速度(聲速)10六月2023多媒體技術-音頻基礎4聲波示意(L.A.Rowe)壓縮稀薄時間幅度正弦波10六月2023多媒體技術-音頻基礎5聲波頻率聲壓變化可以是周期性的和非周期性頻率概念循環(huán)(cycle)-壓縮/稀薄過程頻率(frequency):每秒cycle數(shù),單位hertz(Hz)周期
–
cycle的持續(xù)時間(1/frequency)聲音信號一般由許多頻率不同的信號組成,稱為復合信號;而單一頻率的信號稱為分量信號10六月2023多媒體技術-音頻基礎6頻率范圍頻率小于20Hz一般稱為次聲波(subsonic)人的聽覺器官能感知的聲音頻率范圍約為20Hz~20kHz的信號稱為音頻(Audio)信號人發(fā)音器官發(fā)聲頻率約是80~3400Hz,但人說話的信號頻率約為300~3000Hz,即話音(speech)信號高于20kHz的信號稱為超聲波(ultrasonic)超聲波及次聲波一般不能引起人聽覺器官的感覺,但可借助一些儀器設備進行觀察和測量10六月2023多媒體技術-音頻基礎7樂音與噪音一般樂音指具有確定的基頻以及與該基頻有較小整數(shù)倍關系的各階諧頻(harmonictone)頻率比基音高的所有分音統(tǒng)稱泛音(overtone),泛音的頻率不必與基音成整數(shù)倍關系在主觀上把令人不愉快或不需要的聲音定義為噪音噪音的頻譜較為復雜,具有無規(guī)則的振幅和波形的連續(xù)頻譜10六月2023多媒體技術-音頻基礎8聲音要素(一)響度(音響)loudness到達人耳的聲擾動振幅所產(chǎn)生的聽覺的大小聲振動能量是物理特性,可用聲強(soundpressure)定義,單位:帕斯卡(Pa)實用上通常都以對數(shù)方式的聲壓級(soundpressurelevel)表示,單位:分貝(db)響度是主觀量,不能用任何儀器正確地測量聲音響度使用了以兩個聲強之比的對數(shù)為基礎的相對標度,單位:宋(sone)10六月2023多媒體技術-音頻基礎9聲音要素(二)音調(diào)(音高)pitch或tone人對聲音刺激頻率的主觀判斷與估量,稱之為音調(diào)(Pitch),單位:美(Mel)Frequency是物理量,而音調(diào)是人的感覺聽覺經(jīng)驗一般女生的聲音比男生高較大物體振動的音調(diào)較低10六月2023多媒體技術-音頻基礎10聲音要素(三)音色(音質(zhì))timber由其頻譜決定不同樂器發(fā)出同一音高的樂音,仍然可以分辨可以把音色描述為音的瞬時橫截面,即用諧音(泛音)的數(shù)目、強度、分布和相位來描述。泛音的強度可使音色發(fā)生變化,音色的主觀特性比響度或音調(diào)的主觀特性復雜得多。10六月2023多媒體技術-音頻基礎11模擬信號與數(shù)字信號在時間和幅度上連續(xù)的信號為模擬(analog)信號。巴時間和幅度都用離散的數(shù)字表示的信號就稱為數(shù)字(digital)信號采樣(sampling)-時間量化(quantization)-幅度數(shù)字化實際上就是采樣和量化10六月2023多媒體技術-音頻基礎12聲音的采樣和量化兩個關鍵參數(shù):采樣頻率與量化精度10六月2023多媒體技術-音頻基礎13采樣頻率每秒鐘需要采集多少個聲音樣本根據(jù)奈奎斯特理論(Nyquisttheory)和聲音信號本身的最高頻率決定的fs>=2f或者Ts<=T/2如果一個信號中的最高頻率為fmax,采樣頻率最低要選擇2fmax10六月2023多媒體技術-音頻基礎14量化精度反映度量聲音波形幅度的精度,一般用每個聲音樣本的位數(shù)(bitpersample,bps)表示常見的量化精度有:8與16聲音的質(zhì)量越高,需要的存儲空間越多10六月2023多媒體技術-音頻基礎15聲音質(zhì)量等級質(zhì)量采樣頻率
(kHz)樣本精度
(bit/s)單道聲/立體聲數(shù)據(jù)率(未壓縮)
(kb/s)頻率范圍電話88單道聲64200~3400HzAM11.0258單道聲88.220~15000HzFM22.05016立體聲705.650~7000HzCD44.116立體聲1411.220~20000HzDAT4816立體聲1536.020~20000Hz10六月2023多媒體技術-音頻基礎16聲音質(zhì)量的度量聲音質(zhì)量的評價目前仍然是一個很困難的問題,需要繼續(xù)研究聲音質(zhì)量的度量有兩種基本的方法客觀質(zhì)量度量:主要用信噪比(signaltonioseratio,SNR)主觀質(zhì)量度量:主觀平均判分法對于圖象等其它媒體數(shù)據(jù)的處理同樣存在兩種質(zhì)量度量主客觀結合?10六月2023多媒體技術-音頻基礎17存儲格式(一)用.wav為擴展名的文件格式稱為波形文件格式(WAVEFileFormat)RIFF:ResourceInterchangeFileFormatIBM和微軟公司于1991年8月聯(lián)合開發(fā)支持存儲各種采樣頻率和樣本精度的聲音數(shù)據(jù),并支持一定的聲音數(shù)據(jù)的壓縮主要用于PC類似格式au(SUN),aiff(Apple),snd(SGI)/_articles/AudioFormatIntro.ht
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度文化遺址場地保護與利用合同協(xié)議書3篇
- 專業(yè)拓展訓練合作合同書2024版版B版
- 2024離婚雙方房產(chǎn)分割及過戶操作補充合同版B版
- 2024綜合授信額度合同及分期貸款細則版B版
- 2025年度廠房租賃及品牌授權合作協(xié)議3篇
- 2025年度工業(yè)廠房拆除及重建合同范本4篇
- 2025年度商業(yè)地產(chǎn)項目場地借用合同樣本3篇
- 2025年度數(shù)字化工廠搬遷工程合同范本4篇
- 油品基礎知識培訓課件
- 2024版室內(nèi)粉刷工作班組勞動協(xié)議樣本版B版
- 2023年Web前端技術試題
- GB/T 20840.8-2007互感器第8部分:電子式電流互感器
- GB/T 14864-2013實心聚乙烯絕緣柔軟射頻電纜
- 品牌策劃與推廣-項目5-品牌推廣課件
- 信息學奧賽-計算機基礎知識(完整版)資料
- 發(fā)煙硫酸(CAS:8014-95-7)理化性質(zhì)及危險特性表
- 數(shù)字信號處理(課件)
- 公路自然災害防治對策課件
- 火災報警應急處置程序流程圖
- 耳鳴中醫(yī)臨床路徑
- 安徽身份證號碼前6位
評論
0/150
提交評論