版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、12美科學(xué)家發(fā)明創(chuàng)可貼美科學(xué)家發(fā)明創(chuàng)可貼MP3無需電池供電無需電池供電 1n聲音來自振動。當(dāng)人耳鼓膜上空氣聲音來自振動。當(dāng)人耳鼓膜上空氣壓力變化時(shí),我們就感覺到了聲音。壓力變化時(shí),我們就感覺到了聲音。n把樂聲振動轉(zhuǎn)換為電流或電壓,即把樂聲振動轉(zhuǎn)換為電流或電壓,即可在示波器上顯示其波形??稍谑静ㄆ魃巷@示其波形。n用電流驅(qū)動揚(yáng)聲器音圈而帶動紙盆用電流驅(qū)動揚(yáng)聲器音圈而帶動紙盆振動,就又可把電信號變成聲音。振動,就又可把電信號變成聲音。n這是聲音信號的模擬形式。模擬方式也可以用來儲存聲音,例如這是聲音信號的模擬形式。模擬方式也可以用來儲存聲音,例如傳統(tǒng)的錄音磁帶和唱片就是把聲波的振動儲存在磁粉或凹槽中
2、。傳統(tǒng)的錄音磁帶和唱片就是把聲波的振動儲存在磁粉或凹槽中。美科學(xué)家發(fā)明創(chuàng)可貼美科學(xué)家發(fā)明創(chuàng)可貼MP3無需電池供電無需電池供電 2n由于電腦只認(rèn)得由于電腦只認(rèn)得0 0和和1 1,故為了用計(jì)算機(jī)處理、故為了用計(jì)算機(jī)處理、分析、交互和保存音樂分析、交互和保存音樂信號,首先應(yīng)把原始的、信號,首先應(yīng)把原始的、在時(shí)間和幅度上都是連在時(shí)間和幅度上都是連續(xù)表示的模擬音樂信號,續(xù)表示的模擬音樂信號,變換為數(shù)字信號。這就變換為數(shù)字信號。這就要求把模擬信號在幅度要求把模擬信號在幅度上和時(shí)間上都離散化,上和時(shí)間上都離散化,并用二進(jìn)制編碼來表示。并用二進(jìn)制編碼來表示。 n最自然的振動形式可用正弦波表示:最自然的振動形式
3、可用正弦波表示:)(sin)(2ftAtr 3美科學(xué)家發(fā)明創(chuàng)可貼美科學(xué)家發(fā)明創(chuàng)可貼MP3無需電池供電無需電池供電 4n已知人耳:已知人耳:n通常只能感知到頻率范圍在通常只能感知到頻率范圍在20-20000赫茲的音頻聲音;赫茲的音頻聲音; n對于聲音的相位不敏感;對于聲音的相位不敏感;n感覺到的聲音響度與聲音幅度的對數(shù)成正比。感覺到的聲音響度與聲音幅度的對數(shù)成正比。n這為音樂信號的數(shù)字化和壓縮編碼提供了依據(jù)。這為音樂信號的數(shù)字化和壓縮編碼提供了依據(jù)。n數(shù)字音頻是通過將聲波波形轉(zhuǎn)換成一連串的二進(jìn)制數(shù)字來數(shù)字音頻是通過將聲波波形轉(zhuǎn)換成一連串的二進(jìn)制數(shù)字來再現(xiàn)原始聲音的,這一過程叫做模數(shù)轉(zhuǎn)換(再現(xiàn)原始
4、聲音的,這一過程叫做模數(shù)轉(zhuǎn)換(A/D),包括),包括取樣、量化和編碼取樣、量化和編碼 “三部曲三部曲” 。美科學(xué)家發(fā)明創(chuàng)可貼美科學(xué)家發(fā)明創(chuàng)可貼MP3無需電池供電無需電池供電 5n所謂取樣(又稱采樣、抽樣),就是在時(shí)間上把連續(xù)的所謂取樣(又稱采樣、抽樣),就是在時(shí)間上把連續(xù)的音樂信號音樂信號離散化離散化。每秒鐘所能采集到的樣本個數(shù)(。每秒鐘所能采集到的樣本個數(shù)(sps)稱為采樣速率,在數(shù)值上等于采樣開關(guān)切換的頻率,采稱為采樣速率,在數(shù)值上等于采樣開關(guān)切換的頻率,采樣頻率的單位是赫茲(樣頻率的單位是赫茲(Hz)。)。n采樣頻率越高,越能采樣頻率越高,越能“捕捉捕捉”到更高頻率的聲音。但根到更高頻率
5、的聲音。但根據(jù)奈奎斯特采樣定理,只要采樣頻率不低于音樂信號最據(jù)奈奎斯特采樣定理,只要采樣頻率不低于音樂信號最高頻率的高頻率的2倍,即可無失真地再將采樣信號恢復(fù)成原來倍,即可無失真地再將采樣信號恢復(fù)成原來模擬的音樂信號。模擬的音樂信號。美科學(xué)家發(fā)明創(chuàng)可貼美科學(xué)家發(fā)明創(chuàng)可貼MP3無需電池供電無需電池供電 6 7n所謂量化,就是將取樣所謂量化,就是將取樣信號在幅度上也離散化信號在幅度上也離散化 。通常量化過程一定引入通常量化過程一定引入失真,但從生理學(xué)角度失真,但從生理學(xué)角度看,人耳對信息幅度變看,人耳對信息幅度變化有一個稱為化有一個稱為剛辨差剛辨差的的極限,對低于該極限的極限,對低于該極限的幅度變
6、化已無法感知,幅度變化已無法感知,故傳送過細(xì)的幅度變化故傳送過細(xì)的幅度變化也不必要也不必要 。 n所謂編碼,就是按一定規(guī)律把量化后的脈沖取樣值按幅度所謂編碼,就是按一定規(guī)律把量化后的脈沖取樣值按幅度大小變換成相應(yīng)的二進(jìn)制碼,形成數(shù)字信號。大小變換成相應(yīng)的二進(jìn)制碼,形成數(shù)字信號。 8 9n采用數(shù)字技術(shù)表示或處理音樂信號有許多優(yōu)越性,但也采用數(shù)字技術(shù)表示或處理音樂信號有許多優(yōu)越性,但也使數(shù)據(jù)量大增。把音樂信號轉(zhuǎn)化為數(shù)字表示每秒鐘所需使數(shù)據(jù)量大增。把音樂信號轉(zhuǎn)化為數(shù)字表示每秒鐘所需的數(shù)據(jù)速率或比特(的數(shù)據(jù)速率或比特(bit)率()率(bit/s或或bps)為:)為: 采樣頻率(采樣頻率(Hz)*量化
7、位數(shù)(量化位數(shù)(bit)*音樂聲道數(shù)音樂聲道數(shù) 此即該信號在通信線路上每秒鐘應(yīng)傳送的位數(shù)。此即該信號在通信線路上每秒鐘應(yīng)傳送的位數(shù)。n因?yàn)橛?jì)算機(jī)中一個字節(jié)(因?yàn)橛?jì)算機(jī)中一個字節(jié)(Byte)有)有8位,所以用比特率位,所以用比特率除以除以8,即得到保存,即得到保存1秒鐘數(shù)字音樂信號所需占用的存儲秒鐘數(shù)字音樂信號所需占用的存儲容量。容量。 10n以往主流的電腦聲卡上,采樣頻率一般分三檔:以往主流的電腦聲卡上,采樣頻率一般分三檔:n22.05kHz只能達(dá)到調(diào)頻廣播音質(zhì);只能達(dá)到調(diào)頻廣播音質(zhì);n44.1kHz是早期理論上的是早期理論上的CD音質(zhì)界限;音質(zhì)界限;n48kHz是早期是早期DVD的基本要求。
8、的基本要求。n現(xiàn)在高保真音響如現(xiàn)在高保真音響如高清專業(yè)音頻錄音以及高清音頻回放高清專業(yè)音頻錄音以及高清音頻回放(包含(包含HDCD、DVD-Audio、藍(lán)光、藍(lán)光DVD等),等),對于采樣對于采樣頻率的要求已提高到頻率的要求已提高到96kHz和和192kHz,而新一代,而新一代音頻格音頻格式式HDTA可支持可支持6、8、16個聲道的環(huán)繞聲,甚至支持高達(dá)個聲道的環(huán)繞聲,甚至支持高達(dá)384kHz的采樣頻率。的采樣頻率。 11n音樂信號量化位數(shù),以往標(biāo)準(zhǔn)為音樂信號量化位數(shù),以往標(biāo)準(zhǔn)為16位,現(xiàn)已出現(xiàn)位,現(xiàn)已出現(xiàn)24位和位和32位的規(guī)格。位的規(guī)格。n即使取即使取48kHz采樣頻率和采樣頻率和16bit
9、量化位數(shù),雙聲道,在通量化位數(shù),雙聲道,在通信網(wǎng)絡(luò)上傳輸這樣的立體聲音樂信號,需占用傳輸帶寬信網(wǎng)絡(luò)上傳輸這樣的立體聲音樂信號,需占用傳輸帶寬 48kHz*16bit*2=1536kbit/s=1.536Mbit/sn如果保存這樣的音頻文件,則每秒占用的存儲容量為:如果保存這樣的音頻文件,則每秒占用的存儲容量為: 1536kbit/8bit/字節(jié)字節(jié)=192k字節(jié)字節(jié) 12n保存保存1小時(shí)這樣的音頻文件需要占用小時(shí)這樣的音頻文件需要占用 192k字節(jié)字節(jié)/s*3600s=691200k字節(jié)字節(jié)=691.2MB 一個一個16GB的的U盤只能存盤只能存 16*1000MB/691.2MB/小時(shí)小時(shí)2
10、7.5小時(shí)小時(shí)n因此,如果不進(jìn)行音樂數(shù)據(jù)的壓縮,則無論傳輸或存儲因此,如果不進(jìn)行音樂數(shù)據(jù)的壓縮,則無論傳輸或存儲都很難實(shí)用化。都很難實(shí)用化。n而如果將該音樂數(shù)據(jù)壓縮而如果將該音樂數(shù)據(jù)壓縮10倍,則同樣大小的倍,則同樣大小的U盤即可保盤即可保存存275小時(shí)小時(shí)14.5天天的數(shù)字音樂。的數(shù)字音樂。 13n音樂壓縮,就是音樂壓縮,就是以最少的數(shù)碼表示音樂信號,減少容納以最少的數(shù)碼表示音樂信號,減少容納給定音樂數(shù)據(jù)采樣集合的信號空間。給定音樂數(shù)據(jù)采樣集合的信號空間。n所謂信號空間亦即被壓縮對象,就是音樂信號所占的空所謂信號空間亦即被壓縮對象,就是音樂信號所占的空域、時(shí)域和頻域空間(相互關(guān)聯(lián))。域、時(shí)域
11、和頻域空間(相互關(guān)聯(lián))。建模表達(dá)建模表達(dá)二次量化二次量化熵熵 編編 碼碼原始數(shù)據(jù)原始數(shù)據(jù)模型參數(shù)模型參數(shù)量化符號量化符號壓縮碼流壓縮碼流n在這在這“三步曲三步曲”中,中,有無有無“二次量化二次量化”壓縮結(jié)果壓縮結(jié)果會會有有本質(zhì)的不同。本質(zhì)的不同。 14)(sin)(2ftAtr n有冗余度就可以壓縮(罐中有空氣,茶葉有冗余度就可以壓縮(罐中有空氣,茶葉含水分)。含水分)。n壓縮只能在一定限度內(nèi)可逆(茶葉倒出來壓縮只能在一定限度內(nèi)可逆(茶葉倒出來仍完整)。仍完整)。n超過此限度,必然帶來失真(茶葉會破超過此限度,必然帶來失真(茶葉會破碎)。碎)。n允許的失真越大,壓縮的比例也可以越大允許的失真越
12、大,壓縮的比例也可以越大(若不計(jì)較茶葉形狀,則壓得越碎,同一(若不計(jì)較茶葉形狀,則壓得越碎,同一個罐裝得也越多)。個罐裝得也越多)。n這個這個“限度限度”,就是數(shù)據(jù)的,就是數(shù)據(jù)的“熵熵”。 15 16從音頻壓縮的角度看:凡是人從音頻壓縮的角度看:凡是人耳聽不到或感知極不靈敏的聲耳聽不到或感知極不靈敏的聲音成分,都不妨視為冗余的。音成分,都不妨視為冗余的。因此,各種音頻壓縮的標(biāo)準(zhǔn)算因此,各種音頻壓縮的標(biāo)準(zhǔn)算法,無不涉及對人類聽覺系統(tǒng)法,無不涉及對人類聽覺系統(tǒng)(HAS)的利用,主要是基于)的利用,主要是基于聽覺生理和心理特性的聽覺感聽覺生理和心理特性的聽覺感知模型。知模型。 17人耳剛能聽見的聲壓
13、級稱為人耳剛能聽見的聲壓級稱為“可聞閾可聞閾”或或“聽覺閾聽覺閾”,而使人耳,而使人耳有痛感的聲壓級則稱為有痛感的聲壓級則稱為“疼痛閾疼痛閾”,疼痛閾與可聞閾之差,即為,疼痛閾與可聞閾之差,即為人耳的聽覺范圍。人耳的聽覺范圍。 18純純音音等等響響度度曲曲線線 n聽覺掩蔽效應(yīng):一種頻率的聲音阻礙聽覺聽覺掩蔽效應(yīng):一種頻率的聲音阻礙聽覺系統(tǒng)感受另一種頻率的聲音,又分頻域掩系統(tǒng)感受另一種頻率的聲音,又分頻域掩蔽和時(shí)域掩蔽。蔽和時(shí)域掩蔽。n頻域掩蔽效應(yīng):掩蔽聲與被掩蔽聲頻域掩蔽效應(yīng):掩蔽聲與被掩蔽聲同時(shí)作同時(shí)作用用時(shí)所發(fā)生的掩蔽效應(yīng),是一種時(shí)所發(fā)生的掩蔽效應(yīng),是一種強(qiáng)掩蔽效強(qiáng)掩蔽效應(yīng)應(yīng)和心理聲學(xué)模型
14、的基礎(chǔ)。和心理聲學(xué)模型的基礎(chǔ)。 19n時(shí)域掩蔽效應(yīng):時(shí)域掩蔽效應(yīng):時(shí)間上相鄰聲音之間的掩蔽現(xiàn)象,即掩蔽聲和時(shí)間上相鄰聲音之間的掩蔽現(xiàn)象,即掩蔽聲和被掩蔽聲不同時(shí)出現(xiàn),又叫做被掩蔽聲不同時(shí)出現(xiàn),又叫做異時(shí)掩蔽異時(shí)掩蔽。掩蔽聲音出現(xiàn)之前的一。掩蔽聲音出現(xiàn)之前的一段時(shí)間內(nèi)發(fā)生掩蔽效應(yīng),稱為導(dǎo)前掩蔽;否則稱為滯后掩蔽。段時(shí)間內(nèi)發(fā)生掩蔽效應(yīng),稱為導(dǎo)前掩蔽;否則稱為滯后掩蔽。n主因是人腦處理信主因是人腦處理信息需一定的時(shí)間。息需一定的時(shí)間。異時(shí)掩蔽也隨時(shí)間異時(shí)掩蔽也隨時(shí)間推移而很快衰減,推移而很快衰減,是一種是一種弱掩蔽效應(yīng)弱掩蔽效應(yīng)。通常導(dǎo)前掩蔽只有通常導(dǎo)前掩蔽只有3ms-20ms,而滯后,而滯后掩蔽可
15、持續(xù)掩蔽可持續(xù)50ms-100ms。 20 21時(shí)域分為時(shí)域分為“幀幀”(段),長幾十毫秒;頻域分為(段),長幾十毫秒;頻域分為“子帶子帶”(子頻(子頻帶)。帶)。 22人類聽覺特性人類聽覺特性的這些表現(xiàn),從帶通濾波器組輸出的角度不難理解。的這些表現(xiàn),從帶通濾波器組輸出的角度不難理解。 23標(biāo)標(biāo) 準(zhǔn)準(zhǔn) 號號適適 用用 信信 源源典典 型型 應(yīng)應(yīng) 用用ISO/IEC 11172(MPEG-1)活動圖像及活動圖像及伴音伴音VCD、DAB、多媒體、多媒體、VOD等等ISO/IEC 13818-3(MPEG-2音頻)音頻)高質(zhì)量多聲高質(zhì)量多聲道聲音道聲音DAT、DCC、DAB等及數(shù)字視頻伴等及數(shù)字視頻
16、伴音音ISO/IEC 14496(MPEG-4)多媒體音像多媒體音像數(shù)據(jù)數(shù)據(jù)WWW上的視頻、音頻擴(kuò)展上的視頻、音頻擴(kuò)展GB/T 20090-2006(AVS) 視頻和音頻視頻和音頻 廣播電視、音像產(chǎn)品和多媒體通信等廣播電視、音像產(chǎn)品和多媒體通信等B/T 22726-2008(DRA)高質(zhì)量多聲高質(zhì)量多聲道聲音道聲音DVD、CMMB、DTV、DAB、數(shù)字、數(shù)字影院、網(wǎng)絡(luò)流媒體及影院、網(wǎng)絡(luò)流媒體及IPTV等等 24 25nMPEG-1:按照復(fù)雜程度分為:按照復(fù)雜程度分為3個等級(或個等級(或3層)。層)。nMPEG-1音頻算法第音頻算法第層即常用的層即常用的MP3。 26nMPEG-2:定義了:定
17、義了兩種音頻壓縮算法,兩種音頻壓縮算法,一種為后向兼容多一種為后向兼容多聲道音頻編碼標(biāo)準(zhǔn),聲道音頻編碼標(biāo)準(zhǔn),簡稱簡稱MPEG-2BC,與與MPEG-1音頻算音頻算法兼容,但不得不法兼容,但不得不犧牲數(shù)碼率來換取犧牲數(shù)碼率來換取較好的音質(zhì)。較好的音質(zhì)。 27MPEG-2先進(jìn)音頻編碼標(biāo)準(zhǔn)簡稱先進(jìn)音頻編碼標(biāo)準(zhǔn)簡稱MPEG-2 AAC,與,與MPEG-1不兼不兼容,又稱容,又稱MPEG-2 NBC編碼。編碼。MPEG-2 AAC在在11:1的壓縮比,的壓縮比,即每個聲道的數(shù)碼率為即每個聲道的數(shù)碼率為(44.116 )/11 =64 kbps、5個聲個聲道的總數(shù)碼率為道的總數(shù)碼率為 320kbps的情況
18、的情況下,很難區(qū)分出壓縮失真。與下,很難區(qū)分出壓縮失真。與MP3相比,在質(zhì)量相同的條件下相比,在質(zhì)量相同的條件下數(shù)碼率是其數(shù)碼率是其70,被稱為,被稱為MP4音音頻格式。頻格式。 MPEG-2 AAC通過進(jìn)一步改進(jìn)并增加了感知噪聲代替通過進(jìn)一步改進(jìn)并增加了感知噪聲代替(PNS)和頻帶復(fù)制()和頻帶復(fù)制( SBR )等技術(shù),使之發(fā)展成為)等技術(shù),使之發(fā)展成為MPEG-4的高效先進(jìn)音頻編碼標(biāo)準(zhǔn),即的高效先進(jìn)音頻編碼標(biāo)準(zhǔn),即MPEG-4 HE-AAC。 以往的聲音壓縮,受限于感知編碼,使得高頻段的聲音以往的聲音壓縮,受限于感知編碼,使得高頻段的聲音容易失真,尤其是在低碼率壓縮時(shí),因數(shù)據(jù)量大幅減少,容易失真,尤其是在低碼率壓縮時(shí),因數(shù)據(jù)量大幅減少,聲音質(zhì)量讓使用者無法接受。聲音質(zhì)量讓使用者無法接受。SBR可以大大提升低碼率壓可以大大提升低碼率壓縮時(shí)的音質(zhì)??s時(shí)的音質(zhì)。 目前的目前的MP4已更多地指已更多地指MPEG-4音視頻播放器了。音視頻播放器了。 28 2930我國于我國于2009年年4月正式頒布月正式頒布多聲道數(shù)字音頻編解碼技術(shù)多聲道數(shù)字音頻編解碼技術(shù)規(guī)范規(guī)范為國家標(biāo)準(zhǔn)(為國家標(biāo)準(zhǔn)(GB/T 22726-2008),簡稱),簡稱DRA(Digital Rise Audio)標(biāo)準(zhǔn),曾于)標(biāo)準(zhǔn),曾于2009年年3月被國際藍(lán)光月被國際藍(lán)光DVD組織納入到藍(lán)光組織納入到藍(lán)光DVD標(biāo)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年食品原料采購合同規(guī)范范本2篇
- 2025年度物流園區(qū)綠色物流推廣承包合同3篇
- 2025年度環(huán)保型批灰技術(shù)合作合同協(xié)議
- 二零二五年度旅行社與旅游保險(xiǎn)合作框架協(xié)議3篇
- 二零二五年度不動產(chǎn)抵押貸款債權(quán)讓與合同模板3篇
- 二零二五版綠城物業(yè)智能安防系統(tǒng)升級合同4篇
- 2025版全新注塑機(jī)購銷合同(含設(shè)備安裝與調(diào)試)
- 2025年食品添加劑與添加劑原料供貨協(xié)議書3篇
- 2025版小額貸款公司合作協(xié)議范本2篇
- 二零二五年度企業(yè)員工溝通技巧培訓(xùn)合同8篇
- 室上性心動過速-醫(yī)學(xué)課件
- 建設(shè)工程法規(guī)及相關(guān)知識試題附答案
- 中小學(xué)心理健康教育課程標(biāo)準(zhǔn)
- 四年級上冊脫式計(jì)算400題及答案
- 新課標(biāo)人教版小學(xué)數(shù)學(xué)六年級下冊集體備課教學(xué)案全冊表格式
- 人教精通版三年級英語上冊各單元知識點(diǎn)匯總
- 人口分布 高一地理下學(xué)期人教版 必修第二冊
- 教案:第三章 公共管理職能(《公共管理學(xué)》課程)
- 諾和關(guān)懷俱樂部對外介紹
- 玩轉(zhuǎn)數(shù)和形課件
- 保定市縣級地圖PPT可編輯矢量行政區(qū)劃(河北省)
評論
0/150
提交評論