多媒體技術(shù)好資源-第04講數(shù)字聲音基礎(chǔ)_第1頁(yè)
多媒體技術(shù)好資源-第04講數(shù)字聲音基礎(chǔ)_第2頁(yè)
多媒體技術(shù)好資源-第04講數(shù)字聲音基礎(chǔ)_第3頁(yè)
多媒體技術(shù)好資源-第04講數(shù)字聲音基礎(chǔ)_第4頁(yè)
多媒體技術(shù)好資源-第04講數(shù)字聲音基礎(chǔ)_第5頁(yè)
已閱讀5頁(yè),還剩37頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、數(shù)字聲音根底第 4 章4.1 根本概念 聲音概念 聲音頻率分布 音質(zhì)與 數(shù)據(jù)量 數(shù)字音頻文件的種類4.2 聲音編碼方法 聲音編碼分類 LPC MP34.3 音頻編輯工具Audition 單音軌方式錄音 音頻編輯與處置 多音軌混合 多音軌錄音4.1根本概念 聲音定義聲音是經(jīng)過(guò)空氣傳播的一種延續(xù)的振動(dòng)波,具有振幅、周期和頻率。聲音用電表示時(shí),聲音信號(hào)在時(shí)間和幅度上都是延續(xù)的模擬信號(hào),如下圖。教學(xué)進(jìn)程4.1.1聲音的根本特點(diǎn) 聲音的質(zhì)量簡(jiǎn)稱音質(zhì)。音質(zhì)與頻率范圍成正比,頻率范圍越寬音質(zhì)越好聲音具有延續(xù)性和過(guò)程性,數(shù)據(jù)前后相關(guān),數(shù)據(jù)量大,具有實(shí)時(shí)性 聲音的延續(xù)時(shí)基性 聲音三要素(1) 音調(diào) (高低)頻率

2、(2) 音強(qiáng) (強(qiáng)弱)音高(3) 音色 (特質(zhì))泛音教學(xué)進(jìn)程 聲音的頻譜分為線性頻譜和延續(xù)頻譜。聲音頻率分布次聲波人耳可聽(tīng)域超聲波20,000Hz女性語(yǔ)音150Hz 3,000Hz語(yǔ)音200Hz 3,400Hz調(diào)幅廣播(AM)50Hz 7,000Hz調(diào)頻廣播(FM)20Hz 15,000Hz高級(jí)音響3Hz 40,000Hz男性語(yǔ)音30Hz 9,000Hz聲源種類頻帶寬度4.1.2教學(xué)進(jìn)程1人耳對(duì)不同頻段的聲音的敏感程度不同 如: 對(duì)低頻敏感一些,3-5K最敏感。2不同頻率有不同的聽(tīng)覺(jué)閾值。3人的聽(tīng)覺(jué)具有掩蔽效應(yīng) 。和環(huán)境有關(guān)。同樣大小聲音在嘈雜環(huán)境就會(huì)聽(tīng)不清。聽(tīng)覺(jué)特性4.1.24.1.3數(shù)字化

3、聲音教學(xué)進(jìn)程 數(shù)字信號(hào)處置器(digital signal processor,DSP) DSP與通用微處置器相比,除了它們的構(gòu)造不同外,其根本差別是,DSP有才干呼應(yīng)和處置采樣模擬信號(hào)得到的數(shù)據(jù)流,如做乘法和累加求和運(yùn)算。在數(shù)字域而不在模擬域中做信號(hào)處置的主要優(yōu)點(diǎn)是:首先,數(shù)字信號(hào)計(jì)算是一種準(zhǔn)確的運(yùn)算方法,它不受時(shí)間和環(huán)境變化的影響;其次,表示部件功能的數(shù)學(xué)運(yùn)算不是物理上實(shí)現(xiàn)的功能部件,而是僅用數(shù)學(xué)運(yùn)算去模擬,其中的數(shù)學(xué)運(yùn)算也相對(duì)容易實(shí)現(xiàn);此外,可以對(duì)數(shù)字運(yùn)算部件進(jìn)展編程,如欲改動(dòng)算法或改動(dòng)某些功能,還可對(duì)數(shù)字部件進(jìn)展再編程。4.1.3數(shù)字化聲音模擬信號(hào)與數(shù)字信號(hào)教學(xué)進(jìn)程話音信號(hào)是典型的延續(xù)

4、信號(hào),不僅在時(shí)間上是延續(xù)的,而且在幅度上也是延續(xù)的。在時(shí)間上“延續(xù)是指在一個(gè)指定的時(shí)間范圍里聲音信號(hào)的幅值有無(wú)窮多個(gè),在幅度上“延續(xù)是指幅度的數(shù)值有無(wú)窮多個(gè)。我們把在時(shí)間和幅度上都是延續(xù)的信號(hào)稱為模擬信號(hào)。在某些特定的時(shí)辰對(duì)這種模擬信號(hào)進(jìn)展丈量叫做采樣(sampling),由這些特定時(shí)辰采樣得到的信號(hào)稱為離散時(shí)間信號(hào)。采樣得到的幅值是無(wú)窮多個(gè)實(shí)數(shù)值中的一個(gè),因此幅度還是延續(xù)的。假設(shè)把信號(hào)幅度取值的數(shù)目加以限定,這種由有限個(gè)數(shù)值組成的信號(hào)就稱為離散幅度信號(hào)。例如,假設(shè)輸入電壓的范圍是0.0V0.7V,并假設(shè)它的取值只限定在0、0.1、0.2,0.7共8個(gè)值。假設(shè)采樣得到的幅度值是0.123V,它

5、的取值就應(yīng)算作0.1V,假設(shè)采樣得到的幅度值是0.26V,它的取值就算作0.3,這種數(shù)值就稱為離散數(shù)值。我們把時(shí)間和幅度都用離散的數(shù)字表示的信號(hào)就稱為數(shù)字信號(hào)。4.1.3數(shù)字化聲音 聲音采樣 聲音數(shù)字化 (模/數(shù)轉(zhuǎn)換)聲音采樣131130 130131把聲音(模擬量)按照固定時(shí)間間隔,轉(zhuǎn)換成有限個(gè)數(shù)字表示的離散序列教學(xué)進(jìn)程4.1.3數(shù)字化聲音 聲音量化 聲音數(shù)字化 (模/數(shù)轉(zhuǎn)換)教學(xué)進(jìn)程延續(xù)幅度的離散化經(jīng)過(guò)量化(quantization)來(lái)實(shí)現(xiàn),就是把信號(hào)的強(qiáng)度劃分成一小段一小段,假設(shè)幅度的劃分是等間隔的,就稱為線性量化。4.1.3數(shù)字化聲音教學(xué)進(jìn)程 聲音數(shù)字化需求回答兩個(gè)問(wèn)題每秒鐘需求采集多

6、少個(gè)聲音樣本,也就是采樣頻率(fs)是多少,每個(gè)聲音樣本的位數(shù)(bit per sample,bps)應(yīng)該是多少,也就是量化精度。4.1.3數(shù)字化聲音教學(xué)進(jìn)程采樣頻率采樣頻率的高低是根據(jù)奈奎斯特實(shí)際(Nyquist theory)和聲音信號(hào)本身的最高頻率決議的。奈奎斯特實(shí)際指出,采樣頻率不應(yīng)低于聲音信號(hào)最高頻率的兩倍,這樣就能把以數(shù)字表達(dá)的聲音復(fù)原成原來(lái)的聲音,這叫做無(wú)損數(shù)字化(lossless digitization)。采樣定律用公式表示為 fs 2f 或者 Ts T/2其中f為被采樣信號(hào)的最高頻率。他可以這樣來(lái)了解奈奎斯特實(shí)際:聲音信號(hào)可以看成由許許多多正弦波組成的,一個(gè)振幅為A、頻率為

7、f的正弦波至少需求兩個(gè)采樣樣本表示,因此,假設(shè)一個(gè)信號(hào)中的最高頻率為 ,采樣頻率最低要選擇2 。例如,話音的信號(hào)頻率約為3.4 kHz,采樣頻率就選為8 kHz。樣本大小是用每個(gè)聲音樣本的位數(shù)bit/s(即bps)表示的,它反映度量聲音波形幅度的精度。例如,每個(gè)聲音樣本用16位(2字節(jié))表示,測(cè)得的聲音樣本值是在065536的范圍里,它的精度就是輸入信號(hào)的1/65536。樣本位數(shù)的大小影響到聲音的質(zhì)量,位數(shù)越多,聲音的質(zhì)量越高,而需求的存儲(chǔ)空間也越多;位數(shù)越少,聲音的質(zhì)量越低,需求的存儲(chǔ)空間越少。采樣精度的另一種表示方法是信號(hào)噪聲比,簡(jiǎn)稱為信噪比(signal-to-noise ratio,S

8、NR),并用下式計(jì)算:SNR 10log (Vsignal)2 / (Vnoise)220 log (Vsignal / Vnoise)其中,Vsignal表示信號(hào)電壓,Vnoise表示噪聲電壓;SNR的單位為分貝(db)例1:假設(shè)Vnoise1,采樣精度為1位表示Vsignal21,它的信噪比SNR6分貝。 假設(shè)Vnoise1,采樣精度為16位表示Vsignal216,它的信噪比SNR96分貝。4.1.3數(shù)字化聲音采樣精度4.1.3數(shù)字化聲音 聲音重放 聲音模擬化 (數(shù)/模轉(zhuǎn)換)聲音重放131130把數(shù)字化聲音轉(zhuǎn)換成模擬量,經(jīng)過(guò)音響單元重放出來(lái)教學(xué)進(jìn)程 重放頻率 (模擬量)與采樣頻率 (數(shù)字

9、量)的關(guān)系重放頻率 采樣頻率 2例 采樣頻率為44,100Hz的數(shù)字音頻信號(hào)復(fù)原成聲音后,為22,050Hz教學(xué)進(jìn)程 設(shè)備和軟件(1) 聲音適配器 (聲卡) 8bit、16bit、 128bit(2) 聲卡驅(qū)動(dòng)軟件以及各種聲音處置軟件4.1.3數(shù)字化聲音采樣頻率 Hz數(shù)據(jù)長(zhǎng)度 bit數(shù)據(jù)量分鐘11,02580.66 MB22,05081.32 MB44,10082.64 MB11,025161.32 MB22,050162.64 MB44,100165.29 MB音質(zhì)評(píng)價(jià)低普通良好中良好優(yōu)秀音質(zhì)與數(shù)據(jù)量4.1.4 數(shù)字音頻的教學(xué)進(jìn)程質(zhì)量采樣頻率(kHz)樣本精度(bit/s)單道聲/立體聲數(shù)據(jù)

10、率(kB/s)(未緊縮)頻率范圍*88單道聲8 2003 400 HzAM11.0258單道聲11.0507 000HzFM22.05016立體聲88.2 CD44.116立體聲176.42020 000 HzDAT4816立體聲192.02020 000 Hz音質(zhì)與數(shù)據(jù)量4.1.4 數(shù)字音頻的2015 000Hz4.1.5.wav WAVE (Waveform Audio)波形音頻文件 多媒體系統(tǒng)、音樂(lè)光盤(pán)制造,記錄物理波形,數(shù)據(jù)量大.cda CDA (CD Audio)激光音頻文件 準(zhǔn)確記錄聲波,數(shù)據(jù)量大,經(jīng)過(guò)采樣,生成wav和mp3音頻文件.mid MIDI (Musical Instr

11、ument Digital Interface)樂(lè)器接口文件 用于合成、游戲,記錄音符時(shí)值、頻率、音色特征,數(shù)據(jù)量小.mp3 mp3 (MPEG音頻緊縮規(guī)范)緊縮音頻文件 必需經(jīng)過(guò)解緊縮,數(shù)據(jù)量小 文件種類及特點(diǎn)數(shù)字音頻文件的種類教學(xué)進(jìn)程文件的擴(kuò)展名闡明auSun和NeXT公司的聲音文件存儲(chǔ)格式(8位m 律編碼或者16位線性編碼)aif(Audio Interchange)Apple計(jì)算機(jī)上的聲音文件存儲(chǔ)格式cmf(Creative Music Format)聲霸(SB)卡帶的MIDI文件存儲(chǔ)格式mctMIDI文件存儲(chǔ)格式mff(MIDI Files Format)MIDI文件存儲(chǔ)格式mid(

12、MIDI)Windows的MIDI文件存儲(chǔ)格式mp2MPEG Layer I , IImp3MPEG Layer IIImod(Module)MIDI文件存儲(chǔ)格式rm(RealMedia)RealNetworks公司的流放式聲音文件格式ra(RealAudio)RealNetworks公司的流放式聲音文件格式rolAdlib聲音卡文件存儲(chǔ)格式snd(sound)Apple計(jì)算機(jī)上的聲音文件存儲(chǔ)格式seqMIDI文件存儲(chǔ)格式sngMIDI文件存儲(chǔ)格式voc(Creative Voice)聲霸卡存儲(chǔ)的聲音文件存儲(chǔ)格式wav(Waveform)*Windows采用的波形聲音文件存儲(chǔ)格式wrkCake

13、walk Pro軟件采用的MIDI文件存儲(chǔ)格式用.wav為擴(kuò)展名的文件格式稱為波形文件格式(WAVE File Format),它在多媒體編程接口和數(shù)據(jù)規(guī)范1.0(Multimedia Programming Interface and Data Specifications 1.0)文檔中有詳細(xì)的描畫(huà)。該文檔是由IBM和微軟公司于1991年8月結(jié)合開(kāi)發(fā)的,它是一種為交換多媒體資源而開(kāi)發(fā)的資源交換文件格式(Resource Interchange File Format,RIFF)。波形文件格式支持存儲(chǔ)各種采樣頻率和樣本精度的聲音數(shù)據(jù),并支持聲音數(shù)據(jù)的緊縮。 .WAV聲音文件4.1.5數(shù)字音頻

14、文件的種類波形文件有許多不同類型的文件構(gòu)造塊組成,其中最主要的兩個(gè)文件構(gòu)造塊是Format Chunk(格式塊)和Sound Data Chunk(聲音數(shù)據(jù)塊)。格式塊包含有描畫(huà)波形的重要參數(shù),例如采樣頻率和樣本精度等,聲音數(shù)據(jù)塊那么包含有實(shí)踐的波形聲音數(shù)據(jù)。RIFF中的其他文件塊是可選擇的。它的簡(jiǎn)化構(gòu)造如下圖。 .WAV聲音文件4.1.5數(shù)字音頻文件的種類MIDI是Musical Instrument Digital Interface的首寫(xiě)字母組合詞,可譯成“電子樂(lè)器數(shù)字接口。用于在音樂(lè)合成器(music synthesizers)、樂(lè)器(musical instruments)和計(jì)算機(jī)之

15、間交換音樂(lè)信息的一種規(guī)范協(xié)議。從20世紀(jì)80年代初期開(kāi)場(chǎng),MIDI曾經(jīng)逐漸被音樂(lè)家和作曲家廣泛接受和運(yùn)用。MIDI是樂(lè)器和計(jì)算機(jī)運(yùn)用的規(guī)范言語(yǔ),是一套指令(即命令的商定),它指示樂(lè)器即MIDI設(shè)備要做什么,怎樣做,如演奏音符、加大音量、生成音響效果等。MIDI不是聲音信號(hào),在MIDI電纜上傳送的不是聲音,而是發(fā)給MIDI設(shè)備或其它安裝讓它產(chǎn)生聲音或執(zhí)行某個(gè)動(dòng)作的指令。 MIDI 簡(jiǎn)介4.1.6電子樂(lè)器數(shù)字接口(MIDI)系統(tǒng)可以同時(shí)播放WAVE文件和MIDI文件來(lái)一同播放語(yǔ)音和音樂(lè);不能同時(shí)播放兩個(gè)波形文件,由于播放采樣聲音時(shí)要求準(zhǔn)確的同步。MIDI 規(guī)范之所以遭到歡迎,主要是它有以下幾個(gè)優(yōu)點(diǎn)

16、:生成的文件比較小,由于MIDI文件存儲(chǔ)的是命令,而不是聲音波形;容易編輯,由于編輯命令比編輯聲音波形要容易得多;可以作背景音樂(lè),由于MIDI音樂(lè)可以和其它的媒體,如數(shù)字電視、圖形、動(dòng)畫(huà)、話音等一同播放,這樣可以加強(qiáng)演示效果。 MIDI 文件的優(yōu)點(diǎn)4.1.6電子樂(lè)器數(shù)字接口(MIDI)系統(tǒng)產(chǎn)生MIDI樂(lè)音的方法很多,如今用得較多的方法有兩種:一種是(frequency modulation,F(xiàn)M)合成法,另一種是樂(lè)音樣本合成法,也稱為波形表(Wavetable)合成法。這兩種方法目前主要用來(lái)生成音樂(lè)。 MIDI 的合成方法4.1.6電子樂(lè)器數(shù)字接口(MIDI)系統(tǒng) 頻率調(diào)制FM 合成法4.1.

17、6電子樂(lè)器數(shù)字接口(MIDI)系統(tǒng)20世紀(jì)80年代初,美國(guó)斯坦福大學(xué)(Stanford University)的一名叫John Chowning的研討生發(fā)明了一種產(chǎn)生樂(lè)音的新方法,這種方法稱為數(shù)字式頻率調(diào)制合成法(digital frequency modulation synthesis),簡(jiǎn)稱為FM合成器。他把幾種樂(lè)音的波形用數(shù)字來(lái)表達(dá),并且用數(shù)字計(jì)算機(jī)而不是用模擬電子器件把它們組合起來(lái),經(jīng)過(guò)數(shù)模轉(zhuǎn)換器(digital to analog convertor,DAC)來(lái)生成樂(lè)音。 頻率調(diào)制FM 合成法的原理4.1.6電子樂(lè)器數(shù)字接口(MIDI)系統(tǒng)它由5個(gè)根本模塊組成:數(shù)字載波器、調(diào)制器、

18、聲音包絡(luò)發(fā)生器、數(shù)字運(yùn)算器和模數(shù)轉(zhuǎn)換器。聲音包絡(luò)發(fā)生器用來(lái)調(diào)制聲音的電平,這個(gè)過(guò)程也稱為幅度調(diào)制(amplitude modulation),并且作為數(shù)字式音量控制旋鈕,它的4個(gè)參數(shù)寫(xiě)成ADSR,這條包絡(luò)線也稱為音量升降維持靜音包絡(luò)線(Attack,decay,sustain,release,ADSR)包絡(luò)線。 頻率調(diào)制FM 合成法的原理4.1.6電子樂(lè)器數(shù)字接口(MIDI)系統(tǒng)在樂(lè)音合成器中,數(shù)字載波波形和調(diào)制波形有很多種,不同型號(hào)的FM合成器所選用的波形也不同。以下圖是Yamaha OPL-III數(shù)字式FM合成器采用的波形。各種不同樂(lè)音的產(chǎn)生是經(jīng)過(guò)組合各種波形和各種波形參數(shù)并采用各種不同的

19、方法實(shí)現(xiàn)的。用什么樣的波形作為數(shù)字載波波形、用什么樣的波形作為調(diào)制波形、用什么樣的波形參數(shù)去組合才干產(chǎn)生所希望的樂(lè)音,這就是FM合成器的算法。 樂(lè)音樣本合成聲音的原理4.1.6電子樂(lè)器數(shù)字接口(MIDI)系統(tǒng)這種方法就是把真實(shí)樂(lè)器發(fā)出的聲音以數(shù)字的方式記錄下來(lái),播放時(shí)改動(dòng)播放速度,從而改動(dòng)音調(diào)周期,生成各種音階的音符。樂(lè)音樣本的采集相對(duì)比較直觀。音樂(lè)家在真實(shí)樂(lè)器上演奏不同的音符,選擇44.1 kHz的采樣頻率、16位的樂(lè)音樣本,這相當(dāng)于CD-DA的質(zhì)量,把不同音符的真實(shí)聲音記錄下來(lái),這就完成了樂(lè)音樣本的采集。樂(lè)音樣本通常放在ROM芯片上。樂(lè)音樣本合成器所需求的輸入控制參數(shù)比較少,可控的數(shù)字音效

20、也不多,大多數(shù)采用這種合成方法的聲音設(shè)備都可以控制聲音包絡(luò)的ADSR參數(shù),產(chǎn)生的聲音質(zhì)量比FM合成方法產(chǎn)生的聲音質(zhì)量要高。合成器或者聲音發(fā)生器的多音調(diào)(polyphony)是一次演奏多個(gè)音符(note)的才干。大多數(shù)早期的音樂(lè)合成器是單音調(diào)的,即一次僅演奏一個(gè)音符。假設(shè)在裝配有單音調(diào)合成器(monophonic synthesizer)的鍵盤(pán)上同時(shí)按下5個(gè)鍵,只能聽(tīng)到一個(gè)音符的聲音;假設(shè)在裝配有能支持4個(gè)音調(diào)的合成器的鍵盤(pán)上同時(shí)按下5個(gè)鍵,可產(chǎn)生4個(gè)音符的聲音。許多現(xiàn)代的聲音模塊有16,24或者32個(gè)音符的復(fù)調(diào)音。假設(shè)一個(gè)合成器或者聲音發(fā)生器可以同時(shí)產(chǎn)生2個(gè)或者2個(gè)以上的不同樂(lè)音,就說(shuō)這個(gè)合成

21、器或者聲音發(fā)生器是多音色(multi-timbral)的。例如,假設(shè)一個(gè)合成器可以同時(shí)演奏5個(gè)音調(diào)(notes),就說(shuō)它是多音調(diào)的(polyphonic);假設(shè)一個(gè)合成器也可以同時(shí)產(chǎn)生鋼琴聲(piano sound)和低音(bass sound),就說(shuō)它是一個(gè)多音色(multi-timbral)合成器。 合成器的多音調(diào)和多音色4.1.6電子樂(lè)器數(shù)字接口(MIDI)系統(tǒng) 一個(gè)簡(jiǎn)單的 MIDI 系統(tǒng)4.1.6電子樂(lè)器數(shù)字接口(MIDI)系統(tǒng)上圖表示的是一個(gè)簡(jiǎn)單的MIDI系統(tǒng),它由一個(gè)MIDI鍵盤(pán)控制器和一個(gè)MIDI聲音模塊組成。許多MIDI鍵盤(pán)樂(lè)器在其內(nèi)部既包含鍵盤(pán)控制器,又包含MIDI聲音模塊功

22、能。在這些單元中,鍵盤(pán)控制器和聲音模塊之間曾經(jīng)有內(nèi)部鏈接,這個(gè)鏈接可以經(jīng)過(guò)該設(shè)備中的控制功能(local control)對(duì)鏈接翻開(kāi)(ON)或者封鎖(OFF)。4.2.14.2 聲音編碼方法聲音編碼分類1波形編碼基于音頻數(shù)據(jù)的統(tǒng)計(jì)特性 目的是使重建語(yǔ)音波形堅(jiān)持原波形的外形。如脈沖編碼 調(diào)制等2參數(shù)編碼基于音頻的聲學(xué)參數(shù) 目的是使重建音頻堅(jiān)持原音頻的特性。常用的音頻參數(shù)有共振峰、線性預(yù)測(cè)系數(shù)、濾波器組等。3混合 編碼教學(xué)進(jìn)程LPC是經(jīng)過(guò)分析話音波形來(lái)產(chǎn)生聲道鼓勵(lì)和轉(zhuǎn)移函數(shù)的參數(shù),對(duì)聲音波形的編碼實(shí)踐就轉(zhuǎn)化為對(duì)這些參數(shù)的編碼,這就使聲音的數(shù)據(jù)量大大減少。在接納端運(yùn)用LPC分析得到的參數(shù),經(jīng)過(guò)話音合

23、成器重構(gòu)話音。合成器實(shí)踐上是一個(gè)離散的隨時(shí)間變化的時(shí)變線性濾波器,它代表人的話音生成系統(tǒng)模型。時(shí)變線性濾波器既當(dāng)作預(yù)測(cè)器運(yùn)用,又當(dāng)作合成器運(yùn)用。 4.2 聲音編碼方法4.2.2線性預(yù)測(cè)編碼 (LPC)4.2.2線性預(yù)測(cè)編碼 (LPC)=線性預(yù)測(cè)器是運(yùn)用過(guò)去的P個(gè)樣本值來(lái)預(yù)測(cè)現(xiàn)時(shí)辰的采樣值x(n),預(yù)測(cè)值可以用過(guò)去P個(gè)樣本值的線性組合來(lái)表示: 殘差誤差(residual error)即線性預(yù)測(cè)誤差為 =4.2 聲音編碼方法在給定的時(shí)間范圍里,如 ,使 的平方和即 為最小 經(jīng)過(guò)求解偏微分方程,可找到系數(shù)ai 的值。假設(shè)把發(fā)音器官等效成濾波器,這些系數(shù)值就可以了解成濾波器的系數(shù)。這些參數(shù)不再是聲音波

24、形本身的值,而是發(fā)音器官的鼓勵(lì)參數(shù)。 4.2 聲音編碼方法4.2.2線性預(yù)測(cè)編碼 (LPC)4.2.3GSM編譯碼器GSM是Global System for Mobile communications的縮寫(xiě),可譯成全球數(shù)字挪動(dòng)通訊系統(tǒng)。GSM算法是1992年柏林技術(shù)大學(xué)(Technical University Of Berlin)根據(jù)GSM協(xié)議開(kāi)發(fā)的,這個(gè)協(xié)議是歐洲最流行的數(shù)字蜂窩通訊協(xié)議。GSM的輸入是幀(frame)數(shù)據(jù),一幀(20毫秒)由采樣頻率為8 kHz的帶符號(hào)的160個(gè)樣本組成,每個(gè)樣本為13位或者16位的線性PCM(linear PCM)碼。GSM編碼器可把一幀(16016位

25、)的數(shù)據(jù)緊縮成260位的GSM幀,緊縮后的數(shù)據(jù)率為1625字節(jié),相當(dāng)于13 kb/s。由于260位不是8位的整數(shù)倍,因此編碼器輸出的GSM幀為264位的線性PCM碼。采樣頻率為8 kHz、每個(gè)樣本為16位的未緊縮的話音數(shù)據(jù)率為128 kb/s,運(yùn)用GSM緊縮后的數(shù)據(jù)率為:(264位8000樣本/秒)/160樣本=13.2 千位/秒GSM的緊縮比:128:13.2 = 9.7,近似于10:1。4.2 聲音編碼方法4.3 聲音處置軟件Audition4.3.1單音軌方式錄音編輯界面;多軌界面。主要不同?主要步驟:1.文件-新建-選擇屬性采樣率、聲道、量化位數(shù)2.選項(xiàng)-錄音控制臺(tái)-選擇錄音源3.點(diǎn)擊播放面板的錄音按鈕錄制,完成后點(diǎn)擊停頓。4.文件-保管,選擇類型Windows PCM、Mp3 Pro4.3

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論