語音信號采集和分析報告_第1頁
語音信號采集和分析報告_第2頁
語音信號采集和分析報告_第3頁
語音信號采集和分析報告_第4頁
語音信號采集和分析報告_第5頁
已閱讀5頁,還剩10頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

語音信號的采集與分析一、背景介紹1、語音信號處理的相關(guān)內(nèi)容通過語音相互傳遞信息是人類最重要的根本功能之一.語言是人類特有的功能.聲音是人類常用工具,是相互傳遞信息的最重要的手段.雖然,人可以通過多種手段獲得外界信息,但最重要,最精細的信息源只有語言,圖像和文字三種.與用聲音傳遞信息相比,明顯用視覺和文字相互傳遞信息,其效果要差得多.這是由于語音中除包含實際發(fā)音內(nèi)容的話言信息外,還包括發(fā)音者是誰及喜怒哀樂等各種信息.所以,語音是人類最重要,最有效,最常用和最便利的交換信息的形式.另一方面,語言和語音與人的智力活動親熱相關(guān),與文化和社會的進步嚴密相連,它具有最大的信息容量和最高的智能水平。語音信號處理是爭論用數(shù)字信號處理技術(shù)對語音信號進展處理的一門學科,處理的目的是用于得到某些參數(shù)以便高效傳輸或存儲;或者是用于某種應用,如人工合成出語音,辨識出講話者,識別出講話內(nèi)容,進展語音增加等.語音信號處理是一門興的學科,同時又是綜合性的多學科領域,是一門涉及面很廣的穿插學科.雖然從事達一領域爭論的人員主要來自信息處理及計算機等學科.但是它與語音學,語言學,聲學,認知科學,生理學,心理學及數(shù)理統(tǒng)計等很多學科也有格外親熱的聯(lián)系.語音信號處理是很多信息領域應用的核心技術(shù)之一,是目前進展最為快速的信息科學爭論領域中的一個.語音處理是目前極為活潑和熱門的爭論領域,其爭論涉及一系列前沿科研課題,巳處于快速進展之中;其爭論成果具有重要的學術(shù)及應用價值.2、工作流程:相關(guān)的信號與系統(tǒng)學問:傅里葉變換在信號處理中具有格外重要的作用,它通常能使信號的某些特性變得很明顯,而在原始信號中這些特性可能模糊不清或至少不明顯.在語音信號處理中,傅里葉表示在傳統(tǒng)上始終起主要作用.其緣由一方面在于穩(wěn)態(tài)語音的生成模型由線性系統(tǒng)組成,此系統(tǒng)被一隨時間作周期變化或隨機變化的源所鼓勵.因而系統(tǒng)輸出頻譜反映了鼓勵與聲道頻率響應特性.另一方面,語音信號的頻譜具有格外明顯的語音聲學意義,可以獲得某些重要的語音特征(如共振峰頻率和帶寬等).依據(jù)語音信號的產(chǎn)生模型,可以將其用一個線性非時變系統(tǒng)的輸出表示,即看作是聲門鼓勵信號和聲道沖激響應的卷積.在語音信號數(shù)字處理所涉及的各個領域中,依據(jù)語音信號求解聲門鼓勵和聲道響應具有格外重要的意義.例如,為了求得語音信號的共振蜂就要知道聲道傳遞函數(shù)(共振峰就是聲道傳遞函數(shù)的各對復共軛極點的頻率).又如,為了推斷語音信號是清音還是濁音以及求得濁音狀況下的基音頻率,就應知道聲門鼓勵序列.在實現(xiàn)各種語音編碼,合成,識別以及說話人識別時無不需要由語音信號來求得聲門鼓勵序列和聲道沖激響應.3、相關(guān)MATLAB學問:MATLAB語言是一種數(shù)據(jù)分析和處理功能格外強大的計算機應用軟件,它可以將聲音文件變換為離散的數(shù)據(jù)文件,然后利用其強大的矩陣運算力量處理數(shù)據(jù),如數(shù)字濾波、傅里葉變換、時域和頻域分析、聲音回放以及各種圖的呈現(xiàn)等,信號處理是MATLAB重要應用的領域之一。YR_220444.am”然后使用格式工廠軟件將其轉(zhuǎn)換成wav格式并重命名為“02120008.wav”wavread用費事如下:[y,fs,bits]=wavread(”C:\Users\Lenovo\Desktop\02120008.wav” );通過調(diào)用wavread函數(shù),將錄制好的音頻文件信息儲存在一個矩陣yfswav44.1kHZ。并用一個變量n來儲存信息y的長度:n=length(y);decimateymatlabhelpdecimate,可以得到其調(diào)用方式如下:DECIMATEResampledataatalowerrateafterlowpassfiltering.Y=DECIMATE(X,R)resamplesthesequenceinvectorXat1/Rtimestheoriginalsamplerate. TheresultingresampledvectorYisRtimesshorter,i.e.,LENGTH(Y)=CEIL(LENGTH(X)/R).Bydefault,DECIMATEfiltersthedatawithan8thorderChebyshevTypeIlowpassfilterwithcutofffrequency.8*(Fs/2)/R,beforeresampling.Y = DECIMATE(X,R,N) uses an N”th Chebyshevfilter. ForNgreaterthan13,DECIMATEwillproduceawarningregardingtheunreliabilityoftheresults. SeeNOTEbelow.Y=DECIMATE(X,R,”FIR”)usesa30thorderFIRfiltergeneratedbyFIR1(30,1/R)tofilterthedata.Y=DECIMATE(X,R,N,”FIR”)usesanNthFIRfilter.itis

Note:ForbetterresultswhenRislarge(i.e.,R>13),recommendedtobreakRupintoitsfactorsandcallingDECIMATEseveralTimes.1/2,1/4R2,4z1,z2然后,通過調(diào)用fft函數(shù)對信號進展傅里葉變換,得到采樣matlabplot三、分析時域分析和頻域分析①:原始信號fs=8KHz。②取R=2 即采樣頻率 fs2=1/2*fs=4KHz.③取R=4 即采樣頻率 fs3=1/4*fs=1kHz肯定程度的失真。添加噪聲通過調(diào)用wgn函數(shù),為原始信號添加高斯白噪聲,得到合均勻分布在各個頻率段上。聲音信息的濾波操作通過觀看添加了噪聲之后的聲音信息的幅頻特性曲線的3000Hzkaiser參數(shù)如下:KAISERORD FIR order estimator (lowpass, bandpass,multiband).[N,Wn,BTA,FILTYPE]=KAISERORD(F,A,DEV,Fs)istheapproximateorderN,normalizedfrequencybandedgesWn,KaiserwindowbetaparameterBTAandfiltertypeFILTYPEtobeusedbytheFIR1function:B = FIR1(N, Wn, FILTYPE, kaiser( N+1,BTA ”noscale”)The resulting filter will approximately meet specificationsgivenbytheinputparametersF,A,andDEV.FisavectorofbandedgefrequenciesinHz,inascendingorderbetween0andhalfthesamplingfrequencyFs. Aisavectorof0sand1sspecifyingthedesiredfunction”samplitudeonthebandsdefinedbyF.ThelengthofFistwicethelengthofA,minus2(itmustthereforebeeven). Thefirstfrequencybandisassumedtostartatzero,andthelastonealwaysendsatFs/2.DEVisavectorofmaximumdeviationsorripples(inlinearunits)allowableforeachband.Thesmallestdeviationspecified(MIN(DEV))isusedforboththepassbandandthestopband.Fsisthesamplingfrequency(whichdefaultsto2ifyouleaveitoff).C=KAISERORD(F,A,DEV,Fs,”cell”)isacell-arraywhoseelementsaretheparameterstoFIR1.理合成之后的聲音文件,得到如下的幅頻特性曲線:了很多。四、總結(jié)matlab軟件操作的一局部學問,受益匪淺。2014、626附錄:clear;[y,fs,bits]=wavread(”C:\Users\Lenovo\Desktop\02120008.wav”);n=length(y);time=1/fs:1/fs:n/fs;sound(y,fs)Y=fft(y,n);figure(6)plot(abs(Y));figure(1)subplot(1,2,1);plot(time,y);title(”原始信號波形”);M=0:n/2;freq=M*fs/n;subplot(1,2,2);mag=abs(Y);plot(freq,mag(M+1));title(”原始信號頻譜”);y0decimate(y,2,10);wavwrite(y0,fs,”C:\Users\Lenovo\Desktop\shuchu.wav”);z1=decimate(y,2,10);m1=length(z1);time1=1/fs:1/fs:m1/fs;X1=fft(z1,m1);figure(2)subplot(1,2,1);plot(time1,z1);title(”采樣后波形”);M1=0:m1/2;freq1=M1*fs/m1;mag1=abs(Y(M1+1));subplot(1,2,2);plot(freq1,mag1);title(”采樣后頻譜”);z2=decimate(y,4,10);m2=length(z2);time2=1/fs:1/fs:m2/fs;X2=fft(z2,m2);figure(3)subplot(1,2,1);plot(time2,z2);title(”采樣后波形”);M2=0:m2/2;freq2=M2*fs/m2;mag2=abs(Y(M2+1));subplot(1,2,2);plot(freq2,mag2);title(”采樣后頻譜”);[row,col]=size(y);noise=0.1*wgn(row,col,0);cmb=noise+y;X3=fft(cmb,n);figure(4)subplot(1,2,1);plot(time,cmb);title(”加噪聲后波形”);subplot(1,2,2);mag3=abs(X3(M+1));plot(freq,mag3);title(”加噪聲后頻譜”);=kaiserord([5

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論