基于MATLAB的語音信號處理_第1頁
基于MATLAB的語音信號處理_第2頁
基于MATLAB的語音信號處理_第3頁
基于MATLAB的語音信號處理_第4頁
基于MATLAB的語音信號處理_第5頁
已閱讀5頁,還剩5頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、 基于MATLAB的語音信號處理 摘 要:隨著智能化設備的廣泛普及,語音信號作為智能化設備的一個重要的交互語言顯得尤為重要,語音信號處理被廣泛地應用在語音識別、智能控制、身份識別、智能家居等領域,MATLAB仿真軟件具有強大的信號處理功能,能對語音信號進行平移、尺度變換、系統(tǒng)分析、時頻轉換和濾波等操作,文章借助MATLAB軟件對語音信號進行處理,實現(xiàn)對語音信號的音效處理、時頻分析、濾波處理等功能。Key:語音信號;時頻處理;濾波:TN912.3 文獻標識碼:A :2096-4706(2020)17-0076-03Abstract:With the widely using of intelli

2、gent equipment,the speech signal as an important interactive language of intelligent equipment are more and more important. The speech signal had been used in speech recognition,intelligent control,personal identification,smart home and other fields. MATLAB simulation software had powerful function

3、of signal processing,it can be used in parallel moving,scale transformation,system analysis,time frequency transformation,filtering and other operation. In this paper,MATLAB software is used to process the voice signal to realize the sound effect processing,time-frequency analysis,filtering processi

4、ng and other functions.Keywords:speech signal;time-frequency processing;filtering0 引 言越來越多的智能設備和產品中集成了語音信號處理模塊,語音信號處理作為計算機接口和人機交互的重要手段得到了廣泛的應用,語音信號處理包含語音采集、語音分析、語音轉換、語音識別、語音合成等內容,本文對錄制語音進行了時域頻域分析,并進行了變換以產生不同的音效,對錄制的按鍵音進行了特征參數(shù)的分析與提取,最后設計了濾波系統(tǒng)對語音信號進行了濾波處理。在西安工商學院開展課堂教學創(chuàng)新活動期間,對語音信號的采集和處理在“信號與系統(tǒng)”課程和“數(shù)字信

5、號處理”課程的課堂創(chuàng)新教學中發(fā)揮了重要作用,作者通過對語音信號進行采集變換的方式,將變換前后語音音效及頻譜圖展示給學生,增強了學生對信號的感知和理解,提高了課堂效果。1 原始語音信號讀入首先,利用電腦或者手機錄制一段音頻,時長在5秒以內,錄制的音頻格式如果不為.wav格式的話需要用相應的軟件將音頻格式轉換成.wav,WAV是一種無損的音頻格式,標準格式化的WAV文件,取樣頻率是44.1 kHz,量化數(shù)字為16位。采用MATLAB在命令窗口輸入y,F(xiàn)s,bits = wavread(e: 1.wav)就可以把語音信號讀取進來,原始語音信號放置在電腦E盤下面,命名為1,格式為.wav格式。其中y為

6、語音采樣后的數(shù)據(jù),幅度已經(jīng)歸一化了;Fs為語音信號的采樣率;bits為采樣精度,可以求出語音信號的長度。采用n=length(y)可以求得語音信號的長度n,n=176 128,信號長度也由語音信號時長L(秒)和采樣頻率Fs決定,n=L*Fs。采用plot(y)將語音信號顯示出來,系統(tǒng)默認自變量為采樣后的順序點數(shù),如圖1所示。2 語音信號處理為了讓學生直觀感受信號處理在實際中的用途,我們對采集的語音信號進行了變換處理,產生了回聲和變音的兩種音效。通過對采集語音進行數(shù)學運算,利用延時疊加產生回聲的音效,利用采集尺度變換即采集信號的頻率參數(shù)發(fā)生變化來實現(xiàn)語音信號的變音效果,利用傅里葉變換將語音信號從

7、時域變換到頻域,再在頻域對不同按鍵語音進行核心頻率識別,最后設計了一個低通濾波系統(tǒng)對所采集語音進行濾波,消除高頻分量,保留低頻分量。具體的流程如圖2所示。2.1 回聲音效對語音信號進行時域延時,再和原始語音信號進行疊加就能產生回聲的效果。對語音信號進行延時,做法是產生一個規(guī)格相同的0序列列向量疊加到語音信號之前。疊加延時后語音信號需要和原始語音信號長度相同,所以需要給原始語音信號后面補上相應的0序列。對于本語音,發(fā)現(xiàn)延時0.1秒到0.3秒回聲效果相對較好。程序片段如下:y1=y;zeros(6000,1);y2=zeros(6000,1);y;y3=y1+y2;sound(y3,F(xiàn)s)2.2

8、變音音效實際中為了保護語音采訪者的隱私,媒體一般都會對采訪者的語音進行處理,在MATLAB環(huán)境中,為了達到對語音信號進行變聲的效果,首先把原始語音信號采集進來后,通過改變播放時的播放頻率,原始語音信號本身有一個采樣頻率,可以用一個更高的采樣頻率或者一個更低的采樣頻率對其進行采樣,播放出來的音效就有了變音的功效。原始語音Fs=48 000 Hz,當采用采樣頻率為60 000 Hz進行播放時,sound(y,60 000),語音輸出更清脆,因為采樣頻率變高了,語速變快,音調變高,聲音更向女生的音色方向變化。同樣的,采用采樣頻率為40 000 Hz對原始語音進行播放時,sound(y,40 000)

9、,我們聽到了語音更低沉,更緩慢,音色更接近與男生的音色。調節(jié)此參數(shù)可以調節(jié)變聲效果,從數(shù)學運算的角度,這等同于把原始語音信號進行尺度變換,把原來的信號在時域進行擴展和壓縮。從語音信號的處理效果上來看,起到了很好的“變聲”的效果。2.3 頻域變換對比教學可以加深學生對知識和概念的掌握,實際中我們聽到每一個人的音色都不一樣,男生和女生的聲音差異也比較大。為了區(qū)別每一個人的聲音特征,我們可以通過傅里葉變換工具將語音信號變換到頻域,然后分析語音的特征頻段即語音幅度相對較大的20%比例的頻段的特性。語音信號的傅里葉變換在MATLAB中利用FFT來實現(xiàn)。FFT是離散時間傅里葉變換的快速算法,通過FFT得到

10、的是信號的頻域函數(shù),一般情況下是一個復數(shù),進行信號的頻域分析時需要對這個復數(shù)分別取其模和相位,分析其幅頻圖和相頻圖,一般問題只需要分析到其幅頻圖就可以了。根據(jù)傅里葉變換的特征,語音信號的幅度譜一般為對稱圖形,其自變量為整數(shù),代表的是數(shù)字頻率k。為了更好地理解,我們可以把自變量k轉換成模擬頻率f,轉換公式:f=k*Fs/length(y)。如圖3所示,所錄制信號的主要頻率在0.8104 Hz以內,低頻尤其是0.5104 Hz頻段以內信號分布較多。2.4 語音識別人體語音包含的頻段比較寬,我們選擇了手機按鍵音進行語音識別。我們選取了某款手機按鍵數(shù)字分別為1、5、9的錄音10組,利用傅里葉變換將按鍵

11、音轉換到頻率,觀察其特征頻率。頻域圖形顯示,按鍵音在頻域出現(xiàn)了兩個核心頻段,記錄該頻段數(shù)值,利用統(tǒng)計學的手段,對10組語音的核心雙頻段的10個數(shù)值進行統(tǒng)計運算,求其算術平均值和標準差,然后根據(jù)算術平均值及其標準差得到測量結果。由表1可以看出,相同按鍵音的核心頻率相近,有個別頻率變化較大,在實際中可以根據(jù)誤差理論與數(shù)據(jù)處理中對測量數(shù)據(jù)中粗大誤差的發(fā)現(xiàn)方法,進行異常值判定并剔除;把剩余的數(shù)據(jù)取平均值然后得到一個大概率的數(shù)據(jù)變化區(qū)間,對1、5、9按鍵音錄取測試語音,取其核心頻段進行測試識別。其中,數(shù)字1、5、9按鍵音的核心頻率分別取了兩個,1.1和1.2為數(shù)字1的按鍵音兩個核心頻率,2.1和2.2為

12、數(shù)字5的按鍵音兩個核心頻率,3.1和3.2為數(shù)字9的按鍵音兩個核心頻率。2.5 語音濾波系統(tǒng)設計基于MATLAB的語音信號濾波器是一個能夠實現(xiàn)給語音信號濾波的系統(tǒng),濾波系統(tǒng)從功能上分為低通、高通、帶通和帶阻。濾波器的設計方法分為FIR數(shù)字濾波器設計方法和IIR數(shù)字濾波器設計方法,窗函數(shù)是常見的FIR數(shù)字濾波器設計方法,常見的窗函數(shù)有矩形窗、海明窗、漢寧窗、布拉克曼窗和凱塞窗等;IIR數(shù)字濾波器的設計方法有脈沖響應不變法和雙線性變換法。本設計采用雙線性變換法設計數(shù)字濾波器系統(tǒng)對原始語音信號進行處理,濾波程序片段如下:Fp=2000;Fs=3000;Ft=80000;As=100;Ap=1;wp=

13、2*pi*Fp/Ft;ws=2*pi*Fs/Ft;n,wn=ellipord(wp,ws,Ap,As,s);b,a=ellip(n,Ap,As,wn,s);B,A=bilinear(b,a,1);h,w=freqz(B,A);由圖4可以看出,語音信號原始的頻率分布范圍在0.8 104 Hz以內,主要頻率范圍在0.5104 Hz以內,我們設計的濾波系統(tǒng)通帶截止頻率和阻帶截止頻率分別為0.2104 Hz和0.3104 Hz,將0.2104 Hz內信號進行保留,將0.3 104 Hz以上信號進行濾除。由于濾除以后依然保留了原始語音的核心頻段,濾波后語音用原有采樣頻率播放音頻的語音效果和原始語音差別不

14、大,可以通過調節(jié)通帶和阻帶截止頻率的參數(shù)來改變保留信號的頻段。3 結 論通過MATLAB對錄制的語音進行延時疊加,變換采樣頻率,達到了回聲混響音效處理和變音處理的音效;通過對錄制語音進行時頻變換處理并對比,得到男女音頻域分布的差別和特征;通過對按鍵音進行頻域特征頻率識別,有效地對語音信號進行了識別;最后設計了低通濾波系統(tǒng),對語音信號進行了低通濾波處理,消除了語音信號內頻率在0.3 104 Hz以上的頻譜分量。采用MATLAB能方便快捷地對語音信號進行分析、變換和參數(shù)提取,給語音信號的后續(xù)分析處理打下了良好的基礎。Reference:1 劉婷,柳鈺,薛小慶.MATLAB在語音信號處理中的應用 J.電子測試

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論