




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、 基于MATLAB的語音信號(hào)處理 摘 要:隨著智能化設(shè)備的廣泛普及,語音信號(hào)作為智能化設(shè)備的一個(gè)重要的交互語言顯得尤為重要,語音信號(hào)處理被廣泛地應(yīng)用在語音識(shí)別、智能控制、身份識(shí)別、智能家居等領(lǐng)域,MATLAB仿真軟件具有強(qiáng)大的信號(hào)處理功能,能對(duì)語音信號(hào)進(jìn)行平移、尺度變換、系統(tǒng)分析、時(shí)頻轉(zhuǎn)換和濾波等操作,文章借助MATLAB軟件對(duì)語音信號(hào)進(jìn)行處理,實(shí)現(xiàn)對(duì)語音信號(hào)的音效處理、時(shí)頻分析、濾波處理等功能。Key:語音信號(hào);時(shí)頻處理;濾波:TN912.3 文獻(xiàn)標(biāo)識(shí)碼:A :2096-4706(2020)17-0076-03Abstract:With the widely using of intelli
2、gent equipment,the speech signal as an important interactive language of intelligent equipment are more and more important. The speech signal had been used in speech recognition,intelligent control,personal identification,smart home and other fields. MATLAB simulation software had powerful function
3、of signal processing,it can be used in parallel moving,scale transformation,system analysis,time frequency transformation,filtering and other operation. In this paper,MATLAB software is used to process the voice signal to realize the sound effect processing,time-frequency analysis,filtering processi
4、ng and other functions.Keywords:speech signal;time-frequency processing;filtering0 引 言越來越多的智能設(shè)備和產(chǎn)品中集成了語音信號(hào)處理模塊,語音信號(hào)處理作為計(jì)算機(jī)接口和人機(jī)交互的重要手段得到了廣泛的應(yīng)用,語音信號(hào)處理包含語音采集、語音分析、語音轉(zhuǎn)換、語音識(shí)別、語音合成等內(nèi)容,本文對(duì)錄制語音進(jìn)行了時(shí)域頻域分析,并進(jìn)行了變換以產(chǎn)生不同的音效,對(duì)錄制的按鍵音進(jìn)行了特征參數(shù)的分析與提取,最后設(shè)計(jì)了濾波系統(tǒng)對(duì)語音信號(hào)進(jìn)行了濾波處理。在西安工商學(xué)院開展課堂教學(xué)創(chuàng)新活動(dòng)期間,對(duì)語音信號(hào)的采集和處理在“信號(hào)與系統(tǒng)”課程和“數(shù)字信
5、號(hào)處理”課程的課堂創(chuàng)新教學(xué)中發(fā)揮了重要作用,作者通過對(duì)語音信號(hào)進(jìn)行采集變換的方式,將變換前后語音音效及頻譜圖展示給學(xué)生,增強(qiáng)了學(xué)生對(duì)信號(hào)的感知和理解,提高了課堂效果。1 原始語音信號(hào)讀入首先,利用電腦或者手機(jī)錄制一段音頻,時(shí)長在5秒以內(nèi),錄制的音頻格式如果不為.wav格式的話需要用相應(yīng)的軟件將音頻格式轉(zhuǎn)換成.wav,WAV是一種無損的音頻格式,標(biāo)準(zhǔn)格式化的WAV文件,取樣頻率是44.1 kHz,量化數(shù)字為16位。采用MATLAB在命令窗口輸入y,F(xiàn)s,bits = wavread(e: 1.wav)就可以把語音信號(hào)讀取進(jìn)來,原始語音信號(hào)放置在電腦E盤下面,命名為1,格式為.wav格式。其中y為
6、語音采樣后的數(shù)據(jù),幅度已經(jīng)歸一化了;Fs為語音信號(hào)的采樣率;bits為采樣精度,可以求出語音信號(hào)的長度。采用n=length(y)可以求得語音信號(hào)的長度n,n=176 128,信號(hào)長度也由語音信號(hào)時(shí)長L(秒)和采樣頻率Fs決定,n=L*Fs。采用plot(y)將語音信號(hào)顯示出來,系統(tǒng)默認(rèn)自變量為采樣后的順序點(diǎn)數(shù),如圖1所示。2 語音信號(hào)處理為了讓學(xué)生直觀感受信號(hào)處理在實(shí)際中的用途,我們對(duì)采集的語音信號(hào)進(jìn)行了變換處理,產(chǎn)生了回聲和變音的兩種音效。通過對(duì)采集語音進(jìn)行數(shù)學(xué)運(yùn)算,利用延時(shí)疊加產(chǎn)生回聲的音效,利用采集尺度變換即采集信號(hào)的頻率參數(shù)發(fā)生變化來實(shí)現(xiàn)語音信號(hào)的變音效果,利用傅里葉變換將語音信號(hào)從
7、時(shí)域變換到頻域,再在頻域?qū)Σ煌存I語音進(jìn)行核心頻率識(shí)別,最后設(shè)計(jì)了一個(gè)低通濾波系統(tǒng)對(duì)所采集語音進(jìn)行濾波,消除高頻分量,保留低頻分量。具體的流程如圖2所示。2.1 回聲音效對(duì)語音信號(hào)進(jìn)行時(shí)域延時(shí),再和原始語音信號(hào)進(jìn)行疊加就能產(chǎn)生回聲的效果。對(duì)語音信號(hào)進(jìn)行延時(shí),做法是產(chǎn)生一個(gè)規(guī)格相同的0序列列向量疊加到語音信號(hào)之前。疊加延時(shí)后語音信號(hào)需要和原始語音信號(hào)長度相同,所以需要給原始語音信號(hào)后面補(bǔ)上相應(yīng)的0序列。對(duì)于本語音,發(fā)現(xiàn)延時(shí)0.1秒到0.3秒回聲效果相對(duì)較好。程序片段如下:y1=y;zeros(6000,1);y2=zeros(6000,1);y;y3=y1+y2;sound(y3,F(xiàn)s)2.2
8、變音音效實(shí)際中為了保護(hù)語音采訪者的隱私,媒體一般都會(huì)對(duì)采訪者的語音進(jìn)行處理,在MATLAB環(huán)境中,為了達(dá)到對(duì)語音信號(hào)進(jìn)行變聲的效果,首先把原始語音信號(hào)采集進(jìn)來后,通過改變播放時(shí)的播放頻率,原始語音信號(hào)本身有一個(gè)采樣頻率,可以用一個(gè)更高的采樣頻率或者一個(gè)更低的采樣頻率對(duì)其進(jìn)行采樣,播放出來的音效就有了變音的功效。原始語音Fs=48 000 Hz,當(dāng)采用采樣頻率為60 000 Hz進(jìn)行播放時(shí),sound(y,60 000),語音輸出更清脆,因?yàn)椴蓸宇l率變高了,語速變快,音調(diào)變高,聲音更向女生的音色方向變化。同樣的,采用采樣頻率為40 000 Hz對(duì)原始語音進(jìn)行播放時(shí),sound(y,40 000)
9、,我們聽到了語音更低沉,更緩慢,音色更接近與男生的音色。調(diào)節(jié)此參數(shù)可以調(diào)節(jié)變聲效果,從數(shù)學(xué)運(yùn)算的角度,這等同于把原始語音信號(hào)進(jìn)行尺度變換,把原來的信號(hào)在時(shí)域進(jìn)行擴(kuò)展和壓縮。從語音信號(hào)的處理效果上來看,起到了很好的“變聲”的效果。2.3 頻域變換對(duì)比教學(xué)可以加深學(xué)生對(duì)知識(shí)和概念的掌握,實(shí)際中我們聽到每一個(gè)人的音色都不一樣,男生和女生的聲音差異也比較大。為了區(qū)別每一個(gè)人的聲音特征,我們可以通過傅里葉變換工具將語音信號(hào)變換到頻域,然后分析語音的特征頻段即語音幅度相對(duì)較大的20%比例的頻段的特性。語音信號(hào)的傅里葉變換在MATLAB中利用FFT來實(shí)現(xiàn)。FFT是離散時(shí)間傅里葉變換的快速算法,通過FFT得到
10、的是信號(hào)的頻域函數(shù),一般情況下是一個(gè)復(fù)數(shù),進(jìn)行信號(hào)的頻域分析時(shí)需要對(duì)這個(gè)復(fù)數(shù)分別取其模和相位,分析其幅頻圖和相頻圖,一般問題只需要分析到其幅頻圖就可以了。根據(jù)傅里葉變換的特征,語音信號(hào)的幅度譜一般為對(duì)稱圖形,其自變量為整數(shù),代表的是數(shù)字頻率k。為了更好地理解,我們可以把自變量k轉(zhuǎn)換成模擬頻率f,轉(zhuǎn)換公式:f=k*Fs/length(y)。如圖3所示,所錄制信號(hào)的主要頻率在0.8104 Hz以內(nèi),低頻尤其是0.5104 Hz頻段以內(nèi)信號(hào)分布較多。2.4 語音識(shí)別人體語音包含的頻段比較寬,我們選擇了手機(jī)按鍵音進(jìn)行語音識(shí)別。我們選取了某款手機(jī)按鍵數(shù)字分別為1、5、9的錄音10組,利用傅里葉變換將按鍵
11、音轉(zhuǎn)換到頻率,觀察其特征頻率。頻域圖形顯示,按鍵音在頻域出現(xiàn)了兩個(gè)核心頻段,記錄該頻段數(shù)值,利用統(tǒng)計(jì)學(xué)的手段,對(duì)10組語音的核心雙頻段的10個(gè)數(shù)值進(jìn)行統(tǒng)計(jì)運(yùn)算,求其算術(shù)平均值和標(biāo)準(zhǔn)差,然后根據(jù)算術(shù)平均值及其標(biāo)準(zhǔn)差得到測(cè)量結(jié)果。由表1可以看出,相同按鍵音的核心頻率相近,有個(gè)別頻率變化較大,在實(shí)際中可以根據(jù)誤差理論與數(shù)據(jù)處理中對(duì)測(cè)量數(shù)據(jù)中粗大誤差的發(fā)現(xiàn)方法,進(jìn)行異常值判定并剔除;把剩余的數(shù)據(jù)取平均值然后得到一個(gè)大概率的數(shù)據(jù)變化區(qū)間,對(duì)1、5、9按鍵音錄取測(cè)試語音,取其核心頻段進(jìn)行測(cè)試識(shí)別。其中,數(shù)字1、5、9按鍵音的核心頻率分別取了兩個(gè),1.1和1.2為數(shù)字1的按鍵音兩個(gè)核心頻率,2.1和2.2為
12、數(shù)字5的按鍵音兩個(gè)核心頻率,3.1和3.2為數(shù)字9的按鍵音兩個(gè)核心頻率。2.5 語音濾波系統(tǒng)設(shè)計(jì)基于MATLAB的語音信號(hào)濾波器是一個(gè)能夠?qū)崿F(xiàn)給語音信號(hào)濾波的系統(tǒng),濾波系統(tǒng)從功能上分為低通、高通、帶通和帶阻。濾波器的設(shè)計(jì)方法分為FIR數(shù)字濾波器設(shè)計(jì)方法和IIR數(shù)字濾波器設(shè)計(jì)方法,窗函數(shù)是常見的FIR數(shù)字濾波器設(shè)計(jì)方法,常見的窗函數(shù)有矩形窗、海明窗、漢寧窗、布拉克曼窗和凱塞窗等;IIR數(shù)字濾波器的設(shè)計(jì)方法有脈沖響應(yīng)不變法和雙線性變換法。本設(shè)計(jì)采用雙線性變換法設(shè)計(jì)數(shù)字濾波器系統(tǒng)對(duì)原始語音信號(hào)進(jìn)行處理,濾波程序片段如下:Fp=2000;Fs=3000;Ft=80000;As=100;Ap=1;wp=
13、2*pi*Fp/Ft;ws=2*pi*Fs/Ft;n,wn=ellipord(wp,ws,Ap,As,s);b,a=ellip(n,Ap,As,wn,s);B,A=bilinear(b,a,1);h,w=freqz(B,A);由圖4可以看出,語音信號(hào)原始的頻率分布范圍在0.8 104 Hz以內(nèi),主要頻率范圍在0.5104 Hz以內(nèi),我們?cè)O(shè)計(jì)的濾波系統(tǒng)通帶截止頻率和阻帶截止頻率分別為0.2104 Hz和0.3104 Hz,將0.2104 Hz內(nèi)信號(hào)進(jìn)行保留,將0.3 104 Hz以上信號(hào)進(jìn)行濾除。由于濾除以后依然保留了原始語音的核心頻段,濾波后語音用原有采樣頻率播放音頻的語音效果和原始語音差別不
14、大,可以通過調(diào)節(jié)通帶和阻帶截止頻率的參數(shù)來改變保留信號(hào)的頻段。3 結(jié) 論通過MATLAB對(duì)錄制的語音進(jìn)行延時(shí)疊加,變換采樣頻率,達(dá)到了回聲混響音效處理和變音處理的音效;通過對(duì)錄制語音進(jìn)行時(shí)頻變換處理并對(duì)比,得到男女音頻域分布的差別和特征;通過對(duì)按鍵音進(jìn)行頻域特征頻率識(shí)別,有效地對(duì)語音信號(hào)進(jìn)行了識(shí)別;最后設(shè)計(jì)了低通濾波系統(tǒng),對(duì)語音信號(hào)進(jìn)行了低通濾波處理,消除了語音信號(hào)內(nèi)頻率在0.3 104 Hz以上的頻譜分量。采用MATLAB能方便快捷地對(duì)語音信號(hào)進(jìn)行分析、變換和參數(shù)提取,給語音信號(hào)的后續(xù)分析處理打下了良好的基礎(chǔ)。Reference:1 劉婷,柳鈺,薛小慶.MATLAB在語音信號(hào)處理中的應(yīng)用 J.電子測(cè)試
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 【正版授權(quán)】 ISO 23649:2025 EN Chemicals for the leather tanning industry - Determination of cyclosiloxanes
- 【正版授權(quán)】 ISO 3518:2025 EN Essential oil of sandalwood (Santalum album L.)
- 【正版授權(quán)】 ISO 18162:2024 EN Biotechnology - Biobanking - Requirements for human neural stem cells derived from pluripotent stem cells
- 2025年度標(biāo)準(zhǔn)托盤租賃及全程跟蹤服務(wù)協(xié)議
- 二手機(jī)械二手交易與環(huán)保處理服務(wù)合同(2025版)
- 2025年度二手房購房貸款保險(xiǎn)合同范本
- 2025年辦公設(shè)備升級(jí)改造項(xiàng)目合作協(xié)議
- 生產(chǎn)計(jì)劃的周期性評(píng)審與調(diào)整
- 農(nóng)業(yè)生產(chǎn)的安全防護(hù)措施計(jì)劃
- 如何制定子女的教育基金計(jì)劃
- 建筑基坑工程監(jiān)測(cè)技術(shù)標(biāo)準(zhǔn)
- 2024年廣東汕尾市“奔向海陸豐”事業(yè)單位(綜合崗類)招聘工作人員176人歷年高頻500題難、易錯(cuò)點(diǎn)模擬試題附帶答案詳解
- 【2024高考萬能答題模版】數(shù)學(xué)答題模板1
- DG-TJ 08-2242-2023 民用建筑外窗應(yīng)用技術(shù)標(biāo)準(zhǔn)
- 2024-2025上期學(xué)校心理健康教育工作計(jì)劃(附每周工作安排)
- 【中考真題】2024年河南省普通高中招生考試歷史試卷(含答案)
- YYT 0653-2017 血液分析儀行業(yè)標(biāo)準(zhǔn)
- JT-T-445-2021汽車底盤測(cè)功機(jī)
- 體育科學(xué):田徑考試考試題(三)
- 高考英語經(jīng)常用的七百個(gè)詞匯
- 不定代詞用法總結(jié)及配套練習(xí)題
評(píng)論
0/150
提交評(píng)論