通信工程專業(yè)語音信號(hào)增強(qiáng)技術(shù)的研究與仿真畢業(yè)設(shè)計(jì)_第1頁
通信工程專業(yè)語音信號(hào)增強(qiáng)技術(shù)的研究與仿真畢業(yè)設(shè)計(jì)_第2頁
通信工程專業(yè)語音信號(hào)增強(qiáng)技術(shù)的研究與仿真畢業(yè)設(shè)計(jì)_第3頁
通信工程專業(yè)語音信號(hào)增強(qiáng)技術(shù)的研究與仿真畢業(yè)設(shè)計(jì)_第4頁
通信工程專業(yè)語音信號(hào)增強(qiáng)技術(shù)的研究與仿真畢業(yè)設(shè)計(jì)_第5頁
已閱讀5頁,還剩23頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

黃河科技學(xué)院畢業(yè)論文第PAGEI頁單位代碼01學(xué)號(hào)分類號(hào)TN912.3密級(jí)畢業(yè)設(shè)計(jì)論文語音信號(hào)增強(qiáng)技術(shù)的研究與仿真實(shí)現(xiàn)院(系)名稱信息工程學(xué)院專業(yè)名稱通信工程學(xué)生姓名指導(dǎo)教師201第23頁語音信號(hào)增強(qiáng)技術(shù)的研究與仿真實(shí)現(xiàn)摘要語音信號(hào)處理是研究用數(shù)字信號(hào)處理技術(shù)對(duì)語音信號(hào)進(jìn)行處理的一門新興學(xué)科。語音信號(hào)處理的應(yīng)用極為廣泛,其中的主要技術(shù)包括語音編碼、語音合成、語音識(shí)別和語音增強(qiáng)等,實(shí)際中,語音常常受到環(huán)境噪聲的干擾而使通話質(zhì)量下降,嚴(yán)重時(shí)使語音處理系統(tǒng)不能正常工作。在這種情況下,必須采用信號(hào)處理方法進(jìn)行語音增強(qiáng),抑制背景噪聲,以提高語音通信質(zhì)量。因此,就語音增強(qiáng)技術(shù)本文著重在抑制背景噪聲上進(jìn)行了研究和仿真。首先,對(duì)語音信號(hào)的各種處理技術(shù)進(jìn)行了較為詳細(xì)地介紹;其次根據(jù)對(duì)語音信號(hào)增強(qiáng)處理技術(shù)的分析,設(shè)計(jì)了一個(gè)用于抑制噪聲的數(shù)字濾波器,從而達(dá)到了語音增強(qiáng)的目的。最后在MATLAB的環(huán)境中,對(duì)含噪聲語音信號(hào)讀入,然后通過設(shè)計(jì)的濾波器進(jìn)行了仿真實(shí)現(xiàn),使語音信號(hào)得到了增強(qiáng)。關(guān)鍵詞:語音信號(hào)處理,語音增強(qiáng),MATLABSpeechsignalprocessingtechnologyresearchandsimulationAuthor:ZhuChaojunTutor:TangHailingAbstractSpeechsignalprocessingisanewdevelopingdisciplinewhichhasaresearchonthespeechsignalusingthetechnologyofdigitalsignalprocessing.Theapplicationisverywidespread.Speechcoding,speechsynthesis,speechrecognitionandspeechenhancementaretheprimarykindsoftechnologyofspeechsignalprocessing.Actually,speechisoftendisturbedbyenvironmentalnoise.Sothatthespeechqualitywilldropdown.Ifitisserious,thespeechprocessingsystemwillworkunnormally.Underthiskindofcircumstances,wemustadoptsignalhandlingmathodtoenhancespeechsothatthenoisefrombackgroundcanbecontroled.Ifwedothis,thespeechqualitycanbeimproved.Soaboutspeechenhancementtechnology,thistextemphasizesonresearchandsimulationaboutthecontrolofbackgroundnoise.Firstly,wehaveintroducedvariouskindsofprocessingtechnologyindetail.Secondly,onthebasisofanalysisaboutthetechnologyofspeechsignalenhancementprocessing,wehavedesignedatransformfordigitalfiltertocontrolnoisesothattheobjectiveofspeechenhancementcanbemade.Finally,intheenvironmentofMATLAB,thespeechsignalthatcontainsnoisewillbereaded-in.Thenthroughthetransformfordigitalfilterthathasbeendevesedthesimulationcanberealized.Bymeansofthis,speechsignalwasenhancedindeed.Keywords:Speechsignalprocessing,speechenhancement,MATLAB目錄1緒論 11.1語音處理技術(shù)的概述 11.1.1語音編碼技術(shù) 21.1.2語音合成技術(shù) 31.1.3語音識(shí)別技術(shù) 31.1.4語音增強(qiáng)技術(shù) 51.2課題研究背景及意義 61.3本文主要研究?jī)?nèi)容 62語音及語音增強(qiáng)研究的基礎(chǔ) 82.1語音增強(qiáng)概述 82.2語音增強(qiáng)技術(shù)的基本理論 92.3常用的語音增強(qiáng)算法 102.4小結(jié) 113語音信號(hào)增強(qiáng)的實(shí)現(xiàn) 123.1語音信號(hào)的獲取及相應(yīng)處理 123.1.1時(shí)域信號(hào)的FFT分析 123.1.2語音信號(hào)的獲取 123.2針對(duì)語音信號(hào)的FIR數(shù)字濾波器的設(shè)計(jì) 153.2.1數(shù)字濾波器設(shè)計(jì)原理 153.2.2數(shù)字濾波器的設(shè)計(jì)步驟 153.2.3FIR濾波器與IIR濾波器的性能比較 153.2.4FIR數(shù)字濾波器的設(shè)計(jì) 163.2.5針對(duì)語音信號(hào)的FIR數(shù)字濾波器的設(shè)計(jì) 163.3語音信號(hào)的增強(qiáng)處理 183.4小結(jié) 194結(jié)論 20致謝 21參考文獻(xiàn) 221緒論1.1語音處理技術(shù)的概述通過語音來與人傳遞信息是人類最重要的基本功能之一,語言是人類特有的功能;聲音是人類常用的工具,是相互傳遞信息的最為重要的手段。雖然,人可以通過多種手段拉來獲得外界的信息,但最重要最精細(xì)的信息源只有語言、文字和圖像三種。與用聲音傳遞信息相比,雖然用視覺和文字相互傳遞信息,其效果要差的多。這是因?yàn)檎Z音中除包含實(shí)際發(fā)音內(nèi)容的語言信息外,還包括發(fā)音這是誰及喜怒哀樂等各種信息。所以,語言是人類最重要、最有效、最常用和最方便的交換信息的形式。另一方面,語言和語音與人的智力活動(dòng)密切相關(guān),與文化和社會(huì)的進(jìn)步緊密相連,它具有最大的信息容量和最高的智能水平。語音信號(hào)處理是研究用數(shù)字信號(hào)處理技術(shù)對(duì)語音信號(hào)進(jìn)行處理的一門新興學(xué)科,處理的目的是用于得到某些參數(shù)以便高效傳輸或存儲(chǔ);或者是用于某種應(yīng)用,如人工合成出語音、辨識(shí)出講話者。識(shí)別出講話內(nèi)容,進(jìn)行語音增強(qiáng)等。語音信號(hào)處理是一門新興的學(xué)科,同時(shí)又是綜合性的多學(xué)科領(lǐng)域,是一門涉及面很廣的交叉學(xué)科。雖然從事這一領(lǐng)域研究的人員主要來自信息處理及計(jì)算機(jī)等學(xué)科,但是它與語音學(xué)、語言學(xué)、聲學(xué)、認(rèn)知科學(xué)、生理學(xué)、心理學(xué)及數(shù)理統(tǒng)計(jì)等需要學(xué)科也有非常密切的聯(lián)系[1]。語音信號(hào)處理是信息需要領(lǐng)域應(yīng)用的可信技術(shù)之一,是目前發(fā)展最為迅速的信息科學(xué)研究領(lǐng)域中的一個(gè)。語音處理是目前極為活躍和熱門的研究領(lǐng)域,其研究設(shè)計(jì)一系列前言科研課題,并且處于迅速發(fā)展之中;其研究成果具有重要的學(xué)術(shù)及應(yīng)用價(jià)值。20世紀(jì)60年代中期形成的一系列數(shù)字信號(hào)處理方法和算法,如數(shù)字濾波器、快速傅里葉變換等是語音信號(hào)數(shù)字處理的理論和技術(shù)基礎(chǔ)。進(jìn)入70年代之后,語音技術(shù)取得了需要實(shí)際性的進(jìn)展;用于語音信號(hào)的嬉戲壓縮和特征提取的線性預(yù)測(cè)技術(shù),已成為語音信號(hào)處理最強(qiáng)有力的工具,廣泛應(yīng)用于語音信號(hào)的分析、合成及各個(gè)應(yīng)用領(lǐng)域;用于輸入語音與參考樣本之間時(shí)間匹配的動(dòng)態(tài)規(guī)劃方法。80年代初一種新的基于聚類分析的高效數(shù)據(jù)技術(shù)——矢量量化應(yīng)用于語音信號(hào)處理中;而用隱式馬爾可夫模型描述語音信號(hào)過程的產(chǎn)生式80年代語音信號(hào)處理技術(shù)的重大進(jìn)展。近年來人工神經(jīng)網(wǎng)絡(luò)的研究取得了迅速發(fā)展,語音信號(hào)處理的各項(xiàng)課題是促使其發(fā)展的重要?jiǎng)恿χ?;同時(shí),它的許多成果,也體現(xiàn)在有關(guān)語音的各項(xiàng)應(yīng)用之中,尤其語音識(shí)別是神經(jīng)網(wǎng)絡(luò)的一個(gè)重要應(yīng)用領(lǐng)域。從技術(shù)角度講,語音信號(hào)處理是信息高速公路、多媒體技術(shù)、辦公自動(dòng)化、現(xiàn)代通信及智能系統(tǒng)等新興領(lǐng)域應(yīng)用的核心技術(shù)之一。在高度發(fā)達(dá)的信息社會(huì)用數(shù)字化的方法進(jìn)行語音的傳送、存儲(chǔ)、識(shí)別、合成、增強(qiáng)等是整個(gè)數(shù)字化通信網(wǎng)中最重要、最基本的組成部分之一。同時(shí),由于語言是人類相互間溝通的最自然和最方便的形式,所以它是一種理想的人機(jī)通信方式。因而可為計(jì)算機(jī)、自動(dòng)化系統(tǒng)等建立良好的人機(jī)交互環(huán)境,進(jìn)一步推動(dòng)計(jì)算機(jī)和其他智能機(jī)器的應(yīng)用,提高社會(huì)信息化和自動(dòng)化的程度。語音處理技術(shù)的應(yīng)用及其廣泛。包括工業(yè)、軍事、交通、醫(yī)學(xué)、民用等各個(gè)領(lǐng)域。目前,語音處理技術(shù)處于蓬勃發(fā)展時(shí)期,已有大量產(chǎn)品投放市場(chǎng),并且不斷有新產(chǎn)品被開發(fā)研制,具有及其廣泛的市場(chǎng)需要和應(yīng)用前景[2]。1.1.1語音編碼技術(shù)對(duì)于移動(dòng)通信而言,最多的信息就是語音信號(hào),語音編碼的技術(shù)在數(shù)字移動(dòng)通信中具有相當(dāng)關(guān)鍵的作用,高質(zhì)量低速率的語音編碼技術(shù)是數(shù)字移動(dòng)網(wǎng)永遠(yuǎn)的追求。所謂語音編碼,它是將模擬語音信號(hào)轉(zhuǎn)變?yōu)閿?shù)字信號(hào)以便在信道中傳輸。除了通信帶寬的要求外,計(jì)算機(jī)存儲(chǔ)容量的限制也要求對(duì)語音信號(hào)進(jìn)行壓縮,以滿足海量數(shù)據(jù)情況下進(jìn)行實(shí)時(shí)或準(zhǔn)時(shí)計(jì)算機(jī)處理的目的。

在語音信號(hào)的數(shù)字處理過程中,語音編碼技術(shù)至關(guān)重要,直接影響到話音的存儲(chǔ)、語音合成、語音識(shí)別與理解。語音編碼是將模擬語音信號(hào)實(shí)現(xiàn)數(shù)字化的基本手段。語音信號(hào)是一種時(shí)變的準(zhǔn)周期信號(hào),而經(jīng)過編碼描述以后,語音信號(hào)可以作為數(shù)字?jǐn)?shù)據(jù)來傳輸、存儲(chǔ)或處理,因而具有一般數(shù)字信號(hào)的優(yōu)點(diǎn)。語音編碼主要有三種方式:波形編碼、信源編碼和混合編碼,這三種方式都涉及到語音的壓縮編碼技術(shù)。通常把編碼速率低于64kbps的語音編碼方式稱為語音壓縮編碼技術(shù)。如何在盡量減少失真的情況下,降低語音編碼的比特?cái)?shù)已成為語音壓縮編碼技術(shù)的主要內(nèi)容,換言之,在相同編碼比特率下,如何取得更高質(zhì)量的恢復(fù)語音是較高質(zhì)量語音編碼系統(tǒng)的要求[3]。1.1.2語音合成技術(shù)從18世紀(jì)開始,人們就研究“會(huì)說話的機(jī)器”,現(xiàn)代電子技術(shù)產(chǎn)生以后,“會(huì)說話的機(jī)器”這一術(shù)語也被“語音合成”所替代,由人工制作出語音稱為語音合成,就是由機(jī)器產(chǎn)生出聲音,它是人機(jī)語音通信的一個(gè)重要組成部分。語音合成系統(tǒng)是一個(gè)單向系統(tǒng),由計(jì)算機(jī)到人,用語音合成來傳遞語言具有下面的優(yōu)點(diǎn):不用特別注意和專門訓(xùn)練,任何人都可以理解,可以直接使用電話網(wǎng)和電話機(jī),無須消耗紙張等資源。語音合成,又稱文語轉(zhuǎn)換技術(shù),能將任意文字信息實(shí)時(shí)轉(zhuǎn)化為標(biāo)準(zhǔn)流暢的語音朗讀出來,相當(dāng)于給機(jī)器裝上了人工嘴巴。解決的主要問題就是如何將文字信息轉(zhuǎn)化為可聽的聲音信息,也即讓機(jī)器像人一樣開口說話。語音合成技術(shù)經(jīng)歷了一個(gè)逐步發(fā)展的過程,從參數(shù)合成到拼接合成,再到兩者的逐步結(jié)合,其不斷發(fā)展的動(dòng)力是人們認(rèn)知水平和需求的提高。目前,常用的語音合成方法主要有:共振峰合成、LPC合成、PSOLA拼接合成和LMA聲道模型技術(shù)。它們各有優(yōu)缺點(diǎn),人們?cè)趹?yīng)用過程中往往將多種技術(shù)有機(jī)地結(jié)合在一起,或?qū)⒁环N技術(shù)的優(yōu)點(diǎn)運(yùn)用到另一種技術(shù)上,以克服另一種技術(shù)的不足。語音合成的目的是產(chǎn)生與人通信有關(guān)的語音,所以可懂度是很重要的。同時(shí),語音的和自然度,這些主觀因素對(duì)語音合成的實(shí)用性也有很大的影響。由于計(jì)算機(jī)和集成電路技術(shù)的發(fā)展,推動(dòng)了語音信號(hào)處理的實(shí)用化,已開發(fā)出了很多產(chǎn)品?,F(xiàn)在有很多專用語音處理芯片,這些芯片和微型計(jì)算機(jī)或微處理器相結(jié)合可以組成各種復(fù)雜的語音處理系統(tǒng)。器重語音合成在技術(shù)上比較成熟,在語音處理中影響也最大,多是有限詞匯量的語音合成器。目前,語音合成的應(yīng)用領(lǐng)域十分廣泛,從辦公信息處理、工業(yè)自動(dòng)化、交通運(yùn)輸?shù)轿幕逃灾寥粘I钣闷返葻o處不在[4]。1.1.3語音識(shí)別技術(shù)語音識(shí)別也稱為語音自動(dòng)識(shí)別,語音識(shí)別基于模式匹配的思想,從語音中抽取聲學(xué)特征,然后在特征空間完成模式的比較匹配,尋找最接近的詞或字作為識(shí)別的結(jié)果。語音信號(hào)處理技術(shù)是語音處理領(lǐng)域中新近發(fā)展起來的一個(gè)學(xué)科分支,是研究使機(jī)器能夠準(zhǔn)確的聽出人的語音內(nèi)容的問題,即準(zhǔn)確的識(shí)別所說的話。幾十年來,語音識(shí)別技術(shù)經(jīng)歷了從特定人中小詞匯量的孤立詞語和連接詞語的語音識(shí)別到非特定人大詞匯量的自然口語識(shí)別的發(fā)展歷程。盡管如此,語音識(shí)別技術(shù)要走出實(shí)驗(yàn)室、全面融入人們的日常生活還需假以時(shí)日。當(dāng)使用的環(huán)境與訓(xùn)練的環(huán)境有差異時(shí),如在存在有背景噪聲、信道傳輸噪聲、說話人的語速和發(fā)音不標(biāo)準(zhǔn)等的情況下,識(shí)別系統(tǒng)的性能往往會(huì)顯著下降,無法滿足實(shí)用的要求。環(huán)境噪聲、方言和口音、口語的識(shí)別已經(jīng)成為目前語音識(shí)別中三個(gè)主要的新難題。

語音識(shí)別技術(shù)是2000年間至2010年間信息技術(shù)領(lǐng)域的十大重要科技發(fā)展技術(shù)之一。它是一門交叉學(xué)科,正逐步成為信息技術(shù)中人與機(jī)接口的關(guān)鍵技術(shù)。與機(jī)器進(jìn)行語音交流,讓機(jī)器明白你在說什么,這是人們長期來夢(mèng)寐以求的事情。語音識(shí)別技術(shù)就是讓機(jī)器通過識(shí)別和理解的過程把語音信號(hào)轉(zhuǎn)變?yōu)橄鄳?yīng)的文本或命令的高技術(shù)。讓機(jī)器識(shí)別語音的困難在某種程度上就像一個(gè)外語不好的人聽外國人講話一樣,它和不同的說話人、不同的說話速度、不同的說話內(nèi)容、以及不同的環(huán)境條件有關(guān)。近二十年來,語音識(shí)別技術(shù)取得顯著進(jìn)步,開始從實(shí)驗(yàn)室走向市場(chǎng)。人們預(yù)計(jì),未來10年內(nèi),語音識(shí)別技術(shù)將進(jìn)入工業(yè)、家電、通信、汽車電子、醫(yī)療、家庭服務(wù)、消費(fèi)電子產(chǎn)品等各個(gè)領(lǐng)域。語音信號(hào)本身的特點(diǎn)造成了語音識(shí)別的困難。這些特點(diǎn)包括多變性,動(dòng)態(tài)性,瞬時(shí)性和連續(xù)性等。在電話與通信系統(tǒng)中,智能語音接口正在把電話機(jī)從一個(gè)單純的服務(wù)工具變成為一個(gè)服務(wù)的“提供者”和生活“伙伴”;使用電話與通信網(wǎng)絡(luò),人們可以通過語音命令方便地從遠(yuǎn)端的數(shù)據(jù)庫系統(tǒng)中查詢與提取有關(guān)的信息;隨著計(jì)算機(jī)的小型化,鍵盤已經(jīng)成為移動(dòng)平臺(tái)的一個(gè)很大障礙,想象一下如果手機(jī)僅僅只有一個(gè)手表那么大,再用鍵盤進(jìn)行撥號(hào)操作已經(jīng)是不可能的。語音識(shí)別正逐步成為信息技術(shù)中人機(jī)接口的關(guān)鍵技術(shù),語音識(shí)別技術(shù)與語音合成技術(shù)結(jié)合使人們能夠甩掉鍵盤,通過語音命令進(jìn)行操作。語音技術(shù)的應(yīng)用已經(jīng)成為一個(gè)具有競(jìng)爭(zhēng)性的新興高技術(shù)產(chǎn)業(yè)。一個(gè)完整的語音識(shí)別系統(tǒng)可大致分為三部分:語音特征提取、聲學(xué)模型與模式匹配(識(shí)別算法)和語言模型與語言處理。當(dāng)前在語音識(shí)別中,如何去充分借鑒和利用人在完成語音識(shí)別和理解時(shí)所利用的方法和原理是一大課題,因而將人工神經(jīng)網(wǎng)絡(luò)引入語音識(shí)別中引起了人們極大的興趣。對(duì)于漢語語音識(shí)別來說,本質(zhì)上與其他的語言沒有區(qū)別,但也有其本身特點(diǎn),主要是他易于用音節(jié)作為基本研究的對(duì)象,從而使特征的提取,字節(jié)的分割,動(dòng)態(tài)時(shí)間匹配方法的選取等等,也具有特點(diǎn)。目前漢語語音識(shí)別的研究重點(diǎn)是以詞為單位的孤立詞的識(shí)別以及連續(xù)語音識(shí)別等[5]。1.1.4語音增強(qiáng)技術(shù)在之前所述的理論中,大部分的語音數(shù)據(jù)都是在接近理想的情況下采集的。大多數(shù)的語音識(shí)別和語音編碼在開始研究時(shí)都要在高保真設(shè)備上錄制語音,尤其要在無噪環(huán)境下錄音。在實(shí)際應(yīng)用中,由于噪聲的存在會(huì)產(chǎn)生很多問題,比如,環(huán)境噪聲的污染會(huì)使許多語音處理系統(tǒng)的性能急劇惡化。例如,語音識(shí)別正在步入實(shí)用階段,但識(shí)別系統(tǒng)大都是在安靜的環(huán)境中工作的,在噪聲環(huán)境中,尤其是在強(qiáng)噪聲的環(huán)境中,語音識(shí)別系統(tǒng)的識(shí)別器將嚴(yán)重受到影響,低速率的編碼也會(huì)遇到類似的問題。由于語音生成模型是低速率的參數(shù)編碼的基礎(chǔ),在語音通信中不可避免的會(huì)受到來自周圍環(huán)境、傳輸媒介引入噪聲、通信設(shè)備內(nèi)部的電噪聲,甚至其他人的說話聲的干擾。這些干擾將致使接收到的參數(shù)已非純凈的原始的語音參數(shù),而是受到噪聲污染的參數(shù),當(dāng)噪聲污染嚴(yán)重時(shí),重建的語音質(zhì)量將急劇惡化,甚至變得完全聽不懂。而且特別遺憾的是,線性預(yù)測(cè)的技術(shù)作為語音處理中最有效的方法,恰恰是最容易受噪聲污染的。如果將線性預(yù)測(cè)技術(shù)看作頻譜的匹配過程,則在大量的噪聲使頻譜畸變時(shí)預(yù)測(cè)器就設(shè)法與畸變頻譜匹配,而不是與基本的語音匹配。當(dāng)在聲碼器的接收端使用和發(fā)送端相同的預(yù)測(cè)器時(shí),則合成語音的可懂度就大大的降低了。語音增強(qiáng)是解決噪聲污染的一種最為有效地方法,它的主要目標(biāo)是從帶噪聲的語音信號(hào)中提取盡可能純凈的原始的語音,它不但與信號(hào)處理的技術(shù)有關(guān),還涉及到人的聽覺感知和語音學(xué),此外,噪聲來源眾多,隨著應(yīng)用場(chǎng)合的不同,它的特性也各不相同,因而很難找出一種通用的語音增強(qiáng)算法來適用于各種噪聲環(huán)境。必須針對(duì)不同的噪聲采取不同的語音增強(qiáng)對(duì)策。1.2課題研究背景及意義語音信號(hào)處理是信息高速公路、多媒體技術(shù)、辦公自動(dòng)化、現(xiàn)代通信及智能系統(tǒng)等新興領(lǐng)域應(yīng)用的核心技術(shù)之一,它主要包括語音編碼、合成、識(shí)別和語音增強(qiáng)等方面。然而人們?cè)讷@得語音信號(hào)的同時(shí),不可避免地會(huì)受到來自傳輸媒介引入的噪聲、通信設(shè)備內(nèi)部電噪聲、房間混響乃至其他說話人的話音干擾。這些干擾不僅會(huì)使接收者得到的語音被噪聲污染,同時(shí)也會(huì)導(dǎo)致許多語音處理系統(tǒng)的性能急劇惡化。語音增強(qiáng)作為前置處理方案是抑制干擾的一種有效途徑,是語音信號(hào)其它應(yīng)用的基礎(chǔ)。隨著語音增強(qiáng)研究的深入,人們?cè)絹碓秸J(rèn)識(shí)到由于噪聲通常是隨機(jī)的,要想從帶噪語音信號(hào)中提取完全純凈的原始語音信號(hào)幾乎是不可能的。在這種情況下,語音增強(qiáng)的目的主要有兩個(gè):1.主觀度量:改進(jìn)語音質(zhì)量,消除背景噪聲,使聽者樂于接受,不感覺疲勞。2.客觀度量:提高語音可懂度。在實(shí)際情況下,往往這兩個(gè)目的不能兼得。由此可見,語音增強(qiáng)是一項(xiàng)很復(fù)雜的技術(shù),不僅僅是數(shù)字信號(hào)處理的問題,還涉及到人的聽覺感知特性和語音學(xué)。同時(shí),噪聲的多樣性,即噪聲來源眾多,隨著應(yīng)用場(chǎng)合不同而特性各不相同,也增加了語音增強(qiáng)的難度。因此,要想一勞永逸的設(shè)計(jì)出一種算法是不可能的,只能是針對(duì)不同的噪聲情況,采取不同的語音增強(qiáng)算法。因此,對(duì)于語音增強(qiáng)算法的研究對(duì)我們的生活起著十分重要的作用,它也扮演著十分重要的角色。1.3本文主要研究?jī)?nèi)容基于語音短時(shí)譜估計(jì)的增強(qiáng)方法和基于語音生成模型的增強(qiáng)方法,是語音增強(qiáng)方法中的兩大類?;谡Z音短時(shí)譜估計(jì)的增強(qiáng)方法種類繁多,如譜相減法、維納濾波法、最小均方誤差法等。該類方法具有適應(yīng)信噪比范圍大、方法簡(jiǎn)單、易于實(shí)時(shí)處理等優(yōu)點(diǎn)。盡管該方法研究比較早,但仍具有很強(qiáng)的生命力,成為應(yīng)用最廣泛的語音增強(qiáng)方法。本文重點(diǎn)是研究現(xiàn)有的語音增強(qiáng)方法,設(shè)計(jì)一種實(shí)用的語音增強(qiáng)系統(tǒng)。增強(qiáng)過程不以單純提高信噪比為目標(biāo)。在第二章中,介紹語音增強(qiáng)的基礎(chǔ),介紹了目前流行的幾種語音增強(qiáng)算法,給人們一個(gè)語音增強(qiáng)算法的整體印象。在第三章中,針對(duì)語音增強(qiáng)技術(shù),設(shè)計(jì)出合適的語音信號(hào)濾波器;在MATLAB上用濾波器實(shí)現(xiàn)對(duì)含噪聲語音信號(hào)的濾波。在第四章中,從整體對(duì)論文做出了總結(jié),并描述了一下對(duì)今后工作的展望。2語音及語音增強(qiáng)研究的基礎(chǔ)2.1語音增強(qiáng)概述語音處理技術(shù)的發(fā)展可以從1876年的貝爾發(fā)明電話算起,貝爾第一次采用電訊號(hào)將語音傳輸?shù)竭h(yuǎn)方。1939年H.Dudley首次成功設(shè)計(jì)出了聲碼器,它是將語音提取參數(shù)后,傳輸語音的參數(shù),然后在接收端重新生成語音。它的發(fā)明中所孕育的偉大思想是對(duì)語音信號(hào)的建模。數(shù)字計(jì)算機(jī)是語音處理研究的重要工具。此后時(shí)期語音識(shí)別的主要研究方向和方法都是利用硬件提取語音的頻譜信息,使用計(jì)算機(jī)進(jìn)行匹配計(jì)算和判決。對(duì)語音處理技術(shù)產(chǎn)生決定性的影響的是在上個(gè)世紀(jì)70年的三項(xiàng)研究成果:70年代初期的將動(dòng)態(tài)規(guī)劃法用于語音識(shí)別及隱馬爾可夫模型,為語音識(shí)別在匹配算法上提供了新的方法;中期的線性預(yù)測(cè)法,在語音識(shí)別、語音編碼等方面獲得了極大成功,成為現(xiàn)代語音處理的主要方法,隨后在七十年代末期的矢量編碼量化技術(shù),更推進(jìn)了語音處理技術(shù)的發(fā)展。目前常用的語音信號(hào)增強(qiáng)算法一般可分為基于語音生成模型參數(shù)和非基于語音生成模型參數(shù)兩大類?;谡Z音生成模型參數(shù)方法的特點(diǎn)是對(duì)語音生成模型的參數(shù)進(jìn)行估計(jì)和恢復(fù)。然而在低信噪比下,很難對(duì)模型參數(shù)進(jìn)行準(zhǔn)確估計(jì),并且此類算法往往因需要迭代而增加算法的復(fù)雜度。非基于語音生成模型參數(shù)的語音增強(qiáng)方法主要有自適應(yīng)噪聲濾波法和基于語音短時(shí)譜估計(jì)的增強(qiáng)方法等。語音信號(hào)增強(qiáng)的典型方法有:譜減法、自適應(yīng)噪聲對(duì)消法以及基于語音信號(hào)模型的語音增強(qiáng)法。近些年來,語音增強(qiáng)的研究工作有了一定的進(jìn)展。適用于在帶噪語音信號(hào)采集過程中同時(shí)能獲得參考噪聲源的自適應(yīng)噪聲對(duì)消技術(shù),已日趨成熟。近四十年以來,人們對(duì)不同的語音增強(qiáng)算法進(jìn)行了大量的研究。1978年Lim和Oppenheim提出了維納濾波語音增強(qiáng)方法;1979年S.Boll提出了譜減法語音增強(qiáng),1980年Macaulay和MalpaSs提出了軟判決語音增強(qiáng)方法;1984Ephraim和Malall提出了基于最小均方誤差短時(shí)譜幅度估計(jì)的(MMSE.STSA)方法,并且在1985年提出了基于人耳聽覺特性的最小均方誤差對(duì)數(shù)短時(shí)譜幅度估計(jì)(MMsE.LoG.sTsA);1987年P(guān)aliwal提出了卡爾曼濾波語音增強(qiáng)方法方;1994年RainerM眥in提出了基于最小統(tǒng)計(jì)的語音增強(qiáng)方法;1995年Ephraim提出了基于子空間的語音增強(qiáng)方法;2001年RajnerManin提出了基于最優(yōu)平滑和最小統(tǒng)計(jì)的噪聲功率譜密度估計(jì)。近年,隨著對(duì)語音增強(qiáng)技術(shù)的不斷研究,一些新的語音增強(qiáng)方法如小波變換語音增強(qiáng)方法、卡亨南.洛維變換方法、離散余弦變換方法、人工神經(jīng)網(wǎng)絡(luò)方法、隱含馬爾可夫模型方法等被相繼提出。國內(nèi)的研究較之國外起步較晚,主要的研究單位有清華大學(xué)、中科院聲學(xué)所和西安電子科技大學(xué)等單位。無限詞匯漢語聽寫機(jī)首先由清華大學(xué)于1988年研制成功,四達(dá)公司等單位在90年代初使之產(chǎn)品化、商品化。但從目前的市場(chǎng)應(yīng)用范圍來看,語音產(chǎn)品的實(shí)際應(yīng)用還很狹窄,這說明語音技術(shù)產(chǎn)品還存在缺陷,達(dá)不到市場(chǎng)化、商品化的要求,在技術(shù)上許多工作要做。近幾年,漢語言識(shí)別成為研究的重點(diǎn),國外公司投入巨資進(jìn)行研究,國家“863"計(jì)劃也在這方面加大了投資[6]。2.2語音增強(qiáng)技術(shù)的基本理論語音增強(qiáng)不僅涉及信號(hào)檢測(cè)、波形估計(jì)等傳統(tǒng)信號(hào)處理理論,而且與語音特性、人耳感知特性密切相關(guān),從語音信號(hào)產(chǎn)生的信號(hào)模型和語音信號(hào)增強(qiáng)系統(tǒng)出發(fā),介紹了幾種常用的語音增強(qiáng)算法,并總結(jié)歸納了各種算法的思想、適用條件和存在的問題。為了充分了解語音信號(hào)的特性,首先給出一個(gè)語音信號(hào)的模型,如2.1所示。這個(gè)模型比較簡(jiǎn)單,但可以表現(xiàn)出語音信號(hào)的主要特性,能夠滿足大多數(shù)情況下對(duì)語音信號(hào)的研究和應(yīng)用。圖2-l語音信號(hào)產(chǎn)生模型從上圖可以看出模型包括三個(gè)部分:激勵(lì)源、聲道模型和輻射模型。除語音生成模型外,還可以通過它的時(shí)域或頻域波形來分析其特性。以數(shù)字化方式進(jìn)行語音的傳輸和儲(chǔ)存,無論在可靠性、抗干擾能力、交換速度、保密性和價(jià)格等方面都遠(yuǎn)勝于模擬方式。因此從50年代以來在通信系統(tǒng)中數(shù)字化語音所占比例不斷增加。在衛(wèi)星通信、移動(dòng)通信、微波通信和信息高速公路等系統(tǒng)中將無一例外地采用數(shù)字化語音進(jìn)行傳輸和貯存。通常情況下,為了了解信號(hào)的某些性質(zhì),我們需要對(duì)信號(hào)的時(shí)域波形和頻譜進(jìn)行分析。語音信號(hào)作為一種常見的信號(hào)也包含著許多的特性,在對(duì)語音信號(hào)進(jìn)行處理前有必要對(duì)其特性進(jìn)行分析,下面將介紹一些常見的分析方法。進(jìn)行語音信號(hào)分析時(shí),最先接觸到并且也是最直觀的是它的時(shí)域波形。根據(jù)時(shí)間波形可以看出語音信號(hào)的一些重要特征。清音和濁音這兩類語音的波形有很大的不同。濁音具有較強(qiáng)的振幅,呈周期性變化,并且波形隨時(shí)間變化比較緩慢,大致可以認(rèn)為在l0ms~30ms內(nèi)其波形是固定不變的;清音的振幅比較小,波形隨機(jī)變化,沒有規(guī)律性,非常類似于白噪聲的時(shí)域波形。2.3常用的語音增強(qiáng)算法以下介紹一些語音增強(qiáng)的基本方法:1、一般濾波法一般濾波法就是輸入信號(hào)中有用的頻率成分和希望濾除的頻率成分各占不同的頻帶,通過一個(gè)合適的選頻濾波器達(dá)到濾波的目的。例如,輸入信號(hào)中含有干擾,如果信號(hào)和干擾的頻帶互不重疊,可濾除干擾得到純信號(hào)。但對(duì)于一般濾波器如果信號(hào)和干擾的頻帶互相重疊,則不能完成干擾的有效濾除,這時(shí)就需要另外的濾波方法。2、梳狀濾波法語音中的濁音部分能量很大,往往占據(jù)一段語音的大部分能量,同時(shí)它具有明顯的周期性。利用語音濁音的周期性,可進(jìn)行梳狀濾波。就頻域而言,是保留基頻及其整數(shù)倍的各諧波量,抑制非諧波分量。各諧波之間的間隙基本上是噪聲成分。只要知道基頻就可以把諧波之間的噪聲成分完全濾掉。3、維納濾波法這種方法不僅用到了噪聲的統(tǒng)計(jì)知識(shí),還用到了部分語音知識(shí),但顯然這些知識(shí)都是一種近似的代替。當(dāng)噪聲不是白噪聲時(shí),按照語音的產(chǎn)生模型就很難準(zhǔn)確預(yù)測(cè)語音參數(shù)。因此對(duì)有色噪聲維納濾波法就很難應(yīng)付。由此可以看出采用這種方法來提高語音信噪比和可懂度效果十分有限。特別是在噪聲比較強(qiáng)的情況下估計(jì)的全極點(diǎn)模型參數(shù)誤差明顯增大,而如果使用迭代方法,計(jì)算結(jié)果能夠有所改進(jìn),但仍然存在較大誤差,且計(jì)算量比較大。4、自適應(yīng)濾波法這種方法是從帶噪聲語音中減去噪聲,用兩個(gè)話筒的采集系統(tǒng),一個(gè)采集帶噪語音,另一個(gè)采集噪聲,通過雙話筒采集系統(tǒng)的自適應(yīng)噪聲抵消法的原理,經(jīng)自適應(yīng)濾波器處理后與帶噪語音相減。自適應(yīng)噪聲抵消法可以用于平穩(wěn)噪聲相消,也可以用于準(zhǔn)平穩(wěn)噪聲。采用噪聲抵消法時(shí)為保證系統(tǒng)的性能,兩個(gè)話筒之間必須要有相當(dāng)?shù)母綦x度,應(yīng)避免語音信號(hào)混入噪音通道,如實(shí)在無法隔離,則自適應(yīng)濾波器的系數(shù)只能在語音間隙期間進(jìn)行刷新[7]。2.4小結(jié)本章討論了語音信號(hào)的特征、噪聲特性及其分類,介紹了國內(nèi)外常用的語音增強(qiáng)方法,并就語音增強(qiáng)的計(jì)算機(jī)模擬處理時(shí)采用的方法做了簡(jiǎn)單介紹。由于本文采集到的語音信號(hào)中的有用信號(hào)和噪聲信號(hào)的頻帶互不干擾,根據(jù)以上幾種方法的介紹,我們選擇一般濾波法對(duì)語音信號(hào)進(jìn)行濾波,濾除干擾噪聲信號(hào),得到有用的語音信號(hào),達(dá)到使語音信號(hào)增強(qiáng)的目的。3語音信號(hào)增強(qiáng)的實(shí)現(xiàn)3.1語音信號(hào)的獲取及相應(yīng)處理3.1.1時(shí)域信號(hào)的FFT分析FFT即為快速傅里葉變換,是離散傅里葉變換的快速算法,它是根據(jù)離散傅里葉變換的奇、偶、虛、實(shí)等特性,對(duì)離散傅立葉變換的算法進(jìn)行改進(jìn)獲得的。在MATLAB的信號(hào)處理工具箱中函數(shù)FFT和IFFT用于快速傅立葉變換和逆變換。函數(shù)FFT用于序列快速傅立葉變換,其調(diào)用格式為y=fft(x),其中,x是序列,y是序列的FFT,x可以為一向量或矩陣,若x為一向量,y是x的FFT且和x相同長度;若x為一矩陣,則y是對(duì)矩陣的每一列向量進(jìn)行FFT。如果x長度是2的冪次方,函數(shù)fft執(zhí)行高速基-2FFT算法,否則fft執(zhí)行一種混合基的離散傅立葉變換算法,計(jì)算速度較慢。函數(shù)FFT的另一種調(diào)用格式為y=fft(x,N),式中,x,y意義同前,N為正整數(shù)。函數(shù)執(zhí)行N點(diǎn)的FFT,若x為向量且長度小于N,則函數(shù)將x補(bǔ)零至長度N;若向量x的長度大于N,則函數(shù)截短x使之長度為N;若x為矩陣,按相同方法對(duì)x進(jìn)行處理[8]。3.1.2語音信號(hào)的獲取在MATLAB中,[y,fs,bits]=wavread('*.wav');用于讀取語音,采樣值放在向量n中,fs表示采樣頻率(Hz),bits表示采樣位數(shù)。sound(y,fs);用于對(duì)聲音的回放。向量y則就代表了一個(gè)信號(hào)(也即一個(gè)復(fù)雜的“函數(shù)表達(dá)式”)也就是說可以像處理一個(gè)信號(hào)表達(dá)式一樣處理這個(gè)聲音信號(hào)。本設(shè)計(jì)所采用的語音信號(hào),是一個(gè)經(jīng)過處理的非常純凈的語音信號(hào),下面的一段程序是語音信號(hào)在MATLAB中的最簡(jiǎn)單表現(xiàn),它實(shí)現(xiàn)了語音的讀入打開,以及繪出了語音信號(hào)的波形頻譜圖。并利用MATLAB對(duì)此語音信號(hào)加入了隨機(jī)噪聲,然后繪制出其加噪前后的波形與頻譜圖。其MATLAB程序如下:[y,fs,bits]=wavread('E:\yu.wav');%sound(y,fs)

%回放語音信號(hào)n=length(y)

%選取變換的點(diǎn)數(shù)

y_p=fft(y,n);

%對(duì)n點(diǎn)進(jìn)行傅里葉變換到頻域f=fs*(0:n/2-1)/n;

%對(duì)應(yīng)點(diǎn)的頻率figure(1)subplot(2,2,1);plot(y);

%語音信號(hào)的時(shí)域波形圖title('原始語音信號(hào)采樣后時(shí)域波形');xlabel('時(shí)間軸')ylabel('幅值A(chǔ)')subplot(2,2,2);plot(f,abs(y_p(1:n/2)));

%語音信號(hào)的頻譜圖title('原始語音信號(hào)采樣后頻譜圖');xlabel('頻率Hz');ylabel('頻率幅值');L=length(y)

%計(jì)算音頻信號(hào)的長度noise=0.1*randn(L,2);

%產(chǎn)生等長度的隨機(jī)噪聲信號(hào)(這里的噪聲的大小取決于隨機(jī)函數(shù)的幅度倍數(shù))

y_z=y+noise;

%將兩個(gè)信號(hào)疊加成一個(gè)新的信號(hào)——加噪聲處理

%sound(y_z,fs)%對(duì)加噪后的語音信號(hào)進(jìn)行分析n=length(y);

%選取變換的點(diǎn)數(shù)

y_zp=fft(y_z,n);

%對(duì)n點(diǎn)進(jìn)行傅里葉變換到頻域f=fs*(0:n/2-1)/n;

%對(duì)應(yīng)點(diǎn)的頻率subplot(2,2,3);plot(y_z);

%加噪語音信號(hào)的時(shí)域波形圖title('加噪語音信號(hào)時(shí)域波形');xlabel('時(shí)間軸')ylabel('幅值A(chǔ)')subplot(2,2,4);plot(f,abs(y_zp(1:n/2)));

%加噪語音信號(hào)的頻譜圖title('加噪語音信號(hào)頻譜圖');xlabel('頻率Hz');ylabel('頻率幅值');程序運(yùn)行同時(shí)可以聽到聲音,得到的結(jié)果如圖3-1所示:圖3-1語音及加噪語音信號(hào)的讀入與打開3.2針對(duì)語音信號(hào)的FIR數(shù)字濾波器的設(shè)計(jì)3.2.1數(shù)字濾波器設(shè)計(jì)原理數(shù)字濾波是數(shù)字信號(hào)分析中最重要的組成部分之一,與模擬濾波相比,它具有精度和穩(wěn)定性高、系統(tǒng)函數(shù)容易改變、靈活性強(qiáng)、便于大規(guī)模集成和可實(shí)現(xiàn)多維濾波等優(yōu)點(diǎn)。在信號(hào)的過濾、檢測(cè)和參數(shù)的估計(jì)等方面,經(jīng)典數(shù)字濾波器是使用最廣泛的一種線性系統(tǒng)。數(shù)字濾波器的作用是利用離散時(shí)間系統(tǒng)的特性對(duì)輸入信號(hào)波形(或頻譜)進(jìn)行加工處理,或者說利用數(shù)字方法按預(yù)定的要求對(duì)信號(hào)進(jìn)行變換。3.2.2數(shù)字濾波器的設(shè)計(jì)步驟不論是FIR濾波器還是IIR濾波器的設(shè)計(jì)都包括三個(gè)步驟:(1)按照實(shí)際任務(wù)的要求,確定濾波器的性能指標(biāo)。(2)用一個(gè)因果、穩(wěn)定的離散線性時(shí)不變系統(tǒng)的系統(tǒng)函數(shù)去逼近這一性能指標(biāo)。根據(jù)不同的要求可以用FIR系統(tǒng)函數(shù),也可以用IIR系統(tǒng)函數(shù)去逼近。(3)利用有限精度算法實(shí)現(xiàn)系統(tǒng)函數(shù),包括結(jié)構(gòu)選擇、字長選擇等。3.2.3FIR濾波器與IIR濾波器的性能比較FIR:FiniteImpulseresponse,有限脈沖響應(yīng)IIR:InfiniteImpulseresponse,無限脈沖響應(yīng)從性能上來說,IIR濾波器傳輸函數(shù)的極點(diǎn)可位于單位圓內(nèi)的任何地方,因此可用較低的階數(shù)獲得高的選擇性,所用的存貯單元少,所以經(jīng)濟(jì)而效率高。但是這個(gè)高效率是以相位的非線性為代價(jià)的。選擇性越好,則相位非線性越嚴(yán)重。相反,F(xiàn)IR濾波器卻可以得到嚴(yán)格的線性相位,然而由于FIR濾波器傳輸函數(shù)的極點(diǎn)固定在原點(diǎn),所以只能用較高的階數(shù)達(dá)到高的選擇性;對(duì)于同樣的濾波器設(shè)計(jì)指標(biāo),F(xiàn)IR濾波器所要求的階數(shù)可以比IIR濾波器高5~10倍,結(jié)果,成本較高,信號(hào)延時(shí)也較大;如果按相同的選擇性和相同的線性要求來說,則IIR濾波器就必須加全通網(wǎng)絡(luò)進(jìn)行相位較正,同樣要大增加濾波器的節(jié)數(shù)和復(fù)雜性。整體來看,IIR濾波器達(dá)到同樣效果階數(shù)少,延遲小,但是有穩(wěn)定性問題,非線性相位;FIR濾波器沒有穩(wěn)定性問題,線性相位,但階數(shù)多,延遲大3.2.4FIR數(shù)字濾波器的設(shè)計(jì)FIR濾波器和IIR濾波器的設(shè)計(jì)方法完全不同。IIR濾波器設(shè)計(jì)方法有間接法和直接法,間接法是借助于模擬濾波器的設(shè)計(jì)方法進(jìn)行的。其設(shè)計(jì)步驟是:先設(shè)計(jì)過渡模擬濾波器得到系統(tǒng)函數(shù)H(s),然后將H(s)按某種方法轉(zhuǎn)換成數(shù)字濾波器的系統(tǒng)函數(shù)H(z)。FIR濾波器采用間接法,常用的方法有窗函數(shù)法、頻率采樣發(fā)和切比雪夫等波紋逼近法。對(duì)于線性相位濾波器,經(jīng)常采用FIR濾波器[9]。如前所述,IIR濾波器和FIR濾波器的設(shè)計(jì)方法有很大的區(qū)別。下面我們著重介紹用窗函數(shù)法設(shè)計(jì)FIR濾波器的步驟。如下:(1)根據(jù)對(duì)阻帶衰減及過渡帶的指標(biāo)要求,選擇串窗數(shù)類型(矩形窗、三角窗、漢寧窗、哈明窗、凱塞窗等),并估計(jì)窗口長度N。先按照阻帶衰減選擇窗函數(shù)類型。原則是在保證阻帶衰減滿足要求的情況下,盡量選擇主瓣的窗函數(shù)。(2)構(gòu)造希望逼近的頻率響應(yīng)函數(shù)。(3)計(jì)算h(n).。(4)加窗得到設(shè)計(jì)結(jié)果。3.2.5針對(duì)語音信號(hào)的FIR數(shù)字濾波器的設(shè)計(jì)在Matlab中,可以利用函數(shù)fir1設(shè)計(jì)FIR濾波器,利用Matlab中的函數(shù)freqz畫出各步步器的頻率響應(yīng)。hn=fir1(M,wc,window),可以指定窗函數(shù)向量window。如果缺省window參數(shù),則fir1默認(rèn)為哈明窗。其中可選的窗函數(shù)有矩形窗(RectangleWindow)、三角形窗(BartlettWindow)、漢寧(Hanning)窗、哈明(Hamming)窗、布萊克曼(Blackman)窗、凱塞—貝塞爾窗(Kaiser–BaselWindow),其相應(yīng)的都有實(shí)現(xiàn)函數(shù)[9]。函數(shù)fftfilt用的是重疊相加法實(shí)現(xiàn)線性卷積的計(jì)算。調(diào)用格式為:y=fftfilter(h,x,M)。其中,h是系統(tǒng)單位沖擊響應(yīng)向量;x是輸入序列向量;y是系統(tǒng)的輸出序列向量;M是有用戶選擇的輸入序列的分段長度,缺省時(shí),默認(rèn)的輸入向量的重長度M=512。接下來,根據(jù)分析語音信號(hào)加噪前和加噪后的頻譜圖的對(duì)比,設(shè)定濾波器的技術(shù)指標(biāo):fp=1500Hz,fc=1700Hz,As=100db,Ap=1dB相應(yīng)的MATLAB程序如下:wc=2*pi*fc/fs;wp=2*pi*fp/fs;wdel=wc-wp;beta=0.112*(As-8.7);N=ceil((As-8)/2.285/wdel);wn=kaiser(N+1,beta);ws=(wp+wc)/2/pi;b=fir1(N,ws,wn);figure(2);freqz(b,1);運(yùn)行結(jié)果如下圖所示:圖3-2幅頻和相頻特性曲線3.3語音信號(hào)的增強(qiáng)處理為達(dá)到語音信號(hào)增強(qiáng)的目的,我們采用低通濾波器,對(duì)已經(jīng)加入隨機(jī)噪聲的語音信號(hào)進(jìn)行去噪,在去除噪聲以后,將語音信號(hào)放大,以達(dá)到語音信號(hào)增強(qiáng)的目的。其MATLAB程序如下:x=fftfilt(b,y_z);X=fft(1

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論