![語音信號(hào)處理語音識(shí)別_第1頁](http://file4.renrendoc.com/view/dcdc2c222a7d1c9008aae207a6e1da3d/dcdc2c222a7d1c9008aae207a6e1da3d1.gif)
![語音信號(hào)處理語音識(shí)別_第2頁](http://file4.renrendoc.com/view/dcdc2c222a7d1c9008aae207a6e1da3d/dcdc2c222a7d1c9008aae207a6e1da3d2.gif)
![語音信號(hào)處理語音識(shí)別_第3頁](http://file4.renrendoc.com/view/dcdc2c222a7d1c9008aae207a6e1da3d/dcdc2c222a7d1c9008aae207a6e1da3d3.gif)
![語音信號(hào)處理語音識(shí)別_第4頁](http://file4.renrendoc.com/view/dcdc2c222a7d1c9008aae207a6e1da3d/dcdc2c222a7d1c9008aae207a6e1da3d4.gif)
![語音信號(hào)處理語音識(shí)別_第5頁](http://file4.renrendoc.com/view/dcdc2c222a7d1c9008aae207a6e1da3d/dcdc2c222a7d1c9008aae207a6e1da3d5.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
9.1概述語音識(shí)別(SpeechRecognition)主要指讓機(jī)器聽懂人說的話,即在各種狀況下,精確地識(shí)別出語音的內(nèi)容,從而依據(jù)其信息,執(zhí)行人的各種意圖。它是一門涉及面很廣的交叉學(xué)科,與計(jì)算機(jī)、通信、語音語言學(xué)、數(shù)理統(tǒng)計(jì)、信號(hào)處理、神經(jīng)生理學(xué)、神經(jīng)心理學(xué)和人工智能等學(xué)科都有著親密的關(guān)系。一般語音識(shí)別系統(tǒng)按不同的角度有下面幾種分類方法。孤立詞、連接詞、連續(xù)語音識(shí)別系統(tǒng)以及語音理解和會(huì)話系統(tǒng)。大詞匯、中詞匯和小詞匯量語音識(shí)別系統(tǒng)。特定人和非特定人語音識(shí)別系統(tǒng)。語音識(shí)別所接受的方法也可以作為語音識(shí)別系統(tǒng)分類的依據(jù),因此,也有從識(shí)別方法上來對(duì)語音識(shí)別系統(tǒng)進(jìn)行分類的。語音識(shí)別方法一般有模板匹配法、隨機(jī)模型法和概率語法分析法三種。好用語音識(shí)別探討中存在的幾個(gè)主要問題和困難如下:(1)語音識(shí)別的一種重要應(yīng)用是自然語言的識(shí)別和理解。(2)語音信息的變更很大。(3)語音的模糊性。(4)單個(gè)字母及單個(gè)詞語發(fā)音時(shí)語音特性受上下文環(huán)境的影響,使相同字母有不同的語音特性。(5)環(huán)境的噪聲和干擾對(duì)語音識(shí)別有嚴(yán)峻影響。9.2語音識(shí)別原理和識(shí)別系統(tǒng)的組成語音識(shí)別系統(tǒng)是建立在確定的硬件平臺(tái)和操作系統(tǒng)之上的一套應(yīng)用軟件系統(tǒng)。語音識(shí)別一般分兩個(gè)步驟。第一步是系統(tǒng)“學(xué)習(xí)”或“訓(xùn)練”階段。其次步是“識(shí)別”或“測(cè)試”階段。語音識(shí)別技術(shù)加上各種外圍技術(shù)的組合,才能構(gòu)成一個(gè)完整的實(shí)際應(yīng)用的語音識(shí)別系統(tǒng)。從語音識(shí)別系統(tǒng)的各個(gè)功能劃分的角度動(dòng)身,語音識(shí)別系統(tǒng)可分為語音信號(hào)的預(yù)處理部分、語音識(shí)別系統(tǒng)的核心算法部分以及語音識(shí)別系統(tǒng)的基本數(shù)據(jù)庫等幾部分。一般語音識(shí)別系統(tǒng)框圖9.2.1預(yù)處理和參數(shù)分析語音信號(hào)預(yù)處理部分包括:語音信號(hào)的電壓放大、反混疊濾波、自動(dòng)增益限制、模/數(shù)變換、去除聲門激勵(lì)及口唇輻射的影響等。這里僅對(duì)個(gè)別須要留意的地方做一些介紹。話筒自適應(yīng)和輸入電平的設(shè)定:輸入語音信號(hào)的品質(zhì)對(duì)語音識(shí)別性能的影響很大,因此,對(duì)話筒的耐噪聲性能要求很高。選擇好的麥克風(fēng),不僅能提高輸入語音質(zhì)量,而且,還有助于提高整個(gè)系統(tǒng)的魯棒性。為了保持高精度的語音分析,A/D變換的電平必需正確的設(shè)定。同時(shí)還要通過AGC來自動(dòng)的調(diào)整輸入電平放大的倍數(shù)或者通過對(duì)于輸入數(shù)據(jù)進(jìn)行規(guī)整處理來限制語音數(shù)據(jù)幅度的變更??乖肼暎涵h(huán)境噪聲不行能完全消退。對(duì)于手自由的語音識(shí)別(Hand-Free),話筒與嘴有確定距離的時(shí)候,以及在汽車?yán)锘驊敉獾人闹墉h(huán)境噪聲大的時(shí)候必需對(duì)輸入信號(hào)進(jìn)行降噪處理。對(duì)于平穩(wěn)噪聲,傳統(tǒng)的譜相減(SS)降噪聲技術(shù)是有效的,對(duì)于非平穩(wěn)噪聲也有通過兩個(gè)話筒分別輸入語音和噪聲相互抵消加以消退的方法。語音區(qū)間的端點(diǎn)檢測(cè):端點(diǎn)檢測(cè)的目的是從包含語音的一段信號(hào)中確定出語音的起點(diǎn)以及終點(diǎn)。有效的端點(diǎn)檢測(cè)不僅能使處理時(shí)間減到最小,而且能解除無聲段的噪聲干擾,從而使識(shí)別系統(tǒng)具有良好的識(shí)別性能。傳統(tǒng)的端點(diǎn)檢測(cè)方法是將語音信號(hào)的短時(shí)能量與過零率相結(jié)合加以推斷的。但這種端點(diǎn)檢測(cè)算法假如運(yùn)用不好,將會(huì)發(fā)生漏檢或虛檢的狀況。為了克服傳統(tǒng)端點(diǎn)檢測(cè)算法的缺點(diǎn),已有很多改進(jìn)方法被提出來。例如,可以考慮接受基于相關(guān)性的語音端點(diǎn)檢測(cè)算法。語音參數(shù)分析:經(jīng)過預(yù)處理后的語音信號(hào),就要對(duì)其進(jìn)行特征參數(shù)分析,其目的是抽取語音特征,以使在語音識(shí)別時(shí)類內(nèi)距離盡量小,類間距離盡量大。識(shí)別參數(shù)可以選擇下面的某一種或幾種的組合:平均能量、過零數(shù)或平均過零數(shù)、頻譜、共振峰、倒譜、線性預(yù)料系數(shù)、PARCOR系數(shù)(偏自相關(guān)系數(shù))、聲道形態(tài)的尺寸函數(shù),以及音長、音高、聲調(diào)等超聲短信息函數(shù)。現(xiàn)在,經(jīng)過FFT變換或者LPC得到功率譜以后再經(jīng)過對(duì)數(shù)變換和傅立葉反變換得到的倒譜參數(shù)是常用的語音識(shí)別特征參數(shù)。9.2.2語音識(shí)別語音識(shí)別是語音識(shí)別系統(tǒng)的核心部分。除包括語音的聲學(xué)模型以及相應(yīng)的語言模型的建立、參數(shù)匹配方法、搜尋算法、話者自適應(yīng)算法,還包括增加新詞的功能、數(shù)據(jù)庫管理和友好的人機(jī)交互界面等等。語音模型:語音模型一般指的是用于參數(shù)匹配的聲學(xué)模型。語音聲學(xué)模型的好壞對(duì)語音識(shí)別的性能影響很大,現(xiàn)在公認(rèn)的較好的概率統(tǒng)計(jì)模型是HMM模型。因?yàn)镠MM可以吸取環(huán)境和話者引起的特征參數(shù)的變動(dòng),實(shí)現(xiàn)非特定人的語音識(shí)別。識(shí)別模型的基元單位的選擇對(duì)于識(shí)別性能也有很大的影響。對(duì)于日語和英語,以半音節(jié)、環(huán)境依存音素為模型的探討例子較多。對(duì)于漢語,則可用“聲母---韻母”,也可用音節(jié)字、詞等識(shí)別基元。連續(xù)語音的自動(dòng)分段:連續(xù)語音的自動(dòng)分段,是指從語音信號(hào)流中自動(dòng)地分割出識(shí)別基元的問題。把連續(xù)的語音信號(hào)分成對(duì)應(yīng)于各音的區(qū)間叫做分割(Segmentation),分割的結(jié)果產(chǎn)生的區(qū)間叫做分割區(qū)間(Segment),給分割區(qū)間付與表示音種的符號(hào)叫做符號(hào)化。漢語自動(dòng)分段是指依據(jù)漢語特點(diǎn)及其參數(shù)的統(tǒng)計(jì)規(guī)律,設(shè)置某些參數(shù)的閾值,用計(jì)算機(jī)程序自動(dòng)的進(jìn)行分段。通??捎玫膮?shù)有:幀平均能量、幀平均過零數(shù)、線性預(yù)料的第一個(gè)反射系數(shù)或其殘差序列、音調(diào)值等。從簡(jiǎn)潔、快速的要求而言,最好接受前兩種時(shí)域參數(shù)即幀平均能量FN和幀平均過零數(shù)ZN。語音識(shí)別方法:當(dāng)今語音識(shí)別技術(shù)的主流算法,主要有基于參數(shù)模型的隱馬爾可夫模型(HMM)的方法和基于非參數(shù)模型的矢量量化(VQ)的方法。另外,基于人工神經(jīng)網(wǎng)絡(luò)(ANN)的語音識(shí)別方法,也得到了很好的應(yīng)用。傳統(tǒng)的基于動(dòng)態(tài)時(shí)間伸縮的算法(DTW),在連續(xù)語音識(shí)別中仍舊是主流方法。同時(shí),在小詞匯量、孤立字(詞)識(shí)別系統(tǒng)中,也已有很多改進(jìn)的DTW算法被提出。用于語音識(shí)別的距離測(cè)度有多種,如歐氏距離及其變形的歐氏距離測(cè)度、似然比測(cè)度、加權(quán)的識(shí)別測(cè)度等。選擇什么樣的距離測(cè)度與識(shí)別系統(tǒng)接受什么語音特征參數(shù)和什么樣的識(shí)別模型有關(guān),計(jì)算量和存儲(chǔ)量的削減:對(duì)于在有限的硬件和軟件資源下動(dòng)作的語音識(shí)別系統(tǒng),降低識(shí)別處理的計(jì)算量和存儲(chǔ)量特別重要。當(dāng)用HMM作為識(shí)別模型時(shí),特征矢量的輸出概率計(jì)算以及輸入語音和語音模型的匹配搜尋將占用很大的時(shí)間和空間。為了削減計(jì)算量和存儲(chǔ)量,可以進(jìn)行語音或者標(biāo)準(zhǔn)模式的矢量量化和聚類運(yùn)算分析,利用代表語音特征的中心值進(jìn)行匹配。在HMM語音識(shí)別系統(tǒng)中,識(shí)別運(yùn)算時(shí)輸出概率計(jì)算所消耗的計(jì)算量較大,所以可以在輸出概率計(jì)算上接受快速算法。另外為了提高搜尋效率,可以接受線搜尋方法以及向前向后的組合搜尋法等。拒識(shí)別處理:由于用戶發(fā)音的錯(cuò)誤,可能出現(xiàn)系統(tǒng)詞匯表以外的單詞或者句子,同時(shí),在噪聲環(huán)境下由噪音引起的語音區(qū)間檢測(cè)錯(cuò)誤也可能產(chǎn)生很多誤識(shí)別的結(jié)果。所以在實(shí)際語音識(shí)別系統(tǒng)中,對(duì)信任度低的識(shí)別結(jié)果的Rejection處理也是一個(gè)很重要的課題,可以考慮利用音節(jié)識(shí)別得到的得分補(bǔ)償?shù)姆绞竭M(jìn)行拒識(shí)別處理,在這種方式中,利用在不限定識(shí)別對(duì)象的條件下求得的參考得分來補(bǔ)償?shù)淖R(shí)別結(jié)果,并用補(bǔ)償過的識(shí)別得分進(jìn)行拒識(shí)別判定。識(shí)別結(jié)果確認(rèn),候補(bǔ)選擇:為了避開由于誤識(shí)別而產(chǎn)生的Application的誤動(dòng)作,可以讓用戶對(duì)識(shí)別結(jié)果進(jìn)行確定,或者給用戶供應(yīng)復(fù)數(shù)個(gè)識(shí)別結(jié)果侯選,讓用戶自己選擇正確的結(jié)果。用戶設(shè)定:一臺(tái)識(shí)別系統(tǒng)被多個(gè)用戶運(yùn)用的場(chǎng)合。系統(tǒng)必需具有記憶和選擇每個(gè)用戶特定模型的功能。同時(shí),每個(gè)用戶可以隨時(shí)在自己的詞典里增加或刪減單詞的功能,以及系統(tǒng)依據(jù)確定的特征信息自動(dòng)進(jìn)行不同用戶間的Application識(shí)別程序的切換的功能。9.2.3語音識(shí)別系統(tǒng)的基本數(shù)據(jù)庫語音識(shí)別系統(tǒng)中包括大量的限制參數(shù)信息,這些參數(shù)以數(shù)據(jù)庫的方式存儲(chǔ)在計(jì)算機(jī)內(nèi),構(gòu)成了語音識(shí)別系統(tǒng)的基本數(shù)據(jù)庫。它們是通過“訓(xùn)練”(或叫“學(xué)習(xí)”)的方法,從單講話者或多講話者的多次重復(fù)發(fā)音的語音參數(shù)以及大量的語法規(guī)則中,經(jīng)過長時(shí)間的訓(xùn)練而聚類得到的。須要指出的是,一個(gè)成功的語音識(shí)別系統(tǒng)的建立,確定要結(jié)合其具體的應(yīng)用背景,選擇不同的識(shí)別策略、以及硬件平臺(tái)和軟件平臺(tái)。另外,更應(yīng)留意的是,語音識(shí)別系統(tǒng)的建立應(yīng)當(dāng)結(jié)合語言的自然特點(diǎn),否則,將很難達(dá)到較高的水平。單詞詞典和文法:一般來說,在多任務(wù)環(huán)境中,對(duì)于一個(gè)Application,要定義相應(yīng)的單詞集合,依據(jù)識(shí)別結(jié)果或Application的動(dòng)作進(jìn)行單詞集之間的切換。在文上法要依據(jù)具體的Application,首先設(shè)定和分析輸入語句的語義內(nèi)容;然后,依據(jù)語義內(nèi)容的句法表現(xiàn)、主、謂語的種類、語序、語的省略等,構(gòu)造單詞字典以及文法,同時(shí),文法上的單詞間的語義依存關(guān)系可以利用依存關(guān)系表格表示。通過單詞詞典、文法以及聲學(xué)模型(如HMM)和句法分析搜尋算法的共同編譯,得到用于識(shí)別
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 人民版道德與法治九年級(jí)上冊(cè)第七課《生命之間》配套聽課評(píng)課記錄
- 湘教版七年級(jí)數(shù)學(xué)下冊(cè)第2章2.1.2冪的乘方與積的乘方(第1課時(shí))聽評(píng)課記錄
- 人教版七年級(jí)數(shù)學(xué)上冊(cè):1.2.1《有理數(shù)》聽評(píng)課記錄
- 冀教版數(shù)學(xué)九年級(jí)上冊(cè)《平行線分線段成比例》聽評(píng)課記錄1
- 《兩漢的科技和文化》聽課評(píng)課記錄1(新部編人教版七年級(jí)上冊(cè)歷史)
- 蘇教版四年級(jí)數(shù)學(xué)下冊(cè)期末復(fù)習(xí)口算練習(xí)題三
- 湘教版數(shù)學(xué)八年級(jí)上冊(cè)《小結(jié)練習(xí)》聽評(píng)課記錄
- 聽評(píng)課記錄數(shù)學(xué)二年級(jí)
- 小學(xué)生營養(yǎng)餐飯?zhí)霉ぷ魅藛T聘用合同范本
- 人員派遣租賃協(xié)議書范本
- (正式版)FZ∕T 80014-2024 潔凈室服裝 通 用技術(shù)規(guī)范
- 新起點(diǎn)英語二年級(jí)下冊(cè)全冊(cè)教案
- 【幼兒園戶外體育活動(dòng)材料投放的現(xiàn)狀調(diào)查報(bào)告(定量論文)8700字】
- 剪映專業(yè)版:PC端短視頻制作(全彩慕課版) 課件 第3章 短視頻剪輯快速入門
- 湖南省長沙市開福區(qū)青竹湖湘一外國語學(xué)校2023-2024學(xué)年九年級(jí)下學(xué)期一模歷史試題
- 帶狀皰疹與帶狀皰疹后遺神經(jīng)痛(HZ與PHN)
- 漢密爾頓抑郁和焦慮量表
- 風(fēng)電場(chǎng)事故案例分析
- 前列腺癌的診斷與治療
- 人教版八年級(jí)數(shù)學(xué)初中數(shù)學(xué)《平行四邊形》單元教材教學(xué)分析
- EPC項(xiàng)目設(shè)計(jì)及施工的配合
評(píng)論
0/150
提交評(píng)論