基于倒譜的分析及硬件實現(xiàn)開題報告書_第1頁
基于倒譜的分析及硬件實現(xiàn)開題報告書_第2頁
基于倒譜的分析及硬件實現(xiàn)開題報告書_第3頁
基于倒譜的分析及硬件實現(xiàn)開題報告書_第4頁
基于倒譜的分析及硬件實現(xiàn)開題報告書_第5頁
免費預(yù)覽已結(jié)束,剩余1頁可下載查看

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、學(xué)號 2012704060 昆明理工大學(xué)碩士研究生學(xué)位論文開題報告書專 業(yè) 電子與通信工程 姓 名 朱健晨 入 學(xué) 時 間 2012年九月 導(dǎo) 師 劉增力 擬定的論文題目 基于倒譜的分析及硬件實現(xiàn) 報 告 日 期 2014年5月 研究生院1、論文選題的國內(nèi)外研究動態(tài)及現(xiàn)狀同態(tài)信號系統(tǒng)有2種:乘同態(tài)信號處理系統(tǒng)和卷積同態(tài)信號處理系統(tǒng)。倒譜屬于卷同態(tài)信號處理系統(tǒng),其主要功能是解卷用的,正因為倒譜所具有的性質(zhì),所得倒譜可以對語音信號進(jìn)行分析,語音分析的目的是根據(jù)記錄的語音信號來得到關(guān)于激勵源和聲道沖激響應(yīng)的有關(guān)參數(shù),顯然,卷積同態(tài)系統(tǒng)適合于這一要求。語音識別是機(jī)器通過識別和理解過程把語音信號轉(zhuǎn)變?yōu)橄?/p>

2、應(yīng)的文本文件或命令的高科技。作為專門的研究領(lǐng)域,語音識別又是一門交叉學(xué)科,它與聲學(xué)、語音學(xué)、語言學(xué)、數(shù)字信號處理理論、信息論、計算機(jī)科學(xué)等眾多科學(xué)精密相連。語音識別經(jīng)過四十多年的發(fā)展,已經(jīng)顯示出巨大的應(yīng)用前景。語音信號之所以有強(qiáng)大的應(yīng)用,是因為語音室語言的聲學(xué)表現(xiàn)形式,是人類交流信息最自然、最有效、最方便的手段,也是人類進(jìn)行思維的一種依托。如今,人類開始進(jìn)入了信息化時代,利用現(xiàn)代化手段研究語音處理技術(shù),從而能更加有效地對語音信息進(jìn)行傳輸和存儲。其中,語音識別技術(shù)是實現(xiàn)人機(jī)信息的一種重要的技術(shù)手段,其目的是將人類語言語音中的詞匯內(nèi)容轉(zhuǎn)為計算機(jī)可識別的輸入,語音識別產(chǎn)品在人機(jī)交互中所占的比例越來越

3、大,對于現(xiàn)在的語音識別系統(tǒng),不光考慮高識別率,實時性和大詞匯量這些因素,還要考慮軟硬件設(shè)計簡單、價格低廉、易控制、人機(jī)交互便捷等方面的綜合考慮。目前許多語音識別系統(tǒng)采用的識別算法都是在pc機(jī)上實現(xiàn)的,并且以計算發(fā)雜的美爾倒譜系數(shù)(mfcc)為語音特征參數(shù),采用過程繁瑣的隱馬兒克夫模型為匹配方法,不適合于實時語音信號的識別,相比于hmm等復(fù)雜算法和模型,在小詞匯量語音識別中,dtw算法無論在時間效率還是空間需求上都有很大優(yōu)勢,在帶有多核處理器、dsp或者fpga等具有并行能力的嵌入式軟件和硬件系統(tǒng)實現(xiàn)中,算法性能有很大的提升空間,正所謂具體問題具體分析,不同的語音信號需要不同的算法去實現(xiàn)。正因為

4、如此,語音識別技術(shù)要求計算機(jī)接受人的口語命令并作出相應(yīng),是其識別的重要的分支。語音信號特征參數(shù)的提取是語音識別的關(guān)鍵。特征參數(shù)要能代表語音特征,包括聲道特征、聽覺特征、具有很好的區(qū)分性、各階段參數(shù)之間有良好的獨立性等。常用的有能量、間距頻率、短時間頻譜、倒頻譜、線性預(yù)測系數(shù)、parcor系數(shù)等。線性預(yù)測倒譜系數(shù)是常用特征參數(shù),采用地推公式提取信號倒譜,速度和精度都可以保證。但是,mel頻率倒譜系數(shù)(mfcc)比它更符合人耳聽覺特性,在有信道噪聲和頻率失真的情況下,能產(chǎn)生更高的識別精度。語音識別的這些特點和所具有的性質(zhì)使得在生物尤其是在人類生活領(lǐng)域以其獨特的方便性、經(jīng)濟(jì)型和準(zhǔn)確性等優(yōu)勢受到人們的

5、關(guān)注。近年來隨著dps技術(shù)的迅猛發(fā)展以及性能的不斷完善,用dps來作語音實時處理也越來越受到人們的重視?;赿sp的說話人識別系統(tǒng)具有高精度、速度快、體積小、操作簡單、成本低等特點。可廣泛的用于司法、公安、機(jī)場、辦公室等場所,具有廣闊的應(yīng)用前景。參考文獻(xiàn)【1】 盧剛, 閆敬文. 用 c542 kdsk 實現(xiàn)信號倒譜計算j. 廈門大學(xué)學(xué)報: 自然科學(xué)版, 2001, 40(5): 1056-1061.【2】 賈克明, 陶洪久. 基于 dsp 的嵌入式語音識別系統(tǒng)的研究與實現(xiàn)j. 武漢理工大學(xué)學(xué)報: 信息與管理工程版, 2008 (7): 156-159.【3】 賈克明, and 陶洪久. 基于

6、dsp 的嵌入式語音識別系統(tǒng)的研究與實現(xiàn). 武漢理工大學(xué)學(xué)報: 信息與管理工程版 7 (2008): 156-159.【4】 丘敬云. 說話人識別系統(tǒng)研究及其 dsp 實現(xiàn)j. 2012.【5】 常丹華, 鄭春蕾. 基于 dsp 的語音識別智能控制系統(tǒng)j. 電子測量技術(shù), 2008, 31(4): 175-178.【6】 姚峰英. 語音增強(qiáng)系統(tǒng)的研究與實現(xiàn)d. 中國科學(xué)院上海冶金研究所, 2001.【7】 楊占軍, 楊英杰, 王強(qiáng). 基于 dsp 的語音識別系統(tǒng)的設(shè)計與實現(xiàn)j. 東北電力大學(xué)學(xué)報, 2006, 26(2): 60-64.【8】 趙鵬. 基于 dsp 的連接數(shù)碼語音識別研究與設(shè)計

7、d. 湖南大學(xué), 2006.【9】 沈宏余. 基于 dsp 的聲控系統(tǒng)的研究與實現(xiàn)d. 無錫: 江南大學(xué), 2008.【10】 張爽. 語音識別中的語音前端噪聲處理d. 哈爾濱工業(yè)大學(xué), 2010.【11】 胡金平. 基于說話人識別的無線門禁系統(tǒng)的應(yīng)用研究d. 蘭州理工大學(xué), 2011.2、研究內(nèi)容、試驗設(shè)計方案說話人識別分為三個階段,這是語音處理大概所分的三個環(huán)節(jié)即:語音處理階段、訓(xùn)練階段和識別階段。語音處理階段包括混疊濾波、預(yù)加疊、加窗和端點檢測;訓(xùn)練階段中每個人說出若干訓(xùn)練語句,系統(tǒng)對這些訓(xùn)練語句進(jìn)行相應(yīng)的數(shù)字化處理,提取其中的特征向量,建立每個使用者的模塊以及參數(shù)模型;識別階段由所需要

8、說話人的語音特征提取后與系統(tǒng)訓(xùn)練時產(chǎn)生的每個的參考模型進(jìn)行對比,按照特定的規(guī)定進(jìn)行對比,從而進(jìn)行識別。(此圖為說話人的識別流程圖)在這幾個年的法展當(dāng)中,隨著語音識別技術(shù)的愈發(fā)成熟,以及新的理念和算法的不斷跟新。目前語音識別的算法可以分成以下幾類的研究:(1) 動態(tài)時間規(guī)整(dynannc time varping,dtw)(2) 離散隱馬爾可夫模型(discrete hidden markov model,dhmm)(3) 連續(xù)隱馬爾可夫模型(continuous hidden markov model,chmm)(4) 人工神經(jīng)網(wǎng)絡(luò)(artificia neurul netword,ann)

9、從上面的分類看出,語音信號是具有動態(tài)變化范圍的特性,所欲我們需要綜合的考慮識別方法的相互配合,從而實現(xiàn)較高的語音識別。語音識別是以機(jī)器能聽懂我們的語言為目的,最終的目的是實現(xiàn)人機(jī)對話。這可以歸結(jié)為以下幾個難點:(1) 語音系統(tǒng)的復(fù)雜性(2) 語音識別處理的對象范圍很大(3) 語音信號本身的不平穩(wěn)性(4) 噪聲的干擾在對語音信號進(jìn)行采集時,語音的外部環(huán)境等因素也要加以考慮,因為哲學(xué)因素會給語音信號輸入范圍的斷定、詞間界定的區(qū)分等方面帶來困難??傊?,語音識別是一個極其復(fù)雜的工作,它的發(fā)展依賴于各個領(lǐng)域的協(xié)調(diào)發(fā)展,這反映了從另一個方面減緩了語音識別工作的發(fā)展,所以我們的研究任道而重遠(yuǎn)。本文的主要研究

10、內(nèi)容本論文主要基于dps的聲控系統(tǒng),主要研究如何在實驗室環(huán)境下完成一個簡單的語音識別系統(tǒng)。以dsp芯片為核心芯片,通過外存儲器和codec芯片,完成語音處理板的設(shè)計。使得dps目標(biāo)系統(tǒng)能夠可靠、有效地工作。由于c語言和匯編語言的高效率,考慮到系統(tǒng)開發(fā)周期、可維護(hù)性、可移植性、可繼承性,本文的算法可以通過c語言進(jìn)行實現(xiàn)和matlab進(jìn)行數(shù)據(jù)仿真。本文論文提出基于dsp的聲控系統(tǒng),介紹了整個硬件電路組成,通過a/d轉(zhuǎn)換對數(shù)字信號傳送給dsp進(jìn)行處理和識別。主要工作可以分為以下幾個內(nèi)容:(1) 端點的檢測(2) 特征參數(shù)的提取(3) 模式匹配(4) 硬件電路設(shè)計(5) 對識別算法進(jìn)行測試總的步驟預(yù)計

11、是這些,在以后的學(xué)習(xí)中也許會有改進(jìn)。3、必備的實驗條件、設(shè)備、存在的主要問題(1) 本文所要實現(xiàn)的現(xiàn)實基礎(chǔ)是matlab對前面說話人特征提取,其中包括lpcc的提取和mfcc的提取進(jìn)行仿真(2) 在此基礎(chǔ)上需要把所需要提取的數(shù)據(jù)轉(zhuǎn)換為c語言的表示形式(3) 結(jié)合dps在硬件上進(jìn)行測試以及得出預(yù)期的結(jié)果,一般是以dsp和cpld為核心電路完成對語音信號的采集、說話人識別核心運算來實現(xiàn)的,在實際處理過程中需要找到合適的開發(fā)平臺和語音模塊。(4) 需要在硬件實現(xiàn)平臺上找出合適的dsp開發(fā)平臺(5) 需要熟練掌握css4、進(jìn)度安排,完成論文工作的時間2014,5月204,8月 完成所需的參考文獻(xiàn)的研究2014,9月2015,1月 完成相應(yīng)的ma

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論