語(yǔ)音模式識(shí)別與聲控智能家居設(shè)想_第1頁(yè)
語(yǔ)音模式識(shí)別與聲控智能家居設(shè)想_第2頁(yè)
語(yǔ)音模式識(shí)別與聲控智能家居設(shè)想_第3頁(yè)
語(yǔ)音模式識(shí)別與聲控智能家居設(shè)想_第4頁(yè)
語(yǔ)音模式識(shí)別與聲控智能家居設(shè)想_第5頁(yè)
已閱讀5頁(yè),還剩3頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

語(yǔ)音模式識(shí)別與聲控智能家居設(shè)想模式識(shí)別(PatternRecognition)是指對(duì)表征事物或現(xiàn)象的各種形式的信息進(jìn)行處理和分析,以對(duì)事物或現(xiàn)象進(jìn)行描述、辨認(rèn)、分類(lèi)和解釋的過(guò)程,是信息科學(xué)和人工智能的重要組成部分。近年來(lái),在生物識(shí)別技術(shù)領(lǐng)域中,聲紋識(shí)別技術(shù)以其獨(dú)特的方便性、經(jīng)濟(jì)性和準(zhǔn)確性等優(yōu)勢(shì)受到世人矚目,并日益成為人們?nèi)粘I詈凸ぷ髦兄匾移占暗陌豺?yàn)證方式。而且利用基因算法訓(xùn)練連續(xù)隱馬爾柯夫模型的語(yǔ)音識(shí)別方法現(xiàn)已成為語(yǔ)音識(shí)別的主流技術(shù),該方法在語(yǔ)音識(shí)別時(shí)識(shí)別速度較快,也有較高的識(shí)別率。語(yǔ)音識(shí)別本質(zhì)上是一種模式識(shí)別,因此,識(shí)別算法的好壞對(duì)識(shí)別效果影響巨大。在半個(gè)多世紀(jì)的發(fā)展中,各種算法層出不窮,如濾波器模型法、線性預(yù)測(cè)技術(shù)(LP)、動(dòng)態(tài)時(shí)間規(guī)整算法(DTW)、隱馬爾科夫模型(HMM)、矢量量化技術(shù)(VQ)、人工神經(jīng)網(wǎng)絡(luò)(ANN)和支持向量機(jī)(SVM)等。語(yǔ)音識(shí)別技術(shù)所涉及的領(lǐng)域包括:信號(hào)處理、模式識(shí)別、概率論和信息論、發(fā)聲機(jī)理和聽(tīng)覺(jué)機(jī)理、人工智能等等。語(yǔ)音識(shí)別的原理1?聲學(xué)特征提取聲學(xué)特征的提取與選擇是語(yǔ)音識(shí)別的一個(gè)重要環(huán)節(jié)。聲學(xué)特征的提取既是一個(gè)信息大幅度壓縮的過(guò)程,也是一個(gè)信號(hào)解卷過(guò)程,目的是使模式劃分器能更好地劃分。由于語(yǔ)音信號(hào)的時(shí)變特性,特征提取必須在一小段語(yǔ)音信號(hào)上進(jìn)行,也即進(jìn)行短時(shí)分析。這一段被認(rèn)為是平穩(wěn)的分析區(qū)間稱(chēng)之為幀,幀與幀之間的偏移通常取幀長(zhǎng)的1/2或1/3。通常要對(duì)信號(hào)進(jìn)行預(yù)加重以提升高頻,對(duì)信號(hào)加窗以避免短時(shí)語(yǔ)音段邊緣的影響。2?模型建立語(yǔ)音識(shí)別系統(tǒng)的模型通常由聲學(xué)模型和語(yǔ)言模型兩部分組成,分別對(duì)應(yīng)于語(yǔ)音到音節(jié)概率的計(jì)算和音節(jié)到字概率的計(jì)算。聲學(xué)模型主要包括HMM聲學(xué)建模和上下文相關(guān)建模。語(yǔ)言模型語(yǔ)言模型主要分為規(guī)則模型和統(tǒng)計(jì)模型兩種。統(tǒng)計(jì)語(yǔ)言模型是用概率統(tǒng)計(jì)的方法來(lái)揭示語(yǔ)言單位內(nèi)在的統(tǒng)計(jì)規(guī)律,其中N-Gram簡(jiǎn)單有效,被廣泛使用。3■語(yǔ)音搜索連續(xù)語(yǔ)音識(shí)別中的搜索,就是尋找一個(gè)詞模型序列以描述輸入語(yǔ)音信號(hào),從而得到詞解碼序列。搜索所依據(jù)的是對(duì)公式中的聲學(xué)模型打分和語(yǔ)言模型打分。在實(shí)際使用中,往往要依據(jù)經(jīng)驗(yàn)給語(yǔ)言模型加上一個(gè)高權(quán)重,并設(shè)置一個(gè)長(zhǎng)詞懲罰分?jǐn)?shù)。方法包括Viterbi、N-best搜索和多遍搜索、前向后向搜索算法。4?系統(tǒng)實(shí)現(xiàn)語(yǔ)音識(shí)別系統(tǒng)選擇識(shí)別基元的要求是,有準(zhǔn)確的定義,能得到足夠數(shù)據(jù)進(jìn)行訓(xùn)練,具有一般性。英語(yǔ)通常采用上下文相關(guān)的音素建模,漢語(yǔ)的協(xié)同發(fā)音不如英語(yǔ)嚴(yán)重,可以采用

音節(jié)建模。系統(tǒng)所需的訓(xùn)練數(shù)據(jù)大小與模型復(fù)雜度有關(guān)。模型設(shè)計(jì)得過(guò)于復(fù)雜以至于超出了所提供的訓(xùn)練數(shù)據(jù)的能力,會(huì)使得性能急劇下降。語(yǔ)音識(shí)別的過(guò)程語(yǔ)音識(shí)別主要包括語(yǔ)音信號(hào)預(yù)處理、特征提取、特征建模(建立參考模式庫(kù))、模式匹配和后處理幾個(gè)功能模塊,其中后處理為可選部分,如圖3所示。特征提取迴仿生模式識(shí)別(模式特征提取迴仿生模式識(shí)別(模式匹配)參考模式庫(kù) k(特征建模)識(shí)別后處理豐》圖3基于仿生模式識(shí)別的語(yǔ)音識(shí)別原理框圖一個(gè)語(yǔ)音識(shí)別系統(tǒng)主要包括訓(xùn)練和識(shí)別兩個(gè)階段。無(wú)論是訓(xùn)練還是識(shí)別都需要首先對(duì)輸入的語(yǔ)音進(jìn)行預(yù)處理,并進(jìn)行特征提取。下具體說(shuō)明各個(gè)模塊的功能。預(yù)處理:對(duì)輸入的原始語(yǔ)音信號(hào)進(jìn)行處理,濾除背景噪聲等,進(jìn)行語(yǔ)音信號(hào)的斷點(diǎn)檢測(cè)[5],并進(jìn)行語(yǔ)音分幀以及預(yù)加重等處理工作。特征提取:負(fù)責(zé)計(jì)算語(yǔ)音的聲學(xué)參數(shù),并進(jìn)行特征的計(jì)算,提取關(guān)鍵特征參數(shù)。為了減小計(jì)算量,本文采用一種新的特征提取方法,在傳統(tǒng)的能量、過(guò)零率、倒譜等特征的基礎(chǔ)上,提取每個(gè)字能量、過(guò)零率和倒譜的最大值的位置在字中所占的比例作為改進(jìn)的特征量。識(shí)別階段:將輸入語(yǔ)音的特征量和參考模式庫(kù)中的模式進(jìn)行比較,將相似度最高的模式所屬的類(lèi)別作為識(shí)別的中間候選結(jié)果輸出。訓(xùn)練階段:輸入若干次訓(xùn)練語(yǔ)音,用上述提取得到一組特征參數(shù),建立訓(xùn)練語(yǔ)音的參考模式庫(kù)。后處理:對(duì)上述得到的候選識(shí)別結(jié)果繼續(xù)處理,通過(guò)更多知識(shí)的約束,得到最終的結(jié)果。自適應(yīng)與魯棒性語(yǔ)音識(shí)別系統(tǒng)的性能受許多因素的影響,包括不同的說(shuō)話(huà)人、說(shuō)話(huà)方式、環(huán)境噪音、傳輸信道等等。提高系統(tǒng)魯棒性,是要提高系統(tǒng)克服這些因素影響的能力,使系統(tǒng)在不同的應(yīng)用環(huán)境、條件下性能穩(wěn)定;自適應(yīng)的目的,是根據(jù)不同的影響來(lái)源,自動(dòng)地、有針對(duì)性地對(duì)系統(tǒng)進(jìn)行調(diào)整,在使用中逐步提高性能。以下對(duì)影響系統(tǒng)性能的不同因素分別介紹解決辦法。解決辦法按針對(duì)語(yǔ)音特征的方法和模型調(diào)整的方法分為兩類(lèi)。前者需要尋找更好的、高魯棒性的特征參數(shù),或是在現(xiàn)有的特征參數(shù)基礎(chǔ)上,加入一些特定的處理方法。后者是利用少量的自適應(yīng)語(yǔ)料來(lái)修正或變換原有的說(shuō)話(huà)人無(wú)關(guān)(SI)模型,從而使其成為說(shuō)話(huà)人自適應(yīng)(SA)模型。說(shuō)話(huà)人自適應(yīng)的特征方法有說(shuō)話(huà)人規(guī)一化和說(shuō)話(huà)人子空間法,模型方法有貝葉斯方法、變換法和模型合并法。語(yǔ)音系統(tǒng)中的噪聲,包括環(huán)境噪聲和錄音過(guò)程加入的電子噪聲。提高系統(tǒng)魯棒性的特征方法包括語(yǔ)音增強(qiáng)和尋找對(duì)噪聲干擾不敏感的特征,模型方法有并行模型組合PMC方法和在訓(xùn)練中人為加入噪聲。信道畸變包括錄音時(shí)話(huà)筒的距離、使用不同靈敏度的話(huà)筒、不同增益的前置放大和不同的濾波器設(shè)計(jì)等等。特征方法有從倒譜矢量中減去其長(zhǎng)時(shí)平均值和RASTA濾波,模型方法有倒譜平移。聲控智能家居控制——口令觸發(fā)模式:設(shè)置合理確認(rèn)流程聲控智能家居控制,是在現(xiàn)有的智能家居控制系統(tǒng)中,增加了語(yǔ)音用戶(hù)界面VUI。目

前已有的智能家居控制系統(tǒng),主要有兩種方式:無(wú)線遙控和有線操作(電力載波或者中央布

線)。都會(huì)有一個(gè)中央控制器或者中央遙控器來(lái)操作家里的各種家電。通過(guò)在中央控制器或

者遙控器中集成引入LD3320芯片,可以很方便的為智能家居系統(tǒng)增加語(yǔ)音用戶(hù)界面VUI。對(duì)于中央遙控器,如果是使用電池供電,那么就應(yīng)該采用和聲控電視遙控器采用一樣的按鍵觸發(fā)模式??紤]到用戶(hù)的需求,在不接觸控制器的狀態(tài)下,通過(guò)語(yǔ)音來(lái)遠(yuǎn)程操作家里的各種家電。因此,口令觸發(fā)模式就是最適合的模式。同時(shí),一定需要設(shè)置確認(rèn)的流程,務(wù)必要避免誤觸發(fā)/誤識(shí)別的情況發(fā)生。以下以三個(gè)二級(jí)確認(rèn)的流程來(lái)舉例說(shuō)明,開(kāi)發(fā)者可以在此基礎(chǔ)上進(jìn)行修改,或者拓展成三級(jí)確認(rèn)的流程。也可以在產(chǎn)品中支持多種流程,由終端用戶(hù)根據(jù)自己使用的習(xí)慣來(lái)選擇。1)設(shè)置前置口令,第二級(jí)說(shuō)“操作+設(shè)備”設(shè)置口令為“阿拉丁”或者“大管家”(口令可以選擇發(fā)音響亮,瑯瑯上口的詞語(yǔ))。中央控制器處于一直上電的狀態(tài),所以識(shí)別芯片一直處于循環(huán)識(shí)別狀態(tài),只有在識(shí)別出是口令后,才進(jìn)入下一階段的識(shí)別流程。并且充分利用LD3320芯片的特性,在添加口令的同時(shí)另外增加垃圾詞語(yǔ)直至達(dá)到LD3320芯片的最大容量,這樣可以很大程度地避免其他聲音帶來(lái)的誤識(shí)別。(在成功識(shí)別出口令后,可以選擇播放很輕微的''嘀”的一聲,或者閃一下小的LED燈,來(lái)作為提示)在識(shí)別出口令后,在接下來(lái)的8秒鐘時(shí)間內(nèi),等待接收用戶(hù)的命令,比如“全部關(guān)閉”,'‘打開(kāi)廚房燈”,'‘打開(kāi)空調(diào)”等等。如果在限定的時(shí)間內(nèi),沒(méi)有正確識(shí)別和接收到用戶(hù)的命令,則取消本次識(shí)別流程。重新回到等待口令的狀態(tài)。

識(shí)別否否3)第一級(jí)循環(huán)識(shí)別''操作+設(shè)備”,第二級(jí)說(shuō)“確定”這一種是“后確認(rèn)”的流程:在第一級(jí)循環(huán)識(shí)別時(shí),識(shí)別內(nèi)容是操作的名稱(chēng),比如“打開(kāi)床頭燈”,“全部關(guān)閉”等等,識(shí)別出后,只有在接下來(lái)的5秒鐘時(shí)間內(nèi)說(shuō)出"確定”這個(gè)關(guān)鍵口令,才進(jìn)行正式操作,否則就取消本次識(shí)別流程,重新進(jìn)入循環(huán)識(shí)別狀態(tài)。根振識(shí)別結(jié)果執(zhí)廳操作設(shè)置命令字識(shí)別否否3)第一級(jí)循環(huán)識(shí)別''操作+設(shè)備”,第二級(jí)說(shuō)“確定”這一種是“后確認(rèn)”的流程:在第一級(jí)循環(huán)識(shí)別時(shí),識(shí)別內(nèi)容是操作的名稱(chēng),比如“打開(kāi)床頭燈”,“全部關(guān)閉”等等,識(shí)別出后,只有在接下來(lái)的5秒鐘時(shí)間內(nèi)說(shuō)出"確定”這個(gè)關(guān)鍵口令,才進(jìn)行正式操作,否則就取消本次識(shí)別流程,重新進(jìn)入循環(huán)識(shí)別狀態(tài)。根振識(shí)別結(jié)果執(zhí)廳操作設(shè)置命令字[臺(tái)燈/電視/全部光閉/空調(diào)f?.?】設(shè)置口令【打開(kāi)或看羌閉】終靖用戶(hù)可更改淀蘿添抑垃圾詞謖吸收特誅東減歩滾觸發(fā)可選年插垃d(疇廠戚矗兇LED作為提示循環(huán)識(shí)別8秒鐘仍木有肓效識(shí)別結(jié)果否只別設(shè)宜循環(huán)識(shí)別命令【打開(kāi)臺(tái)燈/關(guān)閉空碉/打開(kāi)床頭燈/全部關(guān)閉/……]一定要添刼趟圾詞語(yǔ)喙收錯(cuò)謀來(lái)減少課觸發(fā)否只別設(shè)宜循環(huán)識(shí)別命令【打開(kāi)臺(tái)燈/關(guān)閉空碉/打開(kāi)床頭燈/全部關(guān)閉/……]一定要添刼趟圾詞語(yǔ)喙收錯(cuò)謀來(lái)減少課觸發(fā)謳拾播液1識(shí)魁出的操作命令】根據(jù)識(shí)別結(jié)果執(zhí)行擬作詮置命令字【確定/確認(rèn)F…】呵進(jìn)徉:播瞼嘀八弋F閃隹D作舟提卒循環(huán)識(shí)別8秒鐘仍未有有效識(shí)別結(jié)?果說(shuō)明:每次加載識(shí)別列表時(shí),如果命令字不到LD3320的最大容量,都可以添加垃圾詞語(yǔ)吸收可能的噪音可以對(duì)同一識(shí)別詞語(yǔ)設(shè)置多個(gè)不同的習(xí)慣發(fā)音,方便用戶(hù)使用。五、結(jié)語(yǔ)雖說(shuō)智能家居系統(tǒng)中也早已有廠家將語(yǔ)音控制引入其中,并宣傳這將是未來(lái)主流方向,但是鑒于目前存在著種種因素的影響,如對(duì)自然語(yǔ)言的識(shí)別和理解、語(yǔ)音信息量大、語(yǔ)音的模糊性、單個(gè)字母或詞、字的語(yǔ)音特性受上下文的影響、環(huán)境噪聲和干擾對(duì)語(yǔ)音識(shí)別有嚴(yán)重影響,致使識(shí)別率低等問(wèn)題。這些都致使語(yǔ)音系統(tǒng)并未能真正進(jìn)入智能家居系統(tǒng),而所謂的引領(lǐng)智能家居聲控潮流,還為時(shí)尚早!唯有技術(shù)不斷升級(jí)及產(chǎn)品的更新方能真正讓聲控技術(shù)進(jìn)入智

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論