




已閱讀5頁,還剩82頁未讀, 繼續(xù)免費(fèi)閱讀
(電路與系統(tǒng)專業(yè)論文)基于說話人識(shí)別的無線門禁系統(tǒng)的應(yīng)用研究.pdf.pdf 免費(fèi)下載
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
h uj i np i n g o fw i r e l e s sa c c e s sc o n t r o l b e l a n z h o uu n i v e r s i t yo ft e c h n o l o g y 2 0 0 8 at h e s i ss u b m i a e di np a r t i a ls a t i s f a c t i o no ft h e r e q u i r e m e n t sf o rt h ed e g r e eo f m a s t e ro f e n g i n e e r i n g c i r c u i t sa n ds y s t e m s i nt h e g r a d u a t es c h o o l o f l a n z h o uu n i v e r s i t yo f t e c h n o l o g y s u p e r v i s o r e n g i n e e rc h e n r u o z h u m a y 2 0 1 1 蘭州理工大學(xué)學(xué)位論文原創(chuàng)性聲明和使用授權(quán)說明 原創(chuàng)性聲明 本人鄭重聲明 所呈交的論文是本人在導(dǎo)師的指導(dǎo)下獨(dú)立進(jìn)行研究所 取得的研究成果 除了文中特別加以標(biāo)注引用的內(nèi)容外 本論文不包含任 何其他個(gè)人或集體已經(jīng)發(fā)表或撰寫的成果作品 對(duì)本文的研究做出重要貢 獻(xiàn)的個(gè)人和集體 均已在文中以明確方式標(biāo)明 本人完全意識(shí)到本聲明的 法律后果由本人承擔(dān) 作者簽名 易 童彳日期 矽 7 年彥月7 日 學(xué)位論文版權(quán)使用授權(quán)書 本學(xué)位論文作者完全了解學(xué)校有關(guān)保留 使用學(xué)位論文的規(guī)定 即 學(xué)校有權(quán)保留并向國家有關(guān)部門或機(jī)構(gòu)送交論文的復(fù)印件和電子版 允許 論文被查閱和借閱 本人授權(quán)蘭州理工大學(xué)可以將本學(xué)位論文的全部或部 分內(nèi)容編入有關(guān)數(shù)據(jù)庫進(jìn)行檢索 可以采用影印 縮印或掃描等復(fù)制手段 保存和匯編本學(xué)位論文 同時(shí)授權(quán)中國科學(xué)技術(shù)信息研究所將本學(xué)位論文 收錄到 中國學(xué)位論文全文數(shù)據(jù)庫 并通過網(wǎng)絡(luò)向社會(huì)公眾提供信息服 務(wù) 篡釹 導(dǎo)師簽名 伢痧影節(jié) 日期 知 7 年多月7 日 日期 沙 年莎月7 日 1 2 國內(nèi)外研究現(xiàn)狀 1 1 3 研究的主要內(nèi)容及論文結(jié)構(gòu) 6 1 4 本章小結(jié) 6 第2 章門禁系統(tǒng)的設(shè)計(jì)方案與相關(guān)理論研究 7 2 1 說話人識(shí)別原理 7 2 2 語音信號(hào)的預(yù)處理 8 2 2 1 預(yù)加重 8 2 2 2 分幀與加窗 8 2 3 語音信號(hào)的端點(diǎn)檢測 一9 2 4 語音信號(hào)的特征提取 1 1 2 4 1 線性預(yù)測系數(shù) 1 1 2 4 2 美爾倒譜系數(shù)m f c c 1 2 2 5 語音信號(hào)的模式匹配 1 4 2 6 本章小結(jié) 1 7 第3 章基于說話人識(shí)別的門禁系統(tǒng)的硬件設(shè)計(jì) 1 8 3 1 系統(tǒng)的硬件結(jié)構(gòu) 1 8 3 2t m s 3 2 0 v c 5 5 xd s p 的基本結(jié)構(gòu) 18 3 2 1c 5 5 x 的c p u 結(jié)構(gòu) 2 0 3 2 2 存儲(chǔ)器映射 2 l 3 2 3d s p 的片內(nèi)外設(shè) 2 2 3 2 4c 5 5 x 的指令流水線和并行性 2 2 3 3 各主要單元電路 2 3 3 3 1 電源電路 2 3 3 3 2 時(shí)鐘電路 一2 4 3 3 3 音頻編解碼模塊 2 6 3 3 4 外擴(kuò)存儲(chǔ)電路 2 9 3 3 5 上電自舉模式與語音處理模式的設(shè)定 3 3 基于說話人識(shí)別的無線門禁系統(tǒng)的應(yīng)用研究 3 3 6j t a g 接口電路 3 5 3 3 7 無線傳輸電路 3 5 3 4 硬件電路板的抗干擾設(shè)計(jì) 3 8 3 5 本章小結(jié) 3 8 第4 章基于說話人識(shí)別門禁系統(tǒng)的軟件設(shè)計(jì) 3 9 4 1 說話人識(shí)別的結(jié)構(gòu)框圖 3 9 4 2 說話人識(shí)別的軟件設(shè)計(jì) 4 0 4 2 1 系統(tǒng)的初始化 4 0 4 2 2a i c 2 3 語音信號(hào)采集 4 3 4 2 3 數(shù)據(jù)處理 4 3 4 2 4b o o tl o a d e r 程序設(shè)計(jì) 一4 4 4 2 5 非易失存儲(chǔ)器f l a s h 在線編程 4 5 4 3 無線通信的軟件設(shè)計(jì) 4 8 4 4 本章小結(jié) 5 l 第5 章系統(tǒng)聯(lián)調(diào)測試與結(jié)果分析 5 2 5 1 系統(tǒng)的硬件調(diào)試 5 2 5 2 系統(tǒng)的軟件調(diào)試 5 2 5 3 系統(tǒng)的測試設(shè)備 5 4 5 4 測試結(jié)果與分析 5 5 5 5 本章小結(jié) 5 7 結(jié)論與展望 5 8 參考文獻(xiàn) 6 0 致謝 6 4 附錄攻讀學(xué)位期間所發(fā)表的學(xué)術(shù)論文目錄 6 5 介紹了說話人識(shí)別的基本原理 包括語音信號(hào)的預(yù)處理 端點(diǎn)檢測 在研究傳統(tǒng) 端點(diǎn)檢測的基礎(chǔ)上提出雙門限的比較方法 特征提取 重點(diǎn)分析了l p c 倒譜和m f c c 倒譜 模式匹配采用改進(jìn)的動(dòng)態(tài)時(shí)間規(guī)整算法并進(jìn)行詳細(xì)的分析 對(duì)算法的各個(gè) 部分進(jìn)行了m a t l a b 仿真驗(yàn)證 本文以t m s 3 2 0 v c 5 5 0 9 ad s p 芯片為核心 以高保真語音編解碼芯片 t l v 3 2 0 a i c 2 3 同步動(dòng)態(tài)隨機(jī)存儲(chǔ)器s d r a m 和異步存儲(chǔ)器f l a s h 為主要外設(shè) 完成了系統(tǒng)的硬件設(shè)計(jì) 具體硬件設(shè)計(jì)電路包括 電源模塊 時(shí)鐘模塊 外擴(kuò)存 儲(chǔ)器模塊 音頻編解碼器模塊 j t a g 接口 s i 4 4 3 2 模塊 根據(jù)系統(tǒng)實(shí)現(xiàn)的功能 要求 軟件基于c c s 開發(fā)環(huán)境 采用并行e m i f 引導(dǎo)方式 實(shí)現(xiàn)了 t m s 3 2 0 v c 5 5 0 9 ad s p 擴(kuò)展f l a s h 的在線燒寫 采用了模塊化的程序設(shè)計(jì)方法 程序整體采用c 語言和匯編語言混合方式編程 完成了語音識(shí)別工程及無線數(shù) 據(jù)收發(fā)工程 本文基于實(shí)驗(yàn)室環(huán)境 實(shí)現(xiàn)了說話人識(shí)別的無線門禁系統(tǒng)的軟硬件設(shè)計(jì) 基 本實(shí)現(xiàn)了預(yù)期的目標(biāo) 充分體現(xiàn)系統(tǒng)的可行性 具有較強(qiáng)的實(shí)用價(jià)值 關(guān)鍵詞 說話人識(shí)別 d s p 動(dòng)態(tài)時(shí)間規(guī)整 s i 4 4 3 2 門禁系統(tǒng) i l l s p e a k e rr e c o g n i t i o n i sak i n do fb i o l o g i c a lc e r t i f i c a t i o n t e c h n o l o g y i nt h e b i o l o g i c a lc e r t i f i c a t i o na r e a s p e a k e rr e c o g n i t i o nw i d e l yd r a w st h ea t t e n t i o nb e c a u s eo f i t sc o n v e n i e n c e e f f i c i e n c ya n da c c u r a c y a tp r e s e n t t h es p e a k e rr e c o g n i t i o ns y s t e m a r ew o r kd e p e n do nc o m p u t e rm o s t l y s ot h es y s t e mi se x p e n s i v ea n ds e r v e j u s tf o ra s i n g l eu s e r t oac e r t a i ne x t e n t i th i n d e r e dt h es p e a k e rr e c o g n i t i o na c c e s sc o n t r o l s y s t e md e v e l o p m e n t t h i sa r t i c l er e v i e wt h ec o u r s e so fs p e e c hr e c o g n i t i o nt e c h n o l o g y o nt h eb a s i so f t h ea b o v e t h eb a s i ct h e o r yo fs p e a k e rr e c o g n i t i o ni si n t r o d u c e da c c o r d i n gt ot h em o d e l o fs p e a k e rr e c o g n i t i o ns y s t e m w h i c hi n c l u d e st h ev o i c e s i g n a l s p r e t r e a t m e n ta n dt h e d e t e c t i o no fe n d p o i n t c o m p a r i n gt h et r a d i t i o n a lm e t h o do fd e t e c t i o n t h i s p a p e r p r o p o s e sad o u b l et h r e s h o l dc o m p a r a t i v em e t h o d t h ef e a t u r ei se x t r a c t e da n di ti s f o c u so nt h ei n v e r t e d p e d i g r e eo fl p ca n dm e ls c a l ef r e q u e n c y t h es p e a k e r r e c o g n i t i o na l g o r i t h md t w i si n t r o d u c e da n da n a l y z e di nt h ep a p e r e a c hp a r to ft h e a l g o r i t h mi sv e r i f i e do nt h em a t l a bs i m u l a t i o n i nt h eh a r d w a r e d e s i g n t h es y s t e m u s e st h ed i g i t a l s i g n a lp r o c e s s o ro f t m s 3 2 0 v c 5 5 0 9 aa st h e c o r e h i g h f i d e l i t yv o i c ec o d e cc h i pt l v 3 2 0 a i c 2 3 s y n c h r o n o u sd y n a m i cr a n d o ma c c e s sm e m o r ys d r a ma n da s y n c h r o n o u sm e m o r y f l a s ha st h em a i np e r i p h e r a l s t h ep a r to fh a r d w a r ec i r c u i td e s i g n s p e c i f i c a l l y i n c l u d e sp o w e rm o d u l e s c l o c km o d u l e s e x t e r n a le x p a n s i o nm e m o r ym o d u l e s a u d i o c o d e cm o d u l e s j t a gi n t e r f a c ea n ds i 4 4 3 2m o d e b a s e do nc c sd e v e l o p m e n t e n v i r o n m e n t t h i sp i e c eo fp a p e rh a sp a r a l l e le m i f b o o tm o d et oa c h i e v et h eo n c h i p b o o t l o a d e ro ft h e d i g i t a ls i g n a lp r o c e s s o ro ft m s 3 2 0 v c 5 5 0 9 aa f t e ro n l i n e s i m u l a t i o n u s i n gm o d u l a rp r o g r a m m i n gm e t h o d s p r o c e d u r e su s i n gcl a n g u a g ea n d a s s e m b l yl a n g u a g eh y b r i d s i tf i n i s h e dt h e i p r o g r a m m i n g i t s p e e c hr e c o g n i t i o n e n g i n e e r i n ga n dw i r e l e s sd a t at r a n s c e i v e re n g i n e e r i n g i ti sp r o v e dt h a tt h ed e s i g n s c h e m eo ft h es y s t e mi se f f e c t i v e k e yw o r d s s p e a k e ri d e n t i f i c a t i o n d s p d t w s i 4 4 3 2 w i r e l e s sa c c e s sc o n t r o ls y s t e m i v 圖2 6m f c c 計(jì)算流程圖 1 4 圖2 7d t w 算法搜索路徑 15 圖2 8 匹配路徑約束示意圖 1 6 圖3 1 系統(tǒng)硬件結(jié)構(gòu)圖 18 圖3 2c 5 5 x 的c p u 結(jié)構(gòu)圖 2 0 圖3 3t m s 3 2 0 v c 5 5 0 9 a 封裝存儲(chǔ)器映射圖 2 l 圖3 4c 5 5 x 流水線示意圖 2 3 圖3 5 電源電路 2 4 圖3 6 時(shí)鐘電路 2 5 圖3 7t 3 2 0 a i c 2 3 芯片引腳圖 2 6 圖3 8t m s 3 2 0 v c 5 5 0 9 a 與a i c 2 3 接口示意圖 2 8 圖3 91 2 c 模塊數(shù)據(jù)傳輸圖 2 9 圖3 1 0a i c 2 3 在d s p 模式下的串口時(shí)序圖 2 9 圖3 1 1t m s 3 2 0 v c 5 5 0 9 a 與s d r a m 接口示意圖 3l 圖3 1 2t m s 3 2 0 v c 5 5 0 9 a 與f l a s h 接口示意圖 3 2 圖3 1 3l v c l 6 2 4 5 連接圖 一3 4 圖3 1 4 上電自舉模式示意圖 3 4 圖3 15j t a g 接口電路 3 5 圖3 1 6s i 4 4 3 2 硬件連接圖 3 7 圖4 1 說話人識(shí)別的軟件流程圖 3 9 圖4 2 擦除和編程命令示意圖 4 6 圖4 3 觸發(fā)位檢測算法流程圖 4 7 圖4 4f l a s h 擦除圖 4 8 圖4 5f l a s h 燒寫圖 4 8 圖4 6d s p 與s 1 4 4 3 2 連接圖 4 9 圖4 7s p c r l 控制寄存器圖 4 9 圖4 8s p c i l 2 控制寄存器圖 j 4 9 圖4 9s p i 操作模式3 時(shí)序圖 5 0 圖4 10s i 4 4 3 2 發(fā)送軟件流程圖 5 0 圖5 1 語音工程y u y i n s h i b i e p j t 界面 5 3 v 5 3 5 4 5 4 5 4 5 5 5 6 5 6 5 6 表3 8l v c l6 2 4 5 功能表 3 4 表3 9s 1 4 4 3 2 的引腳定義與描述 3 7 表4 1 引導(dǎo)構(gòu) 4 4 表4 2a m 2 9 l v 8 0 0 b 操作命令說明 一4 5 表4 3 寫操作各時(shí)間參數(shù) 4 7 表5 1 說話人識(shí)別實(shí)驗(yàn)結(jié)果 5 5 v l i 禁系 容易 的要 求 而在生物技術(shù)和信息科學(xué)迅速發(fā)展的今天 生物認(rèn)證技術(shù)是一種方便 先進(jìn) 的信息安全技術(shù)在現(xiàn)實(shí)生活中已經(jīng)得到廣泛的應(yīng)用 人的語音信號(hào)是自然界生物 信號(hào)的一種 每個(gè)人的聲音都與環(huán)境 情緒 聲道模型 健康狀況等有關(guān) 都有 自己獨(dú)特的特性 所以可以通過分析語音信號(hào)來識(shí)別說話人成為可能n 2 1 特別 是進(jìn)入j u 2 1 世紀(jì)以來 科研人員對(duì)說話人識(shí)別進(jìn)行了很廣泛的研究 在生物識(shí)別 領(lǐng)域中 利用說話人的語音信號(hào)來進(jìn)行說話人識(shí)別有許多獨(dú)特的優(yōu)點(diǎn) 如語音信 號(hào)相對(duì)于其它的生物信號(hào) 成本比較低廉 采集相對(duì)簡單 沒有嚴(yán)格的方向性 可以在黑暗中傳播等 說話人識(shí)別技術(shù)被廣泛的應(yīng)用于醫(yī)學(xué)應(yīng)用 聲控電子鎖 搜索罪犯等領(lǐng)域 而綜合集成了大型計(jì)算機(jī) 無線通訊 自動(dòng)識(shí)別 機(jī)械工程和安全管理等相 關(guān)技術(shù)的門禁系統(tǒng)有效地解決了重要部門和場合的安全控制問題 已經(jīng)被應(yīng)用的 越來越廣泛 并產(chǎn)生了深遠(yuǎn)的影響 目前市場上的門禁系統(tǒng)大多是采用有線的通 信方式 小區(qū)單元通過有線的方式與各個(gè)用戶端相連 與這類有線網(wǎng)絡(luò)通信的樓 宇控制產(chǎn)品相比 無線門禁的解決方案安裝布置更加靈活 費(fèi)用低廉 樓宇間的 設(shè)備重組更加方便 可移動(dòng)性強(qiáng)等方面的優(yōu)勢 因此 無線門禁系統(tǒng)受到相關(guān)公 司 研究團(tuán)隊(duì)的重視 其將在門禁市場中占據(jù)越來越重要的地位 本課題針對(duì)人們對(duì)智能安防系統(tǒng)日益增長的需求 提出了基于說話人識(shí)別的 無線門禁系統(tǒng)的應(yīng)用研究 該系統(tǒng)可應(yīng)用于小區(qū)單元及用戶控制鎖的工程實(shí)踐 中 充分體現(xiàn)了生物信號(hào)中說話人識(shí)別的便利性 無線通信的實(shí)時(shí)性 為現(xiàn)代化 的門禁系統(tǒng)提供一種可靠的方案 1 2 國內(nèi)外研究現(xiàn)狀 對(duì)說話人識(shí)別的研究d 4 開始于上世紀(jì)六十年代 主要研究內(nèi)容是人工的說 話人識(shí)別 1 9 6 6 年 美國法院第一次采用語譜圖進(jìn)行了取證 5 蚓 7 0 年代中期 b s a t a l 研究了線性預(yù)測l p c l i n e a rp r e d i c t i v ec o d i n g 系數(shù) 倒譜系數(shù)等不同 的特征參數(shù) 并論證了倒譜系數(shù)在進(jìn)行說話人識(shí)別中是比較理想的特征參數(shù) 許 多學(xué)者和研究人將對(duì)矢量量化模型v q v e c t o rq u a n t i z a t i o n 隱馬爾科夫模型 h m m h i d d e nm a r k o vm o d e l 1 7 j 和人工神經(jīng)網(wǎng)絡(luò)a n n a r t i f i c i a l n e u r a l n e t w o r k 8 1 0 1 弓i 入到說話人識(shí)別研究中 大大地推動(dòng)了說話人識(shí)別技術(shù)的發(fā)展 綦丁 說i 再人識(shí)別的無線門禁系統(tǒng)的麻用研究 我國說話人識(shí)別的研究工作開始于五十年代 伴隨著計(jì)算機(jī)技術(shù)的快速發(fā)展 根 據(jù)我國的具體實(shí)際情況 特別是在漢語識(shí)別技術(shù)上 創(chuàng)造出適合漢語識(shí)別的技術(shù) 說話人識(shí)別要求從語音信號(hào)中提取個(gè)體差異 提取出能反映說話人是誰的信息 從而進(jìn)行說話人識(shí)別 其基本原理是為每一個(gè)說話人建立一個(gè)能夠描述這一說話 人個(gè)性特征的模型 作為此說話人個(gè)性特征的描述 說話人識(shí)別可以分為兩個(gè)范 疇 即說話人辨認(rèn)和說話人確認(rèn) 前者是把要檢測的語句判為n 個(gè)訓(xùn)練說話人之 一所說 是一個(gè)多擇一的問題 后者則是把帶檢測人的語句與其參考說話人的相 比較 相符的即得到確認(rèn) 不相符的則得到否定 是二擇一的問題 說話人辨識(shí) 時(shí)取與測試語音匹配距離最小的說話人模型所對(duì)應(yīng)的說話人作為說話人辨識(shí)的 結(jié)果 說話人確認(rèn)時(shí)與所聲稱的說話人模型進(jìn)行匹配 若匹配距離小于規(guī)定的閥 值 則該說話人得到證實(shí) 否則該說話人不是他所聲稱的說話人 要實(shí)現(xiàn)說話人 識(shí)別系統(tǒng)需要解決三個(gè)問題 1 首先對(duì)說話人的語音信號(hào)進(jìn)行預(yù)處理 端點(diǎn)檢 測和特征提取 2 說話人模板的建立和模板參數(shù)的訓(xùn)練 3 測試的語音模板與 說話人模板的匹配距離計(jì)算 針對(duì)當(dāng)前的說話人識(shí)別 大致可歸為三類 第一類 模板匹配法 以前的說話人識(shí)別是根據(jù)簡單的模板匹配的原理構(gòu)造 的特定人 小詞匯量 孤立詞識(shí)別系統(tǒng) 叫引 在訓(xùn)練和識(shí)別的時(shí)候 必須保證兩 個(gè)模板采用相同的幀數(shù) 相同的預(yù)處理與窗函數(shù) 但是在實(shí)際的應(yīng)用中 說話人 的語音具有很大的似然性 所以要把兩幀延長到相同的長度 于是 日本學(xué)者板 倉 i t a k u r a 將動(dòng)態(tài)規(guī)劃算法 d y n a m i cp r o g r a m m i n g d p 的概念用于解決孤立詞 識(shí)別時(shí)的說話速度不均勻的難題 提出了著名的動(dòng)態(tài)時(shí)間規(guī)整算法 d y n a m i c t i m ew a r p i n g 簡稱d t w 它是最近被廣泛研究和應(yīng)用的一種模式識(shí)別的方法 在說話人識(shí)別中獲得了比較廣泛的應(yīng)用 h o 引 d t w 是一個(gè)典型的求解最優(yōu)化問題 將說話人的語音信號(hào)在時(shí)間軸上進(jìn)行不均勻的彎曲 使其測試模板與參考模板 對(duì)齊 并計(jì)算最小的幀匹配距離 從而獲得累計(jì)距離最小的規(guī)整函數(shù) 這就保證 了參考模板的特征和測試模板特征之問最大的聲學(xué)相似性和最小的誤差失真 但 是對(duì)于非特定人 大詞匯量 連續(xù)語音識(shí)別系統(tǒng)來講 這種模板匹配就顯得力不 從心 就必須尋求模板匹配以外的其它識(shí)別方法一隨機(jī)模型法及概率語法分析 法 第二類 概率模型法 突出的代表是 1 隱馬爾可夫模型h m m 方法i l 昏博j 可以 使用h 刪的概率參數(shù)來對(duì)似然函數(shù)進(jìn)行估計(jì)與判決 從而得到識(shí)別結(jié)果 在用于 語音建模時(shí) 它是雙重的隨機(jī)過程 2 高斯混合模型 g a u s s i a nm i x t u r e m o d e l g m m 1 9 2 1 因?yàn)槊恳粋€(gè)說話人的個(gè)性特征都可由形式一致的高斯混合概率 密度函數(shù)中的參數(shù)來表示 故為每一個(gè)說話人建立一個(gè)g m m 混合模型來訓(xùn)練 從 而獲得模型中的參數(shù) 第三類 概率語法分析法 對(duì)于大詞匯量 連續(xù)非特定人的語音識(shí)別具有較 2 大的優(yōu)勢 專家學(xué)者通過采集分析語音信號(hào) 并建立不同的約束規(guī)則來描述不 同人的語音信號(hào) 從而達(dá)到識(shí)別說話人的目的 而說話人的語音具有較大的隨機(jī) 性和時(shí)變性 此方法的重點(diǎn)是如何選取這些約束規(guī)則以及它們之間相互轉(zhuǎn)化的條 件等 雖然說話人識(shí)別的正確率大大提高 但是算法計(jì)算的復(fù)雜度要遠(yuǎn)遠(yuǎn)的高于 前兩種方法 并且占用較大的存儲(chǔ)空間 移植起來具有很大的難度 在介紹了常用的說話人識(shí)別的方法外 還有很多像神經(jīng)網(wǎng)絡(luò)方法 2 2 2 3 算法 的識(shí)別方法 人工神經(jīng)網(wǎng)絡(luò)可采用物理可實(shí)現(xiàn)的器件或利用現(xiàn)有的計(jì)算機(jī)來模 擬生物神經(jīng)網(wǎng)絡(luò)的某些結(jié)構(gòu)與功能 包括神經(jīng)元 網(wǎng)絡(luò)拓?fù)浜途W(wǎng)絡(luò)的訓(xùn)練算法 三個(gè)部分 神經(jīng)網(wǎng)絡(luò)對(duì)復(fù)雜不確定性的問題具有自適應(yīng)和自學(xué)習(xí)能力 快速優(yōu) 化能力 對(duì)大量定性或定量信息的分布存儲(chǔ)能力 并行處理與合成能力 神經(jīng) 網(wǎng)絡(luò)還具有較強(qiáng)的魯棒性 若局部或部分神經(jīng)元損壞后 不會(huì)影響全局的活動(dòng) 最近采用不同方法的融合技術(shù) 2 4 2 6 有了廣泛的應(yīng)用 1 維數(shù)約簡與識(shí)別方 式相結(jié)合 局部p c a p r i n c i p a lc o m p o n e n t a n a l y s i s 2 7 j 和g m m 結(jié)合的說話人識(shí)別系統(tǒng) 2 聚類與識(shí)別方法的結(jié)合 3 識(shí)別方式的結(jié)合 主要是采用了s v m s u p p o r tv e c t o r m a c h i n e 2 8 2 9 分類器 充分利用了s v m 適合不同樣本之間的分類 對(duì)于異類樣本 具有很強(qiáng)的分類能力 可以與其它很多模式識(shí)別的算法相結(jié)合 利用不同分類器 的特點(diǎn) 實(shí)現(xiàn)識(shí)別結(jié)果的最優(yōu)化 近年來雖然說話人識(shí)別的研究已經(jīng)取得很大的進(jìn)展 但應(yīng)用于實(shí)際情況還需 要解決很多問題1 3 問題一 高維說話人特征的缺陷 為了提高說話人識(shí)別系統(tǒng)的識(shí)別率 往往 采用更高維的特征 然而 高維的特征矢量會(huì)增加計(jì)算量與存儲(chǔ)空間 不利于實(shí) 時(shí)的對(duì)語音信號(hào)進(jìn)行處理 問題二 說話人分類方法的局限性 目前雖然有很多說話人識(shí)別的方法 在 說話人識(shí)別的領(lǐng)域中也取得了很好的識(shí)別效果 如矢量量化模型 隱馬爾科夫模 型 神經(jīng)網(wǎng)絡(luò)模型 支持向量機(jī)模型等 但是選用這些高維向量 需要不斷的迭 代計(jì)算 使得說話人識(shí)別的時(shí)間相對(duì)較長 因此 高復(fù)雜度的精確的模式匹配方 法并不適合于實(shí)時(shí)的說話人識(shí)別應(yīng)用 這需要強(qiáng)大的計(jì)算處理能力與數(shù)據(jù)存儲(chǔ)設(shè) 備 現(xiàn)有的低復(fù)雜度低計(jì)算量的模式識(shí)別方法 雖然所需的訓(xùn)練時(shí)間和測試時(shí)間 都比較短 但對(duì)說話人識(shí)別的準(zhǔn)確率有所下降 只適用于識(shí)別人數(shù)相對(duì)較少的情 況 一旦說話人的數(shù)量增多 識(shí)別性能就會(huì)急劇下降 隨著說話人識(shí)別中對(duì)于語音信號(hào)處理技術(shù)和計(jì)算機(jī)硬件 d s p 的高速發(fā)展 語音信號(hào)處理的硬件方式發(fā)生著質(zhì)的飛躍 隨著c 5 5 x 系y u d s p 的推出和應(yīng)用開發(fā) 的逐步深入 在實(shí)時(shí)性和低功耗方面體現(xiàn)出其優(yōu)良的性能 c 5 5 x 正成為通信和個(gè) 人消費(fèi)領(lǐng)域的主流d s p 產(chǎn)品1 3 作為t i 公司低功耗系列的d s p 芯片 2 0 0 0 系列主要 用于工程電機(jī)等的自動(dòng)控制中 5 0 0 0 系列主要用于語音信號(hào)處理 算法的實(shí)現(xiàn) 6 0 0 0 系列主要用于圖像的壓縮 增強(qiáng)等 對(duì)于市場上的c 8 0 5 1 單片機(jī) a r m 及f p g a 3 藎 j 說i 再人識(shí)j j l j 的無線門禁系統(tǒng)的啦用研究 曼曼曼曼曼曼曼皇曼皇 蔓曼曼曼曼曼魯曼量皇曼曼曼曼黑笪曼曼曼曼曼量量曼曼曼曼曼曼曼曼曼曼曼曼曼曼曼曼曼曼量皇曼皇呂曼曼曼皇曼曼蔓曼蘭曼鼉蔓量 等 它在功耗 信號(hào)算法的處理等方面具有顯著的優(yōu)勢 3 2 d s p 主要發(fā)展現(xiàn)狀如 下 1 制造工藝與存儲(chǔ)容量 目前的d s p 芯片都采用c m o s i 藝 芯片的引腳 越來越多 集成的功能也越來越強(qiáng) 需要設(shè)計(jì)的外圍電路越來越少 t i 公司在 2 0 0 5 年1 2 月發(fā)布的達(dá)芬奇系統(tǒng)已經(jīng)把音視頻部件集成在d s p 內(nèi)部 內(nèi)部集成的 數(shù)據(jù)和程序存儲(chǔ)器也不斷增大 成本 體積和功耗不斷下降 2 內(nèi)存結(jié)構(gòu)和運(yùn)算速度 目前的d s p 模塊基本上都采用數(shù)據(jù)總線和程序總 線分離的哈佛結(jié)構(gòu)或改進(jìn)的哈佛結(jié)構(gòu) 多級(jí)流水線指令 內(nèi)部集成了鎖相環(huán) 可 以相應(yīng)的進(jìn)行倍頻或者分頻 在一定范圍內(nèi)實(shí)現(xiàn)任意的時(shí)鐘頻率 使c u p 在一 個(gè)指令周期內(nèi)可多次對(duì)程序空間和數(shù)據(jù)空間進(jìn)行訪問 大大提高了d s p 的運(yùn)行 速度 3 開發(fā)工具 具有完善的軟件仿真工具和硬件開發(fā)工具 如 軟件開發(fā)環(huán) 境c c s 軟件仿真器s i m u l a t o r 在線仿真器e m u l a t o r c 編譯器 在線分析器 p r o f i l e 等 給開發(fā)帶來了極大的便利 其中c c s 軟件開發(fā)環(huán)境是t i 公司針對(duì)本 公司的d s p 產(chǎn)品開發(fā)的集成開發(fā)環(huán)境 它集成了代碼的編譯 鏈接和調(diào)試等諸 多功能 而且支持c c 和匯編的混合編程 開放式的結(jié)構(gòu)允許用戶外擴(kuò)自身的 模塊 隨著芯片工藝的不斷發(fā)展 d s p 性能的進(jìn)一步增強(qiáng) 為說話人識(shí)別技術(shù)走向 實(shí)踐應(yīng)用奠定了基礎(chǔ) 3 3 3 4 1 基于說話人識(shí)別的無線門禁系統(tǒng) 作為新型的現(xiàn)代 化智能化安全管理系統(tǒng) 它包括電子信息技術(shù) 計(jì)算機(jī)技術(shù) 無線通訊技術(shù) 生 物識(shí)別技術(shù)等諸多新技術(shù) 如何設(shè)置參考模板和測試模板 何時(shí)打開門鎖 遇到 特殊情況是否要發(fā)出警報(bào)等 以達(dá)到安全快捷的目的 是門禁系統(tǒng)最基本的功 能 在六十年代 計(jì)算機(jī)的應(yīng)用推動(dòng)了說話人識(shí)別的發(fā)展 日本的東京無線電研 究實(shí)驗(yàn)室 京都大學(xué)和n e c 實(shí)驗(yàn)室都制作了能夠進(jìn)行說話人識(shí)別的專用硬件 對(duì) 說話人識(shí)別領(lǐng)域進(jìn)行了開拓性的研究工作 近年來 高性能數(shù)字信號(hào)處理芯片 d s p d g i t i a l s i n g a l p o r e c s s 技術(shù)的迅速發(fā)展 為說話人識(shí)別的實(shí)時(shí)實(shí)現(xiàn)提供了 可能 說話人識(shí)別的研究人員也一直致力于語音識(shí)別專用芯片和系統(tǒng)的研究 但 是 大多數(shù)的語音識(shí)別專用芯片識(shí)別性能差 不具備實(shí)用的要求 直到近十年以 來 隨著說話人識(shí)別算法的深入研究和集成電路技術(shù)的發(fā)展 才出現(xiàn)了一些具有 實(shí)用價(jià)值和市場前景的說話人識(shí)別專用芯片 其中 較為成功的兩個(gè)芯片詳細(xì)介 紹如下 1 r s c 一3 6 4 由美國的公司開發(fā) 2 0 0 0 年開始生產(chǎn) 是一顆為消費(fèi)類電子產(chǎn)品應(yīng)用的低 價(jià)位的語音識(shí)別專用芯片 即r s 3 6 4 它使用預(yù)先學(xué)習(xí)好的人工神經(jīng)網(wǎng)絡(luò)進(jìn)行 4 碩f j 學(xué)位論文 非特定人語音識(shí)別 不需要經(jīng)過訓(xùn)練就可以識(shí)別 y e s o 0 k 等簡單語 句 其說明書上介紹其識(shí)別率為9 7 此外 r s c 3 6 4 可以識(shí)別特定人 孤立詞 命令語句 約6 0 條左右 其說明書上稱其識(shí)別率為9 9 以上 r s c 3 6 4 還具有 5 1 5 k b s 的語音合成 其語音合成由s n e s o r y 專門設(shè)計(jì) 其音質(zhì)較好 它還具 有改進(jìn)的a d p c m 自適應(yīng)差分脈沖調(diào)制 語音編解碼功能 用作語音回放 2 u n i s p e e c h s d a 8 0 d 5 1 德國i n f i n e o n 公司2 0 0 0 年開始生產(chǎn)的產(chǎn)品 它是一顆高性能的語音專用芯 片 這樣的設(shè)計(jì)能夠滿足立體聲處理或者消除外界干擾等功能要求 u n i s p e e c h s d a 8 0 d 5 l 的語音處理軟件包括 利用d t w 算法的特定人語音識(shí)別 能 夠識(shí)別1 0 0 條語句 利用h m m 算法的非特定人語音識(shí)別 詞匯量可以達(dá)到1 0 0 條 語句 高質(zhì)量 低碼率 2 4 1 3 k b s 的語音編解碼 用作語音提示和語音降低外 界的噪聲干擾 說話人識(shí)別功能等等 國內(nèi)在語音識(shí)別專用芯片的開發(fā)與研究方面起步較晚 比如清華大學(xué) 語音 識(shí)別專用芯片研究開發(fā) 課題 研究開發(fā)了國內(nèi)第一個(gè)具有自主知識(shí)產(chǎn)權(quán)的語音 識(shí)別專用芯片的軟件部分 該實(shí)驗(yàn)室是國內(nèi)最早專門從事語音技術(shù)與專用芯片設(shè) 計(jì)研究單位之一 芯片能夠識(shí)別約2 0 3 0 條特定人語音命令 同時(shí)具有語音合成 提示 與語音編解碼 回放 功能 語音識(shí)別率達(dá)到9 8 以上 隨著現(xiàn)代社會(huì)的發(fā)展 人們對(duì)門禁系統(tǒng)的要求越來越嚴(yán)格和現(xiàn)代化 智能化 門禁系統(tǒng)的應(yīng)用范圍也越來越廣泛 近年來 國內(nèi)的門禁市場增長比較快速 門禁管理系統(tǒng)應(yīng)用于現(xiàn)代化智能大廈的出入控制 公司考勤 安防報(bào)警等許多場 合 也出現(xiàn)了許多生產(chǎn)門禁管理系統(tǒng)的公司 也研發(fā)出許多新型的門禁控制系 統(tǒng) 國內(nèi)外研發(fā)和使用的門禁控制系統(tǒng)主要都使用r f i d 門禁系統(tǒng)和生物識(shí)別門 禁系統(tǒng) 從1 9 9 4 年r f i d 射頻卡 進(jìn)入中國 就帶動(dòng)了中國r f i d 卡的技術(shù)快速 革新 在國內(nèi)r j c l d 的應(yīng)用領(lǐng)域越來越廣 它的應(yīng)用也促進(jìn)了門禁管理系統(tǒng)的發(fā) 展 近年來我國經(jīng)濟(jì)總體水平明顯提高 各行各業(yè)對(duì)于現(xiàn)代化 智能化安防設(shè)備 的需求也會(huì)越來越多 安防產(chǎn)品也隨之迅速發(fā)展 目前在歐美的發(fā)達(dá)國家 它們的門禁系統(tǒng)市場已經(jīng)進(jìn)入到細(xì)化的階段 其產(chǎn) 業(yè)的分工越來越細(xì)化 生產(chǎn)卡的公司單獨(dú)生產(chǎn)卡 生產(chǎn)控制器的公司獨(dú)立生產(chǎn)控 制器和配套的軟件 都集中生產(chǎn)某一種產(chǎn)品 而不是生產(chǎn)所有的設(shè)備 最近幾年 歐美各大公司也開始投入到無線門禁系統(tǒng)的研究設(shè)計(jì) 生產(chǎn)中來 正是由于d s p 計(jì)算機(jī)數(shù)字化的大量普及 高性能的模擬數(shù)字電路的不斷完善 各種保護(hù)電路 的不斷成熟改進(jìn) 各種芯片的大幅降價(jià) 使得全世界的工程師才有機(jī)會(huì)設(shè)計(jì)出 性能良好 結(jié)構(gòu)完善 性價(jià)比極高的優(yōu)秀產(chǎn)品 表現(xiàn)出門禁系統(tǒng)對(duì)安防工作以及 對(duì)日常管理工作的真實(shí)貢獻(xiàn) 由于磁卡 接觸式i c 卡對(duì)操作環(huán)境的要求相對(duì)較高 磁卡及i c 卡容易磨損 本身的工作時(shí)間也是一定的 再加上識(shí)別過程中使用者的動(dòng)作和所需時(shí)間明顯的 5 鋤 耔 基丁說 五人識(shí)別的無線門禁系統(tǒng)的戍用研究 要多于非接觸式卡 所以 i c 卡和生物識(shí)別的門禁系統(tǒng)相比 有很多缺點(diǎn) 從 科學(xué)技術(shù)長遠(yuǎn)的發(fā)展角度上看 基于說話人識(shí)別的無線門禁系統(tǒng)或與以上技術(shù)相 結(jié)合的新型門禁產(chǎn)品將成為未來門禁系統(tǒng)發(fā)展的重要方向 本文針對(duì)說話人識(shí)別門禁系統(tǒng)的現(xiàn)狀 從研究與使用的角度出發(fā) 提出了基 于說話人識(shí)別的無線門禁系統(tǒng)并進(jìn)行相關(guān)的研究設(shè)計(jì) 主要研究設(shè)計(jì)是針對(duì)小區(qū) 的單元門禁 包括每個(gè)小區(qū)單元的主機(jī)與用戶端的分機(jī) 整個(gè)系統(tǒng)由一臺(tái)主機(jī)和 多個(gè)用戶端共同完成 本文針對(duì)用戶端進(jìn)行了設(shè)計(jì)研究 音頻編解碼模塊實(shí)現(xiàn)對(duì) 語音信號(hào)的采集 f l a s h 模塊實(shí)現(xiàn)說話人模板的存儲(chǔ) 主控模塊實(shí)現(xiàn)說話人識(shí) 別 無線模塊實(shí)現(xiàn)用戶端與主機(jī)之間的通信 用l e d 的狀態(tài)來實(shí)現(xiàn)說話人識(shí)別 的結(jié)果與電磁鎖的狀態(tài) 1 3 研究的主要內(nèi)容及論文結(jié)構(gòu) 論文共分五章 第一章為緒論 介紹選題的目的和意義 國內(nèi)外研究說話人識(shí)別的主要方法 d s p 的發(fā)展和主要特點(diǎn) 門禁系統(tǒng)的研究現(xiàn)狀以及論文的主要內(nèi)容 第二章詳細(xì)闡述了門禁系統(tǒng)的設(shè)計(jì)方案 說話人識(shí)別的基本原理 說話人識(shí) 別系統(tǒng)的構(gòu)成 對(duì)說話人語音信號(hào)處理的流程 詳細(xì)研究了動(dòng)態(tài)時(shí)問規(guī)整及改進(jìn) 算法的原理 采用雙門限檢測法 通過對(duì)過零率和短時(shí)能量參數(shù)的檢測來判斷起 始點(diǎn)和結(jié)束點(diǎn) 提取出語音信號(hào)數(shù)據(jù) 采用m e l i n 譜m f c c 提取語音信號(hào)的特征參 數(shù) 這些特征參數(shù)組成特征矢量 從而構(gòu)成參考的語音模板 在模式匹配中 采 用了改進(jìn)的動(dòng)態(tài)時(shí)間歸整d t w 方法 將測試模板與參考模板進(jìn)行匹配計(jì)算 比較 兩者之間的失真 最后計(jì)算出最小的匹配距離作為規(guī)整函數(shù)的路徑 從而得出說 話人識(shí)別判決的結(jié)果 第三章為基于說話人識(shí)別門禁系統(tǒng)的硬件電路設(shè)計(jì) 以要單元中各個(gè)用戶為 對(duì)象 詳細(xì)設(shè)計(jì)了整個(gè)系統(tǒng)的硬件結(jié)構(gòu)與元器件的選型標(biāo)準(zhǔn) 各個(gè)主要模塊電路 的構(gòu)成與p c b 制圖 電路的抗干擾設(shè)計(jì)等 第四章為系統(tǒng)的軟件設(shè)計(jì) 基于c c s 開發(fā)環(huán)境 采用并行e m i f 引導(dǎo)方式 實(shí)現(xiàn)了t m s 3 2 0 v c 5 5 0 9 ad s p 擴(kuò)展f l a s h 的在線燒寫 完成各個(gè)主要模塊的初 始化過程 采用c 語言完成語音識(shí)別工程及無線數(shù)據(jù)收發(fā)工程 第五章介紹了系統(tǒng)軟硬件調(diào)試過程 m a t l a b 仿真結(jié)果與移植的實(shí)現(xiàn)結(jié)果 最后為結(jié)論與展望 論述了論文的主要貢獻(xiàn)以及在研究中所遇到的主要不足 之處 指出接下來研究的主要方向 1 4 本章小結(jié) 本章介紹了論文選題的目的和意義 課題的國內(nèi)外研究現(xiàn)狀以及論文研究的 主要內(nèi)容 論文結(jié)構(gòu)等等 6 碩i j 學(xué)位論文 第2 章門禁系統(tǒng)的設(shè)計(jì)方案與相關(guān)理論研究 本文根據(jù)實(shí)際應(yīng)用 提出了基于說話人識(shí)別的無線門禁系統(tǒng) 主要目標(biāo)是基 于各個(gè)小區(qū)單元 以各個(gè)用戶為單位 實(shí)現(xiàn)用戶與樓宇單元門之間的無線通信并 且實(shí)現(xiàn)用戶端的說話人識(shí)別 以開啟用戶端自家的門鎖 達(dá)到便捷性 降低成本 等的目的 門禁系統(tǒng)的設(shè)計(jì)框圖如圖2 1 所示 在用戶端 通過采集說話人的語 音信號(hào) 經(jīng)過預(yù)處理 端點(diǎn)檢測 特征提取與參考模板相比較 輸出比較結(jié)果 如果匹配成功 則打開用戶端的門鎖 當(dāng)在小區(qū)單元門口來訪人員按下用戶門鈴 時(shí) 主機(jī)會(huì)通過無線收發(fā)模塊尋找用戶端的i d 號(hào) 進(jìn)而建立主機(jī)與用戶端的無 線連接 如果用戶允許來訪人員進(jìn)入 則用戶端給主機(jī)發(fā)個(gè)開鎖的信號(hào) 主機(jī)接 收到這個(gè)信號(hào)后 打開單元門 要實(shí)現(xiàn)這些要求 要解決的主要理論問題是說話 人識(shí)別的原理 語音采集 上 語音處理 上 模式匹配 l j r 結(jié)果輸出 無線通信 無線收發(fā)模塊 無線收發(fā)模塊 單元主機(jī)用戶端 2 1 說話人識(shí)別原理 圖2 1 門禁系統(tǒng)框圖 無論是小詞匯 特定人 文本有關(guān)的說話人識(shí)別 還是連續(xù)詞匯 非特定人 文本無關(guān)的說話人識(shí)別 其基本原理都是先要建立說話人語音信號(hào)特征參數(shù)的 參考模板 在進(jìn)行說話人識(shí)別時(shí) 先計(jì)算參考模板與測試模板兩幀之間的幀匹 配距離矩陣 再計(jì)算出最小的累積距離 作為規(guī)整函數(shù)的路徑 因此 若要實(shí)現(xiàn) 對(duì)說話人的識(shí)別 需解決以下幾個(gè)基本問題 1 對(duì)語音信號(hào)的加重 分幀 加窗 端點(diǎn)檢測和特征提取 2 建立說話人的參考模板和測試模板 3 計(jì)算測試模板與參考模板的最小累計(jì)距離 其中關(guān)鍵問題是建立說話人識(shí)別的參考模板 為了保證測試模板與參考模 7 幕于說話人識(shí)別的無線門禁系統(tǒng)的應(yīng)用研究 板的特征參數(shù)一致 常將每一說話人語音信號(hào)進(jìn)行預(yù)加重 分幀 加窗等 它 們的模型結(jié)構(gòu)取得相同 不同的只是模型中的參數(shù)l l l 伴隨著計(jì)算機(jī)和語音信號(hào) 處理 高速的d s p 芯片等外圍電路的不斷發(fā)展 說話人模型已經(jīng)從單一的d t w v q h m m a n n 等模型向著多模型方向發(fā)展 同時(shí)也從實(shí)驗(yàn)室無噪聲的背景 下向著復(fù)雜噪聲的應(yīng)用場合發(fā)展 說話人識(shí)別從實(shí)驗(yàn)環(huán)境走向?qū)嵱糜辛藞?jiān)實(shí)的理 論基礎(chǔ) 從本質(zhì)上講 說話人識(shí)別是一個(gè)語音信號(hào)的模式識(shí)別問題 它由訓(xùn)練和識(shí)別 兩個(gè)過程來完成 說話人識(shí)別的基本原理框圖如圖2 2 示 2 2 語音信號(hào)的預(yù)處理 圖2 2 說話人識(shí)別原理圖 在對(duì)語音信號(hào)進(jìn)行時(shí)域或頻域分析前 理 預(yù)處理主要包括對(duì)語音信號(hào)的預(yù)加重 2 2 1 預(yù)加重 首先要對(duì)語音信號(hào)進(jìn)行一定的預(yù)處 分幀和加窗 說話人的語音信號(hào)經(jīng)過a d 將模擬信號(hào)變?yōu)閿?shù)字信號(hào)后 依次存入一個(gè)數(shù) 據(jù)區(qū) 在語音信號(hào)處理中一般用循環(huán)隊(duì)列的方式來存儲(chǔ)這些數(shù)據(jù) 根據(jù)語音信號(hào) 產(chǎn)生的機(jī)制 高頻端大約在8 0 0 h z 以上按6 d b 倍頻程跌落 這就需要進(jìn)行預(yù)加 重來提升高頻部分 使信號(hào)的頻譜變得平坦 l 預(yù)加重一般是一階的數(shù)字濾波器 h z l z z 1u 值接近為1 2 1 u 決定截止頻率 此濾波器為單零點(diǎn)濾波器 呈高通特性 u 0 9 5 2 2 2 分幀與加窗 在完成預(yù)加重之后 要對(duì)語音信號(hào)要進(jìn)行分幀與加窗處理 根據(jù)語音信號(hào)的 短時(shí)平穩(wěn)性 語音信號(hào)以幀為單位進(jìn)行處理 一般每秒的幀數(shù)為3 3 1 0 0 幀 要 根據(jù)實(shí)際情況而定 分幀應(yīng)該采用部分互相交錯(cuò)的形式 目的是為了使語音信息 損失最小 幀與幀之間平滑的過渡 保持其連續(xù)性 前一幀與后一幀的重合部分 稱為幀移 幀移與幀長的比值一般取為0 1 2 幀與幀之間重合太多 會(huì)增大計(jì) 算量 重合太少會(huì)漏掉部分信息 分幀是通過一個(gè)有限長度窗口進(jìn)行加權(quán)的方法 來實(shí)現(xiàn) 用窗函數(shù)國 z 乘語音信號(hào)j 療 得到s 文功 s 功木奴功 本文采樣頻率 為8 k h z 每幀長2 4 0 點(diǎn) 3 0 m s 幀移8 0 點(diǎn) 采集3 秒的數(shù)據(jù) 約為1 2 0 幀 窗函數(shù)緲 長度與形狀的選擇 影響到短時(shí)參數(shù)的分析 因此在對(duì)說話人 8 從表2 1 可以看出 漢明窗的帶寬增加一倍 能減小時(shí)間窗兩端的坡度 使 得語音信號(hào)能夠很平滑的過渡 語音信號(hào)變化的幅度不是很大 減小語音幀的截 斷效應(yīng) 所以本文選擇漢明窗 2 3 語音信號(hào)的端點(diǎn)檢測 從背景的噪聲環(huán)境中提取出說話人語音信號(hào)的特征信息不是一件容易的事 情 一個(gè)比較好的端點(diǎn)檢測算法可以精確的檢測到語音信號(hào)的開始點(diǎn)與結(jié)束點(diǎn) 在一定程度上能夠有效提高說話人識(shí)別系統(tǒng)的識(shí)別率 信號(hào)的幅度用短時(shí)能量 來表示 過零率定義為一幀語音信號(hào)穿越零電平的次數(shù) 兩者的結(jié)合可以有效的 檢測到語音信號(hào)的起始點(diǎn)和終止點(diǎn) 故本文采用短時(shí)能量和過零率的雙門限檢測 殿 法來進(jìn)行端點(diǎn)檢測 并把可容忍的靜音區(qū)問延長為1 5 幀 設(shè)語音波形的時(shí)域信號(hào)為x t 加窗分幀處理后得得的第n 幀語音信號(hào)為 勘 朋 則勛 聊 滿足 洳 聊 w 冊(cè) x z 歷 0 m n l 2 4 其中 w 腳 為漢明窗 n 0 lt 2 t 并且n 為幀移長度 設(shè)第n 幀語音信號(hào)渤 聊 的短時(shí)能量用e 甩表示 則 v e n l 渤 圳 2 5 n 1 e 玎 y x 2 肌 2 6 一 n 1 v e n l o g x 2 m 2 7 n l 表達(dá)式分別為絕對(duì)值的累加 平方累加和平方的對(duì)數(shù)的累加 只是表達(dá)方 式的不同 實(shí)質(zhì)上是一致的 選擇其中的一種就可以 根據(jù)人的發(fā)音機(jī)理和聲道 模型 人的語音信號(hào)分清音和濁音兩種 濁音的幅度相對(duì)高 相對(duì)的能量也比較 9 藎于說話人識(shí)別的無線門禁系統(tǒng)的麻用研究 大 而清音的幅度比較小 所以可以用短時(shí)能量來區(qū)分清音段與濁音段 根據(jù) 實(shí)驗(yàn)及前人的工作總結(jié) 短時(shí)能量高門限的值為t 氐f j 限的5 倍 通過觀察比較能夠發(fā)現(xiàn) 在靜音段語音信號(hào)的短時(shí)能量低門限很容易被超 過 能量比較低 波形的變化相對(duì)平緩 而在語音段 語音信號(hào)的能量已經(jīng)超 過了雙門限中的高門限 幅度變化比較劇烈 通常用一幀信號(hào)中波形穿越零電平 的次數(shù)來表達(dá)這種變化的程度 稱為過零率 它的公式是 z n l s g n x m 一s g n x m 1 w 刀一肌 i 聊5 一 2 8 n n l i s g n 工 朋 卜s g n x 一1 w 刀一朋 l 式中 s g n 是符號(hào)函數(shù) 即 唧瞰糾 鼉蒜 9 而w n 為窗口序列 設(shè) 以班j 專 刀 旺 10 其它 在實(shí)際的應(yīng)用中 靜音段的隨機(jī)噪聲有可能會(huì)產(chǎn)生過高的過零率 往往先 設(shè)定一個(gè)低門限 在靜音段 如果短時(shí)能量或過零率超過低門限 就認(rèn)為是起 始點(diǎn) 進(jìn)入到過渡段 在語音段 一些突發(fā)性的噪聲也可能引起短時(shí)能量或過零 率的數(shù)值較高 但是往往不能維持很長時(shí)間 如果兩個(gè)參數(shù)的數(shù)值降低到低門限 以下 且一直持續(xù)1 5 幀 則認(rèn)為是一段噪音而放荊3 4 語音進(jìn)入停止 如果說 話人的語音信號(hào)中包含2 個(gè)字的時(shí)間間隔很長 雙門限端點(diǎn)檢測法有可能只檢 測到第一個(gè)字 從而導(dǎo)致語音信號(hào)端點(diǎn)檢測的錯(cuò)誤 漏掉需要檢測的語音信息 使得語音信號(hào)的識(shí)別率下降 如圖2 3 所示 檢測到語音信號(hào)中 你好 的第一 個(gè)字 為了避免這種情況 這需要把雙門限端點(diǎn)檢測可容忍的靜音區(qū)間適當(dāng)?shù)?延長 本文把靜音區(qū)間設(shè)置為1 5 幀 假設(shè)1 5 幀之內(nèi)語音信號(hào)沒有短時(shí)能量或 過零率超過低門限 就認(rèn)為語音信號(hào)結(jié)束 反之 則把短時(shí)能量和過零率計(jì)算在 內(nèi)語音段內(nèi) 圖2 4 是以語音 你好 為例 是改進(jìn)后的雙門限端點(diǎn)檢測 可以 精確的檢測到語音的起始點(diǎn)和終止點(diǎn) 1 0 圖2 3 改進(jìn)前的端點(diǎn)檢測圖2 4 改進(jìn)后的端點(diǎn)檢測 根據(jù)前面的理論分析 短時(shí)過零率可以檢測到語音信號(hào)的清音段 短時(shí)能量 可以檢測到濁音段 所以采用延長幀的雙門限端點(diǎn)檢測法可以準(zhǔn)確的判斷語音 信號(hào)的起始點(diǎn)和結(jié)束點(diǎn) 使得端點(diǎn)檢測更精確 丟棄一些噪聲信號(hào)幀 減少系統(tǒng) 的計(jì)算量 降低噪聲對(duì)系統(tǒng)性能的影響 采用改進(jìn)后的端點(diǎn)檢測算法 對(duì)單個(gè)漢 字或多個(gè)漢字的語音命令均識(shí)別正常 2 4 語音信號(hào)的特征提取 在說話人識(shí)別時(shí) 特征參數(shù)的選取是至關(guān)重要的 能夠表征說話人個(gè)性的特 征有 語音幀能量 基因頻率 語音信號(hào)的短時(shí)頻譜 線性預(yù)測系數(shù) 倒譜特征 基因輪廓特征等 目前進(jìn)行語音信號(hào)特征分析最有效 最重要的方法有線性預(yù)測 系數(shù)和美爾倒譜系數(shù) 躲 2 4 1 線性預(yù)測系數(shù) 說話人的語音信號(hào)是一種典型的時(shí)變信號(hào) 如果語音信號(hào)的觀察時(shí)間盡可能 短 則語音信號(hào)可以看做是近似平穩(wěn)的信號(hào) 全極點(diǎn)線性預(yù)測模型l p c l i n e a r p r e d i c t i v ec o d i n g 簡稱l p c 可以對(duì)聲管模型進(jìn)行很好的描述 它的基本思想是 利用語音信號(hào)的相關(guān)性 用過去的取樣值來預(yù)測現(xiàn)在或未來的取樣值 即利用 過去若干個(gè)語音信號(hào)的取樣值與線性組合來逼近語音信號(hào)的取樣值 l p c 是基 于發(fā)音模型建立的 對(duì)于一個(gè)l p c 系統(tǒng) 采樣點(diǎn)n 的輸出s n 用p 個(gè)樣本的線 性組合來表示 一 s n a l s n 一1 口2 s n 2 口 口s n p q 口2 a p 為常數(shù) 2 1 1 口 上式可簡寫為s 珂 吼
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年職業(yè)安全健康管理師考試題及答案
- 2025年機(jī)械工程師資格認(rèn)證考試試卷及答案
- 2025年外語翻譯資格考試試卷及答案指南
- 2025年電信工程與技術(shù)應(yīng)用考試卷及答案
- 城市綜合體戶外廣告位租賃及廣告發(fā)布合同
- 檔案館數(shù)字化設(shè)備租賃與升級(jí)改造服務(wù)協(xié)議
- 電力設(shè)施安裝補(bǔ)充協(xié)議
- 互動(dòng)式網(wǎng)絡(luò)廣告投放效果評(píng)估合同
- 法拍房交易權(quán)利瑕疵鑒定與風(fēng)險(xiǎn)控制合同
- 電視劇群眾演員招募與角色扮演培訓(xùn)協(xié)議
- 《家具設(shè)計(jì)》課件
- 任務(wù)一淘米(教學(xué)課件)一年級(jí)下冊(cè)勞動(dòng)技術(shù)(人美版)
- 門頭承包合同協(xié)議書范本
- 2024年江西省高考化學(xué)試卷(真題+答案)
- 高壓開關(guān)柜基礎(chǔ)知識(shí)培訓(xùn)課件
- 企業(yè)臨時(shí)用工合同范本(5篇)
- 質(zhì)量三體系課件
- 卡介苗的接種課件
- 瀝青路面設(shè)計(jì)說明
- 路基路面平整度試驗(yàn)檢測記錄表(三米直尺法)
- 60kv變電站電氣部分設(shè)計(jì)
評(píng)論
0/150
提交評(píng)論