數(shù)字語音處理及MATLAB仿真.rar第一章._第1頁
數(shù)字語音處理及MATLAB仿真.rar第一章._第2頁
數(shù)字語音處理及MATLAB仿真.rar第一章._第3頁
數(shù)字語音處理及MATLAB仿真.rar第一章._第4頁
數(shù)字語音處理及MATLAB仿真.rar第一章._第5頁
已閱讀5頁,還剩15頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、豪rr亠處孝數(shù)字語音處理尺M(jìn)ATLAB仿真 張習(xí)英編著數(shù)字語音處理及MATLAB仿真數(shù)字語音處理及MATLAB仿真張雪英太原理工大學(xué)信息工程學(xué)院張雪英編著College of Information Engineering, TaiyuanUniversity of Technology諫程總括課程性質(zhì)課程貝的和任務(wù)課程重點(diǎn) 課程難點(diǎn)2豪rr亠處孝數(shù)字語音處理尺M(jìn)ATLAB仿真 張習(xí)英編著2豪rr亠處孝數(shù)字語音處理尺M(jìn)ATLAB仿真 張習(xí)英編著2數(shù)字語音處理及MATLAB仿真 張雪英編玉數(shù)字語音處理及MATLAB仿真 張雪英編玉無程性質(zhì)語音信號處理是通信、電子信息專業(yè)的選 修課程,主要用于現(xiàn)代

2、通信和電子信息領(lǐng)域, 其主要前修專業(yè)基礎(chǔ)課程為信號與系統(tǒng)和數(shù)字 信號處理。數(shù)字語音處理及MATLAB仿真 張雪英編玉課程目的和任務(wù)通過本課程的學(xué)習(xí)理解語音發(fā)聲和聽覺機(jī)理 及其數(shù)字模型;掌握語音信號處理的基本概念、 原理和方法,為以后的學(xué)習(xí)提供理論依據(jù);掌握 語音信號的短時(shí)時(shí)域分析和頻域分析方法,并且 能夠用Mat I ab語言編程實(shí)現(xiàn)對實(shí)際語音信號進(jìn)行的處理;熟悉語音信號處理的應(yīng)用領(lǐng)域,并了解 該領(lǐng)域的新理論、新技術(shù)和發(fā)展趨勢,為今后的 進(jìn)一步學(xué)習(xí)和工作打下堅(jiān)實(shí)的基礎(chǔ)。課程重點(diǎn)語音信號的產(chǎn)生和語音信號數(shù)字模型。短時(shí) 能量、平均過零率、自相關(guān)的意義,以及這些特 征參量在語音信號中的應(yīng)用,并且會用

3、 MATLAB實(shí)現(xiàn)。短時(shí)頻域分析的兩種解釋以及 實(shí)現(xiàn)、LPC的基本原理以及與語音模型的關(guān)系.前饋和反饋的主要區(qū)別,另外增量調(diào)制中所造成 的失真以及失真補(bǔ)償。矢量量化原理、LBG算法 以及實(shí)驗(yàn)。數(shù)字語音處理及MATLAB仿翼張雪英編著課程難點(diǎn)語音信號的產(chǎn)生和激勵(lì).端點(diǎn)檢測和基音周期的估計(jì).用數(shù)學(xué)公式來證明短時(shí)頻譜是如何反 映整個(gè)語音信號的頻譜的、ITC方程組解法、自 適應(yīng)預(yù)測編碼原理、LBG算法以及實(shí)驗(yàn)中的分幀 和基音周期檢測。數(shù)字語音處理及MATLAB仿翼張雪英編箸r1.5 MATLA數(shù)字語音處理及MATLAB仿真張雪英編著1.1概述數(shù)字語音處理及MATLAB仿真 張雪英編著飛i章緒論1,1.

4、概述1.2語音信號處理的發(fā)展1. -3.語音信號處理的應(yīng)用及新方向1.4語音信號處理過程的總體結(jié)構(gòu)理中的應(yīng)用數(shù)字語音處理及MATLAB仿翼張雪英編箸語音信號處理是一門新興的邊緣學(xué)科,是語音 學(xué)與數(shù)字信號處理兩個(gè)學(xué)科相結(jié)合的產(chǎn)物。它和認(rèn) 知科學(xué)、心理學(xué)、語言學(xué).計(jì)算機(jī)科學(xué).模式識別 和人工智能等學(xué)科有著緊密的聯(lián)系。語音信號處理的目的: 得到某些語音特征參數(shù)以便高效地傳輸或存儲;通過某種處理運(yùn)算以達(dá)到某種用途的要求。語音信息的交換大致上可以分為三大類:(1)人與人之間的語言通信:包括語音壓縮與編碼、語音增強(qiáng)等。(2)第一類人機(jī)語言通信問題:語音合成,機(jī)器講話、人聽話的研究。(3)第二類人機(jī)語言通信

5、問題:語音識別和理解 語音識別和理解:人講話、機(jī)器聽話的情況。數(shù)字語音處理及MATLAB仿真張雪英編爭h喬菩祜號處理的發(fā)展'數(shù)字語音處理及MATLAB仿真 張雪英編爭1.2語音信號處理的發(fā)展數(shù)字語音處理及MATLAB仿真 張雪英編爭1.2.1 語音合成數(shù)字語音處理及MATLAB仿真 張雪英編爭數(shù)字語音處理及MATLAB仿真 張雪英編爭以語言信息壓縮、存儲為主要目的對語音信號數(shù)字模型進(jìn)行研究,同時(shí)研究音素、音節(jié).詞數(shù)字語音處理及MATLAB仿真 張雪英編爭組與句子的發(fā)音規(guī)則。最終恢復(fù)出自然流暢的語 音來。例如文語轉(zhuǎn)換系統(tǒng)(Text-to-speech)o語音 分析與合成將賦予計(jì)算機(jī)說話的

6、功能。也是進(jìn)行 話音編碼、語音識別研究的基礎(chǔ)。1.2.2語音編碼語音編碼的目的:在保證一定語音質(zhì)量的前提下,盡可能降低 編碼比特率,以節(jié)省頻率資源。數(shù)字語音處理及MATLAB仿真 張雪英編爭1.2.2 語苜編碼語音編碼與文本到語音轉(zhuǎn)換兩個(gè)主要區(qū)別一、前者是人與人之間的話音交流,要保說話人的聲音特征。后者是文本到聲音的轉(zhuǎn)換即 計(jì)算機(jī)發(fā)聲。它可以是標(biāo)準(zhǔn)播音員或其它聲音。二.前者不僅対壓縮率和音質(zhì)有要求,而且 要求較低的編、解碼延遲。而后者對處理幀長沒 有什么太嚴(yán)格的限制。數(shù)字語音處理及MATLAB仿真 張雪英編爭歸入同一類應(yīng)用。數(shù)字語音處理及MATLAB仿真 張雪英編玉1.2.3語音識別研究如何使

7、計(jì)算機(jī)能夠聽懂人類的語言。以 漢語語音為例:漢語約有400個(gè)音節(jié),加上聲調(diào)約1200個(gè)音調(diào)節(jié),把這些語音信號的特征存儲到計(jì)算機(jī)內(nèi),并與計(jì)算機(jī)接收到的漢語發(fā)音進(jìn)行比較, 找到特征相同的音節(jié)或音調(diào)節(jié),這個(gè)過程就是語 音識別。將識別出的音節(jié)序列轉(zhuǎn)換成文字,就是 語言理解。許多算法將理解過程溶入到識別中來 提高識別的準(zhǔn)確性。因此可以將語音識別與理解(1) 根據(jù)對說話人說話方式的要求,可以分 為孤立字語音識別系統(tǒng),連接字語音識別系統(tǒng)以 及連續(xù)語音識別系統(tǒng)。(2) 根據(jù)對說話人的依賴程度可以分為特定 人和非特定人語音識別系統(tǒng)。(3) 根據(jù)詞匯量大小,可以分為小詞匯量. 中等詞匯量、大詞匯量以及無限詞匯量語

8、音識別 系統(tǒng)。理的應(yīng)用及新方向-:語音信號處理的應(yīng)用語音技術(shù)的應(yīng)用領(lǐng)域包括語音識別、說話人的鑒別和確認(rèn)、語種的鑒 別和確認(rèn)、關(guān)鍵詞檢測和確認(rèn)、語音合成、語音 編碼等。但其中最具有挑戰(zhàn)性和最富有應(yīng)用前景的為語音 識別技術(shù)。數(shù)字語音處理幾MATLAB仿真 張雪英編爭1.說話人識別技術(shù)的應(yīng)用安全加密、銀行信息電話查詢服務(wù)公安機(jī)關(guān)破案和法庭取證方面在聲控應(yīng)用中,識別輸入的語音內(nèi)容,并根據(jù)內(nèi)容來執(zhí)行相 應(yīng)的動作,這包括了聲控電話轉(zhuǎn)換、聲控語音撥號系統(tǒng)、聲 控智能玩具、信息網(wǎng)絡(luò)查詢、家庭服務(wù).賓館服務(wù)、旅行社 服務(wù)系統(tǒng)、醫(yī)療服務(wù)、股票查詢服務(wù)和工業(yè)控制等。數(shù)字語音處理幾MATLAB仿真 張雪英編爭1.說話

9、人識別技術(shù)的應(yīng)用在電話與通信系統(tǒng)中,智能語音接口正在把 電話機(jī)從一個(gè)單純的服務(wù)工具變成為一個(gè)服務(wù)的 “提供者”和生活“伙伴”。目前,自動口語分析、用戶交換機(jī)、電話機(jī)、 手機(jī)已經(jīng)包含了語音識別撥號功能,還有語音記事 本、語音智能玩具等產(chǎn)品也包含了語音識別與語音 合成功能。人們可以通過電話網(wǎng)絡(luò)用語音識別口語 對話系統(tǒng)査詢有關(guān)的機(jī)票、旅游、銀行信息。數(shù)字語音處理及MATLAB仿真張常英編爭22數(shù)字語音處理幾MATLAB仿真 張雪英編爭22數(shù)字語音處理幾MATLAB仿真 張雪英編爭2. 語音合成的應(yīng)用公交汽車上的自動報(bào)站、各種場合的自動報(bào)時(shí)、自動報(bào)警、手機(jī)查詢服務(wù)和各種文本校對中 的語音提示、在電信聲

10、訊服務(wù):如股票.售后服 務(wù)、車站查詢等信息;也可用于基于微型機(jī)的辦公、教學(xué)、娛樂等智能多媒體軟件,例如語言學(xué) 語音合成技術(shù)與機(jī)器翻譯技術(shù)結(jié)合,實(shí)現(xiàn)語音翻 譯等。習(xí)、教學(xué)軟件.語音玩具.語音書(等;也可與3. 語音編碼的應(yīng)用在移動通信、衛(wèi)星通信、軍事保密通信、信息 高速公路和1P電話通信中的應(yīng)用。在個(gè)人移動通信、語音存儲、多媒體通信、數(shù) 字?jǐn)?shù)據(jù)網(wǎng)(DDN)中的應(yīng)用。未來的ISDN、衛(wèi)星通信、移動通信、微波接 力通信和信息高速公路以及保密電話等中的應(yīng)用。數(shù)字語音處理幾MATLAB仿真 張雪英編爭21二、語音信號處理的新方向(1)基于語音的信息檢索。網(wǎng)絡(luò)技術(shù)及數(shù)字圖書館 技術(shù)的發(fā)展,基于語音識別的信

11、息檢索技術(shù)正成為 研究熱點(diǎn)。(2)基于語音識別的廣播新聞的自動文摘技術(shù)的研 究。由于廣播、電視中的發(fā)音較為標(biāo)準(zhǔn)規(guī)范,在識 別中避免了說話人發(fā)音上的不規(guī)范,有利于語音識 別系統(tǒng)性能的提高。二、語音信號處理的新方向(3) VoIP技術(shù)。是通過TCP/IP網(wǎng)絡(luò),而不是傳統(tǒng)的 電話網(wǎng)絡(luò)來傳輸語音的新的通信方式,通常稱之為IP電話技術(shù)。在網(wǎng)絡(luò)上對壓縮的語音數(shù)據(jù)以數(shù)據(jù)包的形式進(jìn)行傳輸和識別。(4)語音訓(xùn)練與校正技術(shù)?,F(xiàn)在越來越多的人希望23掌握其他非母語語言,以便方便的進(jìn)行交流。因此 語言學(xué)習(xí)機(jī)已成為當(dāng)今外語學(xué)習(xí)者的有利工具。22數(shù)字語音處理幾MATLAB仿真 張雪英編爭22數(shù)字語音處理幾MATLAB仿真

12、 張雪英編爭數(shù)字語音處理及MATLAB仿真 張雪英編爭二、語音信號處理的新方向(5)語種識別。是近年來新出現(xiàn)的研究方向,通過 分析處理一個(gè)語音片斷來判別其所屬語音的種類, 本質(zhì)上屬于語音識別的研究范疇。(6)基于語音的情感處理研究。在人與人的交流中, 除了語音信息外,非語言信息也起著重要的作用。 為了使人機(jī)交流更自然.更人性化,基于語音的情;處理研究也是非常必要的。22信息加工和處理的一般流程如11所示數(shù)字語音處理及MATLAB仿真 張雪英編爭百番著著喜一處理過程的總體結(jié)構(gòu)圖11信號處理和加工的一般示意圖數(shù)字語音處理及MATLAB仿真 張雪英編爭25語音處理過程的結(jié)構(gòu)框圖語音輸入預(yù)處理1數(shù)字化

13、特征提取傳蒯解壓縮;語音輸世壓縮處理加存儲語音識別參考模式庫 |模玨K識別結(jié)果數(shù)字語音處理及MATLAB仿真 張雪英編玉1.5 MATLAB在數(shù)字語音信號處理中的應(yīng)用數(shù)字語音信號處理是將數(shù)字信號處理與語音學(xué) 相結(jié)合,解決現(xiàn)代通信領(lǐng)域中人與人、人與機(jī)器之 間的信息交流的學(xué)科。MATLAB是一種功能強(qiáng)大、效率高、交互性 好的計(jì)算機(jī)高級語言。近年來MATLAB已成為學(xué)習(xí)語音信號處理和 進(jìn)行研究工作的仿真軟件工具。數(shù)字語音處理及MATLAB仿真張雪英編著MATLAB在數(shù)字語音信號中的幾方面應(yīng)用:(1) 通過MATLAB可以對數(shù)字化的語音信號進(jìn) 行時(shí)頻域分析。(2) 通過MATLAB可以對數(shù)字化的語音信

14、號進(jìn) 行估計(jì)和判別。(3) 通過利用MATLAB編程對語音信號進(jìn)行處本書中的程序?qū)嵗肕ATLAB語言編寫,供 大家上機(jī)實(shí)踐時(shí)參考。數(shù)字語音信號處理研究內(nèi)容涉及三方面相互密切配合的任務(wù)和課題:1 應(yīng)用2. 基礎(chǔ)理論和算法3. 硬件系統(tǒng)1.應(yīng)用方面通信產(chǎn)業(yè)起源于1874年電話的發(fā)明。從那時(shí) 起,通信產(chǎn)業(yè)大致發(fā)生了三次重大變革。第一次變革產(chǎn)生于七十年代初。1972年 CCITT組織公布了第一個(gè)語音編碼標(biāo)準(zhǔn)G.711o 即對數(shù)PCM編碼,由此開始,數(shù)字程控交換網(wǎng)絡(luò) 逐步淘汰了傳統(tǒng)的模擬交換傳輸方式。數(shù)字語音處理及MATLAB仿真 張雪英編玉(1) 第二次重大變革產(chǎn)生于八十年代末。1988年 歐共體

15、13個(gè)國家數(shù)字移動特別工作組(GSM)制定了 采用長時(shí)預(yù)測規(guī)則碼激勵(lì)的編碼標(biāo)準(zhǔn)(13k bps RPE-LTP)。1989年美國蜂窩通信工業(yè)協(xié)會(CITA)宣布了 北美數(shù)字移動通信話音編碼標(biāo)準(zhǔn)(8K bps矢量和激 勵(lì)VSELP) o從而確立了全球范圍第二個(gè)傳輸網(wǎng)移 動通信產(chǎn)業(yè)的崛起。數(shù)字語音處理及MATLAB仿真 張雪英編爭(2) 第三次變革發(fā)生在世紀(jì)之交。以新興的計(jì)算機(jī)因特網(wǎng)為基礎(chǔ)的信息高速公路在全世界范圍迅速發(fā)展。如何在INTERNET網(wǎng)上有效地傳輸話音成為產(chǎn)業(yè)界關(guān)注的焦點(diǎn)。IP電話將使因特網(wǎng)成為第三個(gè)話音通信傳輸網(wǎng)。目前1P電話所用的話音編碼標(biāo)準(zhǔn)有G.723.1、G.728、G.729等。這些標(biāo)準(zhǔn) 各有長短。人們正在努

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論