語(yǔ)音信號(hào)處理--第一章_第1頁(yè)
語(yǔ)音信號(hào)處理--第一章_第2頁(yè)
語(yǔ)音信號(hào)處理--第一章_第3頁(yè)
語(yǔ)音信號(hào)處理--第一章_第4頁(yè)
語(yǔ)音信號(hào)處理--第一章_第5頁(yè)
已閱讀5頁(yè),還剩30頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、2022-5-10語(yǔ)音信號(hào)處理 胡航 編著1語(yǔ)音信號(hào)處理語(yǔ)音信號(hào)處理 王小蘭王小蘭 20132013年年9 9月月2022-5-10語(yǔ)音信號(hào)處理 胡航 編著22022-5-102課程總括課程總括課程性質(zhì)課程性質(zhì)1 課程目的和任務(wù)課程目的和任務(wù) 2課程重點(diǎn)課程重點(diǎn) 3課程難點(diǎn)課程難點(diǎn) 42022-5-10語(yǔ)音信號(hào)處理 胡航 編著3課程性質(zhì)課程性質(zhì) 語(yǔ)音信號(hào)處理是通信、電子信息專業(yè)的選語(yǔ)音信號(hào)處理是通信、電子信息專業(yè)的選修課程,主要用于現(xiàn)代通信和電子信息領(lǐng)域,修課程,主要用于現(xiàn)代通信和電子信息領(lǐng)域,其主要前修專業(yè)基礎(chǔ)課程為信號(hào)與系統(tǒng)和數(shù)字其主要前修專業(yè)基礎(chǔ)課程為信號(hào)與系統(tǒng)和數(shù)字信號(hào)處理。信號(hào)處理。

2、 2022-5-10語(yǔ)音信號(hào)處理 胡航 編著4課程目的和任務(wù)課程目的和任務(wù) 通過(guò)本課程的學(xué)習(xí)理解語(yǔ)音發(fā)聲和聽(tīng)覺(jué)機(jī)理通過(guò)本課程的學(xué)習(xí)理解語(yǔ)音發(fā)聲和聽(tīng)覺(jué)機(jī)理及其數(shù)字模型;掌握語(yǔ)音信號(hào)處理的基本概念、及其數(shù)字模型;掌握語(yǔ)音信號(hào)處理的基本概念、原理和方法,為以后的學(xué)習(xí)提供理論依據(jù);掌握原理和方法,為以后的學(xué)習(xí)提供理論依據(jù);掌握語(yǔ)音信號(hào)的短時(shí)時(shí)域分析和頻域分析方法,并且語(yǔ)音信號(hào)的短時(shí)時(shí)域分析和頻域分析方法,并且能夠用能夠用MatlabMatlab語(yǔ)言編程實(shí)現(xiàn)對(duì)實(shí)際語(yǔ)音信號(hào)進(jìn)行語(yǔ)言編程實(shí)現(xiàn)對(duì)實(shí)際語(yǔ)音信號(hào)進(jìn)行的處理;熟悉語(yǔ)音信號(hào)處理的應(yīng)用領(lǐng)域,并了解的處理;熟悉語(yǔ)音信號(hào)處理的應(yīng)用領(lǐng)域,并了解該領(lǐng)域的新理論、

3、新技術(shù)和發(fā)展趨勢(shì),為今后的該領(lǐng)域的新理論、新技術(shù)和發(fā)展趨勢(shì),為今后的進(jìn)一步學(xué)習(xí)和工作打下堅(jiān)實(shí)的基礎(chǔ)。進(jìn)一步學(xué)習(xí)和工作打下堅(jiān)實(shí)的基礎(chǔ)。2022-5-10語(yǔ)音信號(hào)處理 胡航 編著5課程重點(diǎn)課程重點(diǎn) 語(yǔ)音信號(hào)的產(chǎn)生和語(yǔ)音信號(hào)數(shù)字模型。短時(shí)語(yǔ)音信號(hào)的產(chǎn)生和語(yǔ)音信號(hào)數(shù)字模型。短時(shí)能量、平均過(guò)零率、自相關(guān)的意義,以及這些特能量、平均過(guò)零率、自相關(guān)的意義,以及這些特征 參 量 在 語(yǔ) 音 信 號(hào) 中 的 應(yīng) 用 , 并 且 會(huì) 用征 參 量 在 語(yǔ) 音 信 號(hào) 中 的 應(yīng) 用 , 并 且 會(huì) 用MATLAB實(shí)現(xiàn)。短時(shí)頻域分析的兩種解釋以及實(shí)現(xiàn)。短時(shí)頻域分析的兩種解釋以及實(shí)現(xiàn)、自適應(yīng)量化的實(shí)現(xiàn)、自適應(yīng)量化的P

4、CM,自適應(yīng)預(yù)測(cè)編碼原,自適應(yīng)預(yù)測(cè)編碼原理以及前饋和反饋的主要區(qū)別。理以及前饋和反饋的主要區(qū)別。2022-5-10語(yǔ)音信號(hào)處理 胡航 編著6課程難點(diǎn)課程難點(diǎn) 語(yǔ)音信號(hào)的產(chǎn)生和激勵(lì)、端點(diǎn)檢測(cè)和基音周語(yǔ)音信號(hào)的產(chǎn)生和激勵(lì)、端點(diǎn)檢測(cè)和基音周期的估計(jì)、用數(shù)學(xué)公式來(lái)證明短時(shí)頻譜是如何反期的估計(jì)、用數(shù)學(xué)公式來(lái)證明短時(shí)頻譜是如何反映整個(gè)語(yǔ)音信號(hào)的頻譜、自適應(yīng)預(yù)測(cè)編碼原理以映整個(gè)語(yǔ)音信號(hào)的頻譜、自適應(yīng)預(yù)測(cè)編碼原理以及實(shí)驗(yàn)中的分幀和基音周期檢測(cè)。及實(shí)驗(yàn)中的分幀和基音周期檢測(cè)。 2022-5-10語(yǔ)音信號(hào)處理 胡航 編著7第第1 1章章 緒論緒論1.1 概述概述11.2 語(yǔ)音信號(hào)處理的發(fā)展語(yǔ)音信號(hào)處理的發(fā)展21.

5、3 語(yǔ)音信號(hào)處理的應(yīng)用及新方向語(yǔ)音信號(hào)處理的應(yīng)用及新方向31.4 語(yǔ)音信號(hào)處理過(guò)程的總體結(jié)構(gòu)語(yǔ)音信號(hào)處理過(guò)程的總體結(jié)構(gòu)41.5 MATLAB在數(shù)字語(yǔ)音信號(hào)處在數(shù)字語(yǔ)音信號(hào)處 理中的應(yīng)用理中的應(yīng)用 52022-5-10語(yǔ)音信號(hào)處理 胡航 編著8 語(yǔ)音信號(hào)處理是一門(mén)新興的邊緣學(xué)科,是語(yǔ)音語(yǔ)音信號(hào)處理是一門(mén)新興的邊緣學(xué)科,是語(yǔ)音學(xué)與數(shù)字信號(hào)處理兩個(gè)學(xué)科相結(jié)合的產(chǎn)物。它和認(rèn)學(xué)與數(shù)字信號(hào)處理兩個(gè)學(xué)科相結(jié)合的產(chǎn)物。它和認(rèn)知科學(xué)、心理學(xué)、語(yǔ)言學(xué)、計(jì)算機(jī)科學(xué)、模式識(shí)別知科學(xué)、心理學(xué)、語(yǔ)言學(xué)、計(jì)算機(jī)科學(xué)、模式識(shí)別和人工智能等學(xué)科有著緊密的聯(lián)系。和人工智能等學(xué)科有著緊密的聯(lián)系。 語(yǔ)音信號(hào)處理的目的:語(yǔ)音信號(hào)處理的

6、目的: 得到某些語(yǔ)音特征參數(shù)得到某些語(yǔ)音特征參數(shù)以便高效地傳輸或存儲(chǔ);以便高效地傳輸或存儲(chǔ); 通過(guò)某種處理運(yùn)算以達(dá)到某種用途的要求通過(guò)某種處理運(yùn)算以達(dá)到某種用途的要求。 1.1 概述概述 2022-5-10語(yǔ)音信號(hào)處理 胡航 編著9 語(yǔ)音信息的交換大致上可以分為三大類:語(yǔ)音信息的交換大致上可以分為三大類: (1)人與人之間的語(yǔ)言通信:)人與人之間的語(yǔ)言通信: 包括語(yǔ)音壓縮與編碼、語(yǔ)音增強(qiáng)等。包括語(yǔ)音壓縮與編碼、語(yǔ)音增強(qiáng)等。 (2)第一類人機(jī)語(yǔ)言通信問(wèn)題:)第一類人機(jī)語(yǔ)言通信問(wèn)題: 語(yǔ)音合成,機(jī)器講話、人聽(tīng)話的研究。語(yǔ)音合成,機(jī)器講話、人聽(tīng)話的研究。 (3)第二類人機(jī)語(yǔ)言通信問(wèn)題:)第二類人機(jī)語(yǔ)

7、言通信問(wèn)題:語(yǔ)音識(shí)別和理解語(yǔ)音識(shí)別和理解 語(yǔ)音識(shí)別和理解:人講話、機(jī)器聽(tīng)話的情況。語(yǔ)音識(shí)別和理解:人講話、機(jī)器聽(tīng)話的情況。 2022-5-10語(yǔ)音信號(hào)處理 胡航 編著10突破進(jìn)展突破進(jìn)展系統(tǒng)論述語(yǔ)言系統(tǒng)論述語(yǔ)言產(chǎn)生的聲學(xué)理論產(chǎn)生的聲學(xué)理論語(yǔ)譜圖儀問(wèn)世語(yǔ)譜圖儀問(wèn)世 語(yǔ)譜圖語(yǔ)譜圖語(yǔ)音,語(yǔ)音合成語(yǔ)音,語(yǔ)音合成1.2 語(yǔ)音信號(hào)處理的發(fā)展語(yǔ)音信號(hào)處理的發(fā)展 計(jì)算機(jī)計(jì)算機(jī)1貝爾電話貝爾電話的發(fā)明的發(fā)明 3用聲學(xué)方法對(duì)元音和用聲學(xué)方法對(duì)元音和歌唱進(jìn)行了研究歌唱進(jìn)行了研究 2第一個(gè)第一個(gè)聲碼器聲碼器 1876年年1939年年 19世紀(jì)世紀(jì)60年代年代 420世紀(jì)世紀(jì)40年代年代 1948年年 67基礎(chǔ)研究方面

8、基礎(chǔ)研究方面 技術(shù)應(yīng)用領(lǐng)域技術(shù)應(yīng)用領(lǐng)域 520世紀(jì)世紀(jì)50年代年代 2022-5-10語(yǔ)音信號(hào)處理 胡航 編著111.2 語(yǔ)音信號(hào)處理的發(fā)展語(yǔ)音信號(hào)處理的發(fā)展 1語(yǔ)音合成語(yǔ)音合成3語(yǔ)音編碼語(yǔ)音編碼2語(yǔ)音識(shí)別語(yǔ)音識(shí)別語(yǔ)音編碼語(yǔ)音編碼2022-5-10語(yǔ)音信號(hào)處理 胡航 編著121.2.1 語(yǔ)音合成語(yǔ)音合成 以語(yǔ)言信息壓縮、存儲(chǔ)為主要目的對(duì)語(yǔ)音信以語(yǔ)言信息壓縮、存儲(chǔ)為主要目的對(duì)語(yǔ)音信號(hào)數(shù)字模型進(jìn)行研究,同時(shí)研究音素、音節(jié)、詞號(hào)數(shù)字模型進(jìn)行研究,同時(shí)研究音素、音節(jié)、詞組與句子的發(fā)音規(guī)則。最終恢復(fù)出自然流暢的語(yǔ)組與句子的發(fā)音規(guī)則。最終恢復(fù)出自然流暢的語(yǔ)音來(lái)。例如文語(yǔ)轉(zhuǎn)換系統(tǒng)音來(lái)。例如文語(yǔ)轉(zhuǎn)換系統(tǒng)(Te

9、xt-to-speech)。語(yǔ)音。語(yǔ)音分析與合成將賦予分析與合成將賦予計(jì)算機(jī)說(shuō)話計(jì)算機(jī)說(shuō)話的功能。也是進(jìn)行的功能。也是進(jìn)行話音編碼、語(yǔ)音識(shí)別研究的基礎(chǔ)。話音編碼、語(yǔ)音識(shí)別研究的基礎(chǔ)。2022-5-10語(yǔ)音信號(hào)處理 胡航 編著131.2.1 語(yǔ)音合成語(yǔ)音合成 語(yǔ)音合成語(yǔ)音合成(人工制造出的語(yǔ)音)就是用專用的硬(人工制造出的語(yǔ)音)就是用專用的硬件設(shè)備或計(jì)算機(jī)再現(xiàn)人能夠聽(tīng)懂的語(yǔ)音信號(hào),根件設(shè)備或計(jì)算機(jī)再現(xiàn)人能夠聽(tīng)懂的語(yǔ)音信號(hào),根據(jù)輸入的語(yǔ)音符號(hào)產(chǎn)生出具有一定音質(zhì)和可懂度據(jù)輸入的語(yǔ)音符號(hào)產(chǎn)生出具有一定音質(zhì)和可懂度的語(yǔ)音來(lái)。的語(yǔ)音來(lái)。2022-5-10語(yǔ)音信號(hào)處理 胡航 編著141.2.2 語(yǔ)音編碼語(yǔ)音

10、編碼編碼:編碼:用預(yù)先規(guī)定的方法將文字、數(shù)字或其他對(duì)象編成用預(yù)先規(guī)定的方法將文字、數(shù)字或其他對(duì)象編成 數(shù)碼,或?qū)⑿畔?、?shù)據(jù)轉(zhuǎn)換成規(guī)定的電脈沖信號(hào)。數(shù)碼,或?qū)⑿畔ⅰ?shù)據(jù)轉(zhuǎn)換成規(guī)定的電脈沖信號(hào)。 語(yǔ)音編碼的目的:語(yǔ)音編碼的目的: 在保證一定語(yǔ)音質(zhì)量的前提下,盡可能降低編碼在保證一定語(yǔ)音質(zhì)量的前提下,盡可能降低編碼比特率,以節(jié)省頻率資源。比特率,以節(jié)省頻率資源。 2022-5-10語(yǔ)音信號(hào)處理 胡航 編著151.2.2 語(yǔ)音編碼 語(yǔ)音編碼與文本到語(yǔ)音轉(zhuǎn)換兩個(gè)主要區(qū)別語(yǔ)音編碼與文本到語(yǔ)音轉(zhuǎn)換兩個(gè)主要區(qū)別 一、前者是人與人之間的話音交流,要保一、前者是人與人之間的話音交流,要保留說(shuō)話人的聲音特征。后者是

11、文本到聲音的轉(zhuǎn)換留說(shuō)話人的聲音特征。后者是文本到聲音的轉(zhuǎn)換即計(jì)算機(jī)發(fā)聲。它可以是標(biāo)準(zhǔn)播音員或其它聲音。即計(jì)算機(jī)發(fā)聲。它可以是標(biāo)準(zhǔn)播音員或其它聲音。 二、前者不僅對(duì)壓縮率和音質(zhì)有要求,而二、前者不僅對(duì)壓縮率和音質(zhì)有要求,而且要求較低的編、解碼延遲。而后者對(duì)處理幀長(zhǎng)且要求較低的編、解碼延遲。而后者對(duì)處理幀長(zhǎng)沒(méi)有什么太嚴(yán)格的限制。沒(méi)有什么太嚴(yán)格的限制。2022-5-10語(yǔ)音信號(hào)處理 胡航 編著161.2.3 語(yǔ)音識(shí)別語(yǔ)音識(shí)別 研究如何使研究如何使計(jì)算機(jī)能夠聽(tīng)懂人類的語(yǔ)言計(jì)算機(jī)能夠聽(tīng)懂人類的語(yǔ)言。以以漢語(yǔ)語(yǔ)音為例:漢語(yǔ)約有漢語(yǔ)語(yǔ)音為例:漢語(yǔ)約有400400個(gè)音節(jié),加上聲調(diào)約個(gè)音節(jié),加上聲調(diào)約12001

12、200個(gè)音調(diào)節(jié),把這些語(yǔ)音信號(hào)的特征存儲(chǔ)到計(jì)個(gè)音調(diào)節(jié),把這些語(yǔ)音信號(hào)的特征存儲(chǔ)到計(jì)算機(jī)內(nèi),并與計(jì)算機(jī)接收到的漢語(yǔ)發(fā)音進(jìn)行比較,算機(jī)內(nèi),并與計(jì)算機(jī)接收到的漢語(yǔ)發(fā)音進(jìn)行比較,找到特征相同的音節(jié)或音調(diào)節(jié),這個(gè)過(guò)程就是語(yǔ)找到特征相同的音節(jié)或音調(diào)節(jié),這個(gè)過(guò)程就是語(yǔ)音識(shí)別。將識(shí)別出的音節(jié)序列轉(zhuǎn)換成文字,就是音識(shí)別。將識(shí)別出的音節(jié)序列轉(zhuǎn)換成文字,就是語(yǔ)言理解。許多算法將理解過(guò)程溶入到識(shí)別中來(lái)語(yǔ)言理解。許多算法將理解過(guò)程溶入到識(shí)別中來(lái)提高識(shí)別的準(zhǔn)確性。因此可以將語(yǔ)音識(shí)別與理解提高識(shí)別的準(zhǔn)確性。因此可以將語(yǔ)音識(shí)別與理解歸入同一類應(yīng)用。歸入同一類應(yīng)用。 2022-5-10語(yǔ)音信號(hào)處理 胡航 編著17 語(yǔ)音識(shí)別研究

13、領(lǐng)域包括:語(yǔ)音識(shí)別研究領(lǐng)域包括: (1 1)根據(jù)對(duì)說(shuō)話人說(shuō)話方式的要求,可以分)根據(jù)對(duì)說(shuō)話人說(shuō)話方式的要求,可以分為孤立字語(yǔ)音識(shí)別系統(tǒng),連接字語(yǔ)音識(shí)別系統(tǒng)以為孤立字語(yǔ)音識(shí)別系統(tǒng),連接字語(yǔ)音識(shí)別系統(tǒng)以及連續(xù)語(yǔ)音識(shí)別系統(tǒng)。及連續(xù)語(yǔ)音識(shí)別系統(tǒng)。 (2 2)根據(jù)對(duì)說(shuō)話人的依賴程度可以分為特定)根據(jù)對(duì)說(shuō)話人的依賴程度可以分為特定人和非特定人語(yǔ)音識(shí)別系統(tǒng)。人和非特定人語(yǔ)音識(shí)別系統(tǒng)。 (3 3)根據(jù)詞匯量大小,可以分為小詞匯量、)根據(jù)詞匯量大小,可以分為小詞匯量、中等詞匯量、大詞匯量以及無(wú)限詞匯量語(yǔ)音識(shí)別中等詞匯量、大詞匯量以及無(wú)限詞匯量語(yǔ)音識(shí)別系統(tǒng)。系統(tǒng)。 2022-5-10語(yǔ)音信號(hào)處理 胡航 編著181

14、.3 語(yǔ)音信號(hào)處理的應(yīng)用及新方向 語(yǔ)音技術(shù)的應(yīng)用領(lǐng)域語(yǔ)音技術(shù)的應(yīng)用領(lǐng)域 包括語(yǔ)音識(shí)別、說(shuō)話人的鑒別和確認(rèn)、語(yǔ)種的鑒包括語(yǔ)音識(shí)別、說(shuō)話人的鑒別和確認(rèn)、語(yǔ)種的鑒別和確認(rèn)、關(guān)鍵詞檢測(cè)和確認(rèn)、語(yǔ)音合成、語(yǔ)音別和確認(rèn)、關(guān)鍵詞檢測(cè)和確認(rèn)、語(yǔ)音合成、語(yǔ)音編碼等。編碼等。 但其中最具有挑戰(zhàn)性和最富有應(yīng)用前景的為但其中最具有挑戰(zhàn)性和最富有應(yīng)用前景的為語(yǔ)音語(yǔ)音識(shí)別技術(shù)。識(shí)別技術(shù)。 一:語(yǔ)音信號(hào)處理的應(yīng)用一:語(yǔ)音信號(hào)處理的應(yīng)用2022-5-10語(yǔ)音信號(hào)處理 胡航 編著19 1. 說(shuō)話人識(shí)別技術(shù)的應(yīng)用說(shuō)話人識(shí)別技術(shù)的應(yīng)用 安全加密、銀行信息電話查詢服務(wù)安全加密、銀行信息電話查詢服務(wù) 公安機(jī)關(guān)破案和法庭取證方面公安機(jī)關(guān)

15、破案和法庭取證方面 在聲控應(yīng)用中,識(shí)別輸入的語(yǔ)音內(nèi)容,并根據(jù)內(nèi)容來(lái)執(zhí)行相在聲控應(yīng)用中,識(shí)別輸入的語(yǔ)音內(nèi)容,并根據(jù)內(nèi)容來(lái)執(zhí)行相應(yīng)的動(dòng)作,這包括了聲控電話轉(zhuǎn)換、聲控語(yǔ)音撥號(hào)系統(tǒng)、聲應(yīng)的動(dòng)作,這包括了聲控電話轉(zhuǎn)換、聲控語(yǔ)音撥號(hào)系統(tǒng)、聲控智能玩具、信息網(wǎng)絡(luò)查詢、家庭服務(wù)、賓館服務(wù)、旅行社控智能玩具、信息網(wǎng)絡(luò)查詢、家庭服務(wù)、賓館服務(wù)、旅行社服務(wù)系統(tǒng)、醫(yī)療服務(wù)、股票查詢服務(wù)和工業(yè)控制等。服務(wù)系統(tǒng)、醫(yī)療服務(wù)、股票查詢服務(wù)和工業(yè)控制等。2022-5-10語(yǔ)音信號(hào)處理 胡航 編著20 1. 說(shuō)話人識(shí)別技術(shù)的應(yīng)用說(shuō)話人識(shí)別技術(shù)的應(yīng)用 在電話與通信系統(tǒng)中,智能語(yǔ)音接口正在把在電話與通信系統(tǒng)中,智能語(yǔ)音接口正在把電話

16、機(jī)從一個(gè)單純的服務(wù)工具變成為一個(gè)服務(wù)的電話機(jī)從一個(gè)單純的服務(wù)工具變成為一個(gè)服務(wù)的“提供者提供者”和生活和生活“伙伴伙伴”。 目前,自動(dòng)口語(yǔ)分析、用戶交換機(jī)、電話機(jī)、目前,自動(dòng)口語(yǔ)分析、用戶交換機(jī)、電話機(jī)、手機(jī)已經(jīng)包含了語(yǔ)音識(shí)別撥號(hào)功能,還有語(yǔ)音記事手機(jī)已經(jīng)包含了語(yǔ)音識(shí)別撥號(hào)功能,還有語(yǔ)音記事本、語(yǔ)音智能玩具等產(chǎn)品也包含了語(yǔ)音識(shí)別與語(yǔ)音本、語(yǔ)音智能玩具等產(chǎn)品也包含了語(yǔ)音識(shí)別與語(yǔ)音合成功能。人們可以通過(guò)電話網(wǎng)絡(luò)用語(yǔ)音識(shí)別口語(yǔ)合成功能。人們可以通過(guò)電話網(wǎng)絡(luò)用語(yǔ)音識(shí)別口語(yǔ)對(duì)話系統(tǒng)查詢有關(guān)的機(jī)票、旅游、銀行信息。對(duì)話系統(tǒng)查詢有關(guān)的機(jī)票、旅游、銀行信息。2022-5-10語(yǔ)音信號(hào)處理 胡航 編著21 2.

17、 語(yǔ)音合成的應(yīng)用語(yǔ)音合成的應(yīng)用 公交汽車上的自動(dòng)報(bào)站、各種場(chǎng)合的自動(dòng)報(bào)公交汽車上的自動(dòng)報(bào)站、各種場(chǎng)合的自動(dòng)報(bào)時(shí)、自動(dòng)報(bào)警、手機(jī)查詢服務(wù)和各種文本校對(duì)中時(shí)、自動(dòng)報(bào)警、手機(jī)查詢服務(wù)和各種文本校對(duì)中的語(yǔ)音提示、在電信聲訊服務(wù):如股票、售后服的語(yǔ)音提示、在電信聲訊服務(wù):如股票、售后服務(wù)、車站查詢等信息;也可用于基于微型機(jī)的辦務(wù)、車站查詢等信息;也可用于基于微型機(jī)的辦公、教學(xué)、娛樂(lè)等智能多媒體軟件,例如語(yǔ)言學(xué)公、教學(xué)、娛樂(lè)等智能多媒體軟件,例如語(yǔ)言學(xué)習(xí)、教學(xué)軟件、語(yǔ)音玩具、語(yǔ)音書(shū)籍等;也可與習(xí)、教學(xué)軟件、語(yǔ)音玩具、語(yǔ)音書(shū)籍等;也可與語(yǔ)音合成技術(shù)與機(jī)器翻譯技術(shù)結(jié)合,實(shí)現(xiàn)語(yǔ)音翻語(yǔ)音合成技術(shù)與機(jī)器翻譯技術(shù)結(jié)合

18、,實(shí)現(xiàn)語(yǔ)音翻譯等。譯等。2022-5-10語(yǔ)音信號(hào)處理 胡航 編著22 3. 語(yǔ)音編碼的應(yīng)用語(yǔ)音編碼的應(yīng)用 在移動(dòng)通信、衛(wèi)星通信、軍事保密通信、信息在移動(dòng)通信、衛(wèi)星通信、軍事保密通信、信息高速公路和高速公路和IP電話通信中的應(yīng)用。電話通信中的應(yīng)用。 在個(gè)人移動(dòng)通信、語(yǔ)音存儲(chǔ)、多媒體通信、數(shù)在個(gè)人移動(dòng)通信、語(yǔ)音存儲(chǔ)、多媒體通信、數(shù)字?jǐn)?shù)據(jù)網(wǎng)字?jǐn)?shù)據(jù)網(wǎng)(DDN)中的應(yīng)用。中的應(yīng)用。 未來(lái)的綜合業(yè)務(wù)數(shù)字網(wǎng)(未來(lái)的綜合業(yè)務(wù)數(shù)字網(wǎng)(ISDN)、衛(wèi)星通信、)、衛(wèi)星通信、移動(dòng)通信、微波接力通信和信息高速公路以及保密移動(dòng)通信、微波接力通信和信息高速公路以及保密電話等中的應(yīng)用。電話等中的應(yīng)用。2022-5-10語(yǔ)音

19、信號(hào)處理 胡航 編著23 二、語(yǔ)音信號(hào)處理的新方向二、語(yǔ)音信號(hào)處理的新方向 (1)基于語(yǔ)音的信息檢索。網(wǎng)絡(luò)技術(shù)及數(shù)字圖書(shū)館)基于語(yǔ)音的信息檢索。網(wǎng)絡(luò)技術(shù)及數(shù)字圖書(shū)館 技術(shù)的發(fā)展,基于語(yǔ)音識(shí)別的信息檢索技術(shù)正成為技術(shù)的發(fā)展,基于語(yǔ)音識(shí)別的信息檢索技術(shù)正成為研究熱點(diǎn)。研究熱點(diǎn)。 (2)基于語(yǔ)音識(shí)別的廣播新聞的自動(dòng)文摘技術(shù)的研)基于語(yǔ)音識(shí)別的廣播新聞的自動(dòng)文摘技術(shù)的研究。由于廣播、電視中的發(fā)音較為標(biāo)準(zhǔn)規(guī)范,在識(shí)究。由于廣播、電視中的發(fā)音較為標(biāo)準(zhǔn)規(guī)范,在識(shí)別中避免了說(shuō)話人發(fā)音上的不規(guī)范,有利于語(yǔ)音識(shí)別中避免了說(shuō)話人發(fā)音上的不規(guī)范,有利于語(yǔ)音識(shí)別系統(tǒng)性能的提高。別系統(tǒng)性能的提高。2022-5-10語(yǔ)音信

20、號(hào)處理 胡航 編著24 二、語(yǔ)音信號(hào)處理的新方向二、語(yǔ)音信號(hào)處理的新方向 (3)VoIP技術(shù)。是通過(guò)技術(shù)。是通過(guò)TCP/IP網(wǎng)絡(luò),而不是傳統(tǒng)的網(wǎng)絡(luò),而不是傳統(tǒng)的電話網(wǎng)絡(luò)來(lái)傳輸語(yǔ)音的新的通信方式,通常稱之為電話網(wǎng)絡(luò)來(lái)傳輸語(yǔ)音的新的通信方式,通常稱之為IP電話技術(shù)。在網(wǎng)絡(luò)上對(duì)壓縮的語(yǔ)音數(shù)據(jù)以數(shù)據(jù)包電話技術(shù)。在網(wǎng)絡(luò)上對(duì)壓縮的語(yǔ)音數(shù)據(jù)以數(shù)據(jù)包的形式進(jìn)行傳輸和識(shí)別。的形式進(jìn)行傳輸和識(shí)別。 (4)語(yǔ)音訓(xùn)練與校正技術(shù)?,F(xiàn)在越來(lái)越多的人希望)語(yǔ)音訓(xùn)練與校正技術(shù)?,F(xiàn)在越來(lái)越多的人希望掌握其他非母語(yǔ)語(yǔ)言,以便方便的進(jìn)行交流。因此掌握其他非母語(yǔ)語(yǔ)言,以便方便的進(jìn)行交流。因此語(yǔ)言學(xué)習(xí)機(jī)已成為當(dāng)今外語(yǔ)學(xué)習(xí)者的有利工具。

21、語(yǔ)言學(xué)習(xí)機(jī)已成為當(dāng)今外語(yǔ)學(xué)習(xí)者的有利工具。2022-5-10語(yǔ)音信號(hào)處理 胡航 編著25 二、二、語(yǔ)音信號(hào)處理的新方向語(yǔ)音信號(hào)處理的新方向 (5)語(yǔ)種識(shí)別。是近年來(lái)新出現(xiàn)的研究方向,通過(guò))語(yǔ)種識(shí)別。是近年來(lái)新出現(xiàn)的研究方向,通過(guò)分析處理一個(gè)語(yǔ)音片斷來(lái)判別其所屬語(yǔ)音的種類,分析處理一個(gè)語(yǔ)音片斷來(lái)判別其所屬語(yǔ)音的種類,本質(zhì)上屬于語(yǔ)音識(shí)別的研究范疇。本質(zhì)上屬于語(yǔ)音識(shí)別的研究范疇。 (6)基于語(yǔ)音的情感處理研究。在人與人的交流中,)基于語(yǔ)音的情感處理研究。在人與人的交流中,除了語(yǔ)音信息外,非語(yǔ)言信息也起著重要的作用。除了語(yǔ)音信息外,非語(yǔ)言信息也起著重要的作用。為了使人機(jī)交流更自然、更人性化,基于語(yǔ)音的

22、情為了使人機(jī)交流更自然、更人性化,基于語(yǔ)音的情感處理研究也是非常必要的。感處理研究也是非常必要的。2022-5-10語(yǔ)音信號(hào)處理 胡航 編著261.4 語(yǔ)音信號(hào)處理過(guò)程的總體結(jié)構(gòu)語(yǔ)音信號(hào)處理過(guò)程的總體結(jié)構(gòu)圖圖1.1 信號(hào)處理和加工的一般示意圖信號(hào)處理和加工的一般示意圖信號(hào)提取與利用信號(hào)提取與利用信號(hào)變換信號(hào)變換信號(hào)表示信號(hào)表示觀察與測(cè)量觀察與測(cè)量信號(hào)源信號(hào)源信息加工和處理的一般流程如圖信息加工和處理的一般流程如圖1.1所示所示 2022-5-10語(yǔ)音信號(hào)處理 胡航 編著27語(yǔ)音輸入語(yǔ)音輸入預(yù)處理預(yù)處理數(shù)字化數(shù)字化特征提取特征提取合成合成傳輸傳輸參考模式庫(kù)參考模式庫(kù)模式匹配模式匹配識(shí)別結(jié)果識(shí)別結(jié)

23、果壓縮處理壓縮處理識(shí)別識(shí)別訓(xùn)練訓(xùn)練語(yǔ)音識(shí)別語(yǔ)音識(shí)別解壓縮解壓縮存儲(chǔ)存儲(chǔ)語(yǔ)音輸出語(yǔ)音輸出圖圖1.2 語(yǔ)音處理過(guò)程的結(jié)構(gòu)框圖語(yǔ)音處理過(guò)程的結(jié)構(gòu)框圖語(yǔ)音處理過(guò)程的結(jié)構(gòu)框圖語(yǔ)音處理過(guò)程的結(jié)構(gòu)框圖2022-5-10語(yǔ)音信號(hào)處理 胡航 編著281.5 MATLAB在數(shù)字語(yǔ)音信號(hào)處在數(shù)字語(yǔ)音信號(hào)處理中的應(yīng)用理中的應(yīng)用 數(shù)字語(yǔ)音信號(hào)處理是將數(shù)字信號(hào)處理與語(yǔ)音學(xué)數(shù)字語(yǔ)音信號(hào)處理是將數(shù)字信號(hào)處理與語(yǔ)音學(xué)相結(jié)合,解決現(xiàn)代通信領(lǐng)域中人與人、人與機(jī)器之相結(jié)合,解決現(xiàn)代通信領(lǐng)域中人與人、人與機(jī)器之間的信息交流的學(xué)科。間的信息交流的學(xué)科。 MATLAB是一種功能強(qiáng)大、效率高、交互性是一種功能強(qiáng)大、效率高、交互性好的計(jì)算機(jī)高

24、級(jí)語(yǔ)言。好的計(jì)算機(jī)高級(jí)語(yǔ)言。 近年來(lái)近年來(lái)MATLAB已成為學(xué)習(xí)語(yǔ)音信號(hào)處理和已成為學(xué)習(xí)語(yǔ)音信號(hào)處理和進(jìn)行研究工作的仿真軟件工具。進(jìn)行研究工作的仿真軟件工具。 2022-5-10語(yǔ)音信號(hào)處理 胡航 編著29 MATLAB在數(shù)字語(yǔ)音信號(hào)中的幾方面應(yīng)用:在數(shù)字語(yǔ)音信號(hào)中的幾方面應(yīng)用: (1)通過(guò))通過(guò)MATLAB可以對(duì)數(shù)字化的語(yǔ)音信號(hào)進(jìn)行可以對(duì)數(shù)字化的語(yǔ)音信號(hào)進(jìn)行時(shí)頻域分析。時(shí)頻域分析。 (2)通過(guò))通過(guò)MATLAB可以對(duì)數(shù)字化的語(yǔ)音信號(hào)進(jìn)行可以對(duì)數(shù)字化的語(yǔ)音信號(hào)進(jìn)行估計(jì)和判別。估計(jì)和判別。 (3)通過(guò)利用)通過(guò)利用MATLAB編程對(duì)語(yǔ)音信號(hào)進(jìn)行處理編程對(duì)語(yǔ)音信號(hào)進(jìn)行處理2022-5-10語(yǔ)音信號(hào)

25、處理 胡航 編著30數(shù)字語(yǔ)音信號(hào)處理研究?jī)?nèi)容數(shù)字語(yǔ)音信號(hào)處理研究?jī)?nèi)容涉及三方面相互密切配合的任務(wù)和課題:涉及三方面相互密切配合的任務(wù)和課題:1. 應(yīng)用應(yīng)用2. 基礎(chǔ)理論和算法基礎(chǔ)理論和算法3. 硬件系統(tǒng)硬件系統(tǒng)2022-5-10語(yǔ)音信號(hào)處理 胡航 編著31 1. 應(yīng)用方面應(yīng)用方面 通信產(chǎn)業(yè)起源于通信產(chǎn)業(yè)起源于1874年電話的發(fā)明。從那時(shí)年電話的發(fā)明。從那時(shí)起,通信產(chǎn)業(yè)大致發(fā)生了三次重大變革。起,通信產(chǎn)業(yè)大致發(fā)生了三次重大變革。 (1)第一次變革產(chǎn)生于七十年代初。)第一次變革產(chǎn)生于七十年代初。1972年年CCITT組織公布了第一個(gè)語(yǔ)音編碼標(biāo)準(zhǔn)組織公布了第一個(gè)語(yǔ)音編碼標(biāo)準(zhǔn)G.711。即對(duì)數(shù)即對(duì)數(shù)P

26、CM編碼,由此開(kāi)始,數(shù)字程控交換網(wǎng)絡(luò)編碼,由此開(kāi)始,數(shù)字程控交換網(wǎng)絡(luò)逐步淘汰了傳統(tǒng)的模擬交換傳輸方式。逐步淘汰了傳統(tǒng)的模擬交換傳輸方式。 2022-5-10語(yǔ)音信號(hào)處理 胡航 編著32 (2 2)第二次重大變革產(chǎn)生于八十年代末。)第二次重大變革產(chǎn)生于八十年代末。19881988年年歐共體歐共體1313個(gè)國(guó)家數(shù)字移動(dòng)特別工作組個(gè)國(guó)家數(shù)字移動(dòng)特別工作組(GSM)(GSM)制定了制定了采用長(zhǎng)時(shí)預(yù)測(cè)規(guī)則碼激勵(lì)的編碼標(biāo)準(zhǔn)采用長(zhǎng)時(shí)預(yù)測(cè)規(guī)則碼激勵(lì)的編碼標(biāo)準(zhǔn)(13k bps (13k bps RPE-LTP)RPE-LTP)。 19891989年美國(guó)蜂窩通信工業(yè)協(xié)會(huì)年美國(guó)蜂窩通信工業(yè)協(xié)會(huì)(CITA)(CITA)宣布了宣布了北美數(shù)字移動(dòng)通信話音編碼標(biāo)準(zhǔn)北美數(shù)字移動(dòng)通信話音編碼標(biāo)準(zhǔn)(8K bps(8K bps矢量和激矢量和激勵(lì)勵(lì)VSELP)VSELP)。從而確立了全球范圍第二個(gè)傳輸網(wǎng)移。從而確立了全球范圍第二個(gè)傳輸網(wǎng)移動(dòng)通信產(chǎn)業(yè)的崛起。動(dòng)通信產(chǎn)業(yè)的崛起。2022-5-10語(yǔ)音信號(hào)處理 胡航 編著33 (3)第三次變革發(fā)生在世紀(jì)之交。以新興的計(jì)算)第三次變革發(fā)生在世紀(jì)之交。以新興的計(jì)算機(jī)因特網(wǎng)為基礎(chǔ)的信息高速公路在全世界范圍迅機(jī)因特網(wǎng)為基礎(chǔ)的信息高速公路在全世界范圍迅速發(fā)展。如何在速發(fā)展。如何在INTERNET網(wǎng)上有效地傳輸話音網(wǎng)上有效地傳輸話音成為產(chǎn)業(yè)界關(guān)注的焦點(diǎn)。成為產(chǎn)業(yè)界關(guān)注的焦點(diǎn)。IP電話將

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論