




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
語音信號處理第3版第3講矢量量化(VQ,即VectorQuantization)是一種極其重要的信號壓縮方法。VQ在語音信號處理中占十分重要的地位。廣泛應(yīng)用于語音編碼、語音識別和語音合成等領(lǐng)域。量化分為兩類:*標(biāo)量量化:將取樣后的信號值逐個地進(jìn)行量化。*矢量量化:將若干取樣信號分成一組,即構(gòu)成一個矢量,然后對此矢量一次進(jìn)行量化。凡是要用量化的地方都可以采用矢量量化。
矢量量化是實(shí)現(xiàn)數(shù)據(jù)壓縮的一種有效方法,早在50和60年代就被用于語音壓縮編碼。直到70年代線性預(yù)測技術(shù)被引入語音編碼后,矢量量化技術(shù)才活躍起來。80年代初,矢量量化技術(shù)的理論和應(yīng)用研究得到迅速發(fā)展。采用矢量量化技術(shù)對信號波形或參數(shù)進(jìn)行壓縮處理,可以獲得很好的效益,使存儲要求、傳輸比特率需求或和計(jì)算量需求降低.采用矢量量化的效果優(yōu)于標(biāo)量量化的原因?矢量量化能有效的應(yīng)用矢量中各分量之間的四種相互關(guān)聯(lián)性質(zhì)來消除數(shù)據(jù)中的冗余度。這四種相互關(guān)聯(lián)的性質(zhì)是線性依賴(相關(guān)性)、非線性依賴(統(tǒng)計(jì)不獨(dú)立)、概率密度函數(shù)的形狀和矢量量化的維數(shù),而標(biāo)量量化僅能利用線性依賴和概率密度函數(shù)的形狀來消除冗余度。矢量量化研究的目的?針對特定的信息源和矢量維數(shù),設(shè)計(jì)出一種最優(yōu)化的量化器,在R(量化速率)一定的情況下,給出的量化失真盡可能接近D(R)(最小量化失真)。標(biāo)量量化是對信號的單個樣本或參數(shù)的幅度進(jìn)行量化;標(biāo)量是指被量化的變量,為一維變量。矢量量化的過程是將語音信號波形的K個樣點(diǎn)的每一幀,或有K個參數(shù)的每一參數(shù)幀構(gòu)成K維空間的一個矢量,然后對這個矢量進(jìn)行量化。標(biāo)量量化可以說是K=1的矢量量化。矢量量化過程和標(biāo)量量化過程相似。將K維無限空間劃分為M個區(qū)域邊界,然后將輸入矢量與這些邊界進(jìn)行比較,并被量化為“距離”最小的區(qū)域邊界的中心矢量值。
矢量量化的定義設(shè)有N個K維特征矢量(X在K維歐幾里德空間中),其中,第i個矢量記為可以被看作是語音信號中某幀參數(shù)組成的矢量。把K維歐幾里德空間無遺漏地劃分為J個互不相交的子空間即滿足子空間成為胞腔。在每一個子空間找一個代表矢量,則J個代表矢量可以組成矢量集Y是一個矢量量化器,在矢量量化里Y叫作碼書或碼本,稱為碼矢或碼字。矢量個數(shù)J叫作碼本長度,或者碼本尺寸。不同的劃分或者不同的代表矢量選取方法就可以構(gòu)成不同的矢量量化器步驟:1)判斷——具體屬于哪個子空間2)輸出——,Q為量化器函數(shù)以K=2進(jìn)行說明:當(dāng)K=2時,所得到的是二維矢量。所有可能的二維矢量就形成了一個平面。記為(a1,a2),所有可能的(a1,a2)就是一個二維空間。如圖3-1(a)所示矢量量化就是將這個平面劃分為M塊S1,S2,…,Si…SM,然后從每一塊中找出代表值Yi(i=1,2….M),這就構(gòu)成一個有M個區(qū)間的二維矢量量化器。圖3-1(b)所示的是一個7區(qū)間的二維矢量量化器,即K=2,M=7。圖3-1矢量量化概念示意圖通常這些代表值Yi稱為量化矢量。對一個矢量X進(jìn)行量化,首先選擇一個合適的失真測度,然后用最小失真原理,分別計(jì)算用量化矢量Yi替代X所帶來的失真。其中最小失真值所對應(yīng)的那個量化矢量,就是矢量X的重構(gòu)矢量(或恢復(fù)矢量)注:根據(jù)香農(nóng)信息論,矢量越長越好。實(shí)際中碼書是不完備的,即矢量數(shù)是有限的,而對于任何一個實(shí)際應(yīng)用來說,矢量通常是無限的。在實(shí)際運(yùn)用中,輸入矢量和碼書中碼字不匹配的情況下,這種失真是允許的。存在的問題
(1)如何劃分M個區(qū)域邊界。將大量欲處理的信號的矢量進(jìn)行統(tǒng)計(jì)劃分,進(jìn)一步確定這些劃分邊界的中心矢量值來得到碼書。(2)如何確定兩矢量在進(jìn)行比較時的測度。這個測度就是兩矢量間的距離,或以其中某一矢量為基準(zhǔn)時的失真度。它描述了當(dāng)輸入矢量用碼書所對應(yīng)的矢量來表征時所付出的代價。
圖3-2矢量量化系統(tǒng)的組成編碼端恢復(fù)時特點(diǎn):傳輸存儲的不是矢量本身而是其序號,所以據(jù)有高保密性能收發(fā)兩端沒有反饋回路,因此比較穩(wěn)定矢量量化器的關(guān)鍵是編碼器的設(shè)計(jì),譯碼器只是簡單的的查表過程。矢量量化的性能指標(biāo)除了碼書的大小M以外還有由于量化而產(chǎn)生的平均信噪比。矢量量化的準(zhǔn)則:在給定碼本大小K時使量化所造成的失真最小。矢量量化的設(shè)計(jì):從大量信號樣本中訓(xùn)練出好的碼書,從實(shí)際效果出發(fā)尋找最好的失真測度定義公式,設(shè)計(jì)出最佳的矢量量化系統(tǒng),以便用最少的搜索和計(jì)算失真的計(jì)算量,來實(shí)現(xiàn)最大可能的平均信噪比。前面我們講過設(shè)計(jì)矢量量化器的關(guān)鍵是編碼器的設(shè)計(jì)。而在編碼的過程中,就需要引入失真測度的概念。失真測度(距離測度):是將輸入矢量Xi用碼本重構(gòu)矢量Yi來表征時所產(chǎn)生的誤差或失真的度量方法,它可以描述兩個或多個模型矢量間的相似程度。失真測度選擇的好壞直接影響到聚類效果和量化精度,從而影響到語音信號矢量量化處理系統(tǒng)的性能失真度選擇必須具備的特性必須在主觀評價上有意義,即小的失真應(yīng)該對應(yīng)于好的主觀語音質(zhì)量;必須是易于處理的,即在數(shù)學(xué)上易于實(shí)現(xiàn),這樣可以用于實(shí)際的矢量量化器的設(shè)計(jì);平均失真存在并且可以計(jì)算;易于硬件實(shí)現(xiàn)失真測度主要有均方誤差失真測度(即歐氏距離,滿足對稱性+正值性)、加權(quán)的均方誤差失真測度、板倉-齋藤(Itakura-Saito)距離,似然比失真測度等,還有人提出的所謂的“主觀的”失真測度。一、歐氏距離-均方誤差
設(shè)輸入信號的某個K維矢量X,與碼書中某個K維矢量Y進(jìn)行比較,xi,yi分別表示X和Y中的各元素,則定義均方誤差為歐氏距離:幾種其他常用的歐氏距離:r方平均誤差2.r平均誤差3.絕對值平均誤差4.最大平均誤差優(yōu)點(diǎn)在于:計(jì)算簡單、硬件容易實(shí)現(xiàn)5.加權(quán)歐式距離測度3.1.3線性預(yù)測失真測度
用全極模型表示的線性預(yù)測方法,廣泛應(yīng)用于語音信號處理中。它在分析時得到的是模型的預(yù)測系數(shù).僅由預(yù)測系數(shù)的差值,不能完全表征這兩個語音信息的差別。應(yīng)該直接由這些系數(shù)所描述的信號模型的功率譜來進(jìn)行比較。
當(dāng)預(yù)測器的階數(shù),信號與模型完全匹配時,信號功率譜為:信號的功率譜預(yù)測誤差能量預(yù)測逆濾波器的頻率響應(yīng)相應(yīng)的,設(shè)碼書中某重構(gòu)矢量的功率譜為則定義I-S距離為
這種失真測度是針對線性預(yù)測模型、用最大似然準(zhǔn)則推導(dǎo)出來,所以特別適用于LPC參數(shù),描述語音信號的情況,常用于LPC編碼中。我們由此又推導(dǎo)出兩種線性預(yù)測色失真測度,他們比上述具有更好的性能,即對比似然比失真測度模型失真測度注:這兩種失真測度都僅僅比較兩矢量的功率譜,而沒有考慮其他能量信息。3.1.4識別失真測度失真測度的定義加權(quán)因子輸入信號矢量的歸一化能量碼書重構(gòu)矢量的歸一化能量當(dāng)兩矢量的能量接近時(即),忽略能量差異引起的影響;當(dāng)兩矢量能量相差很大時,即進(jìn)行線性加權(quán);而當(dāng)能量差超過門限時,則為固定值3.1.5矢量量化器最佳碼本設(shè)計(jì)矢量量化器最佳設(shè)計(jì)的兩個條件?目的:最佳設(shè)計(jì)就是使失真最小最佳設(shè)計(jì)中,重要的問題是如何劃分量化區(qū)間和確定量化矢量。這兩個條件回答了兩個問題。(1)最佳劃分(2)最佳碼書為實(shí)現(xiàn)失真最小這一目的,應(yīng)該遵循以下兩條原則最近鄰準(zhǔn)則NNR質(zhì)心條件是中包含的矢量個數(shù)基于最近鄰準(zhǔn)則和質(zhì)心條件,可以設(shè)計(jì)出一種碼本設(shè)計(jì)的遞推算法——LBG算法1980年提出,它是標(biāo)量量化器中Lloyd算法的推廣,在矢量量化中是一個基本算法。LBG算法由于其理論上的嚴(yán)密性、應(yīng)用上的簡便性以及較好的設(shè)計(jì)效果,得到了廣泛的應(yīng)用,并常被作為各種改進(jìn)算法的基礎(chǔ)LBG算法步驟第一步:初始化給出訓(xùn)練VQ碼書所需的全部參考矢量X,X的集合用S表示;設(shè)定量化級數(shù),失真控制門限,算法最大迭代次數(shù)L以及初始碼書;設(shè)總失真;迭代次數(shù)的初始化為m=1第二步:迭代2)計(jì)算失真:1)根據(jù)最近鄰準(zhǔn)則將S分成J個子集,即當(dāng)時,下式成立:4)計(jì)算相對失真改進(jìn)量:3)計(jì)算新碼字將與失真門限值進(jìn)行比較。若則轉(zhuǎn)入6)否則轉(zhuǎn)入5);5)若則轉(zhuǎn)至6),否則m
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年金昌貨運(yùn)資格證模擬考試題庫
- 2025年松原貨運(yùn)從業(yè)資格證考試卷
- 第2課+中華文化的世界意義高二下學(xué)期歷史統(tǒng)編版(2019)選擇性必修3
- 重慶市部分區(qū)2024-2025學(xué)年高二(上)期末物理試卷【含解析】
- 四川省達(dá)州市2023-2024學(xué)年高一(上)期末物理試卷【含解析】
- 小升初統(tǒng)編版語文銜接課程:《從感知比喻到運(yùn)用比喻》教學(xué)設(shè)計(jì)001
- 智能手機(jī)用戶位置隱私保護(hù)
- 四川省遂寧市2024-2025學(xué)年高一上學(xué)期期末質(zhì)量檢測歷史試題(解析版)
- 第二單元 第三節(jié)物質(zhì)組成的表示 教學(xué)設(shè)計(jì) -2024-2025學(xué)年九年級化學(xué)魯教版上冊
- 農(nóng)技服務(wù)合同范例
- 2025年人工智能(AI)訓(xùn)練師職業(yè)技能鑒定考試題(附答案)
- 《稀土冶金技術(shù)史》課件-中國的稀土資源與分布
- 2025屆湖北省高三T8聯(lián)盟模擬考數(shù)學(xué)試卷(解析版)
- 女職工權(quán)益保護(hù)法律知識競賽題庫(293題附答案)
- 2025年山西金融職業(yè)學(xué)院高職單招職業(yè)技能測試近5年??及鎱⒖碱}庫含答案解析
- 工程項(xiàng)目成本管理制度
- 2024年安全管理人員安全教育培訓(xùn)試題及答案能力提升
- 2024屆高考適應(yīng)訓(xùn)練考試語文試卷(含答案)
- 2025年中考政治總復(fù)習(xí):九年級上冊道德與法治重點(diǎn)知識梳理匯編
- 3歲以下嬰幼兒托育機(jī)構(gòu)一日生活作息時間表、母乳和配方奶喂養(yǎng)操作流程、嬰兒盥洗操作流程
- 小說買斷合同范例
評論
0/150
提交評論