




已閱讀5頁,還剩45頁未讀, 繼續(xù)免費閱讀
版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
基于多小波的圖像矢量量化研究 摘要 視覺是人類獲取外部信息最為重要的途釋 百聞不如1 見 視覺信息給人 們以直觀 生動的形象 隨著計算機與數(shù)字通信技術的迅速發(fā)展 特別是網(wǎng)絡和 多媒體技術的興起 圖像壓縮已受到人們越來越多的關注 小波分析是從付里葉分析發(fā)展而來的一種新的時頻分析方法 具有良好的空 間 頻率局部化特性 作為小波分析的再發(fā)展 多小波不僅保持了小波的優(yōu)點 而且克服了小波的一些缺陷 同時具備了實際應用中十分重要的光滑性 緊支性 對稱性 正交性 這使得多小波尤比單小波具備更優(yōu)良的性能 其在圖像壓縮方 面 這決定了其在這方面將被越來越廣泛的研究和應用 作為圖像有損壓縮的方法之一 矢量量化的壓縮比極大 一般地講 壓縮比 越大 失真越大 壓縮比越小 失真越小 同時 矢量量化也是一個大量計算的 過程 隨著一些改進算法的提出 矢量量化技術越來越成熟 本文重要的工作就是探討了多小波系數(shù)特性 針對其特點采用合適的矢量量 化方法 實驗中 采用了適合圖像壓縮的c l 多小波與自組織特征映射神經(jīng)網(wǎng)絡 s o f m 提出了一套切實可行的兩者相結合的圖像矢量量化方法 其創(chuàng)新點有二 其一 創(chuàng)新性地將多小波與s o f m 結合在一起進行矢量量化 填補了這方面 的研究空白 其二 根據(jù)多小波系數(shù)的特點 將其一分為三各自進行并行矢量量化 解決 了實際中內(nèi)存不足的問題 提高了編解碼的速度 并同時提高了編碼 質(zhì)量 當然 對自組織特征映射網(wǎng)絡來說 選擇初始的矢量訓練集是非常重要的 實驗中 我們選用了各頻量豐富的l e n a 圖像作為初始訓練集 這樣 在一定程 度上避免了碼本的局部最優(yōu)化 并可以比較均勻的劃分頻率空間 以提高該碼本 的通用性能 實驗結果表明 我們獲得的碼本具有較好的通用性 能夠針對不同 統(tǒng)計特性的圖像進行良好的矢量量化 最后 作為一個應用方法的探索 我們總結和展望了多小波圖像矢量量化的 發(fā)展前景 并提出一些可能的技術 關鍵詞 多小波 矢量量化 s o f m m u i t i w a v i e t b a s e di m a g ev e c t o ro u a n t i z a t i o n a b s tr a c t v i s i o ni st h em o s ti m p o r t a n tw a yf n ro n et og e ti n f o r m a t i o nf r o mt h e o u t e rw o r l d i ti sb e t t e rt os e ef o ro n e s e l fr a t h e rt h a nt oh e a rf o r m a n yt i m e s a n do n ec a ng e ti n t u i t i o n i s t i c v i s u a i z e di m p r e s s i o nb y v i s i o n w i t ht h ef a s td e v e l o p m e n to fc o m p u t e ra n dd i g i t a lc o m m u n i c a t i o n t e c h n o l o g y e s p e c i a l l yw i t ht h er i s eo fi n t e r n e ta n dm u l t i m e d i a t h ei m a g e c o m p r e s s i o nh a sa t t r a c t e dm o r ea n dm o r e a t t e n t i o n w a v e l e ta n a l y s i si san e wk i n do ft i m e f r e q u e n c yt e c h n o l o g y w h i c h d e v e l o p e d o nt h eb a s i so ff o u r i e rt r a n s f o r m a n di th a s g o o d s p a c e f r e q u e n c yl o c a l i z a t i o nc h a r a c t e r i s t i c a st h ef u r t h e rd e v e l o p m e n t o fw a v e l e tm u l t i w a v e l e tn o to n l 7k e e p st h ee x c e l l e n tc h a r a c t e r i s t i c so f t i m ea n df r e q u e n c yf i e l do w n e db yw a v e l e tb u ta l s o o v e r c o m e st h ed e f e c t s o fw a v e l e t m u l t i w a v e l e te o m b i n e ss m o o t h n e s s c o m p a c t n e s s s y m m e t r ya n d o r t h o g o n a l i t yw h i c ha r ev e r yi m p o r t a n ti np r a c t i c e a n de s p e c i a l l yi n i m a g ec o m p r e s s i o ni th a sb e t t e rf u n c t i o n st h a nw a v l e t w h i c hr e s u l t si n m o r ea n dm o r er e s e a r c ha n da p p l i c a t i o n so ni t a so n em e t h o do fi m a g e1 0 s s yc o m p r e s s i o nv e c t o rq u a n t i z a t i o nh a s g r e a tc o m p r e s s i o nr a t i o g e n e r a l l ys p e a k i n g c o m p r e s s i o nr a t i oi sb i g g e r a n dh e n c ed i s t o r t i o ni sb i g g e r o nt h eo t h e rh a n d c o m p r e s s i o nr a t i oi s s m a l l e ra n dh e n c ed i s t o r t i o ni ss m a l l e r a tt h es a m et i m ev e c t o r q u a n t i z a t i o ni sa l s oap r o c e s sw i t hal o to fc o m p u t i n g b u tw i t hs o m e a m e i i o r a t i v ea l g o t i t h m s v e c t o r q u a n t i z a t i o nh a sb e c o m em o r ea n dm o r e m a t u r a t i o n a l t h ec e n t r a lw o r ko ft h i sp a p e rjst o p r o b ei n t ot h ec o e f f i c i e n t s w h i c ha r em a d e f r o mai m a g eb ym u l t i w a v l e t a n d a c c o r d i n gt ot h e l r d i s t r i b u t i o nc h a r a c t e r i s t i cav e c t o r q u a n t i z a t i o na l g o r i t h m is p u t f o r w a r d i ne x p e r i m e n tb a s e do nc lm u l t i w a v e l e ta n ds o f mai m a g ev e c t o r 1 1 q u a n t i z a t i o nd e s i g ni sa d v a n c e d t h e r ea r et w oc r e a t i o n s a sf o ll o w s f i r s t c o m h i r em u l t i w a v l e ta n ds o f mt om a k eav e c t o rq u a n t i z a t i o n s e c o n d d iv i d e c o e f f i e ie n t si n t ot h r e ep a r t s a c c o r d i n g t ot h e c h a r a c t e r i s t i co ft h e m t h e nr e s o l v et h ep r o b l e mo fs h o r t a g eo fm e m o r y a n da tt h es a m et i m ei m p r o v et h es p e e do fc o d i n ga n de n c o d i n g o fc o u r s e i ti sv e r yi m p o r t a n tf o ras e l fo r g a n iz a t i o nf e a t u r em a p n e t w o r kt os e l e c tag o o di n i t i a lt r a i n i n gc 0 11 e c t i o n a n di m a g el e n ai s a d o p t e dt od ot h ev i t a lj o b i m a g el e n ah a sar i c hf r e q u e n c ys p e c t r u m w h i c hc a na v o i dt h el o c a lo p t i m i z a t i o no fc o d et a b l e a n dp a r t i t i o nt h e f r e q u e n c ys p a c ee q u a b l yt om a k et h ec o d et a b l ef itf o ra sm a n yi m a g ea s p o s s i b l e t h ee x p e r i m e n tr e s u l ts h o wt h a tt h ec o d et a b l ew h i c hi sm a d e b yi m a g el e n ac a nf i tf o rm a n yd i f f e r e n ts t a t i s t i cf e a t u r ei m a g e st om a k e v e c t o rq u a n t i z a t i o n s i nt h ee n d w em a k eac o n e l u s i o na n dl o o kf o r w a r dt ot h ef u t u r eo f m u l t i w a v l e tw it hv e c t o rq u a n t i z a t i o n a n dp u tf o r w a r ds o m ep o s s i b l e t e c h n o l o g y k e yr o r d s m u i t i a v i e t v e c t o ro u a n t z a t i o n s 0 雕 i i i 基于多小波的圖像矢量量化研究 0 前言 視覺在人類感知中起著極為重要的作用 而視覺感知的結果和表現(xiàn)形式 圖像 能給人們以直觀而具體的物體形象 百聞不如一見 圖像是人們最熟悉 最樂于接受的信息傳輸媒體 是人類認識世界的重要信息來源 隨著多媒體和互 聯(lián)網(wǎng)的發(fā)展 圖像已成為多媒體技術中最重要的數(shù)據(jù)類型 圖像的處理與分析技 術已發(fā)展成為現(xiàn)代信號處理技術中專門的分支學科 不僅要求存儲和傳輸圖像 而且往往要求在保證質(zhì)量的前提下以較小的空間存儲圖像 以較少的比特率傳輸 圖像 而未壓縮的數(shù)字化圖像的信息量豐富 數(shù)據(jù)量過于龐大 因此 為了滿足 實際應用需要 有必要對圖像數(shù)據(jù)采用合適的方法進行壓縮處理 從而發(fā)展了專 門的研究領域 圖像編碼 作為通信 介質(zhì)存貯 數(shù)據(jù)發(fā)行 多媒體計算機等 技術的關鍵環(huán)節(jié) 圖像壓縮編碼算法的研究是信息技術中最活躍的研究領域之 一 尤其是進入2 l 世紀以后 電子技術和通信技術的發(fā)展使可視電話 會議電 視 數(shù)字電視 高清晰度電視 多媒體計算機 信息高速公路等的生產(chǎn)和建立成 為可能 在這一背景下 如何有效地組織 存貯 傳輸和恢復圖像數(shù)據(jù) 即探索 更有效 更高壓縮比的圖像編碼技術 尋找高效圖像壓縮編碼算法無疑成為了主 要的任務之一 對其研究也成為國際公認的熱點之 1 圖像處理領域 作為2 0 世紀8 0 年代末期出現(xiàn)的時頻分析工具 小波變換獲 得了廣泛的應用 尤其是圖像編碼和圖像去噪等方面 系數(shù)編碼是小波變換用于 壓縮的核心 小波變換壓縮的實質(zhì)是對系數(shù)的量化壓縮 在圖像處理的實際應用 中 正交性能保持能量 而對稱性 線性相位 既適合于人眼的視覺系統(tǒng) 又使信號 在邊界易于處理 所以 分析工具同時擁有這兩種性質(zhì)是十分重要的 可是 實 數(shù)域中 緊支 對稱 正交的非平凡單小波是不存在的 多小波 m u l t i w a v e l e t 是指由兩個或兩個以上函數(shù)作為尺度函數(shù)生成的小波 開創(chuàng)性地將單小波中由單個尺度函數(shù)生成的多尺度分析空間 擴展為由多個尺度 函數(shù)生成 以此來獲得更大的自由度 與多小波相聯(lián)系的是一個多重多分辨分析 m r a 多小波不但具備良好的時頻局部化特性 同時將實際應用中十分重要的 正交性 光滑性 對稱性 緊支性完美地結合在一起 因此在圖像壓縮方面多小 波有著比單小波更佳的性能 這一點引起了越來越廣泛的研究和應用多小波 量化技術是壓縮的一個重要環(huán)節(jié) 尤其矢量量化 是一種高效的數(shù)據(jù)壓縮技 基于多小波的圖像矢量量化研究 術 它有效利用了矢量中各分量間的四種相關性 線性依賴性 非線性依賴性 概率密度函數(shù)的形狀和矢量維數(shù) 來去除冗余度1 將多小波與矢量量化技術結合是一個新的領域 充分利用多小波比單小波更 多自由度的優(yōu)點 但是至今還沒有成熟的方法 本文中將提到一種算法 作為一 種應用上的嘗試 論文的主要內(nèi)容 第一章總體介紹了圖像壓縮技術的發(fā)展及應用 強調(diào)了圖像矢量量化技術在 圖像壓縮中的重要地位 并詳細介紹了矢量量化技術的基本原理 分類 發(fā)展概 況等 第二章闡述了多小波理論 通過介紹多小波的由來 基本理論 多小波的分 類及其特點 發(fā)展概況及應用等方面 是本文中的理論基礎部分 第三章介紹了自組織特征映射網(wǎng)絡s o f m 理論 以及運用s o f m 進行矢量量化 的基本原理 并且介紹了有關的研究成果 該章節(jié)也是本文的理論基礎部分 第四章也就是本文的核心部分 基于c l 多小波和s o f m 的圖像矢量量化 根據(jù)多小波與s o f t 網(wǎng)絡的特點 首先從理論上分析其可行性 然后通過實驗仿 真驗證了兩者結合進行矢量量化的合理性 并通過與單小波s o f m 矢量量化的性 能比較 得出多小波比單小波更適于矢量量化的結論 本文第五章對本文進行了總結討論了今后多小波圖像矢量量化技術的研究 發(fā)展方向 論文的研究意義 多小波比單小波具有更大的自由度 更能很好的描述一個函數(shù) 圖像 是 繼小波分析領域中一個新的方向 特別在圖像壓縮處理方面 而矢量量化是數(shù)字 壓縮的一個重要方面 將這兩種技術糅合在一起 又可能達到更好的壓縮效果 至今關于多小波系數(shù)的矢量量化組織方式還沒有成熟的方法 有著很大的研究空 問 如何合理的利用多小波的特性成了小波領域研究的熱點之一 2 基于多小波的圖像矢量量化研究 1 圖像矢量量化技術 1 1 圖像壓縮技術的發(fā)展 1 1 1 圖像壓縮概述 圖像是一種二維連續(xù)函數(shù) 即它的亮度是其位置的連續(xù)函數(shù) 為了能在計算 機上進行數(shù)據(jù)處理 首先要在空間上和亮度上對圖像進行數(shù)字化 在空間位置上 的數(shù)字化 一幅圖像可以看作是一個有限的數(shù)列或者矩陣 此過程稱為采樣 而 亮度上的數(shù)字化是將得到的圖像亮度離散為整數(shù)值 此過程稱為量化 數(shù)字圖像 就是經(jīng)過采樣和量化后的圖像數(shù)據(jù) 圖像矩陣中的元素就是像素 p i x e l g 圖像可以看作是全體像素的集合 圖像數(shù)據(jù)種類很多 按顏色分為黑白與彩色圖 像 按動靜分類 有靜止圖像和運動圖像之分 按灰度級說 由可以分為灰度圖 像和二值圖像 從用途上來講 有電視 可視電話 動畫 視頻會議等 圖像的相鄰像素之間 相鄰行之間或者相鄰楨之間都存在著較強的相關性 也就是圖像信號存在諸如空間冗余 時間冗余 結構的冗余 視覺冗余和知識冗 余等 利用某種編碼方法在一定程度上消除這些相關特性或冗余 可以實現(xiàn)圖像 數(shù)據(jù)的壓縮編碼 從信息論觀點看 描述圖像信源的數(shù)據(jù)是由有效信息量和冗余量兩部分組成 的 在保持圖像原有信息量的同時 去除冗余量能夠節(jié)省存儲和傳輸中的開銷 同時又不損害圖像信源的有效信息量 圖像編碼與壓縮從本質(zhì)上來說就是對要處 理的圖像數(shù)據(jù)源按一定的規(guī)則進行變換和組合 從而實現(xiàn)以盡可能少的代碼 符 號 來表示盡可能多的數(shù)據(jù)信息 若壓縮編碼過程是盡量將無用的冗余信息去除 恢復的圖像與原始圖像完全 一樣 此過程則屬于無失真編碼 1 0 s s l e s sc o d i n g 若壓縮編碼是結合人眼所 覺察或者在人的視覺可接受的范圍內(nèi) 則該過程屬于失真編碼 圖像壓縮包括編碼和解碼兩個過程 一般編碼過程的流程圖如下圖所示 編 碼可分為三個階段 原始圖像 墮至三受三二l 三至至垂至至三二 三三丑編碼比特流 圖像編碼的流程圖 基于多小波的圖像矢量量化研究 1 圖像分解 圖像分解也就是圖像變換 其目的就是將相關性強的圖像數(shù)據(jù)變換成相關 性弱的數(shù)據(jù) 即變換后數(shù)據(jù)的能量盡可能地集中在少許系數(shù)上 圖像變換一般是 線性變換 如k l 變換 f o u r i e r 變換 d c t 變換 w a l s h 變換 子帶濾波 小波 變換等 其逆變換一定存在 以便于圖像的重構 2 量化 變換后數(shù)據(jù)的量化包括兩種量化方法 標量量化 s c a l a rq u a n t i z a t i o n 簡寫s q 和矢量量化 v e c t o rq u a n t i z a t i o n 簡寫v q 標量量化是對單個像素 進行量化 而矢量量化是對一組像素進行量化 由于量化改變數(shù)據(jù)值 將損失一 些信息 使得原始圖像與重構圖像之間產(chǎn)生了誤差 3 無損壓縮 量化后的數(shù)據(jù)經(jīng)過無損編碼 如編碼 算術編碼 游程編碼等 可以進一步 壓縮 無損編碼的基本思想 依據(jù)代表數(shù)據(jù)的符號出現(xiàn)的概率大小重新分配碼字 即概率大的符號用低比特碼字 概率小的符號用高比特碼字 壓縮算法的性能評價 圖像壓縮質(zhì)量即壓縮后恢復圖像的效果 通常人們采用客觀尺度和主觀尺度相結 合的方法來評價 客觀尺度 可以使用以下指標 峰值信噪比 p s n r l o l o g 9 2 m s e 單位為d b 噸掣m n 刪 廠2 0 y l g y 一f x 單位為d b 式中 q 表示圖像數(shù)據(jù)的量化級數(shù) 如對于標準灰度圖像使用8 比特均勻量化則 量化級數(shù)為2 5 6 當峰值信噪比超過3 0 d b 時 人的視覺無法或者不易分辨出恢 復圖像與原始圖像的差別 均方誤差m s e 定義為 4 基于多小渡的圖像矢量量化研究 m s e 麗 芻m 善nk 小衲 在這里 f x y 夕 y 分別表示原始圖像數(shù)據(jù)和恢復后的圖像數(shù)據(jù) z y 為圖 像平面的坐標 m 和n 為圖像的尺寸 由于主觀評價圖像恢復質(zhì)量比較復雜和困難 因此 在大多數(shù)情況下 人們 采用峰一峰信噪比 p s n r 作為評價恢復圖像質(zhì)量的主要尺度 主觀尺度 是指觀察者對圖像壓縮效果的主觀感覺 不同的人對圖像質(zhì)量的主觀感覺可能是不相同的 因此 在評價圖像壓縮質(zhì) 量時往往采用客觀尺度 算法效率 主要指標包括 壓縮比 壓縮率 定義為c r 一編碼前每像素平均所需位數(shù) 編碼后每 像素平均所需位數(shù) 比特率 也稱碼率 r 表示壓縮后表示每一個像素平均所需位數(shù) 算法的時間和空間復雜度 圖像壓縮算法的設計目標是具有好的壓縮質(zhì)量 較高的壓縮比和較低的時空 復雜性 但是有時候 壓縮質(zhì)量和算法效率是相互制約的 提高壓縮比往往會導 致算法效率降低 或者提高算法效率往往會導致壓縮比的降低 1 1 2 圖像壓縮分類 圖像編碼壓縮的方法目前已有很多種 其分類方法視出發(fā)點不同而有差異 從壓縮技術和方法上看 圖像壓縮可以分為無損壓縮和有損壓縮 無損壓縮對圖像本身的質(zhì)量沒有任何影響 只會影響存儲容量和傳輸速率 目前無損壓縮技術已經(jīng)很成熟 主要有s h a n n o n 編碼h u f f m a n 編碼 算術編碼 游程長度編碼及l(fā) z w 編碼等 無損壓縮的壓縮率是很有限的 有損壓縮的結果直接關系到壓縮后圖像的質(zhì)量 視覺效果 存儲容量及數(shù) 據(jù)傳輸量 因此有損壓縮的理論和方法一直是圖像壓縮研究中最活躍的方面 本 論文題研究的內(nèi)容屬于靜止圖像的有損壓縮編碼 有損壓縮能達到很高的壓縮 比 一般為幾十倍 基于多小波的圖像矢量量化研究 1 1 3 圖像壓縮方法 下面 介紹一下各種基本算法 1 預測編碼 p r e d i c t i v ec o d i n g 預測編碼是一種針對統(tǒng)計冗余進行壓縮的方法 利用圖像的相關性實現(xiàn)壓 縮的 它根據(jù)某一模型利用以往的樣本值對于新樣本值進行預測 然后將樣本的 實際值與其預測值相減得到一個誤差值 對這一誤差值進行編碼 如果模型選的 足夠好且樣本序列在時間相關性較強 那么只需存儲或傳輸起始像元和模型參數(shù) 就可能代替整個一幀圖像了 從而得到較好的數(shù)據(jù)壓縮效果 預測編碼方法中最 常用的是差分脈沖編碼調(diào)制法 d p c md i f f e r e n t i a lp u l s ec o d em o d u l a t i o n 2 變換編碼 t r a n s f o r mc o d in g 變換編碼也是針對統(tǒng)計冗余進行壓縮的方法 它的實現(xiàn)壓縮也是利用圖像 的相關性 正交變換可以去掉相關性 因此能去除原圖像中的冗余信息 實現(xiàn)壓 縮 它是將圖像光強矩陣 對域信號 變換到系數(shù)空間 瀕域 上進行處理的方法 在空間上具有強相關的信號 反映在頻域上是某些特定區(qū)域內(nèi)能量常常被集中在 一起 或者是系數(shù)矩陣的分布具有某些規(guī)律 利用這些規(guī)律分配頻域上的量化比 特數(shù) 從而達到壓縮的目的 變換編碼總是選正交變換來做 因為只有正交變換才能保證解碼運算有解 且運算方便 變換編碼方法常用的有以下幾種 1 k l k a r h u n a n 一1 0 e v e r 變換是最優(yōu)正交變換 具有最小失真 能集中與 去除相關性最佳等特點 但是由于沒有通用變換矩陣核和快速算法 k l 變換 般只作為一種方法用來對新方法 新結果進行分析比較 并沒有真正用到編碼系 統(tǒng)中 2 離散余弦變換 o c t 變換 是接近k l 變換的次最優(yōu)正交變換 方差分布 比較接近k l 變換 且存在通用的快速算法 目前在圖像編碼方案中被廣泛采用 一般圖像編碼方案中采用二維離散余弦變換 3 小波變換 w a v e l e tt r a n s f o r m a t i o n 是八十年代中后期興起的數(shù)學分 支 現(xiàn)在己不僅僅是純數(shù)學的研究工具 而足作為 種實際應用的理論 越來越 受到數(shù)學界及工程界的重視 小波變換可以對時問和頻率同時進行分解 一些實 驗結果表明 在某些情況下 小波變換優(yōu)于d c t 等某它正交變換 6 基于多小波的圖像矢量量化研究 另外 變換編碼方法中還有多小波變換 哈爾變換 w a i s h h a d m a r d 變換 斜變換等變換方法 3 信息熵編碼 1 e n t r o p yc o d i n g 信息熵編碼是根據(jù)信息熵原理 讓出現(xiàn)概率大的用短的碼字表達 出現(xiàn)概率 小的用長的碼字表達 使編碼效率逼近熵值 從而減少數(shù)據(jù)在傳輸和存儲時的冗 余度的編碼方法 利用信息熵編碼的方法中 比較典型的方法有h u f f m a n 編碼 游程編碼和算術編碼 h u f f m a n 編碼的原理是對于出現(xiàn)概率大的信息符號編以短字長的碼 對于出 現(xiàn)概率小的信息符號編以長字長的碼 游程編碼的主要思路是將一個相同值的連續(xù)串用一個代表值串長來代替 算術編碼是將被編碼的信息表示成實數(shù)0 和l 之間的一個問隔 信息越長 編碼表示它的間隔就越小 表示這一間隔所需的二進制位就越多 信息源中連 續(xù)的符號根據(jù)某一模式生成概率的大小來減少間隔 可能出現(xiàn)的符號要比不可 能出現(xiàn)的符號減少范圍的少 算術編碼具有自適應模式 其概率模型可以根據(jù) 出現(xiàn)的符號作相應的改變 只要編碼器和解碼器使用相同的初始模型和相同的 改變方法 就能準確的解碼 j p e 6 成員對多幅圖像的測試結果表明 算術編碼 比t t u f f m a n 編碼能提高5 左右的編碼效率 在j p e g 的擴展系統(tǒng)中 用算術編 碼方法取代了t t u f f i n a n 編碼方法 4 分頻帶編碼 s u b b a n dc o d i n g 將圖像數(shù)據(jù)變換到頻域后 按頻率分帶 然后用不同的量化器進行量化 從而達到最優(yōu)的組合 或者是分步漸進編碼 在初始時對某一頻帶的信號進行 解碼 然后逐漸擴展到所有頻帶 隨著解碼數(shù)據(jù)的增加 解碼圖像逐漸清晰 以上介紹的編碼方法 都是從信號處理理論出發(fā)的 統(tǒng)稱為模型編碼方法 我們把利用知識模型和空間模型的編碼方法統(tǒng)稱為模型編碼 模型編碼方法中 常用的方法包括結構與特征編碼 分析與合成編碼 認識結構編碼以及智能編 碼等 5 矢量量化壓縮編碼 矢量量化編碼是一種高效的圖像壓縮編碼算法 能有效利用矢量中各分量 之間以及各矢量之間的關聯(lián)特性來消除冗余 使一種圖像塊編碼方法 優(yōu)點是壓 基于多小波的圖像矢量量化研究 縮比高 解碼迅速 缺點是算法對初始訓練集比較敏感 恢復圖像存在可見的方 塊效應 并且圖像細節(jié) 邊緣部分失真嚴重 編碼時間長 6 神經(jīng)網(wǎng)絡壓縮編碼 b p 網(wǎng)絡輸入層與隱含層之間的加權值就相當于一個編碼器 隱含層與輸 出層之間加權相當于一個解碼器 從輸入端輸入的原始圖像數(shù)據(jù)經(jīng)過神經(jīng)網(wǎng)絡的 處理在隱含層得到的輸出數(shù)據(jù)就是原始圖像的壓縮編碼 b p 神經(jīng)網(wǎng)絡用于圖像 編碼的壓縮比 輸入層節(jié)點數(shù) 隱含層節(jié)點數(shù) k o h o n e n 自組織網(wǎng)絡亦可直接用于圖像編碼 它能夠構成一個矢量量化 器 對圖像進行矢量量化編碼 詳情請見本文第三章 下面介紹一些新的壓縮方法 1 分形壓縮編碼 分形圖像壓縮是利用原始圖像所具有的自相似性 構造一個迭代函數(shù)系統(tǒng) i f s 利用i f s 抽取圖象的自相似性 基于方塊劃分的圖像壓縮方案 其主 要特點是高壓縮比 運算速度與提高圖像分辨率關系不大 選擇適當?shù)姆中文P?完全可以構造清晰的邊緣細節(jié) 壓縮時計算量大 時間長 而解壓時則很快 2 嵌入式塊最優(yōu)截斷 e b c o t 編碼 嵌入式塊最優(yōu)截斷 通常簡稱為e b c o t 編碼方法主要由t a u b m a n 與 m a r c e ll i n 等人于1 9 9 9 年首先提出 與e z w 以及s p i h t 等嵌入式編碼方法不同 的時 e b c o t 方法處理的對象不是整幅圖像 而是把圖像分成若干個互不重疊的 圖像片 i m a g et i l e s 并對每一個圖像片進行獨立的編解碼操作 以及對每一 個圖像片進行獨立的編解碼處理 同時e b c o t 也沒有使用零樹結構而是使用編碼 塊 并在編碼過程中提出了一種稱為壓縮后率失真優(yōu)化的算法產(chǎn)生的碼流 使用 e b c o t 進行圖像編碼不僅能實現(xiàn)對圖像的有效壓縮 同時產(chǎn)生的碼流具有分辨率 可伸縮性 信噪比可伸縮性 隨機訪問和處理等 在最近推出的國際靜態(tài)圖像壓 縮標準j p e g 2 0 0 0 中 聯(lián)合圖像專家組選定以該算法作為j p e g 2 0 0 0 的核心算法 3 基于小波的分形圖像編碼 基于小波變換的分形壓縮的基本思想是 由于小波變換把圖像分解為不同 空間頻帶上的子圖像 且不同層所對應的子圖像結構之間存在很大的相似性 因 基于多小波的圈像矢量量化研究 此分形壓縮算法主要是利用圖像空間結構的相似性進行壓縮 這樣 就可以在小 波變換后的高層子圖像內(nèi)進行基本分形壓縮 并根據(jù)分形的特點 利用不同層子 圖像之間的相似性 以求獲得更高的壓縮比 同時在小波變換后的高層子圖像內(nèi) 進行壓縮 圖像分割后的r 塊域和其相應的重疊塊d 塊域內(nèi)的圖像塊數(shù)目大大減 少 所以匹配的尋找時間也就相應大幅度地減少 達到了縮短編碼時間的目的 4 自適應網(wǎng)格編碼 這種編碼的原理是 設想一張由結點組成的正規(guī)網(wǎng)格覆蓋在圖像的表面上 圖像上不同的特征對結點產(chǎn)生與其相適應的吸引力 正規(guī)網(wǎng)格上的結點就會按圖 像特征的重要性大小 不同程度地聚集在特征周圍 形成能跟蹤特征的自適應網(wǎng) 格 在這個基礎上 對自適應網(wǎng)格的結點的位置 值以及重建圖像所需的系數(shù)進 行編碼 5 圖像漸進式編碼 基于小波變換或者多小波變換 根據(jù)圖像的系數(shù)分布特點 有順序地傳送 系數(shù) 先川低頻 后高頻系數(shù) 在解碼端先觀察到圖像的輪廓 慢慢觀察到整幅 圖像 細節(jié)成分豐富了 基于多小渡的圖像矢量量化研究 1 1 4 圖像壓縮技術的發(fā)展與現(xiàn)狀 隨著信息技術的發(fā)展 對圖像的壓縮編碼技術的應用越來越廣泛 從家庭娛 樂到專業(yè)的通信設備 從廉價的消費電子產(chǎn)品到昂貴的專業(yè)級專用設備 如 v c d d v d i p 上的視頻服務 數(shù)字圖書館 可視電話 視頻會議 數(shù)字電視 高 清晰電視 數(shù)碼相機 數(shù)字圖像監(jiān)控 網(wǎng)絡攝像頭等設備 圖像壓縮研究始于1 9 4 8 年針對電視圖像傳輸j f l i 提出的脈沖編碼調(diào)制 p c m 原理 從無失真的香農(nóng)信息論定義下的熵編碼到現(xiàn)今注重視頻特點的有損壓縮 人們已研究并提出輯種各樣的壓縮方法 根據(jù)原理可以分為幾類 預測編碼 變換編碼 矢量編碼 熵編碼和子帶編碼等 預測編碼和變換編碼是靜止圖像編 碼中的兩個主要技術 對于這兩個技術 人們也從理論到硬件實現(xiàn)都進行了深入 的研究 1 9 6 9 年舉行的首屆 圖像編碼會議 表明圖像壓縮編碼己作為一個相 對獨立的學科出現(xiàn) 到7 0 年代末 圖像編碼日臻成熟 其標志就是圖像編碼的 國際標準的制定 即1 8 0 i e c 關于靜止圖像的編碼標準j p e c c i t t 關于電視電 話 會議電視的視頻編碼標準h 2 6 1 h 2 6 3 和i s o i e c 關于活動圖像的編碼標準 m p e g 同時 分形和神經(jīng)剛絡在圖像壓縮編碼中取得重要進展 在j p e g 和m p e g 標準中 關鍵技術部分是d c t 編碼 這些圖像編碼算法融合了前面各種性能優(yōu)良 的圖像編碼方法 也是對傳統(tǒng)編碼技術的總結 1 9 8 8 年以前主要研究的壓縮編 碼方法通常稱為 傳統(tǒng)方法 其后提出的具有重要發(fā)展前景的方法稱為 現(xiàn)代 方法 目前基于小波變換技術的新的靜止圖像壓縮標準j p e g2 0 0 0 已經(jīng)公布 這預示著在下一代的靜止圖像編碼設備中 小波變換編碼成為主流技術 并且在 小波基礎上又產(chǎn)生了很多新的編碼方法 例如基于行的圖像編碼方法 零樹編碼 多級樹集合分裂算法s p i h t 漸進傳輸?shù)?新的編碼標準也在不斷研究發(fā)展著 基于模型編碼的m p e g 一4 和m p e g 一7 等新的圖像編碼標準 隨著應用要求的提高 傳統(tǒng)壓縮方法在壓縮效率和壓縮效果等方面己不能滿 足圖像處理的需要 因此高質(zhì)量 高效率的智能圖像壓縮算法成為了國際研究 的重點和目標 研究的思路主要有兩種 一是用新的精度更高的技術來實現(xiàn)已 有壓縮算法 二是尋求全新的圖像壓縮理論 算法和相應的實現(xiàn)技術 有壓縮算法 二是尋求全新的圖像壓縮理論 算法和相應的實現(xiàn)技術 基于多小波的圖像矢量量化研究 1 2 圖像矢量量化技術 1 2 1 矢量量化 矢量量化 v e c t o rq u a n t i z a t i o n 是2 0 世紀5 0 年代由香農(nóng)提出的 其處理 對象不是取樣圖像陣列中的單個像素 而是由n 個像素組成的矢量 具體地說 矢量量化是從輸入矢量空間到碼本空間的映射 即 q 月 一w w 1 w a w i w r i 1 2 a 1 其中 r 為k 維輸入矢量空間 w 為k 維的碼本空間 設s 扛 i 1 2 a 是 相應于碼本空間w 的分割 其中n 為碼本中的碼矢數(shù) 則有 y s r 且s is 妒i j 廬為空集 2 如果訓練矢量為x x x a x h r k i 1 2 人 m 則矢量量化的碼本設計 就是將上述訓練矢量分配給這n 個類 每個類由一個k 維碼矢來代表 這就是聚 類過程i 1 設碼本為b b ib 2 a b lb 量 f 1 2 a 待量化的k 維矢量為 f 厶 a 厶 7 矢量量化就是將該矢量作為一個整體進行聯(lián)合量化 如果 f s 0 j v 則用子空間s 中的碼矢b 代表f 即將落入子空間s 中的任 何待量化矢量均量化成b 重建時 用b l 來近似代替該量化矢量 且此時的量化 誤差應達到極小 如果用f 于碼本中各碼矢b j 1 2 a v 之間的差別函數(shù)d f j 來表征兩 矢量的量化誤差 例如可令d f s 只一b j 7 只一b j 則必然有 d f j d f b v z 不過在矢量傳輸時 發(fā)送端發(fā)出的不是f 也不是 b 而是碼矢島的下標 在接收端 根據(jù)下標 再從與發(fā)送端相同的碼本中查找 到相應的碼矢島 并將其作為輸入矢量f 的重建矢量 由于 的數(shù)據(jù)量一般要比 輸入矢量f 的數(shù)據(jù)量小得多 因而達到了數(shù)據(jù)壓縮的目的 矢量量化的原理如下 基于多小波的圖像矢量量化研究 圖所示 從上可知 矢量量化具有如下幾個明顯的特點 壓縮比極大 由于接收端持有與發(fā)送端相同的碼本 很長的一個碼矢量在 信道中不需要完全傳輸 只需用把它的序號輸出即可 這在繁忙的現(xiàn)代通信 業(yè)務中 節(jié)約了寶貴的信道空間 這個壓縮比在一定范圍內(nèi)是可以控制的 碼矢的長度越長 數(shù)量越少 壓縮比就越大 反之越小 矢量量化是有損壓縮 必然會造成一定程度的失真 一般地講 壓縮比越 大 失真越大 壓縮比越小 失真越小 矢量量化是個計算量很大的過程 其傳輸和解碼都很簡單 主要在編碼時 的計算是個很大的困難 每輸入一個 都要將它與碼本中的每個矢量進行 比較 這是一個逐個搜索的過程 其復雜程度與矢量個數(shù)n 和碼書的長度 有關 也與矢量維數(shù)k 有關 矢量量化的基本原理是很容易理解的 但實際應用可不是一件輕松的事 因 為在選取相應參數(shù)的時候涉及到復雜的數(shù)學問題 現(xiàn)介紹一些當前的矢量量化技 術 1 2 2 典型矢量量化算法及特點 l b g 算法 1 9 8 0 年l i n d e b u z o 和g r a y 設計的有關矢量量化碼書設計算法是目前最經(jīng) 典的算法 稱為l b g 算法 對于給定的訓練集 獲得碼本的訓練方法是矢量量 化器設計的核心問題之一 因為l b g 算法理論上的嚴密性和實施過程中的簡便 性 以及較好的設計效果而得到廣泛的應用 并成為各種改進算法的基礎 l b g 算法的過程如下所示 基于多小波的圖像矢量量化研究 1 設l 是分層數(shù) 預定一個失真f 限占 0 假設初始碼本記為a 五 皇 量 a 皇 訓練集為 x t 叫 a 2 給出a x 女 k 1 2 a 上 是第m 次迭代的碼本 對訓練集進行劃分 將 訓練集劃分成l 個集合 c k 1 2 人 三 劃分的原則是 如果d x 量 d j 龕 工 z 那么將五劃歸c 即x 弗計算失真 專簍m n 皇 3 如果 d m 一 一d m d m 占 則停止迭代 并令a 為最終碼本 否則繼續(xù) 4 形成 1 次碼本集 令 盒 2 南影 這里l l c 劉是c 中矢量個數(shù) 令爿 t k 1 2 a 三 轉向 2 m l 在這個算法中 初始值是很重要的 如果選擇得不好 則迭代算法收斂到局部最 優(yōu)而不是全局最優(yōu) 當碼本確定后 矢量量化器可能對每一個輸入矢量與碼本中 的每一個碼矢作比較 這就是一般的全搜索算法 如果l 是2 的整數(shù)冪 與每一 個碼矢比較需要n 次運算 一個矢量的量化需要的運算量為l n 設每個采樣值 的平均碼率r 1 0 9 2 l n 則l 2 因此 一個矢量量化的運算量為n 2 它是矢量維數(shù)n 和碼率r 的指數(shù)函數(shù) 隨著n 和r 的增大 運算量將非常巨大 其它矢量量化算法 為了解決碼本訓練和碼字搜索中的一些問題 科學家作了大量的研究工作 針對這些問題提出了許多改進的方案 例如 均值 形狀矢量量化 基于多小波的圖像矢量量化研究 將輸入矢量變換成一個0 均值和方差為1 的標準矢量 避免矢量分布過于分 散 在預先的碼本訓練時 訓練集也作同樣的處理 分類矢量量化 根據(jù)圖像像素矢量性質(zhì)的不同 例如一個矢量對應于圖像中的邊 平滑的背 景 復雜的紋理等 將矢量分成m 類 每一類有各自的碼本 在預先的碼本訓 練時 也用同樣的分類指示器將訓練矢量分成m 類 每一類根據(jù)要求的分層數(shù)單 獨進行訓練 分層矢量量化 根據(jù)圖像的局域性質(zhì) 可以將圖像分成不同大小的塊 即不同大小的矢量 例 如2 2 4 4 8 8 等 這種分解可以是自頂而下的 一般某一大小的塊一旦符 合某一個條件 就不進一步分解 在訓練集中 也作同樣的處理 對不同大小塊 產(chǎn)生不同的碼本 分級矢量量化 為了進行多級質(zhì)量控制 可以采用分級矢量量化 第一級矢量量化是對原始 矢量進行量化 產(chǎn)生輸出序號k 和量化誤差 量化誤差矢量可以送入第二級矢量 量化器再進行處理 每增加一級 都使得最終質(zhì)量有所提高 樹形搜索 為了克服全搜索的大運算量 將碼本按樹形結構分組 搜索從根節(jié)點開始 每次比較上 下兩組碼本的一個代表碼矢 確定進入上分支或下分支 這個過程 一直到最終層 得到最終碼矢 如果 則搜索次數(shù)可能從降低到次 但碼本存儲 量增加約一倍 因為在每一層都要存儲系列碼矢的代表值 最底層存儲的是真正 的碼本 這種搜索方法可能得不到全局最優(yōu)的碼矢 s o f m 自學習矢量量化 這一種方法將在后面的章節(jié)罩介紹 因為其自學習和聚類能力 作為我們 試驗的首要方法 此外 學者們對各種基本方法進行了改進 發(fā)展了等誤差競爭學習算法 多層自組織特征映射聚類法 基于人工蟻群優(yōu)化的矢量量化碼書設計算法 遺傳 l v q 聚類算法等 基于多小波的蹦像矢量量化研究 2 多小波理論及其應用 2 1 多小波理論 2 1 1 多小波發(fā)展歷史 在討論多小波的歷史淵源之前我們先了解一下什么是多分辨分析吧 多分辨分析是這樣定義的 f b j l 2 忸 中一列閉子空間e l 稱為上2 心 的 一個多分辨分析 m r a 如果該序列滿足下列條件 1 單調(diào)性 k 一一 一 c a z 2 逼近性 i 一 o 啄 三2 忸 e z 一 3 伸縮性 x 錚f 2 x 一w z 4 平移不變性 x 虼j f x k k v ke z 5 r io s z 基存在性 存在g 仨v o 使塘扛一 ik z 構成 的r i e s z 基 在這里 r a 的概念給出了人類視覺系統(tǒng)對物體認識的物理描述 實際上 如果 把一當作某人在某種尺度j 下所觀察到的該物體的信息 如3 維物體的兩個面 則當尺度增加到j l 時 他所觀察到的信息為以 3 維物體的全部 此時可以 認為是他進一步靠近目標所觀察到的信息 因此 所表示的信息應該比 更 為豐富 即 三一 l 總之 尺度越大 距離目標越近 觀察到的信息就越豐富 反之 尺度越小 距離越遠 含有的信息量越少 由于物體的局部細節(jié)有時候顯 得更為重要 因此通過對補空間的研究從而了解細節(jié)顯得非常重要 而這個所謂 的補空間就是由小波基函數(shù)生成的空間 基于多分辨分析理論 人們可以很好的理解小波分析 小波分析屬于調(diào)和分析 是現(xiàn)代傅立葉分析這一重要學科半個世紀以來的工 作之結晶 它廣泛應用于圖象壓縮 信號處理 數(shù)值分析 流體動力學理論 以 及地震預報 油氣田預測等諸多領域 小波理論建立的最初理由非常簡單 為了 基于多小波的圖像矢量量化研究 把r r 空間分解成一個函數(shù)的伸縮平移而形成的級數(shù) 1 9 0 9 年b a a r7 構成了一 個正交規(guī)范基 從現(xiàn)在來看 它是最簡單的小波規(guī)范正交基 有好的局部性 但 基函數(shù)缺乏光滑性 1 9 8 4 年法國地球物理學家j m o r l e t 在分析地震波的局部 性質(zhì)時發(fā)現(xiàn)傳統(tǒng)的f o u r i e f 變換難以達到要求 因此他引進小波的概念 并用于 信號分析中對信號進行分解 1 9 8 6 年 m e y e r 創(chuàng)造性地構造出一個快速下降的無 窮可微的函數(shù) 它的二進伸縮與平移系渺小g 2 2 妒 2 一 x 一七l t z 構成 上2 伍 的規(guī)范正交基 同時也是所有s o b o l e v 空間的無條件基 繼m e y e r 小波提 出之后 l e m a r i e 和b a t t l e o 又分別獨立地構造出具有指數(shù)衰減的k 次可微的小 波函數(shù) 并具有k 次消失矩 其平移和二進伸縮構成 2 紐 的規(guī)范正交基 同時 也是s o b o l e v 空間y ss t 1 的無條件基 1 9 8 7 年m a l l a t o 巧妙地將計算機視 覺領域的多尺度分析的思想引入到小波分析中 給出了構造小波正交基的一般方 法 從而成功地統(tǒng)一了在此之前的m e y e r l e m a r i e 和b a t t l e 提出的具體小波函 數(shù)的構造 研究了小波變換的離散形式 并給出了現(xiàn)今稱之為m a l l a t 算法 還 把它應用到圖像處理中 1 9 8 8 年t d a u b e c h i e s 利用多尺度思想構造出具有緊 支集的正交小波基 把小波理論向前推進了一大步 這樣小波分析的系統(tǒng)理論初 步得到建立 但這些正交小波缺乏對稱性 其后 c o h e n d a u b e c h i e s j 構造了 雙正交小波基 其尺度函數(shù) 小波函數(shù)及相應的對偶尺度函數(shù) 對偶小波函數(shù)都 具有對稱性和緊支集 1 9 9 0 年c h u i 1 等人構造出基于樣條函數(shù)的所謂單正交小 波函數(shù) 并討論了具有最好局部化性質(zhì)的多尺度分析的生成函數(shù)及相應的小波函 數(shù) w i c k e r h a u s e r2 1 4 等將m a l l a t 算法進一步深化 得n d 波包算法 并
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 鏟車操作人員安全教育與培訓合同
- 餐飲場地租賃及品牌形象設計合作協(xié)議
- 施工安全監(jiān)督站
- 車輛及運輸管理制度
- 文化遺產(chǎn)活態(tài)傳承路徑研究
- 2025至2030中國河沙行業(yè)市場現(xiàn)狀分析及競爭格局與投資發(fā)展報告
- 2025至2030中國柱拉伸模具行業(yè)發(fā)展研究與產(chǎn)業(yè)戰(zhàn)略規(guī)劃分析評估報告
- 熟食連鎖活動方案
- 燕窩店促銷活動方案
- 愛國主義跨年活動方案
- 2025年小學教師班主任能力提升計劃
- 2025年全國統(tǒng)一高考英語試卷(全國一卷)含答案
- GB/T 2982-2024工業(yè)車輛充氣輪胎規(guī)格、尺寸、氣壓與負荷
- 福建省廈門市2024年高一下學期期末考試英語試題含解析
- 渣土運輸安全責任書
- 注塑模具課程設計說明書罩蓋
- 2022年杭州市中小學教師職稱考試卷
- 廣東佛山生育保險待遇申請表
- 機械原理課程設計說明書精壓機
- 三年級除法豎式謎
- 抖音快閃自我介紹(含背景音樂)
評論
0/150
提交評論