版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、PAGE IIIPAGE IV 目 錄TOC o 1-3 h u HYPERLINK l _Toc26011 摘要 PAGEREF _Toc26011 I HYPERLINK l _Toc8484 Abstract PAGEREF _Toc8484 II HYPERLINK l _Toc18175 第1章 緒論 PAGEREF _Toc18175 1 HYPERLINK l _Toc12601 1.1 課題背景 PAGEREF _Toc12601 1 HYPERLINK l _Toc28574 1.1.1 離散余弦變換 PAGEREF _Toc28574 2 HYPERLINK l _Toc1
2、9428 1.1.2 預(yù)測技術(shù) PAGEREF _Toc19428 3 HYPERLINK l _Toc1187 1.2 圖像壓縮技術(shù)的發(fā)展和現(xiàn)狀 PAGEREF _Toc1187 3 HYPERLINK l _Toc30173 1.2.1 圖像編碼技術(shù)發(fā)展歷史 PAGEREF _Toc30173 3 HYPERLINK l _Toc829 1.2.2 圖像編碼技術(shù)的現(xiàn)狀 PAGEREF _Toc829 4 HYPERLINK l _Toc23971 1.3 MATLAB 及其圖像處理工具箱 PAGEREF _Toc23971 4 HYPERLINK l _Toc5582 1.4 論文組織結(jié)構(gòu)
3、 PAGEREF _Toc5582 5 HYPERLINK l _Toc27242 第2章 圖像壓縮編碼理論算法 PAGEREF _Toc27242 6 HYPERLINK l _Toc15274 2.1 DCT變換的思想來源 PAGEREF _Toc15274 6 HYPERLINK l _Toc18273 2.2 基于DCT的JPEG圖像壓縮編碼步驟 PAGEREF _Toc18273 8 HYPERLINK l _Toc8138 2.2.1 顏色空間的轉(zhuǎn)換和采樣 PAGEREF _Toc8138 8 HYPERLINK l _Toc30226 2.2.2 二維離散余弦變換 PAGEREF
4、 _Toc30226 9 HYPERLINK l _Toc7713 2.2.3 DCT系數(shù)的量化 PAGEREF _Toc7713 12 HYPERLINK l _Toc2291 2.2.4 量化系數(shù)的編排 PAGEREF _Toc2291 13 HYPERLINK l _Toc13419 2.2.5 DC系數(shù)的編碼 PAGEREF _Toc13419 14 HYPERLINK l _Toc28520 2.2.6 AC系數(shù)的編碼 PAGEREF _Toc28520 15 HYPERLINK l _Toc17077 2.2.7 組成位數(shù)據(jù)流 PAGEREF _Toc17077 16 HYPERL
5、INK l _Toc18100 2.2.8 DCT變換在圖像壓縮中的應(yīng)用 PAGEREF _Toc18100 19 HYPERLINK l _Toc24818 2.3 JPEG2000壓縮算法 PAGEREF _Toc24818 19 HYPERLINK l _Toc32697 2.3.1 小波變換 PAGEREF _Toc32697 20 HYPERLINK l _Toc31311 2.3.2 量化 PAGEREF _Toc31311 20 HYPERLINK l _Toc26488 2.3.3 熵編碼 PAGEREF _Toc26488 21 HYPERLINK l _Toc9264 2.
6、3.4 位流組織 PAGEREF _Toc9264 21 HYPERLINK l _Toc20640 2.4 JPEG與JPEG2000的區(qū)別 PAGEREF _Toc20640 21 HYPERLINK l _Toc5620 2.5 本章小結(jié) PAGEREF _Toc5620 23 HYPERLINK l _Toc20161 第3章 基于DCT的圖像壓縮MATLAB仿真實現(xiàn) PAGEREF _Toc20161 24 HYPERLINK l _Toc4079 3.1 數(shù)字圖像文件的讀寫 PAGEREF _Toc4079 24 HYPERLINK l _Toc14293 3.2 程序流程圖 PA
7、GEREF _Toc14293 26 HYPERLINK l _Toc13126 3.3 DCT變換的編程實現(xiàn) PAGEREF _Toc13126 27 HYPERLINK l _Toc1846 3.4 MATLAB仿真結(jié)果 PAGEREF _Toc1846 27 HYPERLINK l _Toc6541 3.5 實驗結(jié)果分析 PAGEREF _Toc6541 29 HYPERLINK l _Toc21830 3.6 本章小結(jié) PAGEREF _Toc21830 30 HYPERLINK l _Toc12878 結(jié)論 PAGEREF _Toc12878 31PAGE 6第1章 緒論1.1 課題
8、背景隨著信息技術(shù)的發(fā)展,圖像信息被廣泛應(yīng)用于多媒體通信和計算機系統(tǒng)中,但是圖像數(shù)據(jù)的一個顯著特點就是信息量大。具有龐大的數(shù)據(jù)量,如果不經(jīng)過壓縮,不僅超出了計算機的存儲和處理能力,而且在現(xiàn)有的通信信道的傳輸速率下,是無法完成大量多媒體信息實時傳輸?shù)?因此,為了更有效的存儲、處理和傳輸這些圖像數(shù)據(jù),必須對其進行壓縮,因此有必要對圖像壓縮編碼進行研究。由于組成圖像的各像素之間,無論是在水平方向還是在垂直方向上都存在著一定的相關(guān)性,因此只要應(yīng)用某種圖像壓縮編碼方法提取或者減少這種相關(guān)性, 就可以達到壓縮數(shù)據(jù)的目的1。數(shù)字圖像的冗余主要表現(xiàn)在以下幾種形式:空間冗余:規(guī)則物體和規(guī)則背景的表面物理特性都具有
9、相關(guān)性,數(shù)字化后表現(xiàn)為數(shù)字冗余。例如:某圖片的畫面中有一個規(guī)則物體,其表面顏色均勻,各部分的亮度、飽和度相近,把該圖片作數(shù)字化處理,生成位圖后,很大數(shù)量的相鄰像素的數(shù)據(jù)是完全一樣或十分接近的,完全一樣的數(shù)據(jù)當(dāng)然可以壓縮,而十分接近的數(shù)據(jù)也可以壓縮,因為恢復(fù)后人亦分辨不出它與原圖有什么區(qū)別,這種壓縮就是對空間冗余的壓縮。時間冗余:序列圖像(如電視圖像和運動圖像)和語音數(shù)據(jù)的前后有著很強的相關(guān)性,經(jīng)常包含著冗余。在播出該序列圖像時,時間發(fā)生了推移,但若干幅畫面的同一部位沒有變化,變化的只是其中某些地方,這就形成了時間冗余。統(tǒng)計冗余:空間冗余和時間冗余是把圖像信號看作概率信號時所反應(yīng)出的統(tǒng)計特性,因
10、此,這兩種冗余也被稱為統(tǒng)計冗余。編碼冗余:同樣長度的編碼可以表示不同的信息。結(jié)構(gòu)冗余:相似的,對稱的結(jié)構(gòu)如果都加以記錄就出現(xiàn)結(jié)構(gòu)冗余。知識冗余:由圖像的記錄方式與人對圖像的知識差異而產(chǎn)生的冗余。人對許多圖像的理解與某些基礎(chǔ)知識有很大的相關(guān)性。許多規(guī)律性的結(jié)構(gòu),人可以由先驗知識和背景知識得到。而計算機存儲圖像時還得把一個個像素信息存入,這就形成冗余。視覺冗余:視覺系統(tǒng)對于圖像場的注意是非均勻和非線性的,視覺系統(tǒng)不是對圖像的任何變化都能感知。所謂的圖像壓縮編碼技術(shù)就是對要處理的圖像數(shù)據(jù)按一定的規(guī)則進行變換和組合, 從而達到以盡可能少的數(shù)據(jù)流(代碼)來表示盡可能多的數(shù)據(jù)信息。在眾多的圖像壓縮編碼標(biāo)準(zhǔn)
11、中,JPEG(Joint Photographic Experts Group)格式是一種稱為聯(lián)合圖像專家組的圖像壓縮格式,它適用于不同類型、不同分辨率的彩色和黑白靜止圖像2。在JPEG圖像壓縮算法中,一種是以離散余弦變換(DCT,Discrete Cosine Transform)為基礎(chǔ)的有損壓縮算法,另一種是以預(yù)測技術(shù)為基礎(chǔ)的無損壓縮算法。1.1.1 離散余弦變換 DCT變換利用傅立葉變換的性質(zhì)。采用圖像邊界褶翻將像變換為偶函數(shù)形式,然后對圖像進行二維傅立葉變換,變換后僅包含余弦項,所以稱之為離散余弦變換。DCT編碼屬于正交變換編碼方式,用于去除圖像數(shù)據(jù)的空間冗余。變換編碼就是將圖像光強矩
12、陣(時域信號)變換到系數(shù)空間(頻域信號)上進行處理的方法。在空間上具有強相關(guān)的信號,反映在頻域上是在某些特定的區(qū)域內(nèi)能量常常被集中在一起,或者是系數(shù)矩陣的分布具有某些規(guī)律。我們可以利用這些規(guī)律在頻域上減少量化比特數(shù),達到壓縮的目的。圖像經(jīng)DCT變換以后,DCT系數(shù)之間的相關(guān)性就會變小。而且大部分能量集中在少數(shù)的系數(shù)上,因此,DCT變換在圖像壓縮中非常有用,是有損圖像壓縮國際標(biāo)準(zhǔn)JPEG的核心。從原理上講可以對整幅圖像進行DCT變換,但由于圖像各部位上細節(jié)的豐富程度不同,這種整體處理的方式效果不好。為此,發(fā)送者首先將輸入圖像分解為8*8或16*16塊,然后再對每個圖像塊進行二維DCT變換,接著再
13、對DCT系數(shù)進行量化、編碼和傳輸;接收者通過對量化的DCT系數(shù)進行解碼,并對每個圖像塊進行的二維DCT反變換。最后將操作完成后所有的塊拼接起來構(gòu)成一幅單一的圖像。對于一般的圖像而言,大多數(shù)DCT系數(shù)值都接近于0,所以去掉這些系數(shù)不會對重建圖像的質(zhì)量產(chǎn)生較大影響。因此,利用DCT進行圖像壓縮確實可以節(jié)約大量的存儲空間。在實驗中,先將輸入的原始lena圖像分為8*8塊,然后再對每個塊進行二維DCT變換。MATLAB圖像處理上具箱中提供的二維DCT變換及DCT反變換函數(shù)如下。dct2實現(xiàn)圖像的二維離散余弦變換。其語法格式為:(1)B=dct2(A) 返回圖像A的二維離散余弦變換值,其大小與A相同且各
14、元素為離散余弦變換的系數(shù)B(K1,k2)。(2)B=dct2(A,in,n)或B=dct2(A,m,n) 如果m和n比圖像A大,在對圖像進行二維離散余弦變換之前,先將圖像A補零至m*n如果m和n比圖像A小。則進行變換之前,將圖像A剪切。idct2可以實現(xiàn)圖像的二維離散余弦反變換,其語法格式為:B=idct2(A);B=idct2(A,m,n)或B=idct2(A,m,n)。1.1.2 預(yù)測技術(shù)它是利用空間中相鄰數(shù)據(jù)的相關(guān)性,利用過去和現(xiàn)在出現(xiàn)過的點的數(shù)據(jù)情況來預(yù)測未來點的數(shù)據(jù)。通常用的方法是差分脈沖編碼調(diào)制(DPCM)和自適應(yīng)差分脈沖編碼調(diào)制(ADPCM)。1.2 圖像壓縮技術(shù)的發(fā)展和現(xiàn)狀1.
15、2.1 圖像編碼技術(shù)發(fā)展歷史1948年提出電視信號數(shù)字化后,圖像壓縮編碼的研究工作就宣告開始了。在這項技術(shù)發(fā)展的早期,限于客觀條件,僅對幀內(nèi)預(yù)測法和亞取樣內(nèi)查復(fù)原法進行研究,對視覺特性也做了一些極為有限但可貴的研究工作。1966年J.B.O Neal對比分析了DPCM和PCM并提出了用于電視的實驗數(shù)據(jù)。1969年進行了線性預(yù)測編碼的實際實驗。1969年舉行首屆圖像編碼會議。70年代開始進行了幀間預(yù)測編碼的研究。80年代開始對運動估值和模型編碼進行研究3。進入90年代,ITU-T和ISO制定了一系列圖像編碼國際建議,如H.261、JPEG、MPEG-1、H.262、H.263、MPEG-4等。
16、變換編碼是1968年H.C.Andrews等人提出的,采用的是二維離散傅立葉變換,此后相繼出現(xiàn)用其他變換方法的變換編碼,其中包括二維離散余弦變換。1.2.2 圖像編碼技術(shù)的現(xiàn)狀經(jīng)過幾十年的發(fā)展,圖像編碼技術(shù)業(yè)已成熟,一些國際建議的制定極大地推動了圖像編碼技術(shù)的實現(xiàn)和產(chǎn)業(yè)化,從而推動圖像編碼技術(shù)以更快的速度發(fā)展,目前的研究方向有兩個:(1) 更好地實現(xiàn)現(xiàn)有的圖像編碼國際建議。 研制出集成度更高、性能更好的圖像編碼專用芯片,使編碼系統(tǒng)成本更低、可靠性更高。解決好現(xiàn)有的圖像編碼系統(tǒng)開發(fā)中的技術(shù)問題。例如:提高圖像質(zhì)量、提高抗碼能力等。 (2) 對圖像編碼理論和其他圖像編碼方法的研究。 目前已經(jīng)提出和
17、正在進行研究的圖像編碼方法有:多分辨率編碼、基于表面描述的編碼、模型編碼、利用人工神經(jīng)網(wǎng)絡(luò)的編碼、利用分形幾何的編碼、利用數(shù)學(xué)形態(tài)學(xué)的編碼等等。1.3 MATLAB 及其圖像處理工具箱 如果應(yīng)用高級語言(如Basic,C,F(xiàn)ortran)編寫仿真程序來實現(xiàn)這一基于DCT的圖像壓縮編碼算法比較麻煩,而且仿真效果也不是十分理想。本文主要應(yīng)用MATLAB發(fā)布的圖像處理工具箱中的相關(guān)函數(shù)和命令來實基于DCT的圖像壓縮編碼理論算法的仿真。MATLAB語言是由美國MathWorks公司推出的計算機軟件,經(jīng)過多年的逐步發(fā)展與不斷完善,現(xiàn)已成為國際公認的最優(yōu)秀的科學(xué)計算與數(shù)學(xué)應(yīng)用軟件之一,它集數(shù)值分析、矩陣運
18、算、信號處理和圖形顯示于一體,構(gòu)成了一個方便的、界面友好的用戶環(huán)境,而且還具有可擴展性特征。MATLAB中的數(shù)字圖像是以矩陣形式表示的,矩陣運算的語法對MATLAB中的數(shù)字圖像同樣適用,這意味著MATLAB強大的矩陣運算能力對用于圖像處理非常有利。圖像處理工具箱(Image Processing Toolbox)提供了一套全方位的參照標(biāo)準(zhǔn)算法和圖形工具,用于進行圖像處理、分析、可視化和算法開發(fā)。可進行圖像壓縮、空間轉(zhuǎn)換、圖像增強、特征檢測、降噪、圖像分割和圖像配準(zhǔn)等功能。工具箱中大部分函數(shù)均以開放式 MATLAB 語言編寫,這意味著可以檢查算法、修改源代碼和創(chuàng)建自定義函數(shù)。本文利用MATLAB
19、圖像處理工具箱對基于DCT的JPEG圖像壓縮編碼理論算法進行仿真,實驗證明該軟件功能強大,語言簡潔易學(xué),工具箱具有豐富的技術(shù)支持并集成了該領(lǐng)域?qū)<业闹腔?,?yīng)用簡單而效果良好。1.4 論文組織結(jié)構(gòu)本文的主要內(nèi)容是,介紹圖像壓縮編碼算法中的離散余弦變換(DCT)變換算法,和用MATLAB進行仿真。第1 章緒論,對于圖像壓縮的研究意義、可行性、壓縮技術(shù)的現(xiàn)狀和發(fā)展、MATLAB圖像處理工具進行了簡要的介紹。第2章對圖像壓縮編碼理論算法進行了介紹,著重講解了基于DCT的JPEG圖像壓縮編碼步驟。之后對JPEG2000進行了粗略的介紹,描述了JPEG和JPEG2000的區(qū)別。第3章對基于DCT的圖像壓縮
20、MATLAB仿真實現(xiàn)進行了詳細的描述。其中包括利用MATLAB編寫程序的流程圖,和給出了具體仿真實驗結(jié)果與結(jié)果分析。PAGE 16第2章 圖像壓縮編碼理論算法2.1 DCT變換的思想來源信號的變換分析方法中,通常是通過一組適當(dāng)?shù)幕瘮?shù)對信號進行分解,得到信號在變換域的表示方法,利用信號在變換域中某些特征趨于集中的特點來提取其特征從而進行分析。自1822年傅立葉(Fourier)發(fā)表“熱傳導(dǎo)解析理論”以來,傅立葉變換一直是信號處理領(lǐng)域中應(yīng)用最廣泛、效果最好的一種分析手段。但傅立葉變換只是一種純頻域的分析方法,它在頻域的定位性是完全準(zhǔn)確的(即頻域分辨率最高),而在時域無任何定位性(或分辯能力),也
21、即傅立葉變換所反映的是整個信號全部時間下的整體頻域特征,而不能提供任何局部時間段上的頻率信息。事實上,在我們生活中的常見信號通常都具有非平穩(wěn)的性質(zhì),即其頻域性質(zhì)都是隨時間而變化的。對這一類信號用傅立葉變換進行分析,雖然可以知道信號所包含有哪些頻率信息,但不能知道這些頻率信息具體出現(xiàn)在哪個時間段上,因此不能提供關(guān)于信號完整的信息??梢?,傅立葉變換不適用于提取局部時間段(或瞬間)的頻域特征信息4。為了研究信號在局部時間范圍的頻域特征,1946年Gabor提出了著名的Gabor變換。其基本思想是,取時間函數(shù)作為窗口函數(shù),用與待分析函數(shù)相乘,然后再進行傅立葉變換。在Gabor變換的基礎(chǔ)上,為了適應(yīng)不同
22、問題的需要,進一步發(fā)展了多種形式的窗口函數(shù),如矩形窗、漢寧窗、哈明窗等,這一類加窗的傅立葉變換統(tǒng)稱為短時傅立葉變換(STFT)。STFT從本質(zhì)上講,是用窗函數(shù)截取原始信號的一個待分析段進行傅立葉變換,因而可以描述信號在某一局部時間段上的頻率信息。目前,STFT在許多領(lǐng)域獲得了廣泛的應(yīng)用,但由于STFT的定義決定了其窗函數(shù)的大小和形狀均與時間和頻率無關(guān),一旦選定窗口就保持固定不變,不利于分析時變信號。實際上一般的高頻信號持續(xù)時間較短,而低頻信號持續(xù)時間較長,因此我們期望對于高頻信號采用小時間窗,對于低頻信號采用大時間窗進行分析。在進行信號分析時,這種變時間窗的要求同STFT的固定時窗(窗不隨頻率
23、而變化)的特性是相矛盾的5。離散余弦變換(DCT)從本質(zhì)上是一種變換分析方法,要在變換時最大的去除分析信號的相關(guān)性提取其特征,就必須適當(dāng)?shù)臉?gòu)造一組基函數(shù),這組基函數(shù)以某種形式類似于我們所要表示的數(shù)據(jù),甚至具有與數(shù)據(jù)相同的相關(guān)結(jié)構(gòu)。在我們?nèi)粘I钪谐S龅降男盘栐诳臻g域和頻域都具有相關(guān)性。在空間上相隔較近的樣值間的相關(guān)性比相隔較遠的大的多,而在頻域上通常呈帶狀。為了分析和表示這樣的信號,我們需要基函數(shù)在空間域和頻域是局域性的。由于離散余弦函數(shù)的頻域分辨率與時域分辨率成反比,剛好與實際信號長時低頻、短時高頻的特性相吻合,既能精確定位信號的突發(fā)跳變,又能把握信號的整體變化率。由此可見,離散余弦變換是一
24、種比較理想的進行信號處理的數(shù)學(xué)工具6。圖像壓縮編碼的理論算法。(1)基于DCT的JPEG圖像壓縮編碼理論算法 基于DCT編碼的JPEG編碼壓縮過程框圖,如圖2-1所示。壓縮數(shù)據(jù)原始圖像數(shù)據(jù)分成8*8的小塊量化器DCT變換熵編碼器碼表量化表圖2-1 基于DCT編碼的JPEG壓縮過程簡化圖上圖是基于DCT變換的圖像壓縮編碼的壓縮過程,解壓縮與上圖的過程相反。在編碼過程中,首先將輸入圖像顏色空間轉(zhuǎn)換后分解為88大小的數(shù)據(jù)塊,然后用正向二維DCT把每個塊轉(zhuǎn)變成64個DCT系數(shù)值,其中1個數(shù)值是直流(DC)系數(shù),即88空域圖像子塊的平均值,其余的63個是交流(AC)系數(shù),接下來對DCT系數(shù)進行量化,最后
25、將變換得到的量化的DCT系數(shù)進行編碼和傳送,這樣就完成了圖像的壓縮過程。在解碼過程中,形成壓縮后的圖像格式,先對已編碼的量子化的DCT系數(shù)進行解碼,然后求逆量化并把DCT系數(shù)轉(zhuǎn)化為88樣本像塊(使用二維DCT反變換),最后將操作完成后的塊組合成一個單一的圖像。這樣就完成了圖像的解壓過程。2.2 基于DCT的JPEG圖像壓縮編碼步驟2.2.1 顏色空間的轉(zhuǎn)換和采樣JPEG文件使用的顏色空間為1982年推薦的電視圖像數(shù)字化標(biāo)準(zhǔn)CCIR 601(現(xiàn)為ITU-RB T.601)。在這個色彩空間中,每個分量、每個像素的電平規(guī)定為255級,用8位代碼表示。JPEG只支持YCbCr顏色模式。其中Y代表亮度,
26、CbCr代表色度。全彩色圖像RGB模式轉(zhuǎn)換到Y(jié)CbCr模式,用下組公式。 (2-1) 其逆變換為: (2-2)JPEG是以88的塊為單位來進行處理的,由于人眼對亮度Y的敏感度比色度CbCr的敏感度大的多,所以采用縮減取樣的方式,通常采用YUV422取樣,圖2-2所示。圖2-2 YUV422取樣示意圖即對于1616的塊,Y取4個88的塊,CbCr各取2個88的塊。也有YUV411方式,Y取4個88的塊,CbCr各取1個88的塊。YUV422取樣方式,數(shù)據(jù)減少1/3。YUV411取樣方式,數(shù)據(jù)減少1/2。縮減取樣一般采用圖2-3所示方法。abcdebd圖2-3 壓縮取樣示意圖2.2.2 二維離散余
27、弦變換 在傅里葉級數(shù)展開式中,如果被展開的函數(shù)是實偶函數(shù),那么,其傅里葉技術(shù)中只包含余弦項,在將其離散化由此可導(dǎo)出余弦變換,或稱之為離散余弦變換(DCT,Discrete Cosine Transform)7。二維離散余弦正變換公式為 (2-3)式中,。二維離散余弦逆變換公式為 (2-4)式中,。 JPEG采用的是88大小的子塊的二維離散余弦變換。在編碼器的輸入端,把原始圖像順序地分割成一系列88的子塊,子塊的數(shù)值在-128到127之間。采用余弦變換獲得64個變換系數(shù)8。變換公式,如式(2-5)所示。 (2-5)式中,。 在MATLAB的圖像處理工具箱中,可以直接調(diào)用dct2和idct2來實現(xiàn)
28、二維離散余弦變換及其反變換。(1) dct2dct2函數(shù)實現(xiàn)圖像的二維離散余弦變換,其語法為:F=dct2(f)運行下列程序:f=imread(cameraman.tif);f=im2double(f);F=dct2(f);subplot(121),imshow(f, );subplot(122),imshow(log(1+20*abs(F), );運行結(jié)果如圖24所示。圖24 圖像顯示及圖像DCT變換后頻譜顯示由運行結(jié)果可知,DCT變換具有能量集中的性質(zhì),數(shù)據(jù)集中在左上角。因此進行圖像壓縮時離散余弦變換矩陣可以舍棄右下角的高頻數(shù)據(jù)。(2) idct2 idct2函數(shù)實現(xiàn)圖像的二維離散余弦逆變
29、換,其語法為:F=idct2(f)在MATLAB圖像處理工具箱中,有一個對圖像進行塊操作的函數(shù)blkproc,利用這個函數(shù),可以直接實現(xiàn)圖像一系列88子塊的DCT變換。其語法格式為:B = blkproc(A,m n,fun, parameter1,,parameter2, .)B = blkproc(A,m n,mborder nborder,fun,.)B = blkproc(A,indexed,.)m n是指圖像以m*n為分塊單位,對圖像進行處理(如8像素*8像素)Fun:應(yīng)用此函數(shù)對分別對每個m*n分塊的像素進行處理parameter1, parameter2:要傳給fun函數(shù)的參數(shù)m
30、border nborder:對每個m*n塊上下進行mborder個單位的擴充,左右進行nborder個單位的擴充,擴充的像素值為0,fun函數(shù)對整個擴充后的分塊進行處理。如下列程序:I = imread(cameraman.tif); fun = idct2;J = blkproc(I,8 8,fun);imagesc(J), colormap(hot)運行結(jié)果如圖2-5所示。圖2-5 DCT變換后圖像88的圖像經(jīng)過DCT變換后,其低頻分量都集中在左上角,高頻分量分布在右下角(DCT變換實際上是空間域的低通濾波器)。由于該低頻分量包含了圖像的主要信息(如亮度),而高頻與之相比,就不那么重要了
31、,所以我們可以忽略高頻分量,從而達到壓縮的目的。將高頻分量去掉,這就要用到量化,它是產(chǎn)生信息損失的根源。這里的量化操作,就是將某一個值除以量化表中對應(yīng)的值。由于量化表左上角的值較小,右上角的值較大,這樣就起到了保持低頻分量,抑制高頻分量的目的。JPEG使用的顏色是YUV格式。我們提到過,Y分量代表了亮度信息,UV分量代表了色差信息。相比而言,Y分量更重要一些。我們可以對Y采用細量化,對UV采用粗量化,可進一步提高壓縮比。所以上面所說的量化表通常有兩張,一張是針對Y的,一張是針對UV的。2.2.3 DCT系數(shù)的量化量化是對經(jīng)過DCT變換后的頻率系數(shù)進行量化,其目的是減小非“0”系數(shù)的幅度以及增加
32、“0”值系數(shù)的數(shù)目,它是圖像質(zhì)量下降的最主要原因。對于基于DCT的JPEG圖像壓縮編碼算法使用如圖2-6所示的均勻量化器進行量化,量化步距是按照系數(shù)所在的位置和每種顏色分量的色調(diào)值來確定。因為人眼對亮度信號比對色差信號更敏感,因此使用了表2-1所示的種量化表。此外,由于人眼對低頻分量的圖像比對高頻分量的圖像更敏感,因此表中的左上角的量化步距要比右下角的量化步距小9。DCT系數(shù)輸入量化系數(shù)輸出圖2-6 均勻量化器亮度和色度因為代表的圖像的信息量不同,亮度代表了圖像的低頻分量,色度代表了圖像的高頻分量,要分別對亮度和色度進行量化,所以量化表也是不同的。JPEG壓縮色度和亮度量化表如表2-1所示。表
33、2-1 JPEG壓縮色度和亮度量化表亮度量化表色度量化表161110162440516117182447999999991212141926586055182126669999999914131624405769562426569999999999141722295187806247669999999999991822375668109103779999999999999999243555648110411392999999999999999949647887103121120101999999999999999979929598112100103999999999999999999量化會產(chǎn)生
34、誤差,上圖是綜合大量的圖像測試的實驗結(jié)果,對于大部分圖像都有很好的結(jié)果。表中可以看出,高頻部分對應(yīng)的量化值大,目的就是將高頻部分編程接近于0,以便以后處理。JPEG可以在壓縮比和圖像質(zhì)量間作取舍。方法就是改變量化值。如果量化值放大一倍,則有更多的系數(shù)量化為0,提高了壓縮比。2.2.4 量化系數(shù)的編排經(jīng)過DCT變換后,低頻分量集中在左上角,其中F(0,0)(即第一行第一列元素)代表了直流(DC)系數(shù),即88子塊的平均值,要對它單獨編碼。由于兩個相鄰的88子塊的DC系數(shù)相差很小,所以對它們采用差分編碼DPCM,可以提高壓縮比,也就是說對相鄰的子塊DC系數(shù)的差值進行編碼。88的其它63個元素是交流(
35、AC)系數(shù),采用行程編碼10。所以量化后的系數(shù)要重新編排,目的是為了增加連續(xù)的“0”系數(shù)的個數(shù),就是“0”的游程長度,方法是按照Z字形的式樣編排。DCT變換后低頻分量多呈圓形輻射狀向高頻率衰減,因此可以看成按Z字形衰減。因此,量化系數(shù)按Z字形掃描讀數(shù),這樣就把一個88的矩陣變成一個164的矢量,頻率較低的系數(shù)放在矢量的頂部。量化后的DCT系數(shù)的編排如圖2-7所示。圖2-7 量化DCT系數(shù)的編排量化后的DCT系數(shù)的序號如表2-2所示。表2-2 量化DCT系數(shù)的序號0156141527282471316262942381217253041439111824314044531019233239455
36、254202233384651556021343747505659613536484957586263 2.2.5 DC系數(shù)的編碼88子塊的64個變換系數(shù)經(jīng)量化后,按直流系數(shù)DC和交流系數(shù)AC分成兩類處理。坐標(biāo)u=v=0的直流系數(shù)DC實質(zhì)上就是空域圖像中64個像素的平均值。圖像塊經(jīng)過DCT變換之后得到的DC直流系數(shù)有兩個特點,一是系數(shù)的數(shù)值比較大,二是相鄰88圖像塊的DC系數(shù)值變化不大。根據(jù)這個特點,JPEG算法使用了差分脈沖調(diào)制編碼技術(shù)。差分脈沖編碼調(diào)制(DPCM,Differential Pulse Code Modulation),是一種對模擬信號的編碼模式,先根據(jù)前一個抽樣值計算出一個
37、預(yù)測值,再取當(dāng)前抽樣值和預(yù)測值之差作為編碼用。此差值稱為預(yù)測誤差。抽樣值和預(yù)測值非常接近(因為相關(guān)性強),預(yù)測誤差的可能取值范圍比抽樣值變化范圍小。所以可用少幾位編碼比特來對預(yù)測誤差編碼,從而降低其比特率。這是利用減小冗余度的辦法,降低了編碼比特率。因此,對DC系數(shù)編碼進行差分脈沖編碼就是對相鄰圖像塊之間量化DC系數(shù)的差值(Delta)進行編碼,即對相鄰塊之間的DC系數(shù)的差值DIFF=DC-DC編碼。DC采用差值脈沖編碼的主要原因是由于在連續(xù)色調(diào)的圖像中,其差值多半比原值小,對差值進行編碼所需的位數(shù),會比對原值進行編碼所需的位數(shù)少許多。例如差值為5,它的二進制表示值為101,如果差值為-5,則
38、先改為正整數(shù)5,再將其二進制轉(zhuǎn)換成1的補數(shù)即可。所謂1的補數(shù),就是將每個Bit若值為0,便改成1;Bit為1,則變成0。差值5應(yīng)保留的位數(shù)為3,列出差值所應(yīng)保留的Bit數(shù)與差值內(nèi)容的對照。 在差值前端另外加入一些差值的霍夫曼碼值,例如亮度差值為5(101)的位數(shù)為3,則霍夫曼碼值應(yīng)該是100,兩者連接在一起即為100101。2.2.6 AC系數(shù)的編碼DCT變換所得系數(shù)除直流系數(shù)之外的其余63個系數(shù)稱為交流系數(shù)(AC系數(shù))。量化AC系數(shù)的特點是1 64矢量中包含有許多“0”系數(shù),并且許多“0”是連續(xù)的,因此使用非常簡單和直觀的游程長度編碼(RLE)對它們進行編碼。所謂行程編碼(Run-Lengt
39、h Encoding)就是指僅存儲一個像素值以及具有相同顏色的像素數(shù)目的圖像數(shù)據(jù)編碼方式,或稱 HYPERLINK /view/721796.htm t _blank 游程編碼,常用RLE(Run-Length Encoding)表示。該壓縮編碼技術(shù)相當(dāng)直觀和經(jīng)濟,運算也相當(dāng)簡單,因此解壓縮速度很快。RLE壓縮編碼尤其適用于計算機生成的圖形圖像,對減少存儲容量很有效果11。 63個AC系數(shù)采用行程編碼的方式進行編碼的格式如圖2-8所示。也即在AC01到AC63中,找出每一個非零的AC值,將其表示成(NN/SS)VV的形式,其中:NN表示該AC值前的0的個數(shù)。而SS、VV與DC的定義一樣。如果連
40、續(xù)的非0超過15個時,增加一個擴展字節(jié):(15/0)表示連續(xù)16個0。另外若有一串0延伸到AC63,一律用(0/0)表示結(jié)束。7654321076543210第一字節(jié)第二字節(jié)兩個非零值之間的連續(xù)零的個數(shù)下一個非零值所占的比特數(shù)下一個非零系數(shù)的實際值圖2-8 AC編碼格式對于AC系數(shù),有兩個符號。符號1為行程和尺寸,即上面的(RunLength,Size)。(0,0)和(15,0)是兩個比較特殊的情況。(0,0)表示塊結(jié)束標(biāo)志(EOB),PAGE 17 (15,0)表示ZRL,當(dāng)行程長度超過15時,用增加ZRL的個數(shù)來解決,所以最多有三個ZRL(316+15=63)。符號2為幅度值(Amplit
41、ude)。對于DC系數(shù),也有兩個符號。符號1為尺寸(Size);符號2為幅度值(Amplitude)。對于AC系數(shù),符號1和符號2分別進行編碼。零行程長度超過15個時,有一個符號(15,0),塊結(jié)束時只有一個符號(0,0)。對符號1進行Huffman編碼(亮度,色差的Huffman碼表不同)。對符號2進行變長整數(shù)VLI編碼。舉例來說:Size=6時,Amplitude的范圍是-63-32,以及3263,對絕對值相同,符號相反的碼字之間為反碼關(guān)系。所以AC系數(shù)為32的碼字為100000,33的碼字為100001,-32的碼字為011111,-33的碼字為011110。符號2的碼字緊接于符號1的碼
42、字之后。對于DC系數(shù),Y和UV的Huffman碼表也不同。2.2.7 組成位數(shù)據(jù)流JPEG編碼的最后一個步驟是把各種標(biāo)記代碼和編碼后的圖像數(shù)據(jù)組成一幀一幀的數(shù)據(jù),這樣做的目的是為了便于傳輸、存儲和譯碼器進行譯碼,這樣的組織的數(shù)據(jù)通常稱為JPEG位數(shù)據(jù)流(JPEG bit stream)12。舉個例子來說明上述過程。下面為88的亮度(Y)圖像子塊經(jīng)過量化后的系數(shù),如表2-3所示。表2-3 亮度量化后的系數(shù)150-100000-2-1000000-1-10000000000000000000000000000000000000000000000PAGE 29可見量化后只有左上角的幾個點(低頻分量)
43、不為零,這樣采用行程編碼就會很有效。第一步,熵編碼的中間格式表示。先看DC系數(shù)。假設(shè)前一個88子塊DC系數(shù)的量化值為12,則本塊DC系數(shù)與它的差為3,根據(jù)下表表2-4 DC系數(shù)表SizeAmplitude0011,123,-2,2,337-4,47415-8,815531-16,1631663-32,32637127-64,641278255-128,1282559511-256,256511101023512,5121023112047-1024,10242047查表得Size=2,Amplitude=3,所以DC中間格式為(2)(3)。下面對AC系數(shù)編碼。經(jīng)過Zig-Zag掃描后,遇到的第
44、一個非零系數(shù)為-2,其中遇到零的個數(shù)為1(即RunLength),根據(jù)下面這張AC系數(shù)表:表2-5 AC系數(shù)表 SizeAmplitude11,123,-2,2,337-4,47415-8,815531-16,1631663-32,32637127-64,641278255-128,1282559511-256,256511101023512,5121023查表得Size=2。所以RunLength=1,Size=2,Amplitude=3,所以AC中間格式為(1,2)(-2)。其余的點類似,可以求得這個88子塊熵編碼的中間格式為(DC)(2)(3),(1,2)(-2),(0,1)(-1),(
45、0,1)(-1),(0,1)(-1),(2,1)(-1),(EOB)(0,0)第二步,熵編碼。對于(2)(3):2查DC亮度Huffman表得到11,3經(jīng)過VLI編碼為011;對于(1,2)(-2):(1,2)查AC亮度Huffman表得到11011,-2是2的反碼,為01;對于(0,1)(-1):(0,1)查AC亮度Huffman表得到00,-1是1的反碼,為0;最后,這一88子塊亮度信息壓縮后的數(shù)據(jù)流為11011,1101101,000, 000, 000,111000,1010??偣?1比特,其壓縮比是648/31=16.5,大約每個象素用半個比特。以上是圖像壓縮編碼的整個過程。從上面的
46、例子可以看出,壓縮比和圖像質(zhì)量是呈反比的,以下是壓縮效率與圖像質(zhì)量之間的大致關(guān)系,可以根據(jù)需要,選擇合適的壓縮比。壓縮比和圖像質(zhì)量的關(guān)系如表2-6所示。表2-6 壓縮比與圖像質(zhì)量的關(guān)系壓縮效率(單位:bits/pixel)圖像質(zhì)量0.250.50中好,可滿足某些應(yīng)用0.500.75好很好,滿足多數(shù)應(yīng)用0.751.5極好,滿足大多數(shù)應(yīng)用1.52.0與原始圖像幾乎一樣2.2.8 DCT變換在圖像壓縮中的應(yīng)用JPEG格式是目前網(wǎng)絡(luò)上最流行的圖像格式,是可以把文件壓縮到最小的格式,在 Photoshop軟件中以JPEG格式儲存時,提供11級壓縮級別,以010級表示。其中0級壓縮比最高,圖像品質(zhì)最差。即
47、使采用細節(jié)幾乎無損的10 級質(zhì)量保存時,壓縮比也可達 5:1。以BMP格式保存時得到428MB圖像文件,在采用JPG格式保存時,其文件僅為178KB,壓縮比達到24:1。經(jīng)過多次比較,采用第8級壓縮為存儲空間與圖像質(zhì)量兼得的最佳比例。JPEG格式的應(yīng)用非常廣泛,特別是在網(wǎng)絡(luò)和光盤讀物上,都能找到它的身影。目前各類瀏覽器均支持JPEG這種圖像格式,因為JPEG格式的文件尺寸較小,下載速度快13。2.3 JPEG2000壓縮算法目前的JPEG靜止圖像壓縮標(biāo)準(zhǔn),在中高比特率上壓縮效果較好,然而在低比特速率的情況下,重構(gòu)圖像存在嚴(yán)重的方塊效應(yīng),不能很好地適應(yīng)網(wǎng)絡(luò)傳描圖像的需要。盡管目前的JPEG標(biāo)準(zhǔn)有
48、44種操作模式,但是其中的大部分模式是針對不同的應(yīng)用提出的,不具有通用性,這給交換、傳輸?shù)膲嚎s圖像帶來很大的麻煩。為了彌補目前標(biāo)準(zhǔn)的不足,適應(yīng)21世紀(jì)圖像壓縮的需要,早在1997年ISO/ITU-T組織下的IECJTCl/SC29/WGl小組便開始著手制定新的靜止圖像壓縮標(biāo)準(zhǔn)JPEG2000。與JPEG不同,JPEG2000基于小波變換,采用當(dāng)前最新的嵌入式編碼技術(shù),在獲得優(yōu)于目前JPEG標(biāo)準(zhǔn)壓縮效果的同時,生成的碼流有較強的功能,可應(yīng)用于多個領(lǐng)域。2.3.1 小波變換不同于傳統(tǒng)的DCT變換,小波變換具有對信號進行多分辨率分析和反映信號局部特征的特點。通過對圖像片進行離散小波變換,得到小波系數(shù)
49、圖像,而分解的級數(shù)視具體情況而定。小波系數(shù)圖像由幾種子帶系數(shù)圖像組成。這些子帶系數(shù)圖像描述的是圖像片水平和垂直方向的空間頻率特性。不同子帶的小波系數(shù)反映圖像片不同空間分辨率的特性。通過多級小波分解,小波系數(shù)既能表示圖像片中局部區(qū)域的高頻信息(如圖像邊緣),也能表示圖像片中的低頻信息(如圖像背景)。這樣,即使在低比特律的情況下,我們也能保持較多的圖像細節(jié)(如邊緣)。另外,下一級分解得到的系數(shù)所表示圖像在水平和垂直方向的分辨率只有上一級小波系數(shù)所表示的圖像的一半。所以,通過對系數(shù)圖像的不同級數(shù)進行解碼,就可以得到具有不同空間分辨率(或清晰,或模糊)的圖像。小波變換因其具有的這種優(yōu)點被JPEG200
50、0標(biāo)準(zhǔn)所采用。在編碼系統(tǒng)中,對每個圖像片進行Mallat塔式小波分解。經(jīng)過大量的測試,JPEG2000選用兩種小波濾波器:LeGall 5/3濾波器和Daubechies 9/7濾波器。前者可用于有損或無損圖像壓縮,后者只能用于有損壓縮。在JPEG2000標(biāo)準(zhǔn)中,小波濾波器可以有2種實現(xiàn)模式:基于卷積的和基于提升機制的。而具體實現(xiàn)時,對圖像邊緣都要進行周期對稱延伸,這樣可以防止濾波器對圖像邊緣操作時產(chǎn)生失真。另外,為了減小變換時所需空間的開銷,標(biāo)準(zhǔn)中還應(yīng)用了基于行的小波變換技術(shù)。2.3.2 量化由于人類視覺系統(tǒng)對圖像的分辨率要求有一定的局限,通過適當(dāng)?shù)牧炕瘻p小變換系數(shù)的精度,可在不影響圖像主觀
51、質(zhì)量的前提下,達到圖像壓縮的目的。量化的關(guān)鍵是根據(jù)變換后圖像的特征、重構(gòu)圖像質(zhì)量要求等因素設(shè)計合理的量化步長。量化操作是有損的,會產(chǎn)生量化誤差。不過一種情況除外,那就是量化步長是1,并且小波系數(shù)都是整數(shù),利用可恢復(fù)整數(shù)5/3拍小波濾波器進行小波變換得到的結(jié)果就符合這種情況。在JPEG2000標(biāo)準(zhǔn)中,對每一個子帶可以有不同的量化步長。但是在一個子帶中只有一個量化步長。量化以后,每一個小波系數(shù)有2部分來表示:符號和幅值。對量化后的小波系數(shù)進行編碼。對于無損壓縮,量化步長必須是1。2.3.3 熵編碼圖像經(jīng)過變換、量化后,在一定程度上減少了空域和頻域上的冗余度,但是這些數(shù)據(jù)在統(tǒng)計意義上還存在一定的相關(guān)
52、性,為此采用熵編碼來消除數(shù)據(jù)間的統(tǒng)計相關(guān)。將量化后的子帶系數(shù)劃分成小的矩形單元碼塊(code block)。2.3.4 位流組織為了適合圖像交換,更好地應(yīng)用JPEG2000壓縮碼流的功能,JPEG2000標(biāo)準(zhǔn)規(guī)定了存放壓縮位流和解碼所需參數(shù)的格式,把壓縮碼流以包為單元進行組織,形成最終的碼流。JPEG2000通過采用速率控制方法來計算碼流的理想截斷點,從而獲得給定壓縮碼率下的最佳重構(gòu)圖像質(zhì)量。速率控制使用了PCRD率失真優(yōu)化算法。率失真優(yōu)化,即給定整個壓縮碼流的最大編碼速率,找出每個碼塊壓縮位流的適當(dāng)截斷點,在滿足的條件下,使重構(gòu)圖像失真最小。從而使得嵌入式碼塊編碼具有如下特點:生成的壓縮位流
53、可根據(jù)需要,被截斷成不同長度的位流子集;將所有碼塊的截斷位流組織起來,可重構(gòu)出一定質(zhì)量的圖像。2.4 JPEG與JPEG2000的區(qū)別JPEG2000與傳統(tǒng)JPEG最大的不同在于它放棄了JPEG所采用的以離散余弦變換(DCT)為主的區(qū)塊編碼方式,轉(zhuǎn)而采用以小波變換(DWT)為主的多解析編碼方式14。 余弦變換是經(jīng)典的譜分析工具,它考察的是整個時域過程的頻域特征或整個頻域過程的時域特征,因此對于平穩(wěn)過程,它有很好的效果,但對于非平穩(wěn)過程,它卻有諸多不足。在JPEG中,離散余弦變換將圖像壓縮為88 的小塊,然后依次放入文件中,這種算法靠丟棄頻率信息實現(xiàn)壓縮,因而圖像的壓縮率越高,頻率信息被丟棄的越
54、多。在極端情況下,JPEG圖像只保留了反映圖像外貌的基本信息,精細的圖像細節(jié)都損失了。小波變換是現(xiàn)代譜分析工具,它既能考察局部時域過程的頻域特征,又能考察局部頻域過程的時域特征,因此即使對于非平穩(wěn)過程,處理起來也得心應(yīng)手。它能將圖像變換為一系列小波系數(shù),這些系數(shù)可以被高效壓縮和存儲,此外,小波的粗略邊緣可以更好地表現(xiàn)圖像,因為它消除了DCT壓縮普遍具有的方塊效應(yīng)?,F(xiàn)在網(wǎng)絡(luò)上的JPEG圖像下載時是按“塊”傳輸?shù)?,因此只能逐行顯示,而采用JPEG2000格式的圖像支持漸進傳輸。JPEG2000中的漸進傳輸有2種,按照分辨率的漸進傳輸和按照質(zhì)量的漸進傳輸。按照質(zhì)量的漸進傳輸就是先傳輸圖像輪廓數(shù)據(jù),然
55、后再逐步傳輸細節(jié)數(shù)據(jù)來不斷提高圖像質(zhì)量,而按照分辨率的漸進傳輸則先傳輸分辨率較低的圖像,后一幅圖像在前一幅圖像的基礎(chǔ)上提高其分辨率。圖像的漸進傳輸使得用戶不需要像以前那樣等圖像全部下載后才決定是否需要,有助于快速地瀏覽和選擇大量圖片,從而有效的解決了網(wǎng)絡(luò)傳輸?shù)牟煌槅栴}15。JPEG2000一個極其重要的優(yōu)點就是ROI(Region of Interest,感興趣區(qū)域)。用戶可以任意指定圖片上感興趣的區(qū)域,然后在壓縮時對這些區(qū)域指定壓縮質(zhì)量,或在恢復(fù)時指定某些區(qū)域的解壓縮要求。這是因為子波在空間和頻率域上具有局域性,要完全恢復(fù)圖像中的某個局部,并不需要所有編碼都被精確保留,只要對應(yīng)他的一部分編
56、碼沒有誤差就可以了。在實際應(yīng)用中,我們就可以對一幅圖像中感興趣的部分采用低壓縮比以獲取較好的圖像效果,而對其他部分采用高壓縮比以節(jié)省存儲空間。這樣就能在保證不丟失重要信息的同時又有效地壓縮了數(shù)據(jù)量,實現(xiàn)了真正的交互式壓縮。在相同的壓縮質(zhì)量參數(shù)下。JPEG2000的峰值信噪比要優(yōu)于JPEG;且在低位率時JPEG壓縮會出現(xiàn)明顯的方塊效應(yīng),JPEG2000則會出現(xiàn)Gibbs效應(yīng),但JPEG2000的保真度要優(yōu)于JPEG16。JPEG2000作為JPEG的升級版,其壓縮率比JPEG高約30左右,同時支持有損和無損壓縮。JPEG2000格式有一個極其重要的特征在于它能實現(xiàn)漸進傳輸,即先傳輸圖像的輪廓,然
57、后逐步傳輸數(shù)據(jù),不斷提高圖像質(zhì)量,讓圖像由朦朧到清晰顯示。JPEG2000旨在創(chuàng)建一個新的圖像編碼系統(tǒng),該壓縮編碼系統(tǒng)的率失真和主觀圖像質(zhì)量優(yōu)于現(xiàn)有的JPEG標(biāo)準(zhǔn),能夠提供對圖像的低碼率的壓縮,并且對壓縮碼流可進行靈活的處理,如隨機獲取部分壓縮碼流、圖像的漸進傳輸、感興趣區(qū)域的實現(xiàn)以及壓縮碼流較強的容錯性能等,該標(biāo)準(zhǔn)將與現(xiàn)行JPEG標(biāo)準(zhǔn)兼容。JPEG2000和JPEG相比優(yōu)勢明顯,且向下兼容,因此可取代傳統(tǒng)的JPEG格式。JPEG2000即可應(yīng)用于傳統(tǒng)的JPEG市場,如掃描儀、數(shù)碼相機等,又可應(yīng)用于新興領(lǐng)域,如網(wǎng)路傳輸、無線通訊等等。JPEG不能在單一碼流中提供有損和無損壓縮,并且不能支持大于
58、6464 K的圖像壓縮。同時,盡管當(dāng)前的JPEG標(biāo)準(zhǔn)具有重新啟動間隔的規(guī)定,但當(dāng)碰到比特差錯時圖像質(zhì)量將受到嚴(yán)重的損壞。雖然JPEG2000比JPEG有很多有點,但是由于它的技術(shù)還不成熟,還存在穩(wěn)定性、復(fù)雜性和準(zhǔn)備不充分等問題,所以目前基于DCT的JPEG圖像壓縮編碼仍然是世界上圖像壓縮技術(shù)標(biāo)準(zhǔn)應(yīng)用最廣泛的標(biāo)準(zhǔn)17。2.5 本章小結(jié)本章詳細介紹了DCT變換思想的來源、基于DCT變換的圖像壓縮編碼的原理和具體的編碼步驟,介紹了離散余弦變換在圖像在對JPEG2000進行了介紹并對JPEG和JPEG2000進行了詳細的比較。第3章 基于DCT的圖像壓縮MATLAB仿真實現(xiàn)MATLAB圖像處理工具箱支
59、持四種圖像類型,分別為RGB圖像(真彩色圖像)、索引圖像、灰度圖像、二值圖像,由于有的函數(shù)對圖像類型有限制,這四種類型可以用工具箱的類型轉(zhuǎn)換函數(shù)相互轉(zhuǎn)換。MATLAB可操作的圖像文件包括BMP、HDF、JPEG、PCX、TIFF、XWD等格式。下面就圖像處理的基本過程討論工具箱所實現(xiàn)的常用功能。MATLAB為用戶提供了專門的函數(shù)來從圖像格式的文件中讀寫圖像數(shù)據(jù)。這種方法不像其他編程語言,需要編寫復(fù)雜的代碼,只需要簡單地調(diào)用MATLAB提供的函數(shù)即可。3.1 數(shù)字圖像文件的讀寫數(shù)字圖像文件的讀寫步驟。(1) 圖像文件的讀取。 MATLAB中利用函數(shù)imread來實現(xiàn)圖像文件的讀取操作。其語法格式
60、為:A=imread(filename,fmt)X,map=imread(filename,fmt)=imread(filename)Filename:圖像文件名;fmt:圖像文件格式。A = imread(filename, fmt) 讀取圖像到A,如果文件是包含灰度圖像,A是二維矩陣,如果文件是包含真彩色圖像(RGB),A是三維矩陣(M-by-N-by-3)。文件必須在當(dāng)前目錄下,或在matlab的路徑上。如果imread不能夠找到名稱為filename的文件,那么它將找一名為filename. fmt的文件X,map = (imread filename,fmt) 把圖像filename
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年精簡版:經(jīng)銷商板材銷售簡約合同
- 2024年土地分割與文化產(chǎn)業(yè)投資合作協(xié)議范本6篇
- 陜西工商職業(yè)學(xué)院《構(gòu)成基礎(chǔ)二》2023-2024學(xué)年第一學(xué)期期末試卷
- 2024年度建筑施工合同監(jiān)測與評價服務(wù)
- 2024年油罐交易協(xié)議模板精簡版版B版
- 2024年工程項目質(zhì)量賠償協(xié)議書模板3篇
- 2024衛(wèi)生室裝修與醫(yī)療廢棄物處理站建設(shè)合同范本3篇
- 2024年城市集中供暖保溫管道合同3篇
- 2024年標(biāo)準(zhǔn)農(nóng)用塑料薄膜購買合同版B版
- 2024年正式買賣協(xié)議樣本版B版
- 2024國網(wǎng)國中康健集團招聘74人歷年高頻考題難、易錯點模擬試題(共500題)附帶答案詳解
- 人教版九年級全冊英語Unit 8大單元整體教學(xué)設(shè)計
- 國家開放大學(xué)電大《建筑制圖基礎(chǔ)》機考第三套真題及答案
- 學(xué)習(xí)筆記:-11-酒店業(yè)務(wù)涉及稅目(易混淆)劃分及開票的問題
- DL∕T 1934-2018 火力發(fā)電廠直接空冷系統(tǒng)運行導(dǎo)則
- 2024版小學(xué)六年級上冊心理健康模擬試卷
- 人教版2024年新版七年級上冊英語Unit 6綜合測試卷(含答案)
- 卡通版名人介紹袁隆平
- 走進李叔同完整版本
- 英語兒童繪本I Am A Bunny我是一只小兔子
- 交通系統(tǒng)仿真與評價智慧樹知到期末考試答案章節(jié)答案2024年長安大學(xué)
評論
0/150
提交評論