壓縮編碼在圖像處理中的應(yīng)用_第1頁
壓縮編碼在圖像處理中的應(yīng)用_第2頁
壓縮編碼在圖像處理中的應(yīng)用_第3頁
壓縮編碼在圖像處理中的應(yīng)用_第4頁
壓縮編碼在圖像處理中的應(yīng)用_第5頁
已閱讀5頁,還剩95頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

摘要數(shù)字圖像的表示需要大量的數(shù)據(jù),必須進行數(shù)據(jù)的壓縮。即使采用多種方法對數(shù)據(jù)進行了壓縮,其數(shù)據(jù)量仍然巨大,對傳輸介質(zhì)、傳輸方法和存儲介質(zhì)的要求較高。因此圖象壓縮編碼技術(shù)的研究顯得特別有意義。目前圖像數(shù)據(jù)壓縮的方法主要有哈夫曼編碼、行程編碼、算術(shù)編碼、離散余弦變換編碼以及混合編碼等。本文描述了圖像編碼壓縮方法的主要分類,介紹了每個分類里面的典型算法的原理、特點,列舉了近些年出現(xiàn)的新的壓縮編碼算法,然后在Matlab環(huán)境下運用DCT變換對JPEG圖像壓縮編碼進行仿真,并給出了仿真圖片的比照和分析。關(guān)鍵詞:圖像壓縮編碼;DCT變換;哈弗曼編碼

AbstractThedigitalimagesrequirelargeamountsofdata,sothedatamustbecompressed.Evenwiththevarietyofmethodsofdatacompression,thedataarestillhuge,andtransmissionmethodsandstoragemediarequireahigheronthetransmissionmedia.Therefore,imagecompressioncodingtechnologyresearchisparticularlymeaningful.CurrentimagedatacompressionmethodsareHuffmancoding,lengthencoding,arithmeticcoding,discretecosinetransformcodingandhybridcoding,etc..

Thisarticledescribestheimageencodingmethodofthemaincategories,introducesinsidethetypicalalgorithmsforeachclassificationoftheprinciplesandcharacteristics,citestherecentemergenceofanewcodingalgorithm,thenintheMatlabenvironmentusingDCTtransformcodingoftheJPEGimagecompressionsimulation,andsimulationandanalysisofimagecontrast.Keywords:Imagecompression;DCTtransform;Huffmancoding目錄第1章緒論 11.1數(shù)字圖像處理 11.1.1圖像處理的概念 11.1.2數(shù)字圖像處理的應(yīng)用 21.2圖像數(shù)據(jù)壓縮的研究 31.2.1研究背景及意義 31.2.2圖像數(shù)據(jù)壓縮的必要性 41.2.3圖像數(shù)據(jù)壓縮的可行性 5第2章圖像壓縮編碼理論 62.1模擬圖像信號數(shù)字傳輸與存儲的一般過程 62.2圖像數(shù)據(jù)壓縮原理和圖像壓縮系統(tǒng)構(gòu)成 72.2.1圖像數(shù)據(jù)壓縮的根本原理 72.2.2圖像壓縮系統(tǒng)的一般構(gòu)成 82.3圖象壓縮的幾種方法 82.4圖像壓縮編碼的分類 102.5傳統(tǒng)圖像壓縮編碼方法 112.5.1熵編碼 112.5.2線性預(yù)測編碼 152.5.3變換編碼 162.5.4矢量量化編碼 162.6現(xiàn)代圖像編碼方法 162.6.1子帶編碼(SBC) 162.6.2模型基圖像編碼 172.6.3分形編碼 172.6.4小波變換編碼 172.7圖像壓縮編碼的國際化標準 172.7.1圖像壓縮編碼的國際標準化背景 172.7.2圖像編碼國際標準化建議的特點及適用方向 18第3章壓縮編碼在圖像壓縮中的應(yīng)用研究 223.1幾種圖像壓縮編碼的MATLAB實現(xiàn)例如 223.1.1像素編碼 223.1.2預(yù)測編碼 233.1.3變換編碼 233.1.4其它編碼 243.2JPEG壓縮標準 253.3基于DCT的JPEG圖像壓縮編碼理論算法 263.3.1基于離散余弦變換〔DCT變換〕的JPEG編碼方法 263.3.2基于DCT的JPEG圖像壓縮編碼算法的過程表述 263.3.3基于DCT的JPEG圖像壓縮編碼步驟 273.3.4DCT變換與小波變換的壓縮性能比擬 32第4章基于DCT變換的JPEG壓縮過程MATLAB實現(xiàn) 334.1MATLAB簡介 334.1.1MATLAB軟件 334.1.2MATLAB中數(shù)字圖像文件的讀寫 334.2MATLAB仿真實現(xiàn)流程 354.3MATLAB仿真結(jié)果分析 38結(jié)論 39參考文獻 40附錄Ⅰ外文文獻原文 41附錄Ⅱ外文文獻譯文 55附錄Ⅲ程序清單 66致謝 94第1章緒論數(shù)字圖像處理圖像處理的概念1.什么是圖像?“圖〞——物體透射或反射光的分布〔圖像場〕,是客觀存在;“像〞——人的視覺系統(tǒng)對接收在大腦中形成的圖的印象或認識,是人的感覺;圖像——圖和像的有機結(jié)合,既反映物體的客觀存在,又表達人的心理因素;對客觀存在物體的一種相似性的生動模仿或描述。2.圖像的表示一幅圖像定義為一個二維函數(shù)f(x,y),這里x和y是空間坐標,在任何一對空間坐標(x,y)上的幅值f稱為該點圖像的強度或灰度。當幅值f為有限的、離散的數(shù)值時,稱該圖像為數(shù)字圖像。數(shù)字圖像由有限的元素組成,每個元素都有一個特定的位置和幅值,這些元素稱為像素〔圖像元素或畫面元素〕。空間有界:L-x≤x≤L+x〔1-1〕L-y≤y≤L+y〔1-2〕亮度〔點亮度〕有限:0≤f(x,y)≤Bmax〔1-3〕圖像的數(shù)學表示:一幅圖像所包含的信息首先表現(xiàn)為光的強度,即一幅圖像可看成是空間各個坐標點上的光強度I的集合,其普遍數(shù)學表達式為:I=f〔x,y,z,λ,t〕〔1-4〕式中(x,y,z)是空間坐標,λ是波長,t是時間,I是光點(x,y,z)的強度〔幅度〕。式〔1-4〕表示一幅運動的(t)、彩色/多光譜的(λ)、立體的(x,y,z)圖像。靜止圖像,與時間t無關(guān);單色圖像〔也稱灰度圖像〕,波長λ為一常數(shù);平面圖像,那么與坐標z無關(guān)。在每一種情況下,圖像的表示可省略掉一維,即:靜止圖像:I=f〔x,y,z,λ〕〔1-5〕灰度圖像:I=f〔x,y,z,t〕〔1-6〕平面圖像:I=f〔x,y,λ,t〕〔1-7〕而對于平面上的靜止灰度圖像,其數(shù)學表達式可簡化為:I=f〔x,y〕〔1-8〕運動圖像可用靜止圖像序列表示,彩色圖像可分解成三基色圖像,三維圖像可由二維重建。因此本文主要針對平面上的靜止灰度圖像進行論述。3.數(shù)字圖像處理的定義[1]:利用數(shù)字計算機或其它高速、大規(guī)模集成數(shù)字硬件,對從圖像信息轉(zhuǎn)換來的數(shù)字電信號進行某些運算或處理,以期提高圖像質(zhì)量或到達人們所要求的某些預(yù)期效果。對被噪聲污染的圖像去除噪聲;對信息微弱的圖像進行增強;失真圖像的幾何校正;從遙感圖片中區(qū)分農(nóng)作物、森林、湖泊和軍事設(shè)施等。4.數(shù)字圖像處理的目的對圖像信息進行加工處理和分析,以滿足人的視覺、心理需要和實際應(yīng)用或某種目的〔如機器識別〕的要求。著重強調(diào)在圖像之間進行的變換,廣義上泛指各種圖像技術(shù);狹義上指對圖像進行各種加工處理,到達:改善人的視覺效果;為自動識別打根底;壓縮編碼等目標。5.數(shù)字圖像處理的內(nèi)容和方法圖像數(shù)字化:將非數(shù)字形式的圖像信號通過數(shù)字化設(shè)備轉(zhuǎn)換成數(shù)字圖像,包括采樣和量化。圖像變換:對圖像信息進行變換以便于在頻域?qū)D像進行更有效的處理。圖像增強:增強圖像中的有用信息,削弱干擾和噪聲,提高圖像的清晰度,突出圖像中所感興趣的局部。圖像恢復〔復原〕:對退化的圖像進行處理,使處理后的圖像盡可能地接近原始〔清晰〕圖像。圖像壓縮編碼:對待處理圖像進行壓縮編碼以減少描述圖像的數(shù)據(jù)量。圖像分割:根據(jù)選定的特征將圖像劃分成假設(shè)干個有意義的局部,這些選定的特征包括圖像的邊緣、區(qū)域等。圖像分析與描述:主要是對已經(jīng)分割的或正在分割的圖像各局部的屬性及各局部之間的關(guān)系進行分析表述。圖像識別分類:根據(jù)從圖像中提取的各目標物的特征與目標物固有的特征進行匹配、識別,以作出對各目標物類屬的判別。1.1.2數(shù)字圖像處理的應(yīng)用闡述數(shù)字圖像處理應(yīng)用范圍最簡單的一種方法是根據(jù)信息源來分類。各類信息源及不同的應(yīng)用領(lǐng)域產(chǎn)生各種不同的圖像。宇宙探測中的應(yīng)用:主要是星體圖片的獲取、傳送和處理。通信方面的應(yīng)用:圖像信息傳輸、電視、衛(wèi)星通信、數(shù)字等。主要是壓縮圖像數(shù)據(jù)和動態(tài)圖像〔序列〕傳送。遙感方面的應(yīng)用:航空遙感和衛(wèi)星遙感,地形、地質(zhì)、資源的勘測,自然災(zāi)害監(jiān)測、預(yù)報和調(diào)查,環(huán)境監(jiān)測、調(diào)查等。生物醫(yī)學方面的應(yīng)用:細胞分析、染色體分類、放射圖像處理、血球分類、各種CT、核磁共振圖像分析、DNA顯示分析、顯微圖像處理、癌細胞識別、心臟活動的動態(tài)分析、超聲圖像成像、生物進化的圖像分析等等。軍事公安方面的應(yīng)用:軍事:軍事目標的偵察和探測、導彈制導、各種偵察圖像的判讀和識別,雷達、聲納圖像處理、指揮自動化系統(tǒng)等。公安:現(xiàn)場實景照片、指紋、足跡的分析與鑒別,人像、印章、手跡的識別與分析,集裝箱內(nèi)物品的核輻射成像檢測,人隨身攜帶物品的X射線檢查等。工業(yè)生產(chǎn)的應(yīng)用:將CAD和CAM技術(shù)應(yīng)用于磨具和零件優(yōu)化設(shè)計和制造、印制板質(zhì)量和缺陷的檢測、無損探傷、石油氣勘測、交通管制和機場監(jiān)控、紡織物的圖案設(shè)計、光的彈性場分析、運開工具的視覺反響控制、流水線零件的自動監(jiān)測識別、郵件自動分揀和包裹的自動分揀識別等。天氣預(yù)報:天氣云圖測繪、傳輸,氣象衛(wèi)星云圖的處理和識別等??脊牛赫滟F文物圖片、名畫、壁畫的輔助恢復。新領(lǐng)域:信息平安:信息隱藏與數(shù)字水印,指紋識別、虹膜識別和面部識別等;圖像檢索:基于內(nèi)容的圖像檢測、識別與檢索;體育運動:運發(fā)動動作的分析、評測及優(yōu)化設(shè)計。圖像數(shù)據(jù)壓縮的研究研究背景及意義近年來,隨著計算機技術(shù)、現(xiàn)代通信技術(shù)、網(wǎng)絡(luò)技術(shù)和信息處理技術(shù)的迅速開展,人們對各種信息的需求不斷增長,尤其是圖像和多媒體信息。未經(jīng)處理的圖像信號的數(shù)據(jù)量是巨大的,使得圖像信息的傳輸,處理和存儲都受到限制。因此,研究高效的圖像數(shù)據(jù)壓縮編碼方法,即怎樣處理、組織圖像數(shù)據(jù),在應(yīng)用領(lǐng)域中的作用將是至關(guān)重要的,圖像壓縮編碼技術(shù)已經(jīng)成為多媒體及通訊領(lǐng)域中的關(guān)鍵技術(shù)之一。多媒體數(shù)據(jù)的數(shù)據(jù)量非常巨大,如果不進行壓縮,就無法在計算機中存儲和傳輸,也無法在多媒體信息系統(tǒng)中處理。對數(shù)據(jù)進行壓縮的目的是減小存儲容量和降低數(shù)據(jù)傳輸率,使得現(xiàn)有的PC機的指標與性能方面到達能夠處理聲音和圖像信息的要求,從而實現(xiàn)實時、快速、有效地處理、傳輸和存儲數(shù)據(jù)。壓縮的出發(fā)點是利用各種編碼方法將數(shù)據(jù)冗余壓縮到最小,并盡可能地減少失真,提高數(shù)據(jù)使用效率。在掌握數(shù)據(jù)壓縮技術(shù)的根本原理與方法的根底上,研究數(shù)據(jù)壓縮技術(shù)來實現(xiàn)更高的壓縮比和壓縮質(zhì)量。圖像數(shù)據(jù)壓縮編碼近年來在技術(shù)及應(yīng)用方面都取得了很大進展,它的進步和完善深刻影響著現(xiàn)代社會的方方面面。在眾多編碼標準中,JPEG壓縮算法實現(xiàn)簡單,在很大的壓縮范圍內(nèi),都能得到很好的重建圖像質(zhì)量。用MATLAB做仿真實驗,方法簡單且誤差小,很達程度的提高了圖像壓縮的效率和壓縮精度。DCT變換是最小均方誤差準那么下得出的次最正確正交變換。DCT具有算法簡單,易于硬件實現(xiàn)等優(yōu)點,從而廣泛應(yīng)用于圖像壓縮領(lǐng)域。正是由于具有這些優(yōu)點,JPEG壓縮編碼算法在圖像壓縮領(lǐng)域得到了越來越廣泛的應(yīng)用,尤其在較高比特率的傳輸條件下能取得令人滿意的壓縮效果。圖像數(shù)據(jù)壓縮的必要性進入21世紀,人類已步入信息社會,新信息技術(shù)革命使人類被日益增多的多媒體信息所包圍,這也正好迎合了人類對要示提高視覺信息的需求。多媒體信息主要有三種形式:文本、聲音和圖像。從信息傳輸?shù)拈_展史〔電報、、、收音機、電視機直至現(xiàn)在的網(wǎng)絡(luò)〕可以看出,人們逐漸將信息傳輸?shù)闹攸c從聲音轉(zhuǎn)向圖像,然而圖像是三種信息形式中數(shù)據(jù)量最大的,這給圖像的傳輸和存儲帶來了極大的困難。例如,一幅640×480分辨率的24位真彩色圖像的數(shù)據(jù)量約為900kb;一個100Mb的硬盤只能存儲約l00幅靜止圖像畫面。對于如此巨大的數(shù)字圖像數(shù)據(jù)量,如果不經(jīng)過壓縮,不僅超出了計算機的存儲和處理能力,而且在現(xiàn)有的通信信道的傳輸速率下,是無法完成大量多媒體信息實時傳輸?shù)?,?shù)字圖像高速傳輸和存貯所需要的巨大容量已成為推廣數(shù)字圖像通信和最大障礙。因此,為了存儲、處理和傳輸這些數(shù)據(jù),必須進行壓縮。圖像壓縮之所以能夠進行壓縮是因為原始圖像數(shù)據(jù)是高度相關(guān)的,存在很大的數(shù)據(jù)冗余。數(shù)字圖像包含的冗余信息一般有以下幾種:空間冗余、時間冗余、信息熵冗余、統(tǒng)計冗余、結(jié)構(gòu)冗余、視覺冗余以及知識冗余等。圖像壓縮算法就是要在保證圖像一定的重建質(zhì)量的同時,盡可能多的去除這些冗余信息,以到達對圖像壓縮的目的。圖象采樣后,如果對之進行簡單的8bit量化和PCM編碼,其數(shù)據(jù)量是巨大的。以CIF〔CommonIntermediateFormat〕格式的彩色視頻信號為例,假設(shè)采樣速率為25幀/秒,采樣樣點的Y、U、V分量均為8bit量化,那么一秒鐘的數(shù)據(jù)量為:〔1-9〕352×288×3×8×25=〔1-9〕要傳輸或存儲這樣大的數(shù)據(jù)量是非常困難的,必需對其進行壓縮編碼,在滿足實際需要的前提下,盡量減少要傳輸或存儲的數(shù)據(jù)量。雖然數(shù)字圖象的數(shù)據(jù)量巨大,但圖象數(shù)據(jù)是高度相關(guān)的。一幅圖象的內(nèi)部相鄰象素之間,相鄰行之間的視頻序列中相鄰圖象之間有大量冗余信息——空間相關(guān)性和時間相關(guān)性,可以使用各種方法盡量去除這些冗余信息,減少圖象的數(shù)據(jù)量。除了時間冗余和空間冗余外,在一般的圖象數(shù)據(jù)中還存在信息熵冗余、結(jié)構(gòu)冗余、知識冗余和視覺冗余。各種冗余就是壓縮圖象數(shù)據(jù)的出發(fā)點。圖象編碼的目的就在于采用各種方法去除冗余,以盡量少的數(shù)據(jù)量來表示個重建圖象。圖像數(shù)據(jù)壓縮的可行性經(jīng)研究發(fā)現(xiàn),與音頻數(shù)據(jù)一樣,圖像數(shù)據(jù)中存在著大量的冗余,原因在于原始圖像數(shù)據(jù)是高度相關(guān)的。通過去除那些冗余數(shù)據(jù)可以節(jié)約文件所占的碼字從而極大地降低原始圖像數(shù)據(jù)量,解決圖像數(shù)據(jù)量巨大的問題,到達數(shù)據(jù)壓縮的目的。圖像數(shù)據(jù)壓縮技術(shù)就是研究如何利用圖像數(shù)據(jù)的冗余性來減少圖像數(shù)據(jù)量的方法。因此,進行圖像壓縮研究的起點是研究圖像數(shù)據(jù)的冗余性。空間冗余。在靜態(tài)圖像中有一塊外表顏色均勻的區(qū)域,在這個區(qū)域中所有點的光強和色彩以及色飽和度都相同,具有很大的空間冗余。這是由于基于離散像素采樣的方法不能表示物體顏色之間的空間連貫性導致的。時間冗余。電視圖像、動畫等序列圖片,當其中物體有位移時,后一幀的數(shù)據(jù)與前一幀的數(shù)據(jù)有許多共同的地方,如背景等位置不變,只有局部相鄰幀改變的畫面,顯然是一種冗余,這種冗余稱為時間冗余。結(jié)構(gòu)冗余。在有些圖像的紋理區(qū),圖像的像素值存在著明顯的分布模式。例如,方格狀的地板圖案等,稱此為結(jié)構(gòu)冗余。如果分布模式,就可以通過某一過程生成圖像。知識冗余。對于圖像中重復出現(xiàn)的局部,我們可以構(gòu)造出根本模型,并創(chuàng)立對應(yīng)各種特征的圖像庫,進而使圖像的存儲只需要保存一些特征參數(shù),從而可以大大減少數(shù)據(jù)量。知識冗余是模型編碼主要利用的特性。視覺冗余。事實說明,人的視覺系統(tǒng)對圖像的敏感性是非均勻性和非線性的。在記錄原始的圖像數(shù)據(jù)時,對人眼看不見或不能分辨的局部進行記錄顯然是不必要的。因此,大可利用人的視覺的非均勻性和非線性,降低視覺冗余。圖像區(qū)域的相同性冗余。它是指在圖像中的兩個或多個區(qū)域所對應(yīng)的所有像素值相同或相近,從而產(chǎn)生的數(shù)據(jù)重復性存儲,這就是圖像區(qū)域的相似性冗余。在以上的情況下,當記錄了一個區(qū)域中各像素的顏色值,那么與其相同或相近的其他區(qū)域就不需要記錄其中各像素的值。采用向量量化〔Vectorquantization〕方法就是針對這種冗余性的圖像壓縮編碼方法。隨著對人的視覺系統(tǒng)和圖像模型的進一步研究,人們可能會發(fā)現(xiàn)圖像中存在著更多的冗余性,使圖像數(shù)據(jù)壓縮編碼的可能性越來越大,從而推動圖像壓縮技術(shù)的進一步開展。允許圖像有一定的失真也是圖像可以壓縮的一個重要原因,在許多應(yīng)用場合,并不要求經(jīng)過壓縮后復原的圖像和原始圖像完全相同,而允許有少量的失真。只要這些失真并不被人眼所發(fā)覺,在許多情況下是完全可以接受的。這就個圖像壓縮提供了十分有利的條件。圖像質(zhì)量允許的失真越多,可以實現(xiàn)的壓縮比就越大。這種有失真的壓縮編碼稱為限失真編碼。

第2章圖像壓縮編碼理論圖象的數(shù)字化表示使得圖象信號可以高質(zhì)量地傳輸,并便于圖像的檢索、分析、處理和存儲。但是數(shù)字圖像的表示需要大量的數(shù)據(jù),必須進行數(shù)據(jù)的壓縮。即使采用多種方法對數(shù)據(jù)進行了壓縮,其數(shù)據(jù)量仍然巨大,對傳輸介質(zhì)、傳輸方法和存儲介質(zhì)的要求較高。因此圖象壓縮編碼技術(shù)的研究顯得特別有意義,也正是由于圖象壓縮編碼技術(shù)及傳輸技術(shù)的不斷開展、更新,推動了現(xiàn)代多媒體技術(shù)應(yīng)用的迅速開展。模擬圖像信號數(shù)字傳輸與存儲的一般過程目前,模擬圖像信號的數(shù)字傳輸與存儲的一般原理如圖2-1所示:圖2-1圖像傳輸與存儲原理其中圖像壓縮編碼一般大致分為三個過程:采樣、量化和編碼過程。采樣圖像在空間上的離散化稱為采樣。也就是用空間上局部點的灰度值代表圖像,這些點稱為采樣點。采樣需符合采樣定理,才能使圖像不失真,即:Fs>=2Fmax。量化模擬圖像經(jīng)過采樣后,在時間和空間上離散化為像素。但采樣所得的像素值〔即灰度值〕仍是連續(xù)量。把采樣后所得的各像素的灰度值從模擬量到離散量的轉(zhuǎn)換稱為圖像灰度的量化。量化等級越多,所得圖像層次越豐富,灰度分辨率高,圖像質(zhì)量好,但數(shù)據(jù)量大;量化等級越少,圖像層次欠豐富,灰度分辨率低,會出現(xiàn)假輪廓現(xiàn)象,圖像質(zhì)量變差,但數(shù)據(jù)量小。量化可分為均勻量化和非均勻量化。均勻量化是簡單地在灰度范圍內(nèi)等間隔量化。非均勻量化是對像素出現(xiàn)頻度少的局部量化間隔取大,而對頻度大的量化間隔取小。一般情況下,對灰度變化比擬平緩的局部用比擬多的量化級,在灰度變化比擬劇烈的地方用比擬高的分辨率。一般,當限定數(shù)字圖像的大小時,為了得到質(zhì)量較好的圖像可采用如下原那么:(1)對緩變的圖像,應(yīng)該細量化,粗采樣,以防止假輪廓。(2)對細節(jié)豐富的圖像,應(yīng)細采樣,粗量化,以防止模糊〔混疊〕。編碼圖像編碼是將模擬圖像信號轉(zhuǎn)換成數(shù)字信號的一種技術(shù)。圖像編碼方法很多,圖2-2就是其中的一種。圖2-2圖像編碼的一種方法圖2-2中的圖像編碼包含:(1).PCM編碼;(2).壓縮編碼。圖像數(shù)據(jù)壓縮原理和圖像壓縮系統(tǒng)構(gòu)成圖像數(shù)據(jù)壓縮的根本原理由于圖像數(shù)據(jù)之間存在著一定的冗余,所以使得數(shù)據(jù)的壓縮成為可能。信息論的創(chuàng)始人Shannon提出把數(shù)據(jù)看作是信息和冗余度的組合。所謂冗余度,是由于一副圖像的各像素之間存在著很大的相關(guān)性,可利用一些編碼的方法刪去它們,從而到達減少冗余壓縮數(shù)據(jù)的目的。為了去掉數(shù)據(jù)中的冗余,常常要考慮信號源的統(tǒng)計特性,或建立信號源的統(tǒng)計模型。對數(shù)字圖像進行壓縮通常利用兩個根本原理[2]:(1)數(shù)字圖像的相關(guān)性。在圖像的同一行相鄰像素之間、活動圖像的相鄰幀的對應(yīng)像素之間往往存在很強的相關(guān)性,去除或減少這些相關(guān)性,也就去除或減少圖像信息中的冗余度,即實現(xiàn)了對數(shù)字圖像的壓縮。(2)人的視覺心理特征。人的視覺對于邊緣急劇變化不敏感〔視覺掩蓋效應(yīng)〕,對顏色分辨力弱,利用這些特征可以在相應(yīng)局部適當降低編碼精度,而使人從視覺上并不感覺到圖像質(zhì)量的下降,從而到達對數(shù)字圖像壓縮的目的。圖像壓縮系統(tǒng)的一般構(gòu)成圖2-3圖像壓縮系統(tǒng)的一般構(gòu)成信源編碼:完成原始數(shù)據(jù)的壓縮與編碼。信道編碼:為了抗干擾,增加一些容錯、校驗位,實際上是有規(guī)律地增加傳輸數(shù)據(jù)的冗余,以便于消除傳輸過程中增加的隨機信號。信道:傳輸數(shù)據(jù)〔信息〕的手段。如Internet、播送、通訊、可移動介質(zhì)等。信源數(shù)據(jù)編碼與解碼的模型如圖2-4和圖2-5所示:圖2-4信源編碼模型映射器:減少像素冗余,如使用RLE編碼?;蜻M行圖像變換。量化器:減少視覺心理冗余,僅用于有損壓縮。符號編碼器:減少編碼冗余,如使用哈夫曼編碼。圖2-5信源解碼模型圖象壓縮的幾種方法統(tǒng)計和字典的壓縮方法常規(guī)程序和計算機熵的數(shù)據(jù)對于那些基于利用統(tǒng)計變種的壓縮,效果很好,這些統(tǒng)計變種表現(xiàn)在單個符號的頻率以及符號或短語字符串的頻率等方面,而基于字典的系統(tǒng)實際上就是假扮統(tǒng)計程序??墒沁z憾的是,這類壓縮對于連續(xù)色調(diào)圖象的作用并不是很好。這些程序的主要問題產(chǎn)生于這樣的一個事實:照片圖象的象素廣泛地分布在整個范圍。如果將圖象中的彩色用頻率分布畫出,那么頻率分布圖中,沒有我們在統(tǒng)計壓縮的成功的情況下所看到的“尖峰〞狀,實際上,如果延長這個分布圖,那么從類似于電視那樣的生活圖象源中得出的分布圖會趨于平展。這意味著,每個象素代碼彼此是大約相同的出現(xiàn)時機,決對不存在挖掘熵差的任何時機?;谧值涞膲嚎s程序的運行也有類似的問題,基于掃描照片的圖象決定沒有任何類型的數(shù)據(jù)特征以產(chǎn)生相同的短語的屢次出現(xiàn)。例如,一個柵格化的圖象,類似房子墻邊的垂直局部,在圖片的許多連續(xù)的行中可能可以給出相似的字符串。但不幸的是,由于真實世界是變化多端的,每行中的相同的性能將彼此地略有不同,對于20個象素的一個字符串,其中的一兩個象素會因掃描而彼此出現(xiàn)一步長的變化,雖然這些不同點小到人眼不能探測或?qū)θ搜鄄黄鹱饔?,但他們畢竟阻礙了基于字典壓縮的工作,對于這類壓縮方法來說,字符串必須嚴格匹配,由于小的變化,而使匹配的字符串長度趨于很小,這就限制了壓縮的效率。有損壓縮類似于音頻數(shù)據(jù),圖形圖象也同樣有一個比常規(guī)計算機數(shù)據(jù)文件優(yōu)越的地方:在壓縮/擴展的循環(huán)中,他們可以被略微改動,而不會影響用戶的立即質(zhì)量。如果仔細修改,那么各處象素的精確灰度可以完全不被注意地進行小的改變。由于計算機柵的圖形圖象通常來自對真實世界源的掃描,所有他們通常表達一個已經(jīng)不完美的照片的表達或是不完美的其他打印接著的表達。沒有改變圖象根本性能的有損壓縮程序應(yīng)該是可行的。假設(shè)圖形圖象的有損壓縮是可能的,那么它是如何實現(xiàn)的呢?研究人員最初試驗了用于語音信號的同樣的技術(shù),如差分編碼和自適應(yīng)編碼,雖然這些技術(shù)對圖象有幫助,但并沒有到達所希望的那么好,原因之一是音頻數(shù)據(jù)和視頻數(shù)據(jù)根本不同。用常規(guī)格式采樣的音頻數(shù)據(jù)是趨于反復的,聲音,包括講話,是由每次幾秒的重復的正弦波組成的。雖然計算機上DAC的輸入流可能由許多不同的頻率疊加在一起而成,但是正弦波通常產(chǎn)生反復的波形。音頻反復的本性自然使他利于壓縮,線性預(yù)言編碼和自適應(yīng)差分脈沖編碼調(diào)制等技術(shù)就利于了這一點,因此將音頻數(shù)據(jù)流壓縮了50%到95%。但開始研究圖形壓縮時,人們也試圖用相似的技術(shù)壓縮數(shù)字化的圖象,取得了一些成功。最初,研究人員進行柵格化數(shù)據(jù)流的壓縮,如顯示在電視機柵的數(shù)據(jù)。圖形數(shù)據(jù)柵格化時,圖形顯示成一個象素流,每次一行地顯示在屏幕上,從左到右,從上到下。這樣,當完成一行時,圖片的一個細片就畫出了,直到整個屏幕填滿。數(shù)字化時,象素可以使用從1位到24位,如今的圖形常常使用8位來定義一個象素。差分調(diào)制差分調(diào)制依賴于模擬數(shù)據(jù)趨于“平緩〞的變化,信號幅度上那個的大的跳變是例外,而不是常規(guī)。在音頻數(shù)據(jù)中,只要信號的采樣率一定程度地高于信息本身的最大的頻率分量,那么大的跳變就不會產(chǎn)生。音頻信號的差分調(diào)制通過編碼一個樣點與前一個樣點的不同來利用這一個特點。例如,如果單頻樣點位8位,差分編碼系統(tǒng)可能用4位來編碼樣點之差,這就將輸入數(shù)據(jù)壓縮了50%。這種壓縮方法中所產(chǎn)生的損失是來自于:使用標準的差分方法不可能總是精確地編碼。信號的增長可能快于比編碼的允許,或者,編碼可能太粗而不能容納下的差異,差分編碼的有損性可以很好的處理,以產(chǎn)生出好的信號。當壓縮圖形數(shù)據(jù)時,差分調(diào)制有很多問題。首先,圖形中的象素依賴于平緩的增加或減少是不可靠的,一幅圖中不同的分量間的明顯界限是常有的事情。這意味著,使用差分編碼的系統(tǒng)需要接受樣點間的大的不同和小的不同。這就限制了壓縮的效率。帶有數(shù)據(jù)長結(jié)構(gòu)的許多圖象可以壓縮的很好。長結(jié)構(gòu)中的象素,彼此之間沒有什么差異或差異很少;但時,帶有突變局部的那些圖象不可能壓縮的很好。通常,圖形圖象的差分的編碼似乎不產(chǎn)生非常強于最好的無損算法的壓縮結(jié)果,他當然也不會產(chǎn)生所需要的、對壓縮的數(shù)量級上的改良。自適應(yīng)編碼自適應(yīng)編碼〔常常于差分編碼一同使用〕根據(jù)前面看到的一些象素而對將要到來的一些象素的信息做預(yù)言。例如,如果一幅灰度級照片中的最新的十個象素的值都在45到50之間,那么自適應(yīng)壓縮系統(tǒng)可能預(yù)言,下一個象素很大可能也在這個范圍中,之后,類似于霍夫曼或算術(shù)編碼那樣的基于熵的編碼方案可能給將來到來的各種代碼賦以概率值,可以代替地使用壓縮-擴展方法,將最細的粒度賦給最接近預(yù)言猜想的范圍。圖像壓縮編碼的分類圖像壓縮編碼的方法目前有很多,其分類方法根據(jù)出發(fā)點不同而有差異。根據(jù)解壓重建后的圖像和原始圖像之間是否具有誤差,圖像編碼壓縮分為無損〔亦稱無失真、無誤差、信息保持型〕編碼和有損〔有失真、有誤差、信息非保持型〕編碼兩大類。無損壓縮:這類壓縮算法中刪除的僅僅是圖像數(shù)據(jù)中冗余的信息,因此在解壓縮時能精確恢復原圖像。無損壓縮用于要求重建后圖像嚴格地和原始圖像保持相同的場合,例如復制、保存十分珍貴的歷史、文物圖像等。一些常用的無損壓縮編碼有哈夫曼編碼、行程編碼、算術(shù)編碼等。有損壓縮:這類算法把不相干的信息也刪除了,因此在解壓縮時只能對原始圖像進行近似的重建,而不能精確的復原,有損壓縮適合大多數(shù)用于存儲數(shù)字化了的模擬數(shù)據(jù)。有損編碼包括預(yù)測編碼、變換編碼和其他編碼等。根據(jù)編碼原理圖像編碼分為熵編碼、預(yù)測編碼、變換編碼和混合編碼等。熵編碼:這是純粹基于信號統(tǒng)計特性的編碼技術(shù),是一種無損編碼。熵編碼的根本原理是給出現(xiàn)概率較大的符號賦予一個短碼字,而給出現(xiàn)概率較小的符號賦予一個長碼字,從而使最終的平均碼長很小。常見的熵編碼方法有哈夫曼編碼、算術(shù)編碼和行程編碼。預(yù)測編碼:它是基于圖像數(shù)據(jù)的空間或時間冗余特性,用相鄰的像素〔或像素塊〕來預(yù)測當前像素〔或像素塊〕的取值,然后再對預(yù)測誤差進行量化和編碼。預(yù)測編碼可分為幀內(nèi)預(yù)測和幀間預(yù)測,常用的預(yù)測編碼有差分脈碼調(diào)制〔DifferentialPulseCodeModulation,DPCM〕和運動補償法。變換編碼:通常是將空間域上的圖像經(jīng)過正交變換映射到另一變換域上,使變換后的系數(shù)之間的相關(guān)性降低。圖像變換本身并不能壓縮數(shù)據(jù),但變換后圖像的大局部能量只集中到少數(shù)幾個變換系數(shù)上,再采用適當?shù)牧炕挽鼐幋a就可以有效地壓縮圖像?;旌暇幋a:是指綜合了熵編碼、變換編碼或預(yù)測編碼的編碼方法,如JPEG和MPEG標準。從圖像的光譜特征出發(fā),將壓縮編碼分為單色圖像編碼、彩色圖像編碼和多光譜圖像編碼。從圖像的灰度層次上,壓縮編碼可分為多灰度編碼和二值圖像編碼。根據(jù)編碼作用域劃分,圖像編碼為空間域編碼和變換域編碼兩大類。傳統(tǒng)圖像壓縮編碼方法熵編碼根據(jù)信息論中信源碼理論,可以證明在平均碼長R大于等于圖像熵H的條件下,總可以設(shè)計出某種無失真編碼方法,當然如果編碼結(jié)果使R遠大于H,說明這種編碼方法效率很低,占用比特數(shù)太多;最好的編碼結(jié)果是使R等于或接近于H,這種狀態(tài)的編碼方法稱為最正確編碼,它既不喪失信息而引起圖像失真,又占用最少的比特數(shù)。熵編碼的目的就是要使編碼后的圖像平均碼長R盡可能接近圖像熵H,一般是根據(jù)圖像灰度級數(shù)出現(xiàn)的概率大小賦予不同長度碼字,出現(xiàn)概率大的灰度級用短碼字,出現(xiàn)概率小的灰度級用長碼字??梢宰C明,這樣的編碼結(jié)果所獲得的平均碼字長度最短,這就是下面要介紹的變長最正確編碼定理。變長最正確編碼定理[3]:在變長編碼中,對出現(xiàn)概率大的信息符號賦給短碼字,而對于出現(xiàn)概率小的信息符號賦給長碼字,如果碼字長度嚴格按照所對應(yīng)符號出現(xiàn)概率大小逆序排列,那么編碼結(jié)果平均碼字長度一定小于任何其它排列方式。哈夫曼編碼[4]大多數(shù)存儲數(shù)字的信息編碼系統(tǒng)都采用位數(shù)固定的定長碼,即使用相同位數(shù)對數(shù)據(jù)進行編碼。如常用的ASCII碼,用8位二進制數(shù)表示一個英文字符。正像一篇文章中,每個字符出現(xiàn)的頻度是不同的。有些字符出現(xiàn)的頻率高,有些字符出現(xiàn)的頻率低。同樣,在一幅圖像中,有些圖像數(shù)據(jù)出現(xiàn)的頻率高,有些圖像數(shù)據(jù)出現(xiàn)的頻率低。如果對出現(xiàn)頻率高的數(shù)據(jù)用較少的比特數(shù)來表示,出現(xiàn)頻率低的數(shù)據(jù)用較多的比特數(shù)來表示,這樣從總的效果看還是節(jié)省了存儲空間。采用這種方法對數(shù)據(jù)進行編碼時,代碼的位數(shù)不固定,這種碼稱為變長碼。這種編碼思想首先由香農(nóng)提出,哈夫曼對它提出了改良,用這種方法得到的編碼稱為哈夫曼碼。哈夫曼編碼〔Huffman〕是運用信息熵原理的一種無損編碼方法。哈夫曼編碼于1952年問世,迄今為止仍經(jīng)久不衰,廣泛應(yīng)用于各種數(shù)據(jù)壓縮技術(shù)中。壓縮編碼思想是利用變長編碼將圖像中出現(xiàn)概率大的灰度值賦予短碼字,而對出現(xiàn)概率小的灰度值賦予長字碼,從而到達壓縮圖像數(shù)據(jù)的目的。哈夫曼編碼的理論依據(jù)是變字長編碼理論。在變字長編碼中,編碼器的編碼輸出碼字是字長不等的碼字,按編碼輸入信息符號出現(xiàn)的統(tǒng)計概率,給輸出碼字分配以不同的字長。對于編碼輸入中,出現(xiàn)大概率息符號,賦以短字長的輸出碼字;對于編碼輸入中,出現(xiàn)小概率的信息符號,賦以長字長的輸出碼字。可以證明,按照概率出現(xiàn)大小的順序,對輸出碼字分配不同碼字長度的變字長編碼方法,其輸出碼字的平均碼長最短,與信源熵值最接近。哈夫曼碼字長度和信息符號出現(xiàn)概率大小次序正好相反,即大概信息符號分配碼字長度短,小概率信息符號分配碼字長度長,編碼方法最正確。哈夫曼編碼具有以下特點:哈夫曼編碼構(gòu)造出來的編碼值不是唯一的。原因是在給兩個最小概率的圖像的灰度值進行編碼時,可以是大概率為“0”,小概率為“1”,但也可相反;而當兩個灰度值的概率相等時,“0”、哈夫曼編碼對不同的信源其編碼效率是不同的,當信源概率為2的負冪次方時,哈夫曼編碼的編碼效率到達100%。因此只有當信源概率分布很不均勻時,哈夫曼編碼才會收到顯著的效果。換句話說,在信源概率比擬接近的情況下,一般不使用哈夫曼編碼方法。哈夫曼編碼結(jié)果碼字不等長,雖說平均碼字最短,效率最高,但是碼字長短不一,實時硬件實現(xiàn)很復雜〔特別是譯碼〕,而且在抗誤碼能力方面也比擬差,為此,研究人員提出了一些修正方法,如雙字長哈夫曼編碼〔也稱亞最正確編碼方法〕,希望通過降低一些效率來換取硬件實現(xiàn)簡單的實惠。雙字長編碼只采用兩種字長的碼字,對出現(xiàn)概率高的符號用短碼字,對出現(xiàn)概率低的符號用長碼字。短碼字中留下一個碼字不用,作為長碼字前綴,這種方法編碼壓縮效果不如哈夫曼碼,但其硬件實現(xiàn)相對簡單,抗干擾能力也比哈夫曼方法強得多。哈夫曼編碼應(yīng)用時,均需要與其他編碼結(jié)合起來使用,才能進一步提高數(shù)據(jù)壓縮比。例如,在靜態(tài)圖像國際壓縮標準JPEG中,先對圖像進行分塊,然后進行DCT變換、量化、Z形掃描、行程編碼后,再進行哈夫曼編碼。哈夫曼編碼的一般算法如下:首先統(tǒng)計圖像灰度值出現(xiàn)的概率,按灰度值出現(xiàn)概率從大到小排序。把最小的兩個概率相加合并成新的概率,與剩余的概率組成新的概率集合。對新的概率集合重新排序,再次把其中最小的兩個概率相加,組成新的概率集合。如此重復進行,直到最后兩個概率的和為1。分配碼字。圖像灰度值的概率分布不同,哈夫曼的編碼效率有所差異。圖像灰度值分布很不均勻時,哈夫曼編碼的編碼效率就高。而圖像灰度值分布比擬均勻時,哈夫曼編碼的編碼效率就很低。哈夫曼編碼的性質(zhì):哈夫曼編碼構(gòu)造出來的碼不是惟一的,主要有兩個原因:一是在兩個符號概率相加給兩條支路分配“0〞和“1〞時,這一選擇是任意的;二是當兩個消息的概率相等時,0,1分配也是隨意的。哈夫曼編碼對不同的信源,其編碼效率是不同的。哈夫曼編碼中,沒有一個碼字是另一個碼字的前綴,因此,每個碼字惟一可譯。香農(nóng)—范諾〔Shannon-Fannon〕編碼香農(nóng)—范諾編碼也是一種常見的可變字長編碼,與哈夫曼編碼相似,當信源符號出現(xiàn)的概率正好為2的負冪次方時,采用香農(nóng)—范諾編碼同樣能夠到達100%的編碼效率。香農(nóng)—范諾編碼的理論根底是符號的碼字長度Ni完全由該符號出現(xiàn)的概率來決定。香農(nóng)一范諾編碼的步驟如下:將輸入灰度值xi按其出現(xiàn)概率Pi從大到小排序計算出各概率對應(yīng)的碼字長度bi計算累加概率Ai把各個累加概率Ai由十進制轉(zhuǎn)化為二進制取小數(shù)點后的該二進制數(shù)的前bi位作為對應(yīng)輸入灰度值xi的碼字。香農(nóng)一范諾的編碼程序可由下述幾個步驟來完成:首先統(tǒng)計出每個灰度值出現(xiàn)的概率;對上述概率從大到小排序;從這個概率集合中的某個位置將其分為兩個子集合,并盡量使兩個子集合的概率附近似相等,給前面一個子集合賦值為0,后面一個子集合賦值為1;重復步驟(3),直到各個子集合中只有一個元素為止;將每個元素所屬的子集合的值依次串起來。算術(shù)編碼算術(shù)編碼是80年代開展起來的一種熵編碼方法,這種方法不是將單個信源符號映射成一個碼字,而是把整個信源表示為實數(shù)線上的0到1之間的一個區(qū)間,其長度等于該序列的概率,再在該區(qū)間內(nèi)選擇一個代表性的小數(shù),轉(zhuǎn)化為二進制作為實際的編碼輸出,消息序列中的每個元素都要縮短為一個區(qū)間,消息序列中元素越多,所得到的區(qū)間就越小,當區(qū)間變小時,就需要更多的數(shù)位來表示這個區(qū)間,采用算術(shù)編碼,每個符號的平均編碼長度可以為小數(shù)。算術(shù)編碼根本原理是將被編碼的數(shù)據(jù)序列表示成0~1之間的一個間隔〔也就是一個小數(shù)范圍〕,該間隔的位置與輸入數(shù)據(jù)的概率分布有關(guān)。信息越長,編碼表示它的間隔就越小,因而表示這一間隔所需的二進制位數(shù)就越多〔由于間隔是用小數(shù)表示的〕。算術(shù)編碼有兩種模式:一種是基于信源概率統(tǒng)計特性的固定編碼模式,另一種是針對未知信源概率模型的自適應(yīng)模式。自適應(yīng)模式中各個符號的概率初始值都相同,它們依據(jù)出現(xiàn)的符號而相應(yīng)地改變。只要編碼器和解碼器都使用相同的初始值和相同的改變值的方法,那么它們的概率模型將保持一致。解碼是編碼的逆過程,根據(jù)編碼時的概率分配表和壓縮后數(shù)據(jù)代碼所在的范圍,確定代碼所對應(yīng)的每一個數(shù)據(jù)符號。上述兩種形式的算術(shù)編碼均可用硬件實現(xiàn),其中自適應(yīng)模式適用于不進行概率統(tǒng)計的場合。有關(guān)實驗數(shù)據(jù)說明,在未知信源概率分布的情況下,算術(shù)編碼的實現(xiàn)方法要比哈夫曼編碼復雜一些,一般要優(yōu)于Huffman編碼。在JPEG擴展系統(tǒng)中,就用算術(shù)編碼取代了哈夫曼編碼。行程編碼行程編碼根本方法行程編碼又稱行程長度編碼〔RunLengthEncoding,RLE〕,是一種熵編碼,也是最簡單的壓縮圖像的方法之一。行程編碼原理是在給定的圖像數(shù)據(jù)中尋找連續(xù)重復的數(shù)值,然后用兩個字符值取代這些連續(xù)值。即將具有相同值的連續(xù)串用其串長和一個代表值來代替,該連續(xù)串就稱為行程,串長稱為行程長度。其主要思路是將一個相同值的連續(xù)串用一個代表值和串長來代替。例如有一個字符串“aaabccddddd〞,經(jīng)過行程編碼后可以用“3a1b2c5d〞來表示。對圖像編碼來說,可以定義沿特定方向上具有相同灰度值的相鄰像素為一輪,其延續(xù)長度稱之為延續(xù)的行程,簡稱為行程或游程。例如,假設(shè)沿水平方向有一串M個像素具有相同的灰度N,那么行程編碼后,只傳遞兩個值〔N,M〕就可以代替M個像素的M個灰度值N。行程編碼分為定長行程編碼和變長行程編碼兩種。定長行程編碼是指編碼的行程所使用的二進制位數(shù)固定,如果灰度連續(xù)相等的個數(shù)超過了固定二進制位數(shù)所能表示的最大值,那么進行下一輪行程編碼。變長行程編碼是指對不同范圍的行程使用不同位數(shù)的二進制位數(shù)進行編碼,需要增加標志位來說明所使用的二進制位數(shù)。行程編碼一般不直接應(yīng)用于多灰度圖像,但比擬適合于二值圖像的編碼。為了到達較好的壓縮效果,有時行程編碼和其他一些編碼方法混合使用。例如,在JPEG中,行程編碼和DCT及哈夫曼方法一起使用,先對圖像分塊處理,然后對分塊進行DCT,量化后的頻域圖像數(shù)據(jù)作Z形掃描,然后作行程編碼,對行程編碼的結(jié)果再進行哈夫曼編碼。行程編碼對傳輸過失很敏感,一位符號出錯就會改變行程編碼的長度,從而使整個圖像出現(xiàn)偏移,因此一般要用行同步、列同步的方法把過失控制在一行一列之內(nèi)。PCX的RLE壓縮算法PCX格式的圖像文件是采用行程壓縮方法處理數(shù)據(jù)的。壓縮原理如下:只要在圖像數(shù)據(jù)中發(fā)現(xiàn)一串連續(xù)相同的值,就用兩個字節(jié)代替這串連續(xù)相同的值,存入圖像文件中。這兩個字節(jié)中的第一個字節(jié)代表這串相同數(shù)據(jù)的個數(shù),第二字節(jié)代表這串數(shù)據(jù)的值。對于不重復的數(shù)據(jù)那么單獨處理。BMP的RLE4壓縮算法利用RLE4壓縮算法處理16色位圖數(shù)據(jù)時,與一般的行程編碼算法根本相同。不同點是RLE4壓縮算法在第1字節(jié)中所表示的連續(xù)重復數(shù)據(jù)的個數(shù)是像素個數(shù)而不是一般RLE中所定義的字節(jié)個數(shù),在RLE4壓縮算法中,每個字節(jié)包含兩個像素的顏色值。RLE4壓縮算法與一般RLE壓縮算法不同點還表現(xiàn)在:它是針對16色圖像數(shù)據(jù)的處理,引進了4組特殊的識別碼:0X000X00:表示該行圖像數(shù)據(jù)己經(jīng)結(jié)束0X000X01:表示整個圖像數(shù)據(jù)結(jié)束。0X000X02:用于轉(zhuǎn)義后面兩個字節(jié)0X00N〔0X03≤N≤0XFF〕:表示從當前位置起,圖像數(shù)據(jù)存在連續(xù)N個不同的值。線性預(yù)測編碼預(yù)測編碼是建立在信號〔語音、圖像等〕數(shù)據(jù)的相關(guān)性之上,根據(jù)某一模型利用以往的樣本值對新樣本進行預(yù)測,減少數(shù)據(jù)在時間和空間上的相關(guān)性,以到達壓縮數(shù)據(jù)的目的。但實際利用預(yù)測器時,并不是利用數(shù)據(jù)源的某種確定型數(shù)學模型,而是基于估計理論、現(xiàn)代統(tǒng)計學理論設(shè)計預(yù)測器。預(yù)測方法有多種,其中差分脈沖編碼調(diào)制〔DifferentialPulseCodeModulation〕,簡稱DPCM,是一種具有代表性的編碼方法。預(yù)測編碼的根本思想是通過僅提取每個像素中的新信息并對它們編碼來消除像素間的冗余,這里一個像素的新信息定義為該像素的當前或現(xiàn)實值與預(yù)測值的差,即如果圖像一個像素離散幅度的真實值,利用其相鄰像素的相關(guān)性,預(yù)測它的下一個像素〔水平方向或垂直方向〕的可能數(shù)值,再求其兩者差,或者說利用這種具有預(yù)測性質(zhì)的差值,再量化、編碼、傳輸,其效果更佳,這一方法就稱為DPCM法。因此在預(yù)測法編碼中,編碼和傳輸?shù)牟⒉皇窍袼厝又当旧?,而是這個取樣值的預(yù)測值〔也稱估計值〕與其實際值之間的差值。自適應(yīng)預(yù)測編碼方法:線性預(yù)測編碼的根底是假設(shè)圖像全域為平穩(wěn)的隨機過程,自相關(guān)系數(shù)與像素在域中的位置無關(guān)。實際上,圖像的起伏始終是存在的,被描述像素和周圍像素之間,各有多種多樣的關(guān)系。線性預(yù)測系數(shù)a1是—種近似條件下的常數(shù),忽略了像素的個性,存在以下缺點,影響圖像質(zhì)量:對灰度有突變的地方,會有較大的預(yù)測誤差,致使重建圖像的邊緣模糊,分辨率降低。對灰度變化緩慢區(qū)域,其差值信號應(yīng)為零,但因其預(yù)測值偏大而使重構(gòu)圖像有顆粒噪聲。為了改善圖像質(zhì)量,克服上述預(yù)測編碼帶來的缺點,非線性預(yù)測充分考慮了圖像的統(tǒng)計特性和個別變化,預(yù)測器的預(yù)測系數(shù)不固定,隨圖像的局部特性而有所變化。盡量使預(yù)測系數(shù)與圖像所處的局部特性相匹配,即預(yù)測系數(shù)隨預(yù)測環(huán)境而變,從而得到較為理想的輸出,故稱為自適應(yīng)預(yù)測編碼。變換編碼變換編碼的根本概念就是將原來在空間域上描述的圖像等信號,通過一種數(shù)學變換〔常用二維正交變換如傅立葉變換、離散余弦變換、沃爾什變換等〕,變換到變換域中進行描述,到達改變能量分布的目的,即將圖像能量在空間域的分散分布變?yōu)樵谧儞Q域的能量的相對集中分布,到達去除相關(guān)的目的,再經(jīng)過適當?shù)姆绞搅炕幋a,進一步壓縮圖像。信息論的研究說明,正交變換不改變信源的熵值,變換前后圖像的信息量并無損失,完全可以通過反變換得到原來的圖像值。但是,統(tǒng)計分析說明,圖像經(jīng)過正交變換后,把原來分散在原空間的圖像數(shù)據(jù)在新的坐標空間中得到集中,對于大多數(shù)圖像,大量的變換系數(shù)很小,只要刪除接近于0的系數(shù),并且對較小的系數(shù)進行粗量化,而保存包含圖像主要信息的系數(shù),以此進行壓縮編碼。矢量量化編碼利用相鄰圖像數(shù)據(jù)間的高度相關(guān)性,將輸入圖像數(shù)據(jù)序列分組,每一組M個數(shù)據(jù)構(gòu)成M維矢量,一起進行編碼,即一次量化多個點。矢量量化編碼屬于有損壓縮編碼,它的缺點是復雜度隨矢量維數(shù)呈指數(shù)增加,數(shù)據(jù)量和計算量都很大。現(xiàn)代圖像編碼方法經(jīng)典的圖像處理方法從信息理論出發(fā),只依據(jù)圖像本身固有的統(tǒng)計特性和視覺系統(tǒng)的某些特性進行壓縮編碼,這是不充分的?,F(xiàn)代圖像編碼方法突破了Shanno傳統(tǒng)信息理論的框架,注重對視覺感知特性的應(yīng)用,通過新算法,在主觀視覺感知沒有較大變化地條件下極大地提高了圖像的壓縮比?,F(xiàn)代圖像編碼方法與經(jīng)典方法相比在相同壓縮比的情況下在重構(gòu)圖像的主觀質(zhì)量上有顯著地提高,在重構(gòu)圖像的主觀質(zhì)量不變的情況下壓縮比是經(jīng)典方法的幾倍或幾十倍。子帶編碼(SBC)將圖像信號通過一組帶通濾波器分解成不同頻帶內(nèi)的分量,然后在每一個子帶內(nèi)單獨進行降速采樣和編碼。其優(yōu)點:量化在各子帶內(nèi)單獨進行,量化噪聲被限制在各子帶內(nèi),可以防止能量較小的頻帶內(nèi)信號受其他頻帶內(nèi)量化噪聲的干擾和影響,還可以根據(jù)視覺特性,將有限的比特在各個子帶內(nèi)做合理的分配,即實行噪聲頻譜成型技術(shù),提高了圖像的主觀評價質(zhì)量。模型基圖像編碼利用計算機視覺和計算機圖形學的知識對圖像信號進行分析與合成,分為兩類:語義基圖像編碼、物體基圖像編碼。模型基圖像編碼將圖像信號看作三維世界中的目標和景物投影到二維平面的產(chǎn)物,而對于這一產(chǎn)物的評價是由人類視覺系統(tǒng)的特性決定的。模型基圖像編碼的關(guān)鍵是對特定的圖像建立模型,并根據(jù)這個模型確定圖像中景物的特征參數(shù)。解碼時根據(jù)參數(shù)和己知模型用圖像合成技術(shù)重建圖像。由于編碼的對象是特征參數(shù)而不是原始圖像,因此可以得到較大的壓縮比。其引入的誤差主要是人眼不太敏感的幾何失真。因此重建圖像非常自然逼真。它主要用于低比特率及圖像變化不大的場合,如可視和視頻會議等。分形編碼利用分形幾何的自相似性原理來壓縮圖像。所謂自相似性就是指無論幾何尺寸如何變化,景物中的任何一小局部的形狀都與較大局部的形狀極其相似,在編碼時將信號分解為假設(shè)干分形子圖,提取迭代函數(shù)系統(tǒng)代碼。恢復時由該代碼按規(guī)律迭代重構(gòu)圖像。特點:對于整體與局部存在明顯相似的圖像,此法可取得很高的壓縮比;反之,圖像恢復質(zhì)量不理想。另外,該算法復雜,所需時間較長。小波變換編碼小波變換〔WT:WaveletTransform〕編碼是近年來隨著小波變換理論的研究而提出的一種具有很好開展前景的編碼方法。作為一種多尺度、多分辨率的分析方法,由于小波具有很好的時——頻或空——頻局部特性,特別適合于按照人類視覺系統(tǒng)特性設(shè)計圖像壓縮編碼方案,也非常有利于圖像的分層傳輸。實驗證明,圖像的小波變換編碼,在壓縮比和編碼質(zhì)量方面優(yōu)于傳統(tǒng)的DCT變換編碼。圖像壓縮編碼的國際化標準圖像壓縮編碼的國際標準化背景在圖像通信中,參與通信的各方設(shè)備都必須能夠理解發(fā)送方的“話語〞,即能夠把碼流復原成圖像。但圖像壓縮的方法有多種,像脈沖編碼調(diào)制〔PCM〕、空間和時間二次抽樣編碼、預(yù)測編碼、運動估值和預(yù)測、統(tǒng)計編碼、游程編碼、變換編碼、混合編碼、向量的量化、分形圖像編碼、小波變換編碼、子帶編碼等等。如果發(fā)送方和接收方采用不同的編解碼方法,圖像解壓就根本不可能;即便是雙方采用了相同的編解碼方法,但如果所用的參數(shù)有某些不同,也會導致不能正確解碼和恢復原圖像。例如在離散余弦變換〔DCT〕中,采用8×8的塊與采用16×16的塊進行編解碼是不能互通的。在當今開放的時代,人們希望圖像在經(jīng)過壓縮、存儲或傳輸之后,不管用戶用什么解壓縮流程,只要該流程與壓縮流程遵循同一標準,就能夠解壓縮并恢復原圖像。這就使得天各一方的通信雙方采用不同廠家生產(chǎn)的編解碼產(chǎn)品,也能進行圖像通信。這一點對用戶非常重要,用戶可以根據(jù)自己的要求去挑選不同的產(chǎn)品而不必擔憂它們之間的互通性,從而擺脫對某一廠家的過分依賴。如在會議電視中,這種互通性保證了使用不同的設(shè)備也能正常開會,不會再出現(xiàn)像早期美、日、歐會議電視那樣不能直接互通的情況,而不能互通正是早期會議電視最多只能形成局部會議電視網(wǎng)的原因?;谏鲜鲈颍瑖H上的一些組織如國際標準化組織〔ISO〕、國際電信聯(lián)盟〔ITU〕、國際電子電機工程師委員會〔IEEE〕等一直致力于標準化的工作,并已取得豐碩的成果,如JPEG、MPEG、、等一系列標準化的建議[6]都給廠家和用戶提供了巨大的方便。圖像編碼國際標準化建議的特點及適用方向二值圖像壓縮編碼算法1988年成立的“聯(lián)合二值圖像專家組〞〔JBIG〕提出了一個正式建議〔ISO/IECCD11544〕,作為二值圖像壓縮編碼的標準。其實在JBIG之前就有兩個非常重要的二進制圖像壓縮標準:一個是CCITTG3(G3-REC.T.4),采用了MR(MODIFIEDREAD)技術(shù),這是一種算法結(jié)構(gòu)。這里READ代表RELATIVEELEMENTADDRESSDESIGNATE;另一個是CCITTG4(G4-REC.T.6),采用MMR(MODIFIEDMR)壓縮技術(shù),是G3的簡化版,通過去掉MR中的一些錯誤恢復獲得更好的壓縮。G3和G4對機和黑白文檔的存儲很重要,而JBIG編碼的特點是:其編碼效率高于G3/G4。對于典型的文本和/或線條文件,其壓縮比是G4中的MMR編碼的~倍,同時它可以采用參數(shù)定義的方法,實現(xiàn)二值圖像的“逐漸浮現(xiàn)式〞編碼。這對于通過通信方式從數(shù)據(jù)庫中查詢檔案資料是一種實用效率極高的必要措施。為此,JBIG建議中描述了一種PRES〔PROGESSIVEREDUCTIONSTANDARD〕標準算法,以生成原始圖像的“半分辨率〞圖像。其主觀質(zhì)量明顯優(yōu)于簡單地在水平和垂直方向作亞取樣。而且JBIG建議也可以應(yīng)用于多灰度圖像和彩色圖像的信息保持型壓縮編碼,而其編碼效率并不低于JPEG建議。JPEG此即聯(lián)合圖像專家組〔JPEG〕1992年提出的一種用于連續(xù)色調(diào)靜止圖像壓縮的國際標準。它采用了自適應(yīng)離散余弦變換的方法,方塊大小是8×8,精度限制在每抽樣8比特和12比特,其他精度〔大于12BPP〕可以由選擇適當?shù)谋忍靥畛浠蛄炕壑詠淼玫健PEG希望可識別的圖像到達,優(yōu)質(zhì)圖像到達1BIT/PIXEL〔甚至到達0.75BIT/PIXEL),而和原圖相比看不出差異時大約為4BIT/PIX-EL,這些目標都已經(jīng)到達。目前,該標準已廣泛應(yīng)用于計算機和通信等領(lǐng)域,如電視圖像壓縮、多媒體通信、多媒體計算機等。1990年7月CCITT第15研究組通過了該建議草案,它是世界各國幾十年經(jīng)驗的總結(jié),是使會議電視/可視圖像壓縮編碼技術(shù)走向標準化和實用化的一個里程碑。適用的速率范圍是P×64KBIT/S〔P=1~30〕,即。它在確?;ネㄐ院图嫒菪缘母咨弦砸环N恰當?shù)男问綄Ρ匾膬?nèi)容作了嚴格限制,如規(guī)定了“MC+DPCM+INTER/INTRA+DCT+Q+2D-VLD〞這個大框架及一些編碼傳輸格式。但與此同時,它對那些與兼容性關(guān)系不大,而與圖像質(zhì)量息息相關(guān)的重要局部卻未加嚴格限制,而留有充分的余地供各家根據(jù)各自的應(yīng)用需要進行充實和改良,如:傳輸緩沖存儲器控制策略、量化級自適應(yīng)控制策略、運動檢測方法等等。今天,基于編碼的會議電視在世界上已形成較大范圍的應(yīng)用。MPEGISO為了滿足數(shù)字電視壓縮和CD-ROM等記錄媒體壓縮而制定了該國際標準。僅從二維空間方向的編碼來看,MPEG與JPEG幾乎完全相同,均以DCT作為根本要素。在MPEG中,還以為根底,改良了其中的運動補償,并增加了B幀的雙向時間預(yù)測,這種雙向時間預(yù)測結(jié)構(gòu)在活動圖像編碼中有著極為重要的作用。MPEG標準分為兩個主要方面:MPEG-1和MPEG-2。MPEG-1主要用于CIF格式的圖像分辨率和大約的比特速率,適用于視頻和雙聲道,眾所熟知的VCD就采用了MPEG-1編碼。MPEG-2的預(yù)測結(jié)構(gòu)由MPEG-1的幀結(jié)構(gòu)改為場結(jié)構(gòu),以便適應(yīng)電視圖像的隔行掃描方式,它主要適應(yīng)于CATV、數(shù)字電視、電視點播和數(shù)字視頻播送〔DVB〕系統(tǒng)。MPEG現(xiàn)在正在進行MPEG-4的制定,并于1998年11月定出該標準。該標準是支持通信、存取和處理聲像數(shù)據(jù)的新一代標準。隨著通信趨向無線化,以及要求越來越多的交互式通信,對聲像通信所提出的許多新要求是現(xiàn)有標準無法滿足的。對MPEG-4的期望是應(yīng)具有基于內(nèi)容的存取和處理能力,編碼器能識別圖像中的目標,并跟蹤它的移動;并且MPEG-4要與物理網(wǎng)絡(luò)無關(guān),具有交互性和解碼的可卸載性。MPEG-4將為多媒體通信應(yīng)用和業(yè)務(wù)提供一項通用技術(shù),它將是多行業(yè)的共同標準,并使多媒體通信成為現(xiàn)實。1995年6月ITU-T通過了該標準。是根據(jù)改良而來。針對低比特率視頻編碼,采用了一些較成熟而有效的方法,改善了圖像的質(zhì)量。與一樣,采用了基于運動補償?shù)腄PCM混合編碼方法,同時采用了DCT、二維ZIG-ZAG游程Huffman編碼或基于語法的算術(shù)編碼方法〔中只有Huffman編碼〕,但和并不兼容,原因在于編碼表不一樣。此外比精簡了頭部信息。其針對低碼率的改良在于:改善了運動補償?shù)木龋傻恼袼靥岣叩桨胂袼?,去掉了中的環(huán)濾波器。同時為了進一步改善運動補償?shù)男Ч?,提供?個可選項:無限制的運動矢量模式——為了克服圖像邊緣處運動矢量搜索所受的限制以及某些由于攝像機的抖動所造成的編碼效果的下降〔如FOREMAN序列〕而提供的模式;先進預(yù)測模式——運動補償由的16×16像素宏塊縮小到8×8的像素塊,采用了塊交疊運動補償技術(shù),降低了基于方塊的編碼方法所帶來的方塊效應(yīng);PB幀模式〔PB-FRAMESMODE〕——B幀的雙向預(yù)測技術(shù)在MPEG-2中取得了較好的效果,比方可以消除新背景移出而帶來的前向預(yù)測的錯誤。就參考引入了PB幀模式。以上這些可選項進一步改善了運動補償?shù)男Ч?,保證了低碼率下的圖像質(zhì)量。還提供了算術(shù)編碼的方法來替換二維Huffman游程編碼,在相同碼率下,該選項可進一步提高圖像質(zhì)量。雖說是針對低碼率的視頻編碼,但這些改良方法在更高碼率的情況下也優(yōu)于,所以I-TU-T取消了其原來的“小于64KBIT/S〞的規(guī)定。在ISDN短期內(nèi)無法實現(xiàn)的情況下,是實現(xiàn)話帶傳輸活動圖像的一種很好的方法。目前,基于的圖像解碼板已經(jīng)出現(xiàn),相信基于的應(yīng)用會很快走向廣闊用戶。H.263+它是ITU-T最近新提出的建議。該建議對進行了一些修改,增加了一些新的技術(shù),這些新增的技術(shù)如下:為擴大適用范圍,采用了:——分層圖像表示:考慮到不同的應(yīng)用環(huán)境對圖像質(zhì)量的不同要求,將視頻比特流分到多個邏輯信道中,接收端可以根據(jù)本端的質(zhì)量要求譯碼,可以舍棄增強層的數(shù)據(jù),而且對圖像的重建質(zhì)量不造成不可恢復的損失。這種分層技術(shù)可以分為:時間分層、信噪比分層、空間分層?!艑捔藞D像格式的限制,允許雙方協(xié)商采用專用格式進行通信,只要圖像長度落在〔4,2048〕之間,寬度落在〔4,1152〕之間,且都能被4整除就行。同時圖像序列的時鐘頻率也可以協(xié)商調(diào)整。為增強抗誤碼性能,采用了:——對PB幀模式進行了改良:中的B幀只采用雙向預(yù)測,B幀的譯碼正確與否過分依賴P幀的正確譯碼,這就降低了抗誤碼能力,H.263+中允許B幀可選擇使用雙向預(yù)測或前向預(yù)測,同時B幀的運動矢量獨立進行編碼,這就提高了抗誤碼性能?!制Y(jié)構(gòu):該技術(shù)吸收了MPEG-2建議的分片結(jié)構(gòu)形式,將圖像分為幾個分片,分片之間無重疊,比特流中的分片數(shù)據(jù)相互獨立,這樣某個分片的數(shù)據(jù)壞了之后,不影響其他分片的正確譯碼?!毩⒎侄巫g碼:圖像分段被定義成假設(shè)干個連續(xù)的宏塊組〔使用分片結(jié)構(gòu)時,分段被定義成一個分片〕,分段的數(shù)據(jù)之間沒有任何依賴性,譯碼時壞段的數(shù)據(jù)不干擾其他段的譯碼。為進一步提高壓縮比采用了:——先進的幀內(nèi)編碼模式:H.263+為幀內(nèi)編碼定義了新的編碼方式,包括編碼塊系數(shù)反量化修正和獨立的幀內(nèi)編碼表。反量化的步長并不像那樣固定為8,可以改變,不存在死區(qū)。由于幀內(nèi)編碼的系數(shù)和幀間編碼的系數(shù)的概率分布并不一樣,像中那樣兩種系數(shù)采用同一碼表的做法降低了編碼的效率,H.263+那么采用了不同的碼表,提高了編碼效率?!惶娴膸g變長編碼:當幀間編碼塊的DCT系數(shù)中量化電平大得較多時,采用幀內(nèi)碼表進行編碼后的比特率較小,那么可以采用幀內(nèi)編碼碼表。這種技術(shù)要求譯碼器的處理速度要高,因為它要對系數(shù)進行兩次譯碼,取正確的一個作為解碼系數(shù)?!獏⒖紟x擇:中沒有參考幀的選擇,而H.263+中為了獲得較好的壓縮效率,抑制幀間預(yù)測誤差的擴散,允許編碼器在前幾幀圖像中選擇一個壓縮效率最高的圖像或某個圖像分段來進行運動估值。采用的圖像或分段信息可通過后向通道進行傳輸。但此技術(shù)要擴大幀緩存、提高處理速度來提高壓縮比,抑制幀間預(yù)測誤差的擴散。為改良圖像的重建質(zhì)量和改善編碼控制,采用了:——塊效應(yīng)消除濾波器:中的運動估值和DCT均以塊為單位。這種人為分割圖像造成了方塊邊界的不連續(xù)性,H.263+在塊邊界采用了濾波器來消除方塊效應(yīng)?!档头直媛矢拢涸趫D像有劇烈運動時,編碼的效率將降低,中采用降低編碼幀率來滿足低比特率的要求,但這又造成了更嚴重的動畫效應(yīng)和幀間預(yù)測誤差擴散,使譯碼圖像質(zhì)量急劇降低;而H.263+中采用將編碼圖像的分辨率降低到原圖的1/4,即長寬均減半,這樣編碼比特率就可降下來,譯碼時內(nèi)插到原圖的分辨率,這就防止了幀率的下降及圖像質(zhì)量的急劇下降。——量化修正:H.263+改良了量化修正因子的表示方式,擴大了其可修正范圍,使其比照特率的控制更加靈活;使色差信號的量化步長是亮度信號的一半,提高了圖像色差系數(shù)的量化精度,同時H.263+中還擴大了對系數(shù)量化電平的可表示范圍,即從的2048+2048到現(xiàn)在的4096+4096。以上這些技術(shù)使得H.263+在使用上比更方便,控制上也更靈活,適用范圍也更廣。

第3章壓縮編碼在圖像壓縮中的應(yīng)用研究3.1幾種圖像壓縮編碼的MATLAB實現(xiàn)例如總的來看,圖像壓縮編碼主要分為像素編碼、預(yù)測編碼、變換編碼和其它編碼4類。像素編碼像素編碼是對像素進行單獨編碼,不考慮像素之間的相關(guān)性,如相鄰像素之間的線性。像素編碼主要包括香農(nóng)〔Shannoon〕編碼、哈夫曼〔Huffman〕編碼、游程編碼〔RLC〕等。香農(nóng)編碼和霍夫曼編碼都是根據(jù)像素的概率通過不同的方法進行編碼,游程編碼是通過統(tǒng)計像素的數(shù)目,對每行的像素直接進行編碼。本文以游程編碼為例來介紹像素編碼。游程編碼的編碼原理很簡單,就是將一行中顏色相同的像素值用顏色值和計數(shù)值表示。如在一幅灰度級為256,大小為63353bit的圖像中,第一行中55個連續(xù)像素的灰度值為100,20個連續(xù)像素的灰度值為200,25個相鄰像素的灰度值為255,那么第一行就可以表示成〔100,55〕,〔200,20〕,〔255,25〕。下面利用Matlab對圖3-1中的兩幅圖〔1〕和圖〔2〕進行游程編碼,并且進行比擬[7]。(1)(2)圖3-1游程編碼比擬例如圖對圖3-1〔1〕進行游程編碼后的壓縮比:原始大?。篠ize:256256;Bytes:65536;Class:Unit8陣列;總計為65536元素使用65536個字節(jié)。壓縮圖像大?。篠ize:1111296;Bytes:111296;Class:Unit8陣列;總計為111296元素使用111296個字節(jié)。圖像壓縮比:對圖3-1〔2〕進行游程編碼后的壓縮比:原始大?。篠ize:256256;Bytes:65536;Class:Unit8陣列;總計為65536元素使用65536個字節(jié)。壓縮圖像大?。篠ize:14484;Bytes:4484;Class:Unit8陣列;總計為4484元素使用4484個字節(jié)。圖像壓縮比:我們可以看到對圖3-1〔1〕利用游程壓縮編碼,不但沒有減少傳輸?shù)膱D像數(shù)據(jù),反而增加了。而圖3-1〔2〕通過該編碼方法得到了較大的壓縮比。通過觀察不難發(fā)現(xiàn),當灰度級較少并且相同灰度較多時,通過游程編碼壓縮可以提高傳輸信息的效率。但相鄰像素變化頻率高時,用此方法壓縮反而會增加傳輸數(shù)據(jù)量。通過游程壓縮編碼,可以看到像素壓縮編碼主要是減少編碼冗余到達壓縮的效果。像素編碼方法簡單,無須對圖像做過多的處理,就可以到達壓縮的目的。預(yù)測編碼預(yù)測編碼是一種經(jīng)典的數(shù)據(jù)壓縮編碼方法,常用的預(yù)測編碼是差分脈沖編碼調(diào)制編碼DCPM。DCPM編碼原理就是利用相鄰像素之間的相關(guān)性,對樣本值與預(yù)測值之間的差值進行編碼,即真正用來傳輸?shù)男畔⒌木褪沁@個差值。如圖3-2中的圖〔1〕到〔6〕所示。(1)原灰度圖(2)利用三個相鄰線性預(yù)測后的圖像(3)編碼后的絕對殘差圖像(4)解碼用的殘差圖像(5)使用殘差和線性預(yù)測重建后的圖像(6)解碼重建后圖像的誤差圖3-2利用預(yù)測編碼處理的圖像我們可以從圖3-2中看出編碼的絕對殘差圖像相對于原始圖像的信息量已大大減少,并且重建后的圖像誤差也可以忽略不計。并且重建后的圖像跟原始圖像相比幾乎沒有太大的差異。預(yù)測編碼以它的優(yōu)點,在通信領(lǐng)域的圖像傳輸中發(fā)揮了重要的作用。變換編碼變換編碼首先需要將原始數(shù)據(jù)由空間轉(zhuǎn)換到另一個變換域上,變換不能對原始數(shù)據(jù)進行壓縮,但是變換后的數(shù)據(jù)更有利于壓縮,在總能量不變的情況下,對能量重新分配,并且去除掉相關(guān)性冗余,這樣對信息編碼時無需再考慮相關(guān)性對編碼效率的影響。變換方法有K-L變換、DFT變換、DCT變換、哈爾變換等。圖像進行變換后,接下來要對變換后的系數(shù)量化,在量化后才能對其編碼。其中常用的系數(shù)量化

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論