版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、 第第7章章 圖像的編碼和壓縮圖像的編碼和壓縮 Image Coding and Compressionn 圖像壓縮圖像壓縮(Image Compression)的概念的概念 數(shù)據壓縮的研究內容包括數(shù)據的表示、傳數(shù)據壓縮的研究內容包括數(shù)據的表示、傳輸、變換和編碼方法,目的是減少存儲數(shù)據所輸、變換和編碼方法,目的是減少存儲數(shù)據所需的空間和傳輸所用的時間。需的空間和傳輸所用的時間。 圖像壓縮圖像壓縮就是在一個可以接受的還原狀況就是在一個可以接受的還原狀況的前提下用盡可能少的比特數(shù)來表示源信號,的前提下用盡可能少的比特數(shù)來表示源信號,即把需要存儲或傳輸?shù)膱D像數(shù)據的比特數(shù)減少即把需要存儲或傳輸?shù)膱D像數(shù)
2、據的比特數(shù)減少到最少程度。圖像壓縮是通過到最少程度。圖像壓縮是通過編碼編碼實現(xiàn)的。實現(xiàn)的。 概述概述n 圖像數(shù)據壓縮的必要性圖像數(shù)據壓縮的必要性 圖像數(shù)據的特點之一是信息量大。海量數(shù)據需要巨大圖像數(shù)據的特點之一是信息量大。海量數(shù)據需要巨大的存儲空間。如多媒體中的海量圖像數(shù)據,不進行編碼壓的存儲空間。如多媒體中的海量圖像數(shù)據,不進行編碼壓縮處理,一張縮處理,一張600M字節(jié)的光盤,只能存放字節(jié)的光盤,只能存放20秒左右的秒左右的640 480像素的視頻。沒有編碼壓縮,多媒體信息保存像素的視頻。沒有編碼壓縮,多媒體信息保存有多么困難是可想而知的。有多么困難是可想而知的。 在現(xiàn)代通信中,圖像傳輸已成
3、為重要內容之一。采用在現(xiàn)代通信中,圖像傳輸已成為重要內容之一。采用編碼壓縮技術,減少傳輸數(shù)據量,是提高通信速度的重要編碼壓縮技術,減少傳輸數(shù)據量,是提高通信速度的重要手段??梢?,沒有圖像編碼與壓縮技術的發(fā)展,大容量圖手段。可見,沒有圖像編碼與壓縮技術的發(fā)展,大容量圖像信息的存儲與傳輸是難以實現(xiàn)的,多媒體、信息高速公像信息的存儲與傳輸是難以實現(xiàn)的,多媒體、信息高速公路等新技術在實際中的應用會遇到很大困難。路等新技術在實際中的應用會遇到很大困難。概述概述n 圖像數(shù)據壓縮的可能性圖像數(shù)據壓縮的可能性概述概述 從信息論觀點看,描述圖像信源的數(shù)據由有從信息論觀點看,描述圖像信源的數(shù)據由有用數(shù)據和冗余數(shù)據
4、兩部分組成。用數(shù)據和冗余數(shù)據兩部分組成。duDI信息量信息量數(shù)據量數(shù)據量冗余量冗余量 冗余量是可以壓縮的冗余量是可以壓縮的,在實際應用中應盡量保證去除,在實際應用中應盡量保證去除冗余量而不會減少信息量,即壓縮數(shù)據在一定條件可以近冗余量而不會減少信息量,即壓縮數(shù)據在一定條件可以近似恢復。似恢復。數(shù)據冗余數(shù)據冗余(Data Redundancy)n 編碼冗余編碼冗余(Coding Redundancy)等長編碼等長編碼 平均碼長為平均碼長為3 3變長編碼變長編碼 平均碼長為平均碼長為2.72.7數(shù)據冗余數(shù)據冗余n 像素間冗余像素間冗余(Interpixel Redundancy) 圖像是由按一定規(guī)
5、則排列起來的像素組成,圖像中相圖像是由按一定規(guī)則排列起來的像素組成,圖像中相鄰像素的灰度往往相同或相近,這就稱為像素間冗余或空鄰像素的灰度往往相同或相近,這就稱為像素間冗余或空間冗余。間冗余。數(shù)據冗余數(shù)據冗余n 心理視覺冗余心理視覺冗余(Psychovisual Redundancy) 175K 1.46M 受生理和心理上的影響,人眼對黑白和彩色信息的受生理和心理上的影響,人眼對黑白和彩色信息的分辨率是有限的。光學上不一致的圖像在視覺上可能是分辨率是有限的。光學上不一致的圖像在視覺上可能是一樣。一樣。圖像壓縮系統(tǒng)模型圖像壓縮系統(tǒng)模型信源信源 信源信源編碼器編碼器信道信道編碼器編碼器通信線路通信
6、線路或或存儲介質存儲介質信源信源解碼器解碼器信道信道解碼器解碼器信宿信宿 壓縮的有效性壓縮的有效性編碼的可靠性編碼的可靠性圖像包含大量的數(shù)據,但這些數(shù)據是高度相關的圖像包含大量的數(shù)據,但這些數(shù)據是高度相關的靜止圖像靜止圖像往往含有大量的空間冗余信往往含有大量的空間冗余信息;息;動態(tài)圖像動態(tài)圖像不但含有大量的空間冗不但含有大量的空間冗余信息還含有大量的時間冗余信息。余信息還含有大量的時間冗余信息。目的目的消除各種冗余并在給定畸變下使消除各種冗余并在給定畸變下使用盡量少的比特率表示和重建圖用盡量少的比特率表示和重建圖像,以便更好地傳輸和存儲圖像像,以便更好地傳輸和存儲圖像二值圖像傳真、靜態(tài)圖像傳輸
7、、可視電話、會議電二值圖像傳真、靜態(tài)圖像傳輸、可視電話、會議電視、視、VCD、DVD、常規(guī)數(shù)字電視、高清晰度電視、常規(guī)數(shù)字電視、高清晰度電視、多媒體可視通信、多媒體視頻點播與傳輸?shù)榷嗝襟w可視通信、多媒體視頻點播與傳輸?shù)?應用領域應用領域評價評價準則準則客觀保真度客觀保真度主觀保真度主觀保真度圖像信息圖像信息信息論要素信息論要素(Elements of Information Theory)n 熵熵(Entropy)MkkkPPH12logMkkkPR1根據根據Shannon無干擾信息保持編碼定理,若對原始圖像數(shù)據的信息進無干擾信息保持編碼定理,若對原始圖像數(shù)據的信息進行無失真圖像編碼,壓縮后平
8、均碼長存在一個下限,這個下限是圖像行無失真圖像編碼,壓縮后平均碼長存在一個下限,這個下限是圖像信息熵信息熵H。理論上最佳信息保持編碼的平均碼長可以無限接近圖像信息。理論上最佳信息保持編碼的平均碼長可以無限接近圖像信息熵熵H。但總是大于或等于圖像的熵。但總是大于或等于圖像的熵H。n 平均碼長平均碼長(Average Code Length)平均信息量度,圖像中各灰度級比特數(shù)的統(tǒng)計平均值。平均信息量度,圖像中各灰度級比特數(shù)的統(tǒng)計平均值。M : 灰度級數(shù)Pk : 灰度級Wk出現(xiàn)的概率出現(xiàn)的概率灰度級制代碼的位數(shù))對應的碼字長度(二進灰度級kkkkWPW:n 編碼效率編碼效率Coding Effici
9、encyn 冗余量冗余量Redundancy熵編碼目的:使熵編碼目的:使R盡量減少至盡量減少至H 信息論要素信息論要素(Elements of Information Theory)1)()(xHxRrrxRxH11)()(例題例題設一離散信源如下:設一離散信源如下: 00211WX01412W10813W11814W信源信源概率概率編碼編碼求信源求信源X的熵、平均碼長和編碼效率。的熵、平均碼長和編碼效率。解:解: 412logkkkPPH熵:4781log8181log8141log4121log212222比特比特平均碼長:平均碼長:編碼效率:編碼效率:比特比特28128124122124
10、1kkkPR%5 .8787247RHn 變長最佳編碼定理變長最佳編碼定理 對概率大的消息符號賦予短碼字,而對概率小的信對概率大的消息符號賦予短碼字,而對概率小的信息符號賦予長碼字,則編碼的平均碼長一定最短。息符號賦予長碼字,則編碼的平均碼長一定最短。 如:如: Wm Wn Pm tn tm:長碼 tn:短碼22nmmnmmnntPtPtPtP 02222222222mnmnmnmnmnttPPtPPtPPnmmnmmnntPtPtPtP符合定理的平均碼長符合定理的平均碼長不符合定理的平均碼長不符合定理的平均碼長n 唯一可譯編碼唯一可譯編碼 所編碼字序列能唯一地譯出來。所編碼字序列能唯一地譯出
11、來。單義性、非續(xù)長碼單義性、非續(xù)長碼是是唯一可譯編碼。唯一可譯編碼。單義性代碼單義性代碼:任意一個有限長的碼字序列只能被唯一:任意一個有限長的碼字序列只能被唯一地分割成一個個碼字。地分割成一個個碼字。非續(xù)長代碼非續(xù)長代碼:集合中的碼字不能由其他碼字在后面添:集合中的碼字不能由其他碼字在后面添加碼元構成。加碼元構成。如:如: 信源信源 概率概率 碼碼I 碼碼II 碼碼III 碼碼IV W1 1/2 0 0 0 0 W2 1/4 0 1 10 01 W3 1/8 1 00 110 011 W4 1/8 10 11 111 0111碼碼I:非單義性、續(xù)長碼:非單義性、續(xù)長碼 如如: 00110 W1
12、W2W3W4 W1W1W3W3W1 W1W1W3W3W2碼碼II:非單義性、續(xù)長碼:非單義性、續(xù)長碼 如:如: 010011 W1W2W3W4 W1W2W1W1W4 W1W2W1W3W2W2 W1W2W1W1W2W2碼碼III:單義性、非續(xù)長碼:單義性、非續(xù)長碼 如如: 010110111 W1W2W3W4碼碼IV:單義性、續(xù)長碼:單義性、續(xù)長碼 如如: 0010110111 W1W2W3W4單義非續(xù)長代碼平均碼長最短單義非續(xù)長代碼平均碼長最短單義代碼的充要條件:單義代碼的充要條件:D:代碼中的碼元種類;:代碼中的碼元種類; n:代碼中的碼字個數(shù);:代碼中的碼字個數(shù);ti:第:第i個碼字的碼長
13、;個碼字的碼長;如上例:如上例:11nitiD單義碼:碼單義碼:碼非單義碼:碼非單義碼:碼11615222221222221232222214722222432141332141221141211141ititititiiiiIVIIIIII應用分類應用分類 信息保持型數(shù)據壓縮信息保持型數(shù)據壓縮 無損壓縮無損壓縮壓縮圖像的比特數(shù)和冗余信息,主要用于圖像信息壓縮圖像的比特數(shù)和冗余信息,主要用于圖像信息保存,要求圖像存儲能保持信息并能快速存取圖像保存,要求圖像存儲能保持信息并能快速存取圖像 保真度型數(shù)據壓縮保真度型數(shù)據壓縮傳送的圖像能夠適應通信的通道限制,壓縮圖像過傳送的圖像能夠適應通信的通道限制
14、,壓縮圖像過程中允許丟失一些人感覺不到的信息即允許微量失程中允許丟失一些人感覺不到的信息即允許微量失真,主要用于圖像傳輸、數(shù)字電視和多媒體中。真,主要用于圖像傳輸、數(shù)字電視和多媒體中。 特征保持型數(shù)據壓縮特征保持型數(shù)據壓縮 有損壓縮有損壓縮對于不需要圖像的全部細節(jié)和灰度細節(jié)的圖像,壓對于不需要圖像的全部細節(jié)和灰度細節(jié)的圖像,壓縮過程中可僅保存圖像中的感興趣的特征信息,壓縮過程中可僅保存圖像中的感興趣的特征信息,壓縮其不相干和冗余信息,主要用于計算機的特征識縮其不相干和冗余信息,主要用于計算機的特征識別、分析與控制。別、分析與控制。數(shù)據域分類數(shù)據域分類壓縮技術壓縮技術空間域編碼空間域編碼變換域編
15、碼變換域編碼其他方法其他方法圖像壓縮圖像壓縮編碼技術編碼技術實現(xiàn)實現(xiàn)無損壓縮無損壓縮PCM編碼編碼-脈沖編碼調制脈沖編碼調制對連續(xù)圖像信號的空間進行采樣、幅值量化并用適當碼對連續(xù)圖像信號的空間進行采樣、幅值量化并用適當碼字將其量化編碼。編碼方法有字將其量化編碼。編碼方法有等長等長和和變長編碼變長編碼兩種。兩種。DPCM編碼編碼-差分脈沖編碼調制差分脈沖編碼調制空間域中最成熟也是最通用的編碼技術。其結構和語音空間域中最成熟也是最通用的編碼技術。其結構和語音信號中使用的線性預測編碼完全相同。與信號中使用的線性預測編碼完全相同。與 PCM 不同的是不同的是它編碼的是圖像像素值和其預測值的差分它編碼的
16、是圖像像素值和其預測值的差分。該編碼系統(tǒng)。該編碼系統(tǒng)會引起斜率過載、顆粒噪聲和輪廓噪聲。會引起斜率過載、顆粒噪聲和輪廓噪聲。將模擬圖像信號變?yōu)閿?shù)字圖像信號的基本手段將模擬圖像信號變?yōu)閿?shù)字圖像信號的基本手段預測編碼預測編碼 Huffman編碼是編碼是1952年由年由Huffman提出的一種編碼提出的一種編碼方法。這種編碼方法是根據信源數(shù)據符號發(fā)生的概率進行方法。這種編碼方法是根據信源數(shù)據符號發(fā)生的概率進行編碼的。編碼的。哈夫曼編碼哈夫曼編碼(Huffman Coding)思想:思想: 在信源數(shù)據中出現(xiàn)概率越大的符號,編碼以后相應的在信源數(shù)據中出現(xiàn)概率越大的符號,編碼以后相應的碼長越短;出現(xiàn)概率越
17、小的符號,其碼長越長,從而達到碼長越短;出現(xiàn)概率越小的符號,其碼長越長,從而達到用盡可能少的碼符表示信源數(shù)據。它在無損變長編碼方法用盡可能少的碼符表示信源數(shù)據。它在無損變長編碼方法中是最佳的。中是最佳的。 把輸入符號按出現(xiàn)的概率從大到小排列起來把輸入符號按出現(xiàn)的概率從大到小排列起來,接著把概接著把概 率最小的兩個符號的概率求和率最小的兩個符號的概率求和; 把它(概率之和)同其余符號概率由大到小排序把它(概率之和)同其余符號概率由大到小排序,然后然后把兩個最小概率求和把兩個最小概率求和; 重復重復2,直到最后只剩下兩個概率為止。直到最后只剩下兩個概率為止。在上述工作完畢之后,從最后兩個概率開始逐
18、步向前進行編碼。對于在上述工作完畢之后,從最后兩個概率開始逐步向前進行編碼。對于概率大的消息賦予概率大的消息賦予0,小的賦予,小的賦予1。在反向進行的過程中,若概率不。在反向進行的過程中,若概率不變,保留原碼字;若概率分裂為兩個,前幾位保留原碼字,最后一位變,保留原碼字;若概率分裂為兩個,前幾位保留原碼字,最后一位一個賦一個賦“0”,另一個賦,另一個賦“1”碼。碼。 編碼方法編碼方法:符號集符號集x1x2x3x4x5x6概率分布概率分布0.400.200.120.110.090.08Huffman編碼編碼符號集符號集經排序的經排序的概率分布概率分布 第一次合第一次合并后排序并后排序第二次合第二
19、次合并后排序并后排序第三次合第三次合并后排序并后排序第四次合第四次合并后排序并后排序第五次合第五次合并后排序并后排序x10.400.400.400.400.601x20.200.200.230.370.40 x30.120.170.200.23x40.110.120.17x50.090.11x60.08符號集符號集經排序經排序的概率的概率分布分布 第一次第一次合并后合并后排序排序第二次第二次合并后合并后排序排序第三次第三次合并后合并后排序排序第四次第四次合并后合并后排序排序第五次第五次合并后合并后排序排序x10.400.400.400.400.601x20.200.200.230.370.40
20、 x30.120.170.200.23x40.110.120.17x50.090.11x60.0801100010100000111100000000101001101001100100011符號集符號集x1x2x3x4x5x6概率分布概率分布0.400.200.120.110.090.08Huffman編碼編碼100001001100100011 用二叉樹方法實現(xiàn)用二叉樹方法實現(xiàn)Huffman編碼方法也較為便利。編碼方法也較為便利。 計算該信源的熵、編碼后的平均碼長,并思考對計算該信源的熵、編碼后的平均碼長,并思考對于同一圖像采用于同一圖像采用Huffman編碼,編碼是否唯一?編碼,編碼是否
21、唯一?0.230.4 x10.6 0.11 x4 1 0 1 00.37 0.20 x2 0.08 x60 .09 x50.17 1 0 1 0 1 00.12 x3行程編碼行程編碼RLE(Run-length Encoding)思想:思想: 有些圖像具有許多顏色相同的圖塊,在這些圖塊中,許多連續(xù)的有些圖像具有許多顏色相同的圖塊,在這些圖塊中,許多連續(xù)的掃描行都具有同一顏色,或者同一掃描行上有許多連續(xù)的像素都具有掃描行都具有同一顏色,或者同一掃描行上有許多連續(xù)的像素都具有相同的顏色值。這種情況下就可以不需要存儲每一個像素的顏色值,相同的顏色值。這種情況下就可以不需要存儲每一個像素的顏色值,而僅
22、僅存儲一個像素值以及具有相同顏色的像素數(shù)目。而僅僅存儲一個像素值以及具有相同顏色的像素數(shù)目?;驹恚夯驹恚?用一個符號值和串長代替具有相同值的連續(xù)符號(連續(xù)符號構成用一個符號值和串長代替具有相同值的連續(xù)符號(連續(xù)符號構成了一段連續(xù)的了一段連續(xù)的“行程行程”。行程編碼因此得名),使符號長度少于原始。行程編碼因此得名),使符號長度少于原始數(shù)據長度。數(shù)據長度。 不足:不足: 如果圖像中每兩個相鄰點的顏色都不相同,用行程編碼不但不能如果圖像中每兩個相鄰點的顏色都不相同,用行程編碼不但不能壓縮,反而數(shù)據量增加一倍。壓縮,反而數(shù)據量增加一倍。 對圖象進行行掃描時,行內各像素的對圖象進行行掃描時,行內
23、各像素的灰度級可組成一個整數(shù)序列灰度級可組成一個整數(shù)序列x x1 1, , x x2 2, , , , x xN N 。在行程編碼中,可。在行程編碼中,可將這個序列映射成將這個序列映射成整數(shù)對整數(shù)對( (gk, , lk) ),其中,其中gk表示灰度級,表示灰度級, lk表表示行程長度,等于具有相同灰度級的相鄰示行程長度,等于具有相同灰度級的相鄰像素的數(shù)目。像素的數(shù)目。 一維行程編碼只考慮消除每行內像素一維行程編碼只考慮消除每行內像素(或水平分解元素)的相關性,未考慮行間(或水平分解元素)的相關性,未考慮行間像素(垂直分解元素)的相關性。二維行程像素(垂直分解元素)的相關性。二維行程編碼考慮兩
24、個方向分解元素之間的相關性。編碼考慮兩個方向分解元素之間的相關性。(1 1)預測微分量化編碼()預測微分量化編碼(PDQPDQ) 分解元素陣列分解元素陣列整數(shù)對(整數(shù)對(1 1, ,2 2)序列)序列1 1相繼行行程起始點之間的差值相繼行行程起始點之間的差值2 2相繼行行程長度之間的差值相繼行行程長度之間的差值l l2 2- -l l1 1 它們與它們與“新起始新起始”和和“消失消失”標志符一起,用標志符一起,用來表示亮面積的開端和結束;然后對它們進行編碼來表示亮面積的開端和結束;然后對它們進行編碼l2l11新起始新起始消失2= l2-l1 對對1 1和和3 3進行編碼進行編碼 3 3后邊界在
25、相繼行上的差分后邊界在相繼行上的差分 1新起始新起始消失3一般用B碼對PDQ、DDC編碼。 變換本身變換本身 被壓縮圖像的性質被壓縮圖像的性質變換核選擇變換核選擇 有損壓縮有損壓縮-變換域編碼變換域編碼變換圖像編碼變換圖像編碼 圖像變換后圖像變換后刪去刪去那些那些接近于零接近于零的系數(shù),的系數(shù),粗量化粗量化那些那些較小的系數(shù)較小的系數(shù),由此將傳輸和存儲的數(shù)據集中,由此將傳輸和存儲的數(shù)據集中到那些包含圖像主要信息的系數(shù)上。在重構圖像中,重到那些包含圖像主要信息的系數(shù)上。在重構圖像中,重要內容很少會有損失。要內容很少會有損失。圖像圖像正交變換正交變換圖像編碼技術圖像編碼技術應應用用FFTFFT,D
26、STDST,DCTDCT,斜變換,斜變換,哈爾變換,哈爾變換,K-L K-L 變換變換變換域編碼變換域編碼-K-L變換變換K-L變換編碼變換編碼求圖像向量求圖像向量X的的K_L變換,就是求圖像協(xié)方差變換,就是求圖像協(xié)方差矩陣矩陣Cx的特征向量的特征向量 i i,也稱特征向量變換。也稱特征向量變換。圖像像素變換成非相關的系數(shù);變換圖像像素變換成非相關的系數(shù);變換系數(shù)能按方差大小排列;用系數(shù)能按方差大小排列;用M個變換個變換系數(shù)重建圖像可得到最小均方差。系數(shù)重建圖像可得到最小均方差。優(yōu)優(yōu)點點操作操作復雜復雜缺缺陷陷為了減少運算量,通常將一幅圖像分為了減少運算量,通常將一幅圖像分成成若干等尺寸塊若干
27、等尺寸塊,如果圖像是平穩(wěn)的,如果圖像是平穩(wěn)的隨機圖像,該圖像所有子圖像的協(xié)方隨機圖像,該圖像所有子圖像的協(xié)方差矩陣都相同,求得任意一個子圖像差矩陣都相同,求得任意一個子圖像的的K-L變換圖像,然后,可以由該變變換圖像,然后,可以由該變換圖像的前換圖像的前M個元素重建該子圖像。個元素重建該子圖像。 塊編碼塊編碼變換域編碼變換域編碼-余弦變換余弦變換原圖像原圖像FDCTFDCT量化器量化器編碼器編碼器壓壓縮縮圖圖像像數(shù)數(shù)據據解碼器解碼器解量化器解量化器IDCTIDCT重建圖像重建圖像編碼過程編碼過程解碼過程解碼過程DCT編碼編碼DCT來進行塊變換編碼,舍去高頻的系數(shù),來進行塊變換編碼,舍去高頻的系
28、數(shù),對余下的系數(shù)進行量化以進一步減少數(shù)據量。對余下的系數(shù)進行量化以進一步減少數(shù)據量。最后,使用最后,使用RLE和和Huffman 編碼來完成壓縮。編碼來完成壓縮。JPEGJPEG算法算法圖像圖像DCTDCT變換后,大多數(shù)的變換后,大多數(shù)的DCTDCT系系數(shù)值非常接近數(shù)值非常接近0 0,舍棄這些系數(shù),舍棄這些系數(shù)對重構圖像質量影響不大。對重構圖像質量影響不大。變換域編碼性能比較變換域編碼性能比較圖像大小圖像大小子圖像太小,各變換誤差較大;子圖像太小,各變換誤差較大;子圖像尺寸子圖像尺寸16 16,誤差變小;,誤差變??;誤差最小是誤差最小是 K-L變換變換,最差的,最差的是是哈爾變換哈爾變換;傅立
29、葉變換隨子;傅立葉變換隨子圖像的尺寸變大,其性能變得圖像的尺寸變大,其性能變得越好。越好。重構誤差與子圖像尺寸比較重構誤差與子圖像尺寸比較有損壓縮有損壓縮-矢量量化編碼矢量量化編碼編碼器編碼器在量化時用碼書中的一組碼字代替一在量化時用碼書中的一組碼字代替一組輸入矢量,根據一定的失真測度在組輸入矢量,根據一定的失真測度在碼書中搜索出與輸入矢量失真最小的碼書中搜索出與輸入矢量失真最小的碼字的索引。在傳輸時僅傳輸這些索碼字的索引。在傳輸時僅傳輸這些索引,接收方根據碼字索引在碼書中查引,接收方根據碼字索引在碼書中查找對應碼字,從而再現(xiàn)矢量。找對應碼字,從而再現(xiàn)矢量。解碼器解碼器 訓練碼書訓練碼書 :碼
30、書設計是關鍵碼書設計是關鍵。用。用M個訓練個訓練矢量生成含矢量生成含NM個碼字的碼書,既把個碼字的碼書,既把M個訓練個訓練矢量分成矢量分成N類最佳分類,將各類中心矢量作為碼類最佳分類,將各類中心矢量作為碼書的碼字。常用的有效方法是書的碼字。常用的有效方法是LBG算法算法。 編碼編碼:完成碼字的搜索過程。對于給定的完成碼字的搜索過程。對于給定的輸入矢量在碼書中查找與其失真最小的碼字。輸入矢量在碼書中查找與其失真最小的碼字。 解碼解碼:進行碼書索引分配。進行碼書索引分配。矢量量化過程矢量量化過程圖像壓縮中的矢量量化n標量量化:標量量化:把每個像素的顏色用一個把每個像素的顏色用一個0 0到到2552
31、55之間的整數(shù)值之間的整數(shù)值表示。表示。n矢量量化:矢量量化:把幾個像素組成的像素塊,用一個特定碼書中把幾個像素組成的像素塊,用一個特定碼書中的碼字來表示,碼書中碼字的數(shù)目,一般遠小于這些像素的碼字來表示,碼書中碼字的數(shù)目,一般遠小于這些像素塊所有可能顏色的組合。塊所有可能顏色的組合。n在圖像壓縮中的矢量量化:在圖像壓縮中的矢量量化:原圖像原圖像將圖像分割成將圖像分割成nxn的方塊的方塊(矢量)(矢量)對每個方塊矢量,對每個方塊矢量,尋找與之最接近的尋找與之最接近的碼矢量,即碼矢量,即d(x, xk)最小最小碼書:碼書:xi i=1,2, , c用用k編碼方塊編碼方塊n如果一個如果一個2x2像
32、素的小塊像素的小塊,每像素有,每像素有8位位表示,則表示,則所有的像素塊的可能取值有:所有的像素塊的可能取值有:232=4G種,可以選種,可以選擇一個擇一個遠遠小于這個數(shù)的數(shù)遠遠小于這個數(shù)的數(shù)n,作為碼書中碼的,作為碼書中碼的個數(shù)個數(shù),然后對圖像中的每個塊(矢量),用一個,然后對圖像中的每個塊(矢量),用一個碼書中的碼來近似,只需用這個碼的編號來編碼碼書中的碼來近似,只需用這個碼的編號來編碼這個圖像矢量即可,因此每一個小塊,最后都只這個圖像矢量即可,因此每一個小塊,最后都只需用需用log2n個位個位來表示,由此達到壓縮的目的。來表示,由此達到壓縮的目的。圖像壓縮中的矢量量化矢量量化編碼示例矢量
33、量化編碼示例原始原始壓縮壓縮 只傳遞碼字下標,編碼效率高只傳遞碼字下標,編碼效率高 同速率下,比標量量化失真小同速率下,比標量量化失真小 同失真情況下,比標量量化所同失真情況下,比標量量化所需傳輸速率高需傳輸速率高優(yōu)點優(yōu)點碼書大小為碼書大小為512,碼字大小為碼字大小為4 4。圖像大小為圖像大小為 256 256,圖像分割成圖像分割成4 4子圖像塊,共子圖像塊,共有有64 64塊。可以計算原圖像塊。可以計算原圖像存儲空間為存儲空間為256 256 8。利用。利用矢量量化壓縮后,需要矢量量化壓縮后,需要64 64 9,既壓縮比為,既壓縮比為14.2。過程過程1個矢量個矢量 4 4 8 bits
34、9 bits小波變換編碼小波變換編碼利用小波分解,去掉圖像利用小波分解,去掉圖像高頻部分而保留低頻部分高頻部分而保留低頻部分壓縮比高,能保持圖壓縮比高,能保持圖像特征基本不變,抗像特征基本不變,抗干擾能力強。干擾能力強。高頻子圖像上高頻子圖像上大部分點數(shù)值大部分點數(shù)值接近零接近零第第一一次次壓壓縮縮第第二二次次壓壓縮縮圖像作小波分圖像作小波分解后,得到一解后,得到一系列不同分辨系列不同分辨率 的 子 圖 像率 的 子 圖 像高頻高頻低低頻頻原圖原圖新發(fā)展的編碼技術新發(fā)展的編碼技術用一個或幾個公式表示一個紋理用一個或幾個公式表示一個紋理或形狀圖像。一個分形是一個幾或形狀圖像。一個分形是一個幾何形
35、狀,其不規(guī)則形狀可用不同何形狀,其不規(guī)則形狀可用不同的尺度和角度重復出現(xiàn)的尺度和角度重復出現(xiàn)分形分形分形圖像生成即根據給定的公分形圖像生成即根據給定的公式產生一幅圖像的逆過程。尋式產生一幅圖像的逆過程。尋求求一幅圖像的一組分形一幅圖像的一組分形,該組,該組分形能夠重構原整幅圖像。分形能夠重構原整幅圖像。僅需存儲少量的數(shù)據,壓縮比高僅需存儲少量的數(shù)據,壓縮比高分形變換編碼分形變換編碼優(yōu)點優(yōu)點 訓練完成,其計算過訓練完成,其計算過程簡單程簡單 壓縮以學習完成,能壓縮以學習完成,能提高編碼壓縮比提高編碼壓縮比 對信號統(tǒng)計特征無要對信號統(tǒng)計特征無要求,適合于任何圖像的求,適合于任何圖像的壓縮,壓縮比和
36、信噪比壓縮,壓縮比和信噪比可預先設置可預先設置優(yōu)點優(yōu)點神經網絡編碼神經網絡編碼Hopfield網網: 將圖像作為輸入矢量,二進制代碼將圖像作為輸入矢量,二進制代碼為輸出的最優(yōu)化求解問題。為輸出的最優(yōu)化求解問題。前向網絡法前向網絡法-BP網網:用前向網絡表示廣義變換,再:用前向網絡表示廣義變換,再用適當?shù)膶W習算法學習訓練,完成圖像壓縮。用適當?shù)膶W習算法學習訓練,完成圖像壓縮??陀^保真度評價準則客觀保真度評價準則以輸入圖像和重建圖像之間數(shù)據的誤差為基礎,導出各種以輸入圖像和重建圖像之間數(shù)據的誤差為基礎,導出各種失真測度,如均方差、均方根誤差或均方信噪比的各種保失真測度,如均方差、均方根誤差或均方信
37、噪比的各種保真度準則。保真度準則可作為檢驗圖像系統(tǒng)的一種量度。真度準則。保真度準則可作為檢驗圖像系統(tǒng)的一種量度。平方誤差測度平方誤差測度最常見失真測度最常見失真測度信噪比信噪比均方誤差均方誤差 kiiixxXXD12)(),( 51205120251205120210)(log10ijijijijijxxxSNR512512)(512051202 ijijijxxMSE原始圖像原始圖像重建圖像重建圖像主觀保真度評價準則主觀保真度評價準則圖像質量的優(yōu)劣既與圖像的客觀保真度圖像質量的優(yōu)劣既與圖像的客觀保真度有關,又與人的視覺生理特征有關。有關,又與人的視覺生理特征有關。 評優(yōu)尺度評優(yōu)尺度 評劣尺度
38、評劣尺度 相對評價尺度相對評價尺度電視電影協(xié)會對電視電影協(xié)會對重建圖像評價重建圖像評價主觀評價常受到圖像的內容、類型主觀評價常受到圖像的內容、類型復雜程度、測試環(huán)境等因素的影響復雜程度、測試環(huán)境等因素的影響測試條件及環(huán)境選擇測試條件及環(huán)境選擇電視屏的亮度和最高亮度,背景亮度、室內照度、電視屏的亮度和最高亮度,背景亮度、室內照度、圖像對比度、觀看距離、屏幕寬度圖像對比度、觀看距離、屏幕寬度壓縮標準壓縮標準 1990年年12月通過的有關圖像(視頻)壓縮編碼的第一個國際月通過的有關圖像(視頻)壓縮編碼的第一個國際標準化建議,其中文名稱為標準化建議,其中文名稱為“p 64kbit/s聲像服務用的視頻編
39、聲像服務用的視頻編解碼器解碼器”。H261主要對象是主要對象是m 64k bit/s 和和n 384kbit/s兩類兩類碼率,可用于可視電話、會議電視,圖像質量要求不高,能在碼率,可用于可視電話、會議電視,圖像質量要求不高,能在ISDN的的p 64kbit/s信道上進行可視電話、會議電視等聲像服務。信道上進行可視電話、會議電視等聲像服務。H261 建議建議JPEG標準標準- Joint Photographic Expert Group1986年成立的聯(lián)合圖片專家組簡稱。年成立的聯(lián)合圖片專家組簡稱。1992年作為靜止圖像壓縮年作為靜止圖像壓縮算法的國際標準正式推出,中文名稱為算法的國際標準正式
40、推出,中文名稱為“連續(xù)色調靜止圖像的連續(xù)色調靜止圖像的數(shù)字壓縮與編碼數(shù)字壓縮與編碼”。它適合于各種不同類型、分辨率要求的彩。它適合于各種不同類型、分辨率要求的彩色和黑白靜止圖像,有多種編碼模式和數(shù)據格式。主要應用于色和黑白靜止圖像,有多種編碼模式和數(shù)據格式。主要應用于彩色傳真、靜止圖像、可視通信、印刷出版、新聞圖片、醫(yī)學彩色傳真、靜止圖像、可視通信、印刷出版、新聞圖片、醫(yī)學和衛(wèi)星圖像的傳輸、檢索和存儲。和衛(wèi)星圖像的傳輸、檢索和存儲。壓縮標準壓縮標準MPEG-1標準標準- Moving Picture Expert Group活動圖像專家組簡稱?;顒訄D像專家組簡稱。1993年正式通過為國際標準,
41、中文名稱年正式通過為國際標準,中文名稱為為“用于數(shù)字存儲媒體碼率約為用于數(shù)字存儲媒體碼率約為1.5M bit/s活動圖像及其伴音的活動圖像及其伴音的編碼編碼”。它包括系統(tǒng)、視頻、音頻以及測試和軟件實現(xiàn)等;主。它包括系統(tǒng)、視頻、音頻以及測試和軟件實現(xiàn)等;主要面向數(shù)字存儲媒體,應用于多媒體計算機要面向數(shù)字存儲媒體,應用于多媒體計算機MPC、教育與訓練、教育與訓練、演示與咨詢、創(chuàng)作與娛樂、電子出版物、數(shù)字視聽系統(tǒng)、交互演示與咨詢、創(chuàng)作與娛樂、電子出版物、數(shù)字視聽系統(tǒng)、交互式電視等領域。式電視等領域。MPEG-1技術比技術比H261有重大改進發(fā)展。有重大改進發(fā)展。MPEG-2標準標準1993年年11月
42、正式推出月正式推出,中文名稱為中文名稱為“活動圖像及其伴音信息的活動圖像及其伴音信息的通用編碼通用編碼”。它包括系統(tǒng)、視頻、音頻以及測試和軟件實現(xiàn)等。它包括系統(tǒng)、視頻、音頻以及測試和軟件實現(xiàn)等,與與MPEG-1后向兼容;其視頻編碼部分碼率為后向兼容;其視頻編碼部分碼率為410M bit/s,圖像,圖像質量接近演播室質量;技術比質量接近演播室質量;技術比MPEG-1和和H261有重大改進和發(fā)有重大改進和發(fā)展,成為一種從多媒體計算機到家用數(shù)字音像電子產品展,成為一種從多媒體計算機到家用數(shù)字音像電子產品,從寬從寬帶數(shù)字通信到視頻廣播及帶數(shù)字通信到視頻廣播及HDTV的通用共性關鍵技術。的通用共性關鍵技
43、術。壓縮標準壓縮標準MPEG-4 交互式的多媒體交互式的多媒體內容交互性;多媒體數(shù)據訪問;碼流操作和編輯;內容交互性;多媒體數(shù)據訪問;碼流操作和編輯; 高效壓縮算法;高效壓縮算法; 自然的與合成的圖像編碼及其混合編碼;自然的與合成的圖像編碼及其混合編碼; 通用的可接性。通用的可接性。特點特點MPEG-7 多媒體信息內容的描述接口多媒體信息內容的描述接口數(shù)字化圖書館(圖像庫、音樂字典等)數(shù)字化圖書館(圖像庫、音樂字典等)多媒體目錄服務多媒體目錄服務廣播式媒體選擇(廣播和電視頻道選擇)廣播式媒體選擇(廣播和電視頻道選擇)多媒體編輯(電子新聞)多媒體編輯(電子新聞)壓縮標準壓縮標準JBIG標準標準
44、Joint Bi-level Image Group聯(lián)合二值化圖像專家組簡稱。聯(lián)合二值化圖像專家組簡稱。1991年年9月推出,用于二值月推出,用于二值圖像壓縮編碼,是一種傳真圖像壓縮新標準。圖像壓縮編碼,是一種傳真圖像壓縮新標準。 無失真編碼,編碼效率高,能自適應圖像特征;無失真編碼,編碼效率高,能自適應圖像特征;適用于圖像數(shù)據庫的瀏覽;適用于圖像數(shù)據庫的瀏覽; 灰度和彩色圖像的信息保持型編碼。效率不低于灰度和彩色圖像的信息保持型編碼。效率不低于 JPEG 的無失真模式。的無失真模式。特點特點壓縮標準壓縮標準評價圖像壓縮技術評價圖像壓縮技術壓縮比(比特率)壓縮比(比特率)壓縮時間壓縮時間壓縮質
45、量(保真度)壓縮質量(保真度)TIFFGIFBMPJPEGGIF圖像文件格式圖像文件格式1987年,年,CompuServe 公司為方便網絡以及公司為方便網絡以及BBS用戶傳送圖像數(shù)據而設計的文件格式用戶傳送圖像數(shù)據而設計的文件格式 - Graphics Interchange Format特點特點文字疊加功能;文字疊加功能; 改進的改進的LZW壓縮算法處理圖像數(shù)據;壓縮算法處理圖像數(shù)據; 一個文件同時存儲多幅圖像;一個文件同時存儲多幅圖像; 支持交錯圖像生成,適合于圖像傳輸類應用;支持交錯圖像生成,適合于圖像傳輸類應用; 為圖像傳輸格式設計,使用順序文件組織方式。為圖像傳輸格式設計,使用順序
46、文件組織方式。GIF圖像文件結構圖像文件結構文件標識塊文件標識塊邏輯屏幕描述塊邏輯屏幕描述塊可選擇的調色板數(shù)據塊可選擇的調色板數(shù)據塊圖像數(shù)據塊圖像數(shù)據塊結束碼的尾塊結束碼的尾塊固固定定順順序序五五大大部部分分特殊的特殊的標識碼標識碼或或特征碼特征碼塊塊GIF圖像文件格式圖像文件格式 優(yōu)點優(yōu)點C多幅圖像的保存多幅圖像的保存C 提供足夠的信息,結構性好提供足夠的信息,結構性好C允許差別較大的允許差別較大的I/O設備交換圖像設備交換圖像 缺點缺點I 不提供保存灰度或彩色校正表不提供保存灰度或彩色校正表I 不能保存不能保存CMYK 數(shù)據或數(shù)據或HIS數(shù)據數(shù)據I 只能保存只能保存256種種24位彩色位彩
47、色TIFF圖像文件格式圖像文件格式1986年,年,Aldus 公司設計的一種通用的位映公司設計的一種通用的位映射圖像文件格式射圖像文件格式 - Tagged Image File Format特點特點 一個文件中保存多幅圖像;一個文件中保存多幅圖像; 支持任何尺寸的圖像;支持任何尺寸的圖像; 支持多種壓縮方法,靈活性好,適應范圍廣;支持多種壓縮方法,靈活性好,適應范圍廣; 為圖像存儲格式設計,使用隨機組織方式;為圖像存儲格式設計,使用隨機組織方式; 獨立于計算機結構,操作系統(tǒng)和圖形硬件。獨立于計算機結構,操作系統(tǒng)和圖形硬件。TIFF文件結構文件結構 文件頭文件頭 - 圖像文件頭圖像文件頭IFH
48、,8個字節(jié)組個字節(jié)組成,必須位于和成,必須位于和0相對的固定位置;相對的固定位置; 標識信息區(qū)標識信息區(qū) - 圖像文件目錄圖像文件目錄IFD,每一,每一組都由固定長度組都由固定長度12字節(jié)的標記指針組成,字節(jié)的標記指針組成,指向指向IFD目錄的信息指針;目錄的信息指針; 圖像數(shù)據區(qū)圖像數(shù)據區(qū) - 存放圖像數(shù)據的部分,存放圖像數(shù)據的部分,并指示并指示TIFF圖像文件的壓縮與保存、數(shù)據圖像文件的壓縮與保存、數(shù)據的排列方式以及圖像分割的方法等信息。的排列方式以及圖像分割的方法等信息。TIFF圖像文件格式圖像文件格式 優(yōu)點優(yōu)點C 適用范圍廣;適用范圍廣;C 獨立于計算機結構,操作系統(tǒng)和圖形硬件;獨立于計算機結構,操作系統(tǒng)和圖形硬件;C 能保存黑白、灰度及彩色圖像;能保存黑白、灰度及彩色圖像;C 用作進行數(shù)據交換的位圖格式。用作進行數(shù)據交換的位圖格式。 缺點缺點I TIFF的任選項及變種帶來解碼困難;的任選項及變種帶來解碼困難;I TIFF文件格式可定義而變得文件格式可定義而變得“模糊模糊”BMP圖像文件格式圖像文件格式微軟公司為微軟公司為Windows環(huán)境設置的標準圖像格環(huán)境設置的標準圖像格式,而且式,而且Windows系統(tǒng)軟件中內含了一系列系統(tǒng)軟件中內含了一系列支持支持BMP
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- GB/T 34912-2024工業(yè)鍋爐系統(tǒng)節(jié)能設計指南
- 果園經營權轉讓合同模板
- 個人與公司間借款協(xié)議書范本2024年
- 婚前財產協(xié)議書公證流程
- 展覽延期協(xié)議書范本
- 自由職業(yè)者合作工作室合伙協(xié)議
- 房屋中介服務協(xié)議書樣式
- 設計合同補充協(xié)議范本
- 瀝青運輸合同模板
- 建筑施工合同補充協(xié)議模板
- 超星爾雅學習通《媒體創(chuàng)意經濟玩轉互聯(lián)網時代》章節(jié)測試答案
- KF思維技術-在合作中解決問題與決策完整課件
- 2023年傳染病防治知識考試試題及答案
- Windows server WEB服務器搭建與應用說課公開課一等獎省優(yōu)質課大賽獲獎課件
- 高考作文寫作句子素材:動漫臺詞(附適用主題與示例)
- 主題班會-同學情教學課件
- 泌尿系統(tǒng)完整結構培訓課件
- (中職)Office 辦公軟件應用W11-3詩詞-實訓任務+評分標準
- 規(guī)培體表腫物切除術
- 履帶吊使用安全技術規(guī)程
- 漢語詞性專題練習(附答案)
評論
0/150
提交評論