版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、數(shù)數(shù) 字字 圖圖 像像 處處 理理第九章第九章 圖像編碼圖像編碼主要內(nèi)容圖像編碼分類圖像編碼的保真度圖像編碼方法簡介PCM編碼統(tǒng)計編碼預測編碼變換編碼圖像編碼方的國際標準 (1)圖像編碼分類圖像信源圖像信源圖像預處理圖像預處理圖像信源圖像信源編碼編碼信道編碼信道編碼調(diào)制調(diào)制信道傳輸信道傳輸解調(diào)解調(diào)信道解碼信道解碼圖像信源圖像信源解碼解碼用戶用戶數(shù)字通信系統(tǒng)圖像編碼對信源進行數(shù)字化壓縮處理 第一代壓縮編碼以去除冗余度為基礎(chǔ),主要根據(jù)傳統(tǒng)的信源編碼方法(八十年代以前): PCM、DPCM、M、亞采樣、DFT、DCT、Walsh-Hadamard變換編碼 第二代壓縮編碼八十年代以后提出,突破傳統(tǒng)信源
2、編碼理論,充分考慮視覺系統(tǒng)生理心理特性和圖像信信號的分解與表述,采用圖像的合成與識別策略: 金字塔編碼、分形、模型基、神經(jīng)網(wǎng)絡(luò)、小波變換 (1)圖像編碼分類 圖像編碼應(yīng)用分類 無損編碼又稱為信息保持編碼。要求解碼過程中能夠無誤差的重建圖像,如在醫(yī)學圖像應(yīng)用中。 有損編碼常被稱為保真度編碼。常用在圖像的輸出為人眼應(yīng)用中,如數(shù)字電視、可視電話等。 特征抽取編碼是另一種有損編碼。常用在圖像的輸出為計算機應(yīng)用中,只需要保留計算機處理的信息特征如圖像識別。 圖像編碼實現(xiàn)方案分類預測編碼變換編碼統(tǒng)計編碼其他 (1)圖像編碼分類(2)圖像編碼的保真度圖象保真度 描述解碼圖象相對于原始圖象的偏離程度 對信息損
3、失的測度主觀保真度準則 主觀測量圖象的質(zhì)量,因人而異,應(yīng)用不方便客觀保真度準則用編碼輸入與解碼輸出的某個確定函數(shù)表示損失的信息量, 便于計算或測量),(),(),(yxfyxfyxe 10102 2),(),( 1MxNyyxfyxfMNe 212rmsee客觀保真度準則點誤差均方誤差均方信噪比均方根誤差 10102 10102),(),( ),( MxNyMxNymsyxfyxfyxfSNR原圖像為 , 經(jīng)壓縮后解壓的圖像為),(yxf),(yxf(2)圖像編碼的保真度 1010),( 1MxNyyxfMNf 10102 10102 ),(),( ),( lg10MxNyMxNyyxfyxf
4、fyxfSNR10102 2max),(),(lg10MxNyyxfyxffMNPSNR歸一化信噪比令峰值信噪比(單位:分貝)主觀保真度準則(2)圖像編碼的保真度(3)圖像編碼方法簡介一、PCM編碼脈沖編碼調(diào)制 (Pulse Coding Modulation, PCM)將模擬信號轉(zhuǎn)換為數(shù)字信號 (產(chǎn)生量化噪聲) 線性PCM編碼均勻量化(一般用等長碼或格雷碼)。 非線性PCM編碼提高小信號在量化過程中的信噪比,采用非線性壓擴。輸入采樣壓縮/擴張編碼譯碼擴張/壓縮(均勻)量化輸出 亞奈奎斯特采樣PCM編碼降低采樣速率以提高編碼效率。在亞奈奎斯特采樣時,使混疊部分處于原始信號各次諧波的間隙內(nèi),在接
5、收端濾除(梳狀濾波器)。二、統(tǒng)計編碼(基于像素灰度概率分布) 編碼效率與冗余度12( ,)Nx xx),(21NpppNiip11設(shè)無記憶信源X 有N個消息其概率分布設(shè)某個信源xk出現(xiàn)的概率是pk信源熵xk的自信息量kkkppxI22log1log)(NiiippXH12log)( 要求用符號集合A=a1,a2, ,am, 通常A=0,1,對X 進行編碼(比特/消息)(3)圖像編碼方法簡介設(shè)第i個消息的碼字長度為Li,則平均碼長NiiiLpL1LXHS)(n2log平均每個符號所含有的熵將編碼后的每個符號視為新的無記憶“信源”,符號數(shù)為n,則該“信源”的最大熵為(各符號出現(xiàn)概率相等時)(比特/
6、符號)若 S n2log則編碼效率達到100一般情況下,S n2log信源熵(S)是進行無失真編碼的理論極限。(3)圖像編碼方法簡介(比特/符號)定義編碼效率nLXH2log)(1R81,81,41,21冗余度設(shè)信源 有4個消息 (x1, x2, x3, x4) 其概率分布取A=0,1,則n =2,可以用如下等長碼:x1=00, x2=10, x3=01, x4=11 4781log8181log8141log4121log21log)(222212NiiippXH(比特/消息)(3)圖像編碼方法簡介21NiiiLpL872log247log)(22nLXH81871R平均碼長編碼效率冗余度如
7、果采用不等長碼概率大的短,概率小的長x1=0, x2=10, x3=110, x4=111 (3)圖像編碼方法簡介47813813412211L12log474720R平均碼長編碼效率冗余度變長編碼可以實現(xiàn)較高的編碼效率,而且是一種無損編碼(3)圖像編碼方法簡介變長編碼條件:單義性和非續(xù)長性單義性任意一個有限長的碼字序列只能被唯一分割成碼字集合中的碼字,而任何其他的分割方法都會產(chǎn)生不屬于碼字集合中的碼字。非續(xù)長性任意一個碼字都不是由碼字集合中的一個碼字在后面添上一些碼元構(gòu)成的信源碼碼碼碼x10000 x2011001x3100110011x410111110111* 碼缺乏單義性;碼缺乏單義性
8、和非續(xù)長性;碼具備單義性和非續(xù)長性;碼具備單義性,但缺乏非續(xù)長性(3)圖像編碼方法簡介 霍夫曼(Huffman)編碼編碼步驟:Step1: 按照圖像灰度出現(xiàn)的概率從大到小排序;Step2:把最后兩個概率相加,再重新排序(消減信源);Step3:重復2,直到只有兩個概率為止(構(gòu)造二叉樹);Step4:從最后的位置開始反向編碼,每遇到二叉樹,在上位添0,下位添1。0.40.30.10.10.060.040.40.30.10.10.10.40.30.10.20.40.30.30.40.61234a12a5a3a6a4a初始信源信源的消減步驟符號概率(3)圖像編碼方法簡介0.40.30.10.10.0
9、60.040.40.30.10.10.10.40.30.10.20.40.30.30.40.61234a12a5a3a6a4a初始信源對消減信源的賦值符號概率10001101000101100010011100010110001101000101001011碼字平均碼長:信源熵:編碼效率:142)()log()(1.uJjjjaPaPH2 . 2)543(1 . 023 . 014 . 0)()(10LkkskavgspslL ( )2.140.9732.2avgHLu(3)圖像編碼方法簡介 Huffman編碼是最優(yōu)變長碼;需要多次排序,耗時大可采用分塊編碼。 香農(nóng)-法諾(Shannon-Fa
10、no)編碼編碼步驟:Step1: 按照信源出現(xiàn)的概率從大到小排序;Step2:把信源分成上下兩個子集,使得兩個子集中的概率和相等或最接近;Step3:分別對兩個子集賦值0和1;Step4:對每一個子集重復步驟24,直到每個子集只包含一個信源。(3)圖像編碼方法簡介輸入概率w1w2w3w4w5w60.40.30.10.10.060.0401010100110101100110111101111三、預測編碼 基本原理圖像像素間存在很大的相關(guān)性,可以由前n個采樣值預測下一個值:nnnxaxaxax22111iiixxe)()(mineHNe預測誤差:預測編碼對ei 進行編碼由信息論可知直接對信號編碼
11、的平均碼長的下限: 對預測誤差編碼的平均碼長的下限為: )(minxHN(3)圖像編碼方法簡介如果預測較準確,則必有 H(e) H(x) 概率分布越均勻,熵越大,而ei的分布集中在0附近預測編碼可以提高編碼效率 最佳預測均方誤差最小 22)(iiixxE0)(2jiiaxxE均方誤差: j = 0,1,n; 0)(jiixxxE要求: j = 0,1,n; (3)圖像編碼方法簡介視信號為零均值的平穩(wěn)隨機過程,其協(xié)方差為:Rij=Exixj 對i=0,有 nnnnnnnnnnRaRaRaRRaRaRaRRaRaRaR22110222212102121211101由此求出ai(n為預測階數(shù)) 一維
12、預測:利用圖像中同一行的前面若干個像素進行預測;二維預測:利用圖像中前面幾行進行預測; 三維預測:利用視頻信號前面幾幀進行預測對于電視信號,一般認為是一階馬爾柯夫過程,可以采用前值預測:11iixax(3)圖像編碼方法簡介 M編碼(增量調(diào)制編碼,或DM)原理:編碼器是1bit的預測編碼 )()()(tftfte0 1)(te當e(t)0 當e(t) 0 在接收端,當譯碼器收到“1”時信號產(chǎn)生正跳變,收到“0”時產(chǎn)生負跳變。 M編碼的基本特性斜率過載、量化噪聲、信噪比等(3)圖像編碼方法簡介 DPCM編碼(Differential Pulse Code Modulation)M 和PCM 二者結(jié)
13、合的編碼方法 (原理)編碼器:采樣 比較 量化 預測 編碼 譯碼器:PCM譯碼 與預測值相加量化器編碼器預測器+f (t)s(n)(tfe(t)解碼器預測器+f (t)(tfe(t)(DPCM編、譯碼原理) (3)圖像編碼方法簡介四、變換編碼(3)圖像編碼方法簡介 行程編碼(RLC, Run-Length Coding)將掃描行中灰度值相同的相鄰像素,用一個計數(shù)值和該灰度值來代替。1 1、一維行程編碼、一維行程編碼g1g2g3g46161824l1l2l3l4灰度級像素行程序列 gi li1 g1 62 g2 10 3 g3 24 g4 6映射結(jié)果設(shè)掃描行中有8個灰度級,24個像素,直接編碼的
14、比特數(shù):243=72bit若對參數(shù) (gi , li) 編碼,灰度值需3bit,長度用4bit, 則每對參數(shù)需7bit,共有74=28bit提高壓縮率(3)圖像編碼方法簡介行程編碼尤其適用二值(黑白)圖像行程編碼尤其適用二值(黑白)圖像 (位平面表示)對二值圖像,掃描行中的行程長度組成信源集合:(1, 2, , N)對應(yīng)的出現(xiàn)概率: (P1,P2, , PN)用統(tǒng)計編碼,平均每個行程的比特數(shù)滿足:HBH1 (變長編碼定理)NiiiPL1NiiiPPXH12log)(平均行程長度:可以估計平均每個像素所需比特數(shù) b(比特率):LLHbLH1(3)圖像編碼方法簡介如果把黑白行程分別編碼,可進一步減
15、小比特率。如果采用一階馬爾可夫模型,測量平均行程長度就能較好估計出比特率。1 1、二維行程編碼、二維行程編碼(a) (b) (方法一)轉(zhuǎn)換成一維行程:(3)圖像編碼方法簡介(方法二)利用相鄰的一維掃描線之間的相關(guān)性預測微分量化器(PDQ, Predictive Differential Quantizer)l1l2 AB“開始開始”“消失消失” 1= l2-l1 相鄰掃描行上行程起點之間的差; 1 1 相鄰掃描行的行程的差;自左向右開始(排掃),依次記錄( , 1, “開始”,“消失”)這4個參量的序列。圖像有少量大暗區(qū)時更有效;而圖像有大量小暗區(qū)時,一維行程編碼有效(3)圖像編碼方法簡介3
16、3、等值線編碼、等值線編碼不同灰度級的像素構(gòu)成不同高度的“平臺”,對所有平臺的高度、位置和形狀的表示,即是對圖像的表示。三要素三要素:等值線的灰度級、起始點(IP)、跟蹤方式算法算法:從圖像左上角開始(第一個IP),用T算法跟蹤直至返回此IP,得到第一條等值線,再用IP算法尋找第二個IP,用T算法跟蹤直至返回,得到第二條等值線,以此類推。此過程中,賦予每個像素一個指示符(代表四種走向)。編碼方法編碼方法:對四個參量(等值線灰度;IP行號,列號,指示符序列)編碼。(3)圖像編碼方法簡介 正交變換編碼 正交變換的特點正交變換的特點(1)熵保持(變換不丟失信息);(2)能量保持(Parseval定理
17、);(3)稀疏性;(4)去相關(guān)性。高壓縮比的可能性預處理正交變換量化編碼傳輸譯碼反變換后處理(圖像分塊)(3)圖像編碼方法簡介 數(shù)學模型數(shù)學模型YTX1Y=TXX= x0, x1, , xN-1TY= y0, y1, , yN-1T(T為正交矩陣)X=T-1Y如果變換后只保留M個分量(MN),則反變換得到X的近似 最佳變換準則最佳變換準則X 與 有最小均方誤差XK-L變換(完全去除冗余)K-L變換由信源計算,復雜度高,難以實時處理(3)圖像編碼方法簡介 準準最佳變換最佳變換根據(jù)線性代數(shù)理論,任何矩陣A可以經(jīng)相似變換為Jordan標準型: TTAT=B (T非唯一)121010100NNBFT、
18、DCT、Walsh-Hadamard等具備變換T的性質(zhì)。將信源變換為近似對角矩陣(3)圖像編碼方法簡介 一個能把最多的信息集中到最少的系數(shù)上去的變換所產(chǎn)生的重建誤差最小。 不同變換的信息集中能力不同 K-L最優(yōu),但計算量非常大(依賴于圖像) 正弦類變換(如DFT和DCT)較優(yōu) 非正弦類變換(如WHT)實現(xiàn)簡單 小波變換計算快且有局部性質(zhì)(不需分塊) 變換選擇變換選擇信息集中能力: K-L DCT DFT WHT所需計算量: K-L DCT DFT WHT DCT是較好的(綜合)選擇(3)圖像編碼方法簡介 編碼編碼(1)區(qū)域編碼只對能量集中的區(qū)域內(nèi)的系數(shù)編碼(低頻部分)。均方誤差與所選區(qū)域尺度有
19、關(guān)。缺點:區(qū)域方塊固定不變,某些圖像可能產(chǎn)生較大降質(zhì)。 (2)門限編碼對變換系數(shù)設(shè)定門限,只對大于門限的部分編碼,具有自適應(yīng)性。缺點:需加上位置碼對系數(shù)所在位置做標記,壓縮比可能會降低。 (3)圖像編碼方法簡介圖像編碼的國際標準 JPEG標準(靜止圖像)聯(lián)合圖像專家組(Joint Photographic Expert Group)1991年提出。 基本系統(tǒng)基本系統(tǒng):以88的圖像塊為基本單位進行編碼; 將RGB轉(zhuǎn)換為亮度、色調(diào)、飽和度表示,并重新采樣; 采用DCT變換編碼。重采樣色彩轉(zhuǎn)換圖象分塊FDCT量化系數(shù)編碼系數(shù)解碼反量化IDCT圖像拼接量化表碼表(4)圖像編碼的國際標準 JPEG系統(tǒng)規(guī)定了亮度分量和色度分量的量化表,色度分量的量化步長比亮度分量大;將每個DCT系數(shù)除以各自量化步長并四舍五入后取整,得到量化系數(shù)(高頻部分出現(xiàn)大量0值);量化:量化:依據(jù)視覺心理經(jīng)驗得出(4)圖像編碼的國際標準編碼:編碼: 對量化后系數(shù)的DC(直流
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 生產(chǎn)主管每日工作培訓
- 化工安全生產(chǎn)
- 江西省宜春市豐城市2023-2024學年三年級上學期第三次月考數(shù)學試卷
- 08 中華文化之傳統(tǒng)工藝-2025年中考英語新熱點時文閱讀
- 1.3地球的歷史(導學案)高一地理同步高效課堂(人教版2019必修一)
- 期中摸底測試(1-4單元)(試題)(含答案)2024-2025學年六年級上冊數(shù)學人教版
- 碩論開題全解析-從答辯準備到學術(shù)規(guī)范
- 影響健康因素多 課件 2024-2025學年人教版(2024)初中體育與健康七年級全一冊
- 全省小學美術(shù)教師賽課一等獎人美版美術(shù)三年級下冊《恐龍的世界》課件
- 高中語文15永不消逝的歌聲課件蘇教版必修
- 小學科學教育科學三年級上冊空氣 我們來做熱氣球 省一等獎 省賽獲獎
- 最新膿毒癥護理查房課件
- 第五課 做守法的公民 復習課件-部編版道德與法治八年級上冊
- 課件-鏈式聚合反應(yīng)
- 生命質(zhì)量評價 課件
- 石大皮膚性病學教案
- 籌集資金的核算課件
- 義務(wù)教育課程實施情況匯報
- 蘇科版三年級上冊勞動第一課《包書皮》課件(定稿)
- 課文解釋-the-story of an hour翻譯
- 2022年廣東恒健投資控股有限公司校園招聘筆試模擬試題及答案解析
評論
0/150
提交評論