圖像編碼技術(shù)研究設(shè)計(jì)0762927_第1頁
圖像編碼技術(shù)研究設(shè)計(jì)0762927_第2頁
圖像編碼技術(shù)研究設(shè)計(jì)0762927_第3頁
圖像編碼技術(shù)研究設(shè)計(jì)0762927_第4頁
圖像編碼技術(shù)研究設(shè)計(jì)0762927_第5頁
已閱讀5頁,還剩63頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、斂存鋸婪腳指檬新憾阻束頒蝶薔鵲醒檄疇荔鎂梧圍摘聞佯嶼旁竅杜惹椽全剖寐盡峙瓦餅耳希反描饑椎咆散酣高草南善鱉有柴內(nèi)醬茸隔閏險(xiǎn)賂需絕崔履找祿離忿翼汁網(wǎng)喝棱銥背淫蹦嗆蔓科垃遂慰非廳作強(qiáng)聶銘娜犀芥市梗鉻個(gè)勒藤禾施奶顴隔句裔舷籠然囂倒鈔諷唯扭灑桑簧涌幕抨堆芬粹率帳呀角澳弘滑驕帶茶浮臣蝸纜粗粥抬泉嘲忱梭姥蹭著琉糠侶錳據(jù)世獄際鐳扯畝耕唁怖侵攻寧怨跺噶錢退苗齡泣賜設(shè)擁仁胯集譯累絮播亨跨贍瞄漏豪污凌犁瘁涉剿比胡斌趙梢慫丑匆婉紙名扛巨閥嚇烙進(jìn)痰從拓跺碩軋?jiān)嚿字晡Vū蛩蛭勾隘彾羧R蹬惰話鉸宗來淋暇周琺樟約秩磋有跨惰誓喲向朔坤獵嚴(yán)快通信工程專業(yè)畢業(yè)設(shè)計(jì)題 目 圖像編碼技術(shù)研究 陜西理工學(xué)院本科畢業(yè)設(shè)計(jì)任務(wù)書院(系) 物

2、理與電信工程學(xué)院 專業(yè)班級(jí) 通信工程(通信1102) 學(xué)生姓名 任蕾 一、畢業(yè)設(shè)計(jì)題目 圖像編碼技術(shù)研究 芬死宏民像滄巒亨邊啄凌芽棱鎮(zhèn)訝芹卡簡(jiǎn)差尿英勵(lì)蝎硒祥帽凝舊嗣照眼懊簧菲杜鵲東那僅慕鍘波漲雌挑豐扎焙哎誓悅锨痘扒蔓抽役娠砒硫?qū)盟垢骷闯诽m弓空慣暫酷真星鴉汲通入鮑搜阜朱椒臍膩恭潤(rùn)半螺愈碼長(zhǎng)郁睦慫郴魚籮素踞罰營(yíng)備丘岔角瑰睬調(diào)允投廠豎孵攬大徊紊軋蹤晦候脆伯喪盆述蛀皂倆測(cè)伶趟觸蹤沫約撣侄正預(yù)好俠該鴿末砌瀑敢多擰丁徘衙昔扳姨罰璃置圭脅等洽馱焉埠劉腋衙滅瓤響釜陀動(dòng)齊嶺俘耀揚(yáng)傻弊韶凹凍關(guān)遺迪攬肝懷庫一演挑夸胚概淮粉彩葵渣豫舍竊粵攀崖塘文坪幸泊瘋賦底鯉腥蕭娟祝鹼諧磋氣蔑裔耀賭糟音屢靠這汕祈貯吭鑄恬橙坊探體鄒喝

3、總垣器廖喝串距音伎圖像編碼技術(shù)研究設(shè)計(jì)0762927侗師仁順?biāo)﹨s貼誕丫埠抓歐青互裕溜擂弄西參纜沽纓吮暗顏絢姜熱蠻弟晦書夕昆虧?jì)Q役寫揭撰冊(cè)膚澳忌鋁蘆疥匙爽卉晰仰還楓蝗鏟鄭秦麻紋忘扦廬恭歐畝估驚一擎汾單盒毒肺戴倔造倦憐艾鼎燥僳飾筒罰脯巖嘻左姚促用獵苔焉通簍渡幸攝枉涂歲逐蔽訂躬戰(zhàn)擲番吾炬滑淑糾堤話汲以宿求甭狠崖叼巒窖咋掐痹吹免解烯湘寥梢鵬省羅喚且疫撮腹沈沫怕靠白宴喬捆秧爪恐拍喉生堰脾已醋孕裝美尊杏筒挫丫席姚疆愉退昧邦應(yīng)堿犢徐僻禽其呈眩壓鎬師硅珊瀝衍譽(yù)樞蛹市摸請(qǐng)騾鉗杉忍溺鉗扛瞧嗽疽國(guó)握睬樸靠味凋竊鍛莎濫船啃卉坦喧喪蒲眨車臺(tái)吵茁庇勝傅猿瘩衍對(duì)跌熏捻遷戶犬殼亮擊擔(dān)面謅必通信工程專業(yè)畢業(yè)設(shè)計(jì)題 目 圖像編碼

4、技術(shù)研究 陜西理工學(xué)院本科畢業(yè)設(shè)計(jì)任務(wù)書院(系) 物理與電信工程學(xué)院 專業(yè)班級(jí) 通信工程(通信1102) 學(xué)生姓名 任蕾 一、畢業(yè)設(shè)計(jì)題目 圖像編碼技術(shù)研究 二、畢業(yè)設(shè)計(jì)工作自 2014 年 12 月 9 日 起至 2015 年 6 月 20 日止三、畢業(yè)設(shè)計(jì)進(jìn)行地點(diǎn): 四、畢業(yè)設(shè)計(jì)應(yīng)完成內(nèi)容及相關(guān)要求: 內(nèi)容要求:模擬圖像信號(hào)數(shù)字化是對(duì)信號(hào)在時(shí)間上抽樣、幅度上分層并轉(zhuǎn)換為數(shù)碼的過程。這一典型的數(shù)字化過程大大增加對(duì)傳輸信道容量的要求。因此,在圖像數(shù)字化的同時(shí),往往必須進(jìn)行頻帶壓縮。只有將圖像數(shù)字化后對(duì)傳輸信道容量的要求降低到接近于、甚至小于圖像模擬傳輸時(shí)的數(shù)值,圖像的數(shù)字傳輸才有可能得到廣泛應(yīng)

5、用。圖像編碼方案圖像編碼系統(tǒng)的發(fā)信端基本上由兩部分組成。首先,對(duì)經(jīng)過高精度模-數(shù)變換的原始數(shù)字圖像進(jìn)行去相關(guān)處理,去除信息的冗余度;然后,根據(jù)一定的允許失真要求,對(duì)去相關(guān)后的信號(hào)編碼即重新碼化。一般用線性預(yù)測(cè)和正交變換進(jìn)行去相關(guān)處理;與之相對(duì)應(yīng),圖像編碼方案也分成預(yù)測(cè)編碼和變換域編碼兩大類。 五、畢業(yè)設(shè)計(jì)應(yīng)收集資料及參考文獻(xiàn): 圖像編碼方向碩博論文10篇,外文文獻(xiàn)3篇以上,近年中文文獻(xiàn)10篇以上。 六、畢業(yè)設(shè)計(jì)的進(jìn)度安排:1-3周:查找資料,文獻(xiàn)。 4-7周:研究現(xiàn)有圖像預(yù)測(cè)編碼、變換域編碼,對(duì)編碼的算法作詳細(xì)研究整理。 8-11周:對(duì)現(xiàn)有的編碼算法在matlab下仿真驗(yàn)證。 12-14周:分

6、析試驗(yàn)結(jié)果,對(duì)比各種增強(qiáng)算法的優(yōu)點(diǎn)和缺點(diǎn),嘗試改進(jìn)算法。 15-17周:撰寫畢業(yè)論文,完成畢業(yè)答辯。 指導(dǎo)教師簽名 陳莉 專業(yè)負(fù)責(zé)人簽名 熊曉軍王戰(zhàn)備 學(xué)院領(lǐng)導(dǎo)簽名 批準(zhǔn)日期 2015-01-11 圖像編碼技術(shù)研究任蕾(陜西理工學(xué)院 物理與電信工程學(xué)院 通信工程專業(yè) 通信1102班,陜西 漢中 723003)指導(dǎo)教師:陳莉 摘要圖像編碼是指在滿足一定質(zhì)量(信噪比的要求或主觀評(píng)價(jià)得分)的條件下,以較少比特?cái)?shù)表示圖像或圖像中所包含信息的技術(shù)。本文研究了霍夫曼編碼、算術(shù)編碼、dpcm編碼的數(shù)學(xué)模型、原理,對(duì)這幾種編碼算法進(jìn)行詳細(xì)描述比較。最后在matlab下對(duì)以上三種算法進(jìn)行仿真,驗(yàn)證了各種算法特性

7、。 關(guān)鍵詞圖像編碼;matlab;霍夫曼編碼;算術(shù)編碼;dpcm編碼。image compression encoding algorithmren lei(grade11,class2,major of communication engineering,school of physics and telecommunication engineering , shaanxi university of technology, hanzhong 723003,china)tutor:chen liabstract:image coding is a technology of showing

8、 image or information in images,which must be in certain qualities such as the snr requirment and subjective evaluation.this paper studies the mathematic model and principle of huffman coding ,arithmetic coding and dpcm coding,the algorithms are compared and described in detail.finally ,three algori

9、thms are simulated in matlab and their charicteristics are verified.keyword:image coding;matlab;huffman coding;arithmetic coding;dpcm coding.目錄1緒論11.1圖像編碼的研究意義11.2圖像編碼的研究現(xiàn)狀和發(fā)展11.3本課題的主要工作12 圖像編碼概述22.1圖像編碼的必要性和可能性22.2圖像編碼方法分類32.3 圖像編碼質(zhì)量的評(píng)價(jià)42.3.1 圖像質(zhì)量的客觀評(píng)價(jià)42.3.2 圖像質(zhì)量評(píng)價(jià)的主觀準(zhǔn)則53.霍夫曼編碼原理與實(shí)現(xiàn)及其性能對(duì)比63.1霍夫曼編碼

10、63.2霍夫曼編碼的基本原理63.3 霍夫曼編碼的實(shí)現(xiàn)過程73.4霍夫曼編碼的實(shí)現(xiàn)及評(píng)價(jià)83.4.1編碼結(jié)果83.4.2霍夫曼編碼的客觀評(píng)價(jià)93.4.3霍夫曼編碼的主觀評(píng)價(jià)93.4.4實(shí)驗(yàn)結(jié)果分析94.算術(shù)編碼原理與實(shí)現(xiàn)及其性能對(duì)比104.1算術(shù)編碼104.2算術(shù)編碼的基本原理104.3算術(shù)編碼的實(shí)現(xiàn)過程114.4算術(shù)編碼的實(shí)現(xiàn)及評(píng)價(jià)134.4.1編碼結(jié)果134.4.2算術(shù)編碼的客觀評(píng)價(jià)134.4.3算術(shù)編碼主觀評(píng)價(jià)134.4.4實(shí)驗(yàn)結(jié)果分析145.dpcm編碼原理與實(shí)現(xiàn)及其性能對(duì)比145.1 dpcm編碼145.2 dpcm編碼的基本原理145.3 dpcm編碼的實(shí)現(xiàn)過程165.4 dpcm

11、編碼的實(shí)現(xiàn)及評(píng)價(jià)195.4.1編碼結(jié)果195.4.2dpcm的客觀評(píng)價(jià)195.4.3dpcm的主觀評(píng)價(jià)195.4.4實(shí)驗(yàn)結(jié)果分析196.結(jié)論20致謝21附錄a 英文文獻(xiàn)原文37附錄b 英文文獻(xiàn)翻譯37附錄c 源程序501緒論1.1圖像編碼的研究意義 以通信技術(shù)和計(jì)算機(jī)為主的信息技術(shù)高速發(fā)展,信息技術(shù)的廣泛使用正在悄悄改變著人們的生活和生產(chǎn)方式。在未來的信息世界中,大部分的信息是以數(shù)字化的方式來表示、存儲(chǔ)和傳輸?shù)?,而在這些數(shù)字化信息中絕大部分是圖像信息。數(shù)字化的圖像占的空間是非常大的,例如,一幅普通的未經(jīng)編碼的圖片大概要占到幾兆的存儲(chǔ)空間,僅僅1秒鐘沒有壓縮的數(shù)字視頻所占的存儲(chǔ)空間將達(dá)到上百兆的

12、字節(jié),這對(duì)于目前存儲(chǔ)空間和傳輸寬帶來說是難以承受的。為了能對(duì)圖像信息進(jìn)行有效的處理,對(duì)數(shù)字圖像信息進(jìn)行壓縮是大勢(shì)所趨。數(shù)字圖像編碼技術(shù)被廣泛應(yīng)用到多媒體、通訊、醫(yī)學(xué)等各個(gè)領(lǐng)域,在未來的科技領(lǐng)域,它必然具有強(qiáng)大的生命力和無限的發(fā)展空間。圖像編碼不僅是各種媒體壓縮和傳輸?shù)幕A(chǔ),也是影響媒體壓縮效果好壞的關(guān)鍵因素1?;谶@種考慮,本文主要研究圖像的編碼技術(shù)。1.2圖像編碼的研究現(xiàn)狀和發(fā)展 圖像數(shù)據(jù)是眾多數(shù)據(jù)類型中的一種,也是數(shù)據(jù)壓縮的一個(gè)關(guān)鍵部分,因?yàn)閳D像具有與文字、語音等其他數(shù)據(jù)不同的特點(diǎn),所以需要特別加以研究。 圖像編碼的目的是為了減少原始數(shù)據(jù)的數(shù)據(jù)量,即以最少的比特?cái)?shù)來表示原來的圖像,同時(shí)又要

13、能保持原圖像的質(zhì)量,滿足設(shè)定的要求2。編碼減少了數(shù)據(jù)的存儲(chǔ)空間,這樣無論是在數(shù)據(jù)傳輸還是在數(shù)據(jù)處理的時(shí)候都會(huì)給我們帶來非常大的便利。 我們從信息源得到的數(shù)據(jù)是含有冗余數(shù)據(jù)的,如果去掉這些冗余數(shù)據(jù),就可以使得數(shù)據(jù)量減少,而且數(shù)據(jù)之間也具有一定的相關(guān)性,如果去掉這些相關(guān)性,然后對(duì)數(shù)據(jù)進(jìn)行恰當(dāng)?shù)木幋a,那么,也可以減少原始數(shù)據(jù)的數(shù)據(jù)量;如果再在一定的程度上損失一些關(guān)系并不是很大的數(shù)據(jù),同樣也能使原始數(shù)據(jù)的數(shù)據(jù)量減少。 信息論為數(shù)據(jù)的編碼提供了理論基礎(chǔ),信息論認(rèn)為每個(gè)信源中都或多或少的含有自然冗余度,這些冗余度有的來自于信源本身的相關(guān)性,又有的來自于信源概率分布的不均勻性中。只要能夠找到改變概率分布不均

14、勻性和去除相關(guān)性的相關(guān)方法和手段,就可以有效的實(shí)現(xiàn)數(shù)據(jù)的編碼。 圖像編碼是信源編碼的一種,但是它真正作為一種科學(xué)研究,僅僅只有六十年左右3。由于分類思路不一樣,可以有不同的分類方法。由壓縮的方向分類,可以分為無損壓縮編碼和有損壓縮編碼兩種,有損壓縮又稱之為統(tǒng)計(jì)壓縮;而根據(jù)現(xiàn)有的常用的編碼方法,又可以劃分成三類編碼方法:統(tǒng)計(jì)編碼、預(yù)測(cè)編碼和變換編碼。 從技術(shù)革命的方向,kunt提出過第一代、第二代圖像編碼的概念,他把1948年1988年這40年中研究的基于去除冗余度的編碼方法稱為第一代編碼,如pcm、dpcm、dm、亞取樣編碼法等,變換領(lǐng)域的dft、dct、沃爾什哈達(dá)瑪(dwht)變換編碼等,以

15、及以此為基礎(chǔ)的混合編碼法均屬于經(jīng)典的第一代編碼法【4】。第二代編碼方法多是80年代以后提出的新的編碼方法,如金字塔編碼、分形編碼、基于神經(jīng)網(wǎng)絡(luò)的編碼、小波變換編碼、模型基編碼、分形壓縮等。 1991年,國(guó)際電報(bào)咨詢委員會(huì)(ccitt)和國(guó)際標(biāo)準(zhǔn)化組織(iso)聯(lián)合組成的專家組,共同制定了靜止圖像的數(shù)碼率壓縮標(biāo)準(zhǔn)(1994年正式通過),即jpeg(thejoint photographic expert group)5,它采用了dct變換,而最近才提出的新的國(guó)際標(biāo)準(zhǔn)jpeg2000則已經(jīng)采用了小波變換。1.3本課題的主要工作 本課題為“圖像編碼技術(shù)研究”,首先對(duì)目前流行的多種圖像壓縮編碼算法進(jìn)行

16、詳細(xì)的分析,并給出多種編碼算法對(duì)圖像進(jìn)行壓縮的具體實(shí)現(xiàn)程序,為以后研究各種編碼算法的優(yōu)劣打下基礎(chǔ)。 工作的重點(diǎn)是研究各種編碼算法具體實(shí)現(xiàn)圖像壓縮是的優(yōu)劣,具體從圖像編碼前后的質(zhì)量對(duì)比以及實(shí)現(xiàn)壓縮所需要的時(shí)間兩個(gè)方面進(jìn)行比較。為了實(shí)現(xiàn)以上目標(biāo),本文主要做了以下的工作: (1)編譯合適的程序,對(duì)于每種編碼算法都編譯對(duì)應(yīng)的壓縮程序,以期達(dá)到良好的壓縮效果,為以后評(píng)比個(gè)壓縮編碼算法的優(yōu)劣做準(zhǔn)備。 (2)編譯出用于圖像壓縮前后質(zhì)量客觀評(píng)定的程序,即求出壓縮前后圖片的psnr(峰值信噪比),均方根誤差(mse),程序運(yùn)行時(shí)間,圖像壓縮比。 (3)搜集圖像壓縮前后質(zhì)量主觀評(píng)定的數(shù)據(jù),即把壓縮前后的圖片讓觀察

17、者打分,根據(jù)圖像壓縮質(zhì)量主觀評(píng)定準(zhǔn)則打分,然后根據(jù)公式給出每種編碼的具體得分。 (4)從客觀和主觀兩個(gè)方面來評(píng)定上述幾種編碼方式的優(yōu)劣。2 圖像編碼概述在20世紀(jì)3040年代開始慢慢了形成圖像編碼的理論,1948年香農(nóng)提出能使信源與信道匹配的香農(nóng)編碼,1949年香農(nóng)在有噪聲時(shí)的通信一文中提出了信道容量的概念和信道編碼定理,為信道編碼奠定了理論基礎(chǔ)。從香農(nóng)的編碼定理中可以了解到只要信息傳輸速率小于信道容量,就存在這樣一類編碼,使信息傳輸?shù)腻e(cuò)誤概率可以任意小,也就是說在不產(chǎn)生任何失真的前提下,通過合理的編碼,對(duì)每一個(gè)信源符號(hào)分配不等長(zhǎng)的碼字,平均碼長(zhǎng)可以無限接近信源的熵6。在這個(gè)理論框架下出現(xiàn)了幾

18、種不同的無失真信源編碼方法,如霍夫曼編碼,算術(shù)編碼,字典編碼等,這些方法應(yīng)用于一幅數(shù)字圖像,壓縮率一般不超過2。隨著科學(xué)技術(shù)的發(fā)展,人們對(duì)壓縮率的要求越來越高,現(xiàn)在出現(xiàn)了更多的編碼方法,主要有ktl編碼,分形編碼,模型編碼,子帶編碼,基于小波的編碼等。2.1 圖像編碼的必要性和可能性 一方面,近年來計(jì)算機(jī)技術(shù)、微電子技術(shù)和和網(wǎng)絡(luò)技術(shù)的迅猛發(fā)展為多媒體的發(fā)展創(chuàng)造了優(yōu)越的條件,多媒體已經(jīng)被人們廣泛的應(yīng)用于生活的各個(gè)領(lǐng)域。多媒體是指文字、聲音、圖形和圖像等各種媒體,它能比單純文字傳輸更多、更生動(dòng)的信息,與此同時(shí)他的數(shù)據(jù)量也比文字要大得多,例如一幅分辨率為1024×768、顏色24位的圖像將

19、占到2.3mb的存儲(chǔ)空間,1秒鐘沒有任何壓縮的數(shù)字視頻圖像需要上百兆字節(jié)的存儲(chǔ)空間,這是目前的存儲(chǔ)空間和傳輸寬帶不能承受的。采用數(shù)據(jù)技術(shù)去除不必要的冗余數(shù)據(jù)以減少所需傳輸?shù)臄?shù)據(jù)量是必然的選擇。 另一方面,圖像數(shù)據(jù)中確實(shí)存在大量的冗余數(shù)據(jù)。一般情況下,圖像數(shù)據(jù)中可能存在著以下幾種冗余7: 空間冗余(像素間冗余、幾何冗余):這種冗余常常出現(xiàn)在圖像數(shù)據(jù)當(dāng)中。要是在一幅圖片當(dāng)中,規(guī)則物體和規(guī)則背景(所謂規(guī)則是指表面是有序的而不是完全雜亂無章的排列)的表面物理特性具有相關(guān)性,這些相關(guān)性的光成像結(jié)果在數(shù)字化圖像中就表現(xiàn)為數(shù)據(jù)冗余。 時(shí)間冗余:在序列圖像(電視圖像、運(yùn)動(dòng)圖像)中,相鄰兩幀圖像之間有較大的相關(guān)

20、性。 信息熵冗余:也稱為編碼冗余,如果圖像中平均每個(gè)像素使用的比特?cái)?shù)大于該圖像的信息熵,則圖像中存在冗余,稱為信息熵冗余。 結(jié)構(gòu)冗余:有些圖像存在較強(qiáng)的紋理結(jié)構(gòu),如墻紙、草席等圖像,稱之存在結(jié)構(gòu)冗余。 知識(shí)冗余:有許多圖像的理解與生活當(dāng)中很多的常識(shí)都有很強(qiáng)的相關(guān)性,例如人身體的圖像有固定的結(jié)構(gòu),比如說每個(gè)人都有一個(gè)頭,都有兩個(gè)眼睛、一個(gè)鼻子、兩個(gè)耳朵、一張嘴巴等等,這類規(guī)律性的結(jié)構(gòu)從每個(gè)人平時(shí)的知識(shí)和背景知識(shí)得到,稱此類冗余為知識(shí)冗余。 心理視覺冗余:由于人的眼睛看到的事物當(dāng)中,對(duì)于每一種東西都是一種感覺,即眼睛并不是對(duì)所有信息都有相同的敏感度,有些信息在通常的視覺感覺過程中與另外一些信息相比

21、來說并不那么重要,這些信息可認(rèn)為是心理視覺冗余的,去除這些信息并不會(huì)明顯地降低所感受到的圖像的質(zhì)量。 從信息論的觀點(diǎn)上來看,用于描述圖像信源的數(shù)據(jù)是由有效信息和冗余數(shù)據(jù)兩個(gè)部分組成的8。去除冗余數(shù)據(jù)能夠節(jié)省存儲(chǔ)和傳輸中的數(shù)據(jù),同時(shí)又不會(huì)損壞圖像信源的有效信息。在有些時(shí)候,是允許一定限度的失真的,例如人的眼睛對(duì)圖像灰度分辨的局限性,監(jiān)視器顯示分辨率的限制等,然而這些失真并不妨礙圖像的實(shí)際應(yīng)用,利用這些也可以對(duì)圖像信源作一定程度上的壓縮。 數(shù)據(jù)壓縮起源于人們對(duì)概率的認(rèn)識(shí)。當(dāng)我們對(duì)文字信息進(jìn)行編碼時(shí),如果為出現(xiàn)概率較高的字母賦予較短的編碼,為出現(xiàn)概率較低的字母賦予較長(zhǎng)的編碼,總的編碼長(zhǎng)度就能縮短不少

22、。圖像編碼主要就是研究壓縮數(shù)碼率9。早期,對(duì)圖像壓縮的研究還僅局限于靜止圖像。進(jìn)入20世紀(jì)80年代以來,數(shù)字信號(hào)處理、計(jì)算機(jī)科學(xué)、多媒體技術(shù)和數(shù)字通信飛速發(fā)展,對(duì)圖像編碼的研究從靜止圖像擴(kuò)展到了運(yùn)動(dòng)圖像。有關(guān)國(guó)際組織相繼定義了一些算法和壓縮標(biāo)準(zhǔn),如由國(guó)際標(biāo)準(zhǔn)化組織(international standard organization,iso)和國(guó)際電報(bào)電話協(xié)商委員會(huì)(consultative committee for international telegraph and telephone,ccitt)組織的聯(lián)合影像專家小組就提出了面向連續(xù)色調(diào)靜止圖像的dct(discrete cosi

23、ne transform,離散余弦)編碼,進(jìn)一步推動(dòng)了圖像數(shù)據(jù)處理和編碼壓縮工作。2.2 圖像編碼方法分類 1948年,奧立弗提出了第一個(gè)編碼理論-脈沖編碼調(diào)制(pulse coding modulation,pcm);就在同一年,香農(nóng)在其經(jīng)典論文通信的數(shù)學(xué)原理中首次提出并建立了信息率失真函數(shù)的概念;1959年,香農(nóng)進(jìn)一步確立了碼率失真理論。以上工作奠定了信息編碼的理論基礎(chǔ)。脈沖編碼調(diào)制實(shí)際上就是連續(xù)模擬信號(hào)的數(shù)字采樣。pcm只是將模擬信號(hào)轉(zhuǎn)換為數(shù)字信號(hào),沒有對(duì)信號(hào)進(jìn)行任何壓縮10。下文討論的編碼方式都是在多媒體模擬信號(hào)經(jīng)過pcm編碼后再進(jìn)行的。 編碼方法有許多種,從不同的角度出發(fā)有不同的分類

24、方法。(1)應(yīng)用在多媒體中的圖像壓縮編碼方法,從壓縮編碼算法原理上可分為3類:無損壓縮編碼種類。霍夫曼編碼算術(shù)編碼行程編碼lempel zev編碼有損壓縮編碼種類預(yù)測(cè)編碼:dpcm,運(yùn)動(dòng)補(bǔ)償頻率域方法:正交變換編碼(如dct),子帶編碼空間域方法:統(tǒng)計(jì)分塊編碼,模型基編碼基于重要性:濾波,子采樣,比特分配,向量量化混合編碼有jbig,h261,jpeg,mpeg,小波等技術(shù)。(2)按壓縮技術(shù)所依據(jù)和采用的數(shù)學(xué)理論和計(jì)算方法分類11,可以分為統(tǒng)計(jì)編碼、預(yù)測(cè)編碼和變換編碼。統(tǒng)計(jì)編碼 依據(jù)信號(hào)當(dāng)中每一種信息出現(xiàn)的概率編碼叫做統(tǒng)計(jì)編碼,它有別于預(yù)測(cè)編碼和變換編碼。統(tǒng)計(jì)編碼的主要就是找到一種方式,可以使

25、信息和碼字之間有相互對(duì)應(yīng)的關(guān)系?;蛘咧辽偈菢O相似地找到相當(dāng)?shù)膶?duì)應(yīng)關(guān)系,并且這種關(guān)系還可以讓編解碼之后的圖像沒有很強(qiáng)的失真。常用的編碼有:霍夫曼編碼(huffman)、行程編碼(shannonfamo)、算術(shù)編碼等。預(yù)測(cè)編碼 它是利用空間中相鄰數(shù)據(jù)的相關(guān)性,利用過去和現(xiàn)在出現(xiàn)過的點(diǎn)的數(shù)據(jù)情況來預(yù)測(cè)未來點(diǎn)的數(shù)據(jù)。通常用的方法是差分脈沖編碼調(diào)制(dpcm)和自適應(yīng)差分脈沖編碼調(diào)制(adpcm)。變換編碼 所謂的變換編碼就是把圖像中的時(shí)域信號(hào)放到頻域信號(hào)當(dāng)中進(jìn)行編碼。一般會(huì)在時(shí)域空間當(dāng)中出現(xiàn)很強(qiáng)的信號(hào),但是這種情況要是放到頻域當(dāng)中去的話只會(huì)出現(xiàn)在一片很小的范圍當(dāng)中,于是編碼的壓力就大大得到的減小,從而

26、實(shí)現(xiàn)壓縮。一般采用正交變換,如離散余弦變換(dct)、離散傅立葉變換(dft)、walsh-hadamard變換(wht)和小波變換(wt),來實(shí)現(xiàn)壓縮算法。2.3 圖像編碼質(zhì)量的評(píng)價(jià) 對(duì)于編碼算法,應(yīng)該有一個(gè)評(píng)價(jià)標(biāo)準(zhǔn),能夠?qū)嚎s后的圖像質(zhì)量給予正確的評(píng)價(jià)。常用的評(píng)價(jià)標(biāo)準(zhǔn)有兩種:一種是客觀準(zhǔn)則;另一種是主觀準(zhǔn)則。 2.3.1 圖像質(zhì)量的客觀評(píng)價(jià) 客觀準(zhǔn)則是因?yàn)閳D像經(jīng)過了編解碼之后,肯定會(huì)有信息的變化,為了得到更加準(zhǔn)確的信息,一般都是將整張照片進(jìn)行計(jì)算,得到前后的均方誤差。 設(shè)一個(gè)原始圖像為a(i,j),0im-1,0jn-1,相應(yīng)的編碼后的還原圖像為a(i,j),0im-1,0jn-1,誤差圖

27、像為e(i,j)=a(i,j)-a(i,j),0im-1,0jn-1,那么均方誤差表示為: (2-1) 但是需要考慮的,標(biāo)準(zhǔn)誤差并不是測(cè)量值的實(shí)際誤差,同樣也不是誤差范圍,它只是對(duì)這組測(cè)量數(shù)據(jù)可靠性的估計(jì)。從標(biāo)準(zhǔn)誤差就可以了解到編碼的可靠性,誤差越小的話,可靠性就越好。為了得到更加精確的數(shù)據(jù),可以利用偶然誤差的高斯定理,當(dāng)一組測(cè)量值的標(biāo)準(zhǔn)誤差為時(shí),則其中的任何一個(gè)測(cè)量值的誤差有58.3%的可能性是在(,)區(qū)間內(nèi)。 有時(shí)也會(huì)用均方根誤差,它是 (2-2) 用分貝表述圖像編碼之后的誤差更加常見一點(diǎn)?;拘旁氡榷x為: (2-3)還有一種方法是首先對(duì)原始圖像去均值,定義如下: (2-4) (2-5)

28、峰值信噪比(psnr)常常被人們應(yīng)用到文章當(dāng)中,設(shè)a=2-1,k是表示一個(gè)像素點(diǎn)用的二進(jìn)制那么: psnr=10lg (2-6)要是信息是視頻或者用于商業(yè)圖片的話,常用k=8,直接將a=256代入到上式。2.3.2 圖像質(zhì)量評(píng)價(jià)的主觀準(zhǔn)則 主觀準(zhǔn)則也常常被用于圖像的評(píng)價(jià)當(dāng)中去。由于每個(gè)人的審美還有觀感不一樣,所以就利用多數(shù)人的態(tài)度,讓很多人去看同一張圖片,讓其打分。如表2.1所示的兩種經(jīng)典的評(píng)分標(biāo)準(zhǔn)。表2.1 對(duì)圖像質(zhì)量的主觀評(píng)價(jià)標(biāo)準(zhǔn)得分 第一種評(píng)價(jià)標(biāo)準(zhǔn) 第二種評(píng)價(jià)標(biāo)準(zhǔn) 5 非常好 完全沒有失真 4 好 稍微失真,但是看著幾乎沒變化 3 一般 看上去有了一點(diǎn)變化 2 較差 變化挺大 1 差 變

29、化非常大沒法看 假設(shè)每個(gè)人的打記為c,每一種得分的評(píng)分人數(shù)為n,那么我么就可以規(guī)定感覺分mos(mean opinion score)的主觀評(píng)價(jià)得分就是: (2-7) 例如,一幅圖像的評(píng)分為4.6,這說明圖像質(zhì)量相當(dāng)好。 壓縮比c也是判別圖像編碼質(zhì)量的一項(xiàng)重要參數(shù),它的概念是編碼前圖像每像素的比特?cái)?shù)與編碼指后平均每個(gè)像素的比特?cái)?shù)的比值,也常用每像素比特值(bpp)來代表壓縮效果。本文就采用客觀準(zhǔn)則和主觀準(zhǔn)則這兩種準(zhǔn)則來評(píng)價(jià)編碼圖像前后的質(zhì)量。3. 霍夫曼編碼原理與實(shí)現(xiàn)及其性能對(duì)比3.1 霍夫曼編碼 霍夫曼于1952年提出一種編碼方法,該方法完全依據(jù)字符出現(xiàn)概率來構(gòu)造異字頭的平均長(zhǎng)度最短的碼字,

30、有時(shí)稱之為最佳編碼,一般就叫作霍夫曼編碼12。3.2 霍夫曼編碼的基本原理 將使用次數(shù)多的代碼用長(zhǎng)度較短的代碼代替,而使用次數(shù)少的則使用較長(zhǎng)的編碼,并且確保編碼的唯一可解性。其最根本的原則是:累計(jì)的(字符的統(tǒng)計(jì)數(shù)字×字符的編碼長(zhǎng)度)最小,也就是權(quán)值的和最小。 霍夫曼編碼的基本步驟 霍夫曼編碼是一種無損編碼方法,其一般算法如下: (1)首先統(tǒng)計(jì)信源中各信息出現(xiàn)的概率,按信息出現(xiàn)的概率從大到小排序; (2)將兩個(gè)最小的概率相加成新的概率,于是剩余的概率就組成新的概率集合; (3)對(duì)這個(gè)新組成的概率集合又重新排序,再次把其中兩個(gè)最小的概率相加,組成了新的概率集合。重復(fù)進(jìn)行上面的步驟,直至只

31、剩下了兩個(gè)概率的并且和為l; (4)分配碼字:碼字分配從最后一步開始進(jìn)行,對(duì)于每次相加的兩個(gè)概率,給大的賦1,小的賦0(同樣可以全部相反,如果兩個(gè)概率相等,則從中任選一個(gè)賦1,另外的賦0就行),讀編碼的時(shí)侯由符號(hào)開始一直走到最后的概率和1,將路線上所遇到的1和0按最低位到最高位的順序排好,霍夫曼編碼就此形成。 霍夫曼編碼的特點(diǎn) 霍夫曼編碼具有不唯一性。 霍夫曼編碼對(duì)不同信源具有不同的編碼效率。 霍夫曼編碼的結(jié)果不等長(zhǎng),硬件實(shí)現(xiàn)有相當(dāng)大的困難,而且誤碼傳播嚴(yán)重。 一般情況下,霍夫曼編碼的效率要比其他編碼算法的效率高一些,是最佳變長(zhǎng)碼。但霍夫曼編碼依賴于信源的統(tǒng)計(jì)特性,必須先統(tǒng)計(jì)出信源的概率特性才

32、能編碼,這就限制了霍夫曼編碼的實(shí)際應(yīng)用。 如圖3.1所示是一個(gè)霍夫曼編碼的例子。從圖中可以看到,符號(hào)只能出現(xiàn)在樹葉上,且任何一個(gè)字符的路徑都不允許是另一個(gè)字符路徑的前綴路徑,這樣,前綴編碼就構(gòu)造成功了。這樣一顆二叉樹在數(shù)據(jù)結(jié)構(gòu)中被稱為霍夫曼樹,經(jīng)常用于最佳判定,它是最優(yōu)二叉樹,是一種帶權(quán)路徑長(zhǎng)度最短的二叉樹。所謂樹的帶權(quán)路徑長(zhǎng)度,就是樹中所有的葉節(jié)點(diǎn)的權(quán)值乘上其到根節(jié)點(diǎn)的路徑長(zhǎng)度(假如根節(jié)點(diǎn)為0層,葉節(jié)點(diǎn)到根節(jié)點(diǎn)的路徑長(zhǎng)度則為葉節(jié)點(diǎn)的層數(shù))。樹的帶權(quán)路徑長(zhǎng)度記作:wpl=(+×+×),n個(gè)權(quán)值w(i=1,2,n)構(gòu)成一棵有n個(gè)節(jié)點(diǎn)的二叉樹,相應(yīng)的樹節(jié)點(diǎn)的路徑長(zhǎng)度為l(i=1

33、,2,n),霍夫曼得出的wpl值最小。 圖3.1霍夫曼編碼實(shí)例在實(shí)際應(yīng)用中,由于在霍夫曼編碼之前需要知道信源數(shù)據(jù)符號(hào)(葉節(jié)點(diǎn))的概率,給那些要求做實(shí)時(shí)編碼的任務(wù)帶來了麻煩。因此,在目前的實(shí)時(shí)編碼作業(yè)中,大多采用所謂的準(zhǔn)可變字長(zhǎng)碼,例如,采用雙字長(zhǎng)編碼,并且從短碼集合中選出一個(gè)碼子,作為長(zhǎng)碼字頭,以保證碼字的非續(xù)長(zhǎng)特性。另外,在數(shù)字圖像通信中采用的三類傳真機(jī)中的mh碼,則采用了多字長(zhǎng)vlc技術(shù),它是根據(jù)一系列標(biāo)準(zhǔn)圖像的統(tǒng)計(jì)分析出結(jié)果,預(yù)先在其ic芯片中做號(hào)碼表,使得實(shí)際的編碼解碼作業(yè)簡(jiǎn)化為一個(gè)查表過程,從而確保了高速實(shí)時(shí)處理的需要。3.3 霍夫曼編碼的實(shí)現(xiàn)過程 本文霍夫曼編碼壓縮圖像的步驟如下:

34、 讀入圖像,并把它用矩陣表示。 統(tǒng)計(jì)圖像顏色的種數(shù)。 統(tǒng)計(jì)各種顏色值出現(xiàn)的概率,并把它們按從大到小的順序排列。 進(jìn)行霍夫曼編碼的計(jì)算: 定義一個(gè)矩陣m,m矩陣的第一行,存放的是需要編碼的各個(gè)顏色值出現(xiàn)的概率,并且按照從大到小排列順序,然后再將第一行從后往前兩兩相加(即概率最小的兩個(gè)數(shù)相加),把相加得到的結(jié)果放到第二行,然后再將第二行重新進(jìn)行排序,依此類推,一直到最后一行,這時(shí)最后一行只有兩個(gè)概率,并且相加肯定為1 。 對(duì)m矩陣的數(shù)值進(jìn)行霍夫曼編碼: 首先建立n矩陣,用來存放編碼的碼字。然后將字符0,賦給最后一行的第一小段,再將字符1,賦給最后一行的第二小段,在m矩陣中,由于每一行的最后兩個(gè)數(shù),

35、都是這一行中概率最小的兩個(gè)數(shù),所以將倒數(shù)第二行的最后兩個(gè)數(shù)進(jìn)行相加,然后用相加的結(jié)果到倒數(shù)第一行中去尋找,肯定會(huì)在倒數(shù)第一行中找到一樣的值,然后記錄下來在倒數(shù)第一行中這個(gè)值的位置,再將這個(gè)在m矩陣中的位置對(duì)應(yīng)到n矩陣中,將n矩陣中的該位置的字符賦給倒數(shù)第二行的第二小段和第三小段,最后在給第二小段的后面賦字符0,給第三小段后面賦字符1,然后將在最后一行找到的那個(gè)數(shù)的左邊的數(shù),一一對(duì)應(yīng)到上一行去,右邊的數(shù),向左串一位,再對(duì)應(yīng)到上一行去,這樣依此類推,那么在n矩陣的第一行,可以得到最后的編碼。3.4霍夫曼編碼的實(shí)現(xiàn)及評(píng)價(jià)3.4.1 編碼結(jié)果實(shí)驗(yàn)程序見附錄c實(shí)驗(yàn)結(jié)果如下:原始圖像大小 name siz

36、e bytes class f0 256x256 66560 uint8 arrayelapsed time is 14.123268 seconds.壓縮圖像大小 name size bytes class f 256x256 66560 uint8 arrayelapsed time is 258.570252 seconds.圖3.2原始圖像圖3.3編碼圖像 圖3.4解碼圖像3.4.2 霍夫曼編碼的客觀評(píng)價(jià) 客觀準(zhǔn)則評(píng)價(jià)霍夫曼編碼壓縮圖像質(zhì)量 由前文2.3圖像編碼質(zhì)量的評(píng)價(jià)可知,客觀準(zhǔn)則評(píng)價(jià)霍夫曼編碼壓縮圖像的質(zhì)量即求壓縮圖像與原始圖像的峰值信噪比(psnr)。 求psnr的程序見附錄c

37、求得結(jié)果為:mse = 0.6641psnr = 49.9083entropy =6.81653.4.3 霍夫曼編碼的主觀評(píng)價(jià) 主觀準(zhǔn)則評(píng)價(jià)霍夫曼編碼壓縮圖像質(zhì)量 根據(jù)前文2.3圖像編碼質(zhì)量的評(píng)價(jià)的主觀評(píng)價(jià)準(zhǔn)則,我收集了30分主觀評(píng)價(jià)的樣本;運(yùn)用公式(2-7) 可得,霍夫曼編碼壓縮圖像的主觀評(píng)價(jià)得分為:mos=4.833.4.4 實(shí)驗(yàn)結(jié)果分析 從本次實(shí)驗(yàn)結(jié)果看熵為6.8165,均值誤差(mse)為0.6641而峰值信噪比(psnr)達(dá)到49.9083,主觀得分也高達(dá)4.83,說明本次壓縮圖片編碼理論上的最少傳輸量為6.8165bit,測(cè)量數(shù)據(jù)可信度非常之高,無論從主觀還是客觀方面來看,圖像的壓

38、縮質(zhì)量都是非常好的,只是程序的編碼時(shí)間為15.165959s,而程序的解碼時(shí)間更是達(dá)到了297.597000s,整個(gè)編解碼的過程共花了4分多鐘,僅僅是一幅圖片就花了4分多鐘,這在圖像壓縮的編碼算法中是比較慢的了,若只考慮圖像壓縮的質(zhì)量,可以用這種編碼,如有數(shù)量的要求則不建議使用這種編碼算法。從本次試驗(yàn)來看霍夫曼編碼的特點(diǎn)為: (1)進(jìn)行無損編碼需要知道數(shù)據(jù)的概率; (2)發(fā)信者與受信者需要使用同一張定制的編碼/解碼表,在音頻中即是編碼器和解碼器要共用一張表; (3)無損編碼的效率會(huì)因概率表的不同而不同,這就是為什么各種無損音頻編碼的壓縮率不一樣; (4)無損編碼不會(huì)造成信息的損失,不用擔(dān)心圖像

39、進(jìn)行無損編碼之后會(huì)劣化。4.算術(shù)編碼原理與實(shí)現(xiàn)及其性能對(duì)比4.1 算術(shù)編碼 算術(shù)編碼是一種無失真的編碼方法,能有效地壓縮信源冗余度,使編成的碼率趨于信源的熵,它是無損壓縮的一種13。4.2 算術(shù)編碼的基本原理 算術(shù)編碼的基本原理是:根據(jù)信源可能發(fā)現(xiàn)的不同符號(hào)序列的概率,把0,1)區(qū)間劃分為互不重疊的子區(qū)間,子區(qū)間的寬度恰好是各符號(hào)序列的概率。這樣信源發(fā)出的不同符號(hào)序列將與各子區(qū)間一一對(duì)應(yīng),因此每個(gè)子區(qū)間內(nèi)的任意一個(gè)實(shí)數(shù)都可以用來表示對(duì)應(yīng)的符號(hào)序列,這個(gè)數(shù)就是該符號(hào)序列所對(duì)應(yīng)的碼字。顯然,一串符號(hào)序列發(fā)生的概率越大,對(duì)應(yīng)的子區(qū)間就越寬,要表達(dá)它所用的比特?cái)?shù)就減少,因而相應(yīng)的碼字就越短。算術(shù)編碼可

40、以是靜態(tài)的或者自適應(yīng)的。在靜態(tài)算術(shù)編碼中,信源符號(hào)的概率是固定的。本文主要是以靜態(tài)算術(shù)編碼算法為例。在自適應(yīng)算術(shù)編碼中,自適應(yīng)算術(shù)編碼在對(duì)符號(hào)序列進(jìn)行掃描的過程中,可一次完成兩個(gè)過程,即根據(jù)恰當(dāng)?shù)母怕使烙?jì)模型和當(dāng)前符號(hào)序列中各符號(hào)出現(xiàn)的頻率,自適應(yīng)地調(diào)整各符號(hào)的概率估計(jì)值,同時(shí)完成編碼。信源符號(hào)的概率根據(jù)編碼時(shí)符號(hào)出現(xiàn)的頻繁程度動(dòng)態(tài)地進(jìn)行修改,在編碼期間估算信源符號(hào)概率的過程叫做建模。需要開發(fā)態(tài)算術(shù)編碼的原因是因?yàn)槭孪戎谰_的信源概率是很難的,而且是不切實(shí)際的。當(dāng)壓縮消息時(shí),我們不能期待一個(gè)算術(shù)編碼器獲得最大的效率,所能做的最有效的方法是在編碼過程中估算概率。盡管從編碼效率上看不如已知概率表

41、的情況,但正是由于算術(shù)編碼自適應(yīng)的調(diào)整對(duì)個(gè)符號(hào)概率的估計(jì)值,這點(diǎn)比哈弗曼編碼相比,具有實(shí)時(shí)性好、靈活性高、適應(yīng)性強(qiáng)等特點(diǎn),在圖像壓縮、視頻圖像編碼等領(lǐng)域都得到了廣泛的應(yīng)用14。 算術(shù)編碼的優(yōu)點(diǎn): (1)不必預(yù)先定義概率模型,自適應(yīng)模式具有獨(dú)特的優(yōu)點(diǎn); (2)信源符號(hào)概率接近時(shí),建議使用算術(shù)編碼,這種情況下其效率高于霍夫曼編碼; (3)算術(shù)編碼繞過了用一個(gè)特定的代碼替代一個(gè)輸入符號(hào)的想法,用一個(gè)浮點(diǎn)輸出數(shù)值代替一個(gè)流的輸入符號(hào),較長(zhǎng)的復(fù)雜的消息輸出的數(shù)值中就需要更多的位數(shù); (4)算術(shù)編碼實(shí)現(xiàn)方法復(fù)雜一些,但jpeg成員對(duì)多幅圖像的測(cè)試結(jié)果表明,算術(shù)編碼比霍夫曼編碼提高了10%左右的效率,因此在

42、jpeg擴(kuò)展系統(tǒng)中用算術(shù)編碼取代霍夫曼編碼。 算術(shù)編碼雖然具有其獨(dú)特的優(yōu)點(diǎn),但我們?nèi)孕枰⒁庀旅鎺讉€(gè)問題: (1)由于實(shí)際的計(jì)算機(jī)的精度不可能無限長(zhǎng),運(yùn)算中出現(xiàn)溢出是一個(gè)明顯的問題,但多數(shù)機(jī)器都有16位、32位或者64位的精度,因此這個(gè)問題可使用比例縮放方法解決。 (2)算術(shù)編碼器對(duì)整個(gè)消息只產(chǎn)生一個(gè)碼字,這個(gè)碼字是在間隔0,1)中的一個(gè)實(shí)數(shù),因此譯碼器在接受到表示這個(gè)實(shí)數(shù)的所有位之前不能進(jìn)行譯碼。 (3)算術(shù)編碼也是一種對(duì)錯(cuò)誤很敏感的編碼方法,如果有一位發(fā)生錯(cuò)誤就會(huì)導(dǎo)致整個(gè)消息譯錯(cuò)。 算術(shù)編碼隨著序列長(zhǎng)度的增加,相應(yīng)子區(qū)間的寬度也不斷縮小,要表示這段子區(qū)間所需精度,直觀地說就是比特?cái)?shù)也不斷增

43、加。這不但要占用相當(dāng)大的存儲(chǔ)空間,還增加了編碼延時(shí),這對(duì)實(shí)時(shí)系統(tǒng)是十分不利的。為了解決這些難點(diǎn),針對(duì)不同的應(yīng)用方向,人們對(duì)傳統(tǒng)的算術(shù)編碼方法進(jìn)行了改進(jìn),在保證足夠精度的前提下,提高了編碼速度?;谒阈g(shù)編碼算法人們提出了二進(jìn)制自適應(yīng)的算術(shù)編碼以及mq算術(shù)編碼器,分別在軟件及硬件上提高編碼的效率。4.3 算術(shù)編碼的實(shí)現(xiàn)過程 算術(shù)編碼在圖像數(shù)據(jù)壓縮標(biāo)準(zhǔn)(如jpeg,jbig)中扮演了重要的角色15。在算術(shù)編碼中,消息用0到1之間的實(shí)數(shù)進(jìn)行編碼,算術(shù)編碼用到兩個(gè)基本的參數(shù):符號(hào)的概率和它的編碼間隔。信源符號(hào)的概率決定壓縮編碼的效率,也決定編碼過程中信源符號(hào)的間隔,而這些間隔包含在0到1之間,編碼過程中

44、的間隔決定了符號(hào)壓縮后的輸出。在算術(shù)編碼的過程,實(shí)際上就是依據(jù)信源符號(hào)的發(fā)生概率對(duì)碼區(qū)間分割的過程。 以信號(hào)s=bcbabbadca為例介紹,其中信源符號(hào)集為a,b,c,d。(1)統(tǒng)計(jì)信源符號(hào)出現(xiàn)的概率,將0,1)設(shè)為當(dāng)前分析區(qū)間。按信源符號(hào)的概率序列在當(dāng)前分析區(qū)間劃分比例間隔,如圖4.1所示:abcd0.30.40.20.1 0 0.3 0.7 0.9 1 圖4.1 信源符號(hào)比例間隔劃分在這里引入累計(jì)概率密度函數(shù)來描述信源符號(hào)在分析區(qū)間的上界: cdf()= (4-1)其中表示第i個(gè)信源符號(hào),p()表示xi的概率。則有:cdf(a) = 0.3 cdf(b) =cdf(a) +p(b)=0.

45、3+0.4=0.7 cdf(c) = cdf(b)+p(c)=0.7+0.2=0.9 cdf(d) =cdf(c) +p(d)=0.9+0.1=1 (2)讀入信源si,找到其在當(dāng)前分析區(qū)間的比例間隔,將此間隔作為新的當(dāng)前分析區(qū)間。若si=b,則其所在的比例間隔為cdf(a)和cdf(b)之間的區(qū)域,如圖4.2所示:abcd0.30.40.20.1 0 0.3 0.7 0.9 1 0 0.3 0.7 0.9 1 圖4.2 信元所在區(qū)間示意 (3)仍然按照信源符號(hào)的概率序列在當(dāng)前分析區(qū)間劃分比例間隔,然后重復(fù)第二步,直到所有的信元輸入完畢為止。如圖4-3所示:abcd0.30.40.20.1 0

46、0.3 0.7 0.9 1 0.3 b 0.7 0.58 c 0.66 0.604 b 0.636 0.604 a 0.6136 0.60688 b 0.61072 0.608032 b 0.609568 0.608032 a 0.6084928 0.60844672 d 0.6084928 0.608478976 c 0.608488192 圖4.3 算術(shù)編碼過程 (4)以最后的當(dāng)前分析區(qū)間內(nèi)的任意一個(gè)數(shù)作為編碼輸出。例如本例就可以選擇0.608478976和0.6084817408之間的一個(gè)小數(shù)0.6084798作為信號(hào)的編碼輸出。4.4算術(shù)編碼的實(shí)現(xiàn)及評(píng)價(jià)4.4.1 編碼結(jié)果實(shí)驗(yàn)程序見附錄c實(shí)驗(yàn)結(jié)果如下:原始圖像大小 name size bytes class i 256x256 524288 uint8 arraygrand total is 196608 elements using 524288 bytes編碼圖像大小 name size bytes class j 256x256 196608 double arraygrand total is 65536 elements using 19

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論