版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
第三章
多媒體數(shù)據(jù)壓縮
3.1數(shù)據(jù)壓縮的
基本原理和方法3.1數(shù)據(jù)壓縮的基本原理和方法
壓縮的必要性音頻、視頻的數(shù)據(jù)量很大,如果不進行處理,計算機系統(tǒng)幾乎將無法對它進行存取和交換。文本:屏幕分辨率為1024×768,字符大小為8×8點陣,每個字符用兩個字節(jié)表示滿屏字符的數(shù)量為:(1024/8)×(768/8)=12288(個)存儲空間(字節(jié))為:12288×(2×8)=196688bit=24KB3.1數(shù)據(jù)壓縮的基本原理和方法矢量圖形:一幅由500條直線組成的矢量圖形,每條線的信息由起點X1,起點Y1,終點X2,終點Y2,屬性(線的顏色和寬度等性質(zhì))等五個項目表示。設(shè)屏幕大小為768×512,屬性位用1字節(jié)表示。每條線的存儲空間為:19×2+8=46bit一幅圖形需要的存儲空間為:500×46=2.8KB3.1數(shù)據(jù)壓縮的基本原理和方法點陣圖:一個簡單的全屏點陣圖,設(shè)屏幕大小為768×512,每點是256色(位深為8位)一屏點陣圖需要的存儲空間為:768×512×8/8→384KB將一張11英寸×8.5英寸的彩色照片掃描輸入計算機,掃描儀的分辨率設(shè)定為300dpi(點/英寸),每個像素的R、G、B分量分別為8位,掃描產(chǎn)生24位的真彩圖。存儲空間為:11×300×8.5×300×8×3/8→24.08MB3.1數(shù)據(jù)壓縮的基本原理和方法數(shù)字化聲音(語音):聲音的模擬帶寬為4KHz,采樣位數(shù):8bit,采樣頻率:8kHz1s聲音的存儲空間為:8k×8=64kbit=8KB
數(shù)字化高質(zhì)量音頻:聲音的模擬帶寬為22KHz,采樣位數(shù):32bit,采樣頻率:44KHz1s音頻的存儲空間為:44×32=1408kbit=176KB3.1數(shù)據(jù)壓縮的基本原理和方法數(shù)字化視頻(PAL制式):視頻帶寬為5MHz,幀速率為25幀/s,樣本寬是24bit,采樣頻率為10MHz,因而存儲一幀數(shù)字化的PAL制式視頻圖像需要的空間為:10÷25×24=9.6Mbit=1.2MB一秒種PAL制式的視頻圖像需要的存儲空間為:1.2×25=30MB3.1.2數(shù)據(jù)冗余的類型1.數(shù)據(jù)冗余的類型(1)空間冗余(2)時間冗余(3)信息墑冗余(4)視覺冗余(5)聽覺冗余(6)其他冗余——結(jié)構(gòu)冗余、知識冗余3.1.3數(shù)據(jù)壓縮技術(shù)的性能指標節(jié)省圖象或視頻的存儲容量,增加訪問速度,使數(shù)字視頻能在PC機上實現(xiàn),需要進行視頻和圖象的壓縮。評價一個壓縮系統(tǒng)的三個關(guān)鍵參數(shù)壓縮比圖象質(zhì)量壓縮和解壓的速度另外也必須考慮每個壓縮算法所需的硬件和軟件。3.1.3數(shù)據(jù)壓縮技術(shù)的性能指標
1.壓縮比壓縮性能常常用壓縮比定義(輸入數(shù)據(jù)和輸出數(shù)據(jù)比)例:512×480,24bit/pixel輸入=737280byte輸出15000byte
壓縮比=737280/15000=493.1.3數(shù)據(jù)壓縮技術(shù)的性能指標2.圖象質(zhì)量壓縮方法:無損壓縮(圖象質(zhì)量不變)有損壓縮有損壓縮:失真情況很難量化,只能對測試的圖象進行估計。模擬圖象質(zhì)量的指標:信噪比、分辨率、顏色錯,但必須在觀察了實際圖象以后。3.1.3數(shù)據(jù)壓縮技術(shù)的性能指標3.解壓縮速度在許多應用中,壓縮和解壓可能不同時用,在不同的位置不同的系統(tǒng)中。所以壓縮、解壓速度分別估計。靜態(tài)圖象中,壓縮速度沒有解壓速度嚴格;動態(tài)圖象中,壓縮、解壓速度都有要求,因為需實時地從攝像機或錄像機中抓取動態(tài)視頻。3.1.3數(shù)據(jù)壓縮技術(shù)的性能指標4.硬軟件系統(tǒng)有些壓縮解壓工作可用軟件實現(xiàn)。設(shè)計系統(tǒng)時必須充分考慮:算法復雜-壓縮解壓過程長算法簡單-壓縮效果差目前有些特殊硬件可用于加速壓縮/解壓。硬接線系統(tǒng)速度快,但各種選擇在初始設(shè)計時已確定,一般不能更改。因此在設(shè)計硬接線壓縮/解壓系統(tǒng)時必須先將算法標準化。數(shù)據(jù)冗余的例子你的妻子,Helen,將于明天晚上6點零5分在上海的虹橋機場接你。
(23*2+10=56個半角字符)你的妻子將于明天晚上6點零5分在虹橋機場接你。
(20*2+3=43個半角字符)Helen將于明晚6點在虹橋機場接你。
(10*2+7=27個半角字符)描述語言
1.
“這是一幅2×2的圖像,圖像的第一個像素是紅的,第二個像素是紅的,第三個像素是紅的,第四個像素是紅的”。
2.“這是一幅2×2的圖像,整幅圖都是紅色的”整理圖像的描述方法可以達到壓縮的目的圖像壓縮編碼的可能性圖像無損壓縮的原理RGBRGBRGBRGBRGBRGBRGBRGBRGBRGBRGBRGBRGBRGBRGBRGB16RGB從原來的16×3×8bit=284bit壓縮為:(1+3)×8bit=32bit圖像有損壓縮的原理36353434343434323434333730343434343434343435343431343434343434343434343434343434343434343434343434342534實際圖像中冗余信息的表現(xiàn)(灰度圖)數(shù)據(jù)冗余信息分析結(jié)論由于一幅圖像存在數(shù)據(jù)冗余和主觀視覺冗余,壓縮方式從這兩方面著手來開展1)數(shù)據(jù)冗余:將圖像信息的描述方式改變之后,壓縮掉這些冗余。如統(tǒng)計冗余度、空域冗余度、時域冗余度等2)主觀視覺冗余:忽略一些視覺不太明顯的微小差異,可以進行所謂的“有損”壓縮3.1.4數(shù)據(jù)壓縮方法分類2.數(shù)據(jù)壓縮技術(shù)分類根據(jù)解碼后數(shù)據(jù)與原始數(shù)據(jù)是否完全一致可以分為兩大類:熵編碼(冗余壓縮法),也稱無損壓縮法、無失真壓縮法。由于不會失真,多用于文本、數(shù)據(jù)的壓縮,但也有例外,非線性編輯系統(tǒng)為了保證視頻質(zhì)量,有些高檔系統(tǒng)采用的是無失真壓縮方法。熵壓縮法,也稱有損壓縮法、有失真壓縮法。大多數(shù)圖像、聲音、動態(tài)視頻等數(shù)據(jù)的壓縮是采用有失真壓縮。3.1.4數(shù)據(jù)壓縮方法分類從信息語義角度分為“熵(平均信息量)編碼”和“源編碼”兩種:熵(平均信息量)編碼(EntropyCoding)
熵編碼是一種泛指那些不考慮被壓縮信息的性質(zhì)的編碼和壓縮技術(shù)。它是基于平均信息量的技術(shù)把所有的數(shù)據(jù)當作比特序列,而不根據(jù)壓縮信息的類型優(yōu)化壓縮。熵編碼分為:重復序列消除編碼(含:消零、行程編碼)統(tǒng)計編碼3.1.4數(shù)據(jù)壓縮方法分類源編碼(SourceCoding)
源編碼的冗余壓縮取決于初始信號的類型、前后的相關(guān)性、信號的語義內(nèi)容等。源編碼比嚴格的平均信息量編碼的壓縮率更高。
源編碼主要分為:預測編碼變換編碼向量量化3.1.5常用數(shù)據(jù)壓縮方法的基本原理1.統(tǒng)計編碼
其方法是識別一個給定的流中出現(xiàn)頻率最高的比特或字節(jié)模式,并用比原始比特更少的比特數(shù)來對其編碼。若碼流中所有模式出現(xiàn)的概率相等,則平均信息量最大,信源就沒有冗余。(1)行程編碼(RunLengthCoding)(2)LZW編碼(3)哈夫曼編碼(4)算術(shù)編碼(1)行程編碼(RunLengthCoding)
行程編碼(RLE,Run-lengthencoding)是一種非常簡單的數(shù)據(jù)壓縮編碼形式。它基于簡單的編碼數(shù)據(jù)原則,這個原則就是,重復的數(shù)據(jù)值序列(或稱為“流”)用一個重復次數(shù)和單個數(shù)據(jù)值來代替。這里,重復的值稱為一個“連續(xù)”(run)。
Huffman編碼Huffman編碼的步驟:(1)概率統(tǒng)計,得到n個不同概率的信息符號;(2)將n個信源信息符號的n個概率,按概率大小排序;(3)將n個概率中,最后兩個小概率相加,這時概率個數(shù)減為n-1個;(4)將n-1個概率,按大小重新排序;(5)重復(3),將新排序后的最后兩個小概率相加,相加和與其余概率再排序;(6)如此反復重復n-2次,得到只剩兩個概率序列;(7)以二進制碼元(0,1)賦值,構(gòu)成哈夫曼碼字,編碼結(jié)束。3.1.5常用數(shù)據(jù)壓縮方法的基本原理霍夫曼編碼舉例現(xiàn)在有7個待編碼的符號,它們的概率如下表所示,使用霍夫曼編碼算法求出7個符號所分配的代碼。(寫出編碼樹)待編碼的符號X1X2X3X4X5X6X7概率0.350.200.150.100.100.060.043.1.3常用數(shù)據(jù)壓縮方法的基本原理2.預測編碼(PredictionCoding)
預測編碼是指利用前面的一個或多個信號對下一個信號進行預測,然后對實際值和預測值的差進行編碼。典型的預測編碼有兩種:(1)差分脈碼調(diào)制(DPCM)(2)自適應差分脈碼調(diào)制(ADPCM)差分脈碼調(diào)制(DPCM)
在PCM系統(tǒng)中,原始的模擬信號經(jīng)過采樣后得到的每一個樣值都被量化成為數(shù)字信號。為了壓縮數(shù)據(jù),可以不對每一樣值都進行量化,而是預測下一樣值,并量化實際值與預測值之間的差值,這就是DPCM(DifferentialPulseCodeModulation,差分脈沖編碼調(diào)制)。1952年貝爾(Bell)實驗室的C.C.Cutler取得了差分脈沖編碼調(diào)制系統(tǒng)的專利,奠定了真正實用的預測編碼系統(tǒng)的基礎(chǔ)。
預測編碼的基本原理鄰近的M個值預測當前值,當前值與預測值之差量化編碼3.1.3常用數(shù)據(jù)壓縮方法的基本原理3.變換編碼(TransformationCoding)
在變換編碼時,初始數(shù)據(jù)要從初始空間或時間域進行數(shù)學變換,變換為一個更適于壓縮的抽象域。該過程是可逆的;即使用反變換可恢復原始數(shù)據(jù)。如將時域信號變換到頻域,因為聲音、圖像大部分信號都是低頻信號,在頻域中信號的能量較集中,再進行采樣、編碼就可以壓縮數(shù)據(jù)(1)最佳變換(K-L變換)(2)離散余弦變換(DCT變換)DCT的原理
離散余弦變換(DiscreteCosineTransform,DCT)是一種實數(shù)域變換,其變換核為實數(shù)余弦函數(shù)。對一幅圖像進行離散余弦變換后,許多有關(guān)圖像的重要可視信息都集中在DCT變換的一小部分系數(shù)中。因此,離散余弦變換(DCT)是有損圖像壓縮JPEG的核心,同時也是所謂“變換域信息隱藏算法”的主要“變換域(DCT域)”之一。因為圖像處理運用二維離散余弦變換,所以直接介紹二維DCT變換。
分析DCT系數(shù)的性質(zhì)下面以lenna圖像為例,利用DCT變換函數(shù)得到的DCT系數(shù)的性質(zhì)。我們只取R層的DCT系數(shù)矩陣進行分析。下圖顯示了變化的結(jié)果,其中DCT系數(shù)用光譜的形式給出,直觀的表明了低頻和高頻系數(shù)的分布規(guī)律。
分析DCT系數(shù)的性質(zhì)
3.1.3常用數(shù)據(jù)壓縮方法的基本原理典型的變換編碼系統(tǒng)框圖:信源序列變換變換域采樣量化編碼存儲或傳輸譯碼填零反變換再現(xiàn)序列變換編碼系統(tǒng)壓縮數(shù)據(jù)的三個步驟3.1.3常用數(shù)據(jù)壓縮方法的基本原理4.分析合成編碼通過對原始數(shù)據(jù)分析,將其分解為一系列更適合于表示的基元或從中提取出更有本質(zhì)意義的參數(shù),僅對這些基本單元或者特征參數(shù)進行編碼,而解碼時則借助于一定的規(guī)則或者模型,按照一定的算法將這些基元或者參數(shù)再綜合成逼近原始數(shù)據(jù)的結(jié)果。矢量量化小波變換編碼分形編碼子帶編碼
3.2音頻的壓縮3.2音頻的壓縮音頻頻率范圍
低頻聲音(Infra-sound):0Hz-20Hz
人類聽覺頻率范圍的聲音:20Hz-20kHz
高頻(Ultrasound):20kHz-1GHz
超聲波(Hypersound):1GHz-10THz不同音頻的帶寬
電話語音:
200Hz-3.4kHz
調(diào)幅廣播:50Hz-7kHz
調(diào)頻廣播:20Hz-15kHz
寬帶音響:20Hz-20kHz3.2.1音頻壓縮編碼的基本方法無失真壓縮音頻壓縮方法有失真壓縮Huffman編碼行程編碼波形編碼參數(shù)編碼混合編碼全頻帶編碼PCMDPCMADPCM子帶編碼自適應變換編碼ATC
心理學模型矢量量化線性預測LPC矢量和激勵線性預測VSELP多脈沖線性預測MP-LPC碼本激勵線性預測CELP調(diào)幅廣播與調(diào)頻廣播介紹隨著生活水平的提高,人們對只能收聽中波調(diào)幅廣播的收音機已經(jīng)不滿足了,在選購收音機時,要求具備調(diào)頻、調(diào)幅兩種功能的產(chǎn)品。那么電臺為什么要用調(diào)頻、調(diào)幅兩種不同的方式進行廣播?調(diào)頻廣播與調(diào)幅廣播各有什么特點,又有什么區(qū)別?無線電廣播是依靠空間的高頻電磁波來傳播節(jié)目的。高頻電磁波并不含有任何信息,只起了“運載工具”的作用。因此,又稱它為載波。平時講的中央人民廣播電臺的頻率為540千赫、上海人民廣播電臺的頻率為990千赫,就是載波的頻率。要傳送的廣播節(jié)目的頻率要比載波的頻率低得多,在30赫~15000赫之間,稱為音頻信號或低頻信號。低頻信號是傳不遠的。必須設(shè)法把它與高頻載波疊加起來,才能達到遠傳的目的。這種疊加的過程,稱它為調(diào)制。
常用的調(diào)制方式有兩種:當高頻振蕩的幅度隨著音頻信號的大小變化而變化,這種調(diào)制方式稱為調(diào)幅。如果被高頻振蕩的頻率隨著音頻信號的大小變化而變化,這種調(diào)制方式稱為調(diào)頻。
調(diào)幅的特點是載波的頻率始終不變,而載波幅度變化的形狀與音頻信號變化的形態(tài)一樣。我們把幅度變化的軌跡稱作包絡線。從圖1中可以看出,包絡線的形狀與音頻信號是相同的。被音頻信號調(diào)制后的載波,稱已調(diào)波。我國中波調(diào)幅廣播的頻率范圍為535~1605千赫。為了在有限的廣播頻率段中,既要防止臨近頻率電臺相互干擾,又要設(shè)置更多的電臺數(shù)目,只能壓縮每個電臺的頻帶寬度。國際上規(guī)定中波廣播的頻道間隔為9千赫。即每一電臺的頻帶寬度限制于9千赫之內(nèi)。調(diào)幅廣播的不足是抗干擾能力差.調(diào)頻的特點是載波的幅度始終不變,而它的頻率則隨著音頻信號大小在變化。如圖
所示:當音頻信號增強的時候,頻率變高,波形就密;當音頻信號減弱的時候,頻率變低,波形就疏。調(diào)頻波的頻譜要比調(diào)幅波復雜得多。每個電臺所占頻帶寬寬為200千赫所以調(diào)頻電臺的節(jié)目聽起來要比調(diào)幅廣播高音豐富、清晰、逼真。特別是在聆聽立體聲高保真音樂節(jié)目。
調(diào)頻廣播的另一個特點是抗干擾能力強。因為干擾主要是影響載波的幅度,對載波的頻率幾乎沒有影響。因此在接收機中用限幅器很容易將干擾消除掉。參見圖
。3.2.2電話質(zhì)量的語音壓縮標準ITU-TS建議的語音壓縮的標準G.711:采用PCM(脈沖)編碼,采樣速率為8kHz,量化位數(shù)為8bit,對應的比特流速率為64kbit/sG.721:
將64Kbps的比特流轉(zhuǎn)換為32Kbps的流,它是基于ADPCM(自適應音頻脈沖編碼)技術(shù)。每個數(shù)值差分用4位編碼,其采樣率為8kHzG.723:以24Kbps運行的基于ADPCM的有損耗壓縮標準。其音質(zhì)不如非壓縮的G.711PCM標準以及基于SB-ADPCM的G.722標準3.2.2電話質(zhì)量的語音壓縮標準G.728:采用低延遲代碼激勵線性預測(LD-CELP)的向量量化技術(shù)。其比特率為16Kbps,帶寬限于3.4kHz。其音質(zhì)比G.711或G.722差得多CELP是一種常用的語音壓縮技術(shù)。它用于美國聯(lián)邦標準1016,可將語音壓縮至4.8Kbps。美國聯(lián)邦標準1015使用CELP的一個簡本,稱為線性預測編碼(LPC)。LPC-10E標準可以運行于2.4Kbps。采用了一種向量量化方法。聲音聽起來有點象機器在說話,但4.8Kbps與電話差不多3.2.3調(diào)幅廣播質(zhì)量的音頻壓縮標準調(diào)幅廣播質(zhì)量:50Hz-7kHz,稱“7kHz音頻信號”G.722:基于子帶ADPCM技術(shù)(SB-ADPCM),是將現(xiàn)有的帶寬分成兩個獨立的子帶信道分別采用差分脈碼調(diào)制算法G.722壓縮信號的帶寬范圍為50Hz到7kHz,而G.711僅限于3.4kHz。其比特率為48、56、64Kbps,在標準模式下,采樣速率是16KHz,幅度深度為14比特3.2.4高保真立體聲音頻壓縮標準高質(zhì)量的聲音信號頻率范圍:50Hz-20kHz目前國際上比較成熟的高質(zhì)量聲音壓縮標準為MPEG音頻MPEG-1的音頻信號在ISO11172-3文檔中的描述。MPEG音頻不是單個一種壓縮算法,而是3種音頻編碼和壓縮方案的一個系列
MPEG聲音編碼分為:層-1、層-2、層-3。隨著層數(shù)的增加算法的復雜度也增大3.2.4高保真立體聲音頻壓縮標準所有3層都分級兼容。最復雜的譯碼器(即在層-3工作的譯碼器)也可對層-2或?qū)?l的碼流進行譯碼所有3層均運用變換編碼和子帶編碼頻譜被分為32個子帶應用快速博里葉變換來表示高頻域中的信號應用心理聲學模式來變換信號以估計剛能引起注意的噪音級層1、2和3主要在最后一個階段——即量化階段的方式上有所區(qū)別,但不是唯一的差別。3.3圖像和視頻的壓縮圖像和動畫的存儲方式是一個很重要的問題。幸好我們有了數(shù)據(jù)壓縮,有了JPEG等多種壓縮存儲圖像的文件格式,我們今天才能夠拿著小小的一個存儲器,卻存上許多張色彩鮮艷的圖片。如果沒有圖像壓縮算法,也許我們的多媒體時代就會晚到來許多年。3.3.1圖像和視頻壓縮編碼的基本方法圖像和視頻壓縮方法無失真壓縮有失真壓縮Huffman編碼行程編碼算術(shù)編碼LZW編碼預測編碼運動補償變換編碼DCT變換小波變換子帶編碼模型編碼分形編碼基于重要性濾波子采樣矢量量化混合編碼JPEGMPEGH.2613.3.2靜止圖像壓縮標準靜止圖像壓縮的國際標準:ISO制訂的JPEG標準、JBIG標準ITU-T的G3標準、G4標準JPEG標準適用于黑白及彩色照片、彩色傳真和印刷圖片,可以支持很高的圖像分辨率和量化精度3.3.2靜止圖像壓縮標準1.JPEG壓縮標準壓縮比高,圖像質(zhì)量保真程度好適應不同的數(shù)字圖像參數(shù)、大小、圖像內(nèi)容、彩色空間、統(tǒng)計特性等,但不包括二值圖像用戶可以對壓縮比、質(zhì)量效果進行選擇應該滿足硬軟件實現(xiàn)的計算需求支持多種操作方式JPEG圖像存儲格式一個比較成熟的圖像壓縮格式,雖然一個圖片經(jīng)過轉(zhuǎn)化為JPEG圖像后,一些數(shù)據(jù)會丟失,但是,人眼是很不容易分辨出來這種差別的。也就是說,JPEG圖像存儲格式既滿足了人眼對色彩和分辨率的要求,又適當?shù)娜コ藞D像中很難被人眼所分辨出的色彩,在圖像的清晰與大小中JPEG找到了一個很好的平衡點。JPEG文件的格式是分為一個一個的段來存儲的,段的多少和長度并不是一定的。只要包含了足夠的信息,該JPEG文件就能夠被打開,呈現(xiàn)給人們。JPEG文件的每個段都一定包含兩部分一個是段的標識,它由兩個字節(jié)構(gòu)成:第一個字節(jié)是十六進制0xFF,第二個字節(jié)對于不同的段,這個值是不同的。3.3.2靜止圖像壓縮標準(1)JPEG的無損預測編碼算法無損壓縮中采用一個簡單的預測器。預測器可以采用不同的預測方法,不同的預測方法將決定有哪些相鄰的象素將被用于預測下一個象素。常用的預測方法如三鄰域預測法。源圖像數(shù)據(jù)預測器熵編碼器壓縮的圖像數(shù)據(jù)表說明3.3.2靜止圖像壓縮標準(2)JPEG基于DCT的有損編碼算法8*8DCT正變換量化器熵編碼器壓縮后的圖像數(shù)據(jù)JPEG編碼器表說明表說明塊準備源圖像數(shù)據(jù)3.3.2靜止圖像壓縮標準塊準備:塊準備將一幀幀圖像分成8×8的數(shù)據(jù)塊DCT變換:原始的圖像數(shù)據(jù)塊經(jīng)過DCT變換后,將每個數(shù)據(jù)塊的數(shù)據(jù)從空間域變換到頻率域,輸出64個DCT變換系數(shù)
量化:JPEG的量化采用線性均勻量化器DCT系數(shù)的編碼:JPEG中對DC系數(shù)采用DPCM編碼,64個AC系數(shù)在JPEG算法中采用行程編碼熵編碼:經(jīng)過DPCM編碼的直流項和經(jīng)過行程編碼的交流項再進行霍夫曼編碼或自適應二進制算術(shù)編碼3.3.2靜止圖像壓縮標準壓縮比和圖像質(zhì)量基于DCT(離散余弦變換)的JPEG標準的壓縮是有失真的,DCT變換后系數(shù)的量化是引起失真的主要原因壓縮效果與圖像內(nèi)容本身有較大的關(guān)系,對于中等復雜程度的彩色圖像,其壓縮比與恢復圖像的質(zhì)量大致如下表所示3.3.2靜止圖像壓縮標準壓縮效果(比特/象素)質(zhì)量0.25~0.50中~好,滿足某些應用0.50~0.75好~很好,滿足多數(shù)應用0.75~1.5極好,滿足大多數(shù)應用1.5~2.0與原始圖像幾乎分不出3.3.2靜止圖像壓縮標準2.JPEG2000簡介
JPEG2000的原理JPEG2000與傳統(tǒng)JPEG最大的不同,在于它放棄了JPEG所采用的以離散余弦轉(zhuǎn)換(DiscreteCosineTransform)為主的區(qū)塊編碼方式,而采用以小波轉(zhuǎn)換(Wavelettransform)為主的多解析編碼方式。小波轉(zhuǎn)換的主要目的是要將圖像的頻率成分抽取出來3.3.2靜止圖像壓縮標準
JPEG2000的優(yōu)點1、壓縮率比JPEG約高30%
左右2、同時支持有損和無損壓縮,適合保存重要圖片3、能實現(xiàn)漸進傳輸,這是其一個極其重要的特征。即GIF格式圖像的“漸現(xiàn)”特性。它先傳輸圖像的輪廓,然后逐步傳輸數(shù)據(jù),不斷提高圖像質(zhì)量,讓圖像由朦朧到清晰顯示,而不必是像現(xiàn)在的JPEG一樣,由上到下慢慢顯示4、支持所謂的“感興趣區(qū)域”特性,可以任意指定圖像上感興趣區(qū)域的壓縮質(zhì)量,還可以選擇指定的部份先解壓縮,可以很方便的突出重點3.3.2靜止圖像壓縮標準
JPEG2000的應用JPEG2000的應用領(lǐng)域可概略分成兩部分,一為傳統(tǒng)JPEG的市場,如打印機,掃描儀,數(shù)碼相機等;一為新興應用領(lǐng)域,如網(wǎng)絡傳輸,無線通訊,醫(yī)療圖像等
JPEG2000和JPEG相比優(yōu)勢明顯,且可向下兼容,取代傳統(tǒng)的JPEG格式目前對JPEG2000熱情最大的是那些數(shù)字照相機廠商
3.3.3視頻壓縮標準視頻壓縮的一個重要標準是MPEG(MotionPictureExpertsGroup),已推出了MPEG(或MPEG-Ⅰ)、MPEG-Ⅱ、MPEG-4等系列標準,新的標準MPEG-7、MPEG-21等標準也在醞釀之中另一個重要標準是H系列,包括H.261、H.263等標準,此外還有運動JPEG等壓縮標準3.3.3視頻壓縮標準1.MPEG-1壓縮標準能夠傳輸用戶可以接受的視頻能夠支持對稱或者非對稱的壓縮解壓應用根據(jù)需要可以支持隨機存取根據(jù)需要支持快進、快倒、快放等多種工作方式能夠支持視頻和音頻的同步工作能夠避免出現(xiàn)大的障礙可以控制壓縮解壓的延遲可以具有編輯能力能夠以靈活的格式支持窗口視頻演示不排斥使用價格低廉又能夠?qū)崟r編碼的芯片3.3.3視頻壓縮標準MPEG-Ⅰ標準的目標是以約1.5Mbps的速率傳輸電視質(zhì)量的視頻信號,亮度信號的分辨率為360×240,色度信號的分辨率為180×120,每秒30幀MPEG-Ⅰ標準包括:MPEG系統(tǒng)(ISO/IEC11172-1)MPEG視頻(ISO/IEC11172-2)MPEG音頻(ISO/IEC11172-3)測試驗證(ISO/IEC11172-4)MPEG涉及的問題是視頻壓縮、音頻壓縮及多種壓縮數(shù)據(jù)流的復合和同步問題MPEG-Ⅰ視頻壓縮技術(shù)以兩個基本技術(shù)為基礎(chǔ)的.一個是基于子塊的運動補償,可減少幀序列的時域冗余度。二是基于DCT的壓縮技術(shù),減少空域冗余度。運動補償一個視頻序列包含一定數(shù)量的圖片--通常稱為幀相鄰的圖片通常很相似,包含了很多冗余。使用運動補償?shù)哪康氖峭ㄟ^消除這種冗余,來提高壓縮比。運動補償是一種描述相鄰幀差別的方法,具體來說是描述前面一幀的每個小塊怎樣移動到當前幀中的某個位置去。
運動補償最早的運動補償?shù)脑O(shè)計只是簡單的從當前幀中減去參考幀,從而得到通常含有較少能量(或者稱為信息)的“殘差”,從而可以用較低的碼率進行編碼。解碼器可以通過簡單的加法完全恢復編碼幀。運動補償有兩種算法:運動補償預測法
畫面上的運動部分在幀與幀之間必然有連續(xù)性,預測法根據(jù)這一特性,將當前的圖像畫面看作是前面某時刻圖像的位移,位移的幅度和方向在圖像畫面的各處可有不同。
運動補償插補法
用插補的方法進行運動的補償,可以大幅度地壓縮運動圖像的信息。
3.3.3視頻壓縮標準2.MPEG-Ⅱ壓縮標準MPEG-Ⅱ標準包括MPEG系統(tǒng)、MPEG視頻、MPEG音頻和一致性四大部分內(nèi)容,是運動圖像及其伴音的通用編碼國際標準MPEG-Ⅱ壓縮標準克服并解決了MPEG-Ⅰ標準不能滿足的日益增長的多媒體技術(shù)、數(shù)字電視技術(shù)、多媒體分辨率和傳輸率等方面的技術(shù)要求的缺陷3.3.3視頻壓縮標準MPEG-Ⅱ系統(tǒng)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 《社區(qū)足球賽方案》課件
- 《汽車客運站調(diào)研》課件
- 2024年黑龍江林業(yè)職業(yè)技術(shù)學院單招職業(yè)技能測試題庫完整答案
- 單位管理制度集合大全【人事管理篇】
- 《綜合分析觀點類》課件
- 單位管理制度匯編大全【人員管理】
- 2024的前臺工作計劃(35篇)
- 單位管理制度范文大合集【職工管理篇】
- 單位管理制度范例匯編【人員管理篇】十篇
- 《禽流感的預防措施》課件
- 2023-2024學年廣東省深圳市羅湖區(qū)八年級上學期期末生物試題
- 2025年醫(yī)院保衛(wèi)科工作總結(jié)及2025年工作計劃
- 班會課件高中
- 部編版一年級上冊語文第一單元-作業(yè)設(shè)計
- 安全生產(chǎn)泄漏課件
- 陜西省西安市高新第一中學2023-2024學年八年級上學期期末歷史試題
- 中建履帶吊安拆安全專項施工方案
- 眼鏡銷售儀容儀表培訓
- 扁桃體術(shù)后出血的應急預案
- 醫(yī)生或醫(yī)技崗位招聘面試題與參考回答(某大型國企)2024年
- 人教PEP版(一起)(2024)一年級上冊英語全冊教案(單元整體教學設(shè)計)
評論
0/150
提交評論