視頻信號的獲取與處理_第1頁
視頻信號的獲取與處理_第2頁
視頻信號的獲取與處理_第3頁
視頻信號的獲取與處理_第4頁
視頻信號的獲取與處理_第5頁
已閱讀5頁,還剩71頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第3章MULTIMEDIATECHNOLOGY主講教師:何源多媒體技術(shù)視頻信號的獲取與處理第3

章3.1圖像的數(shù)字化3.2

顏色的基本概念

3.2.1顏色的基本知識

3.2.2顏色空間表示

3.2.3顏色空間從技術(shù)角度的分類3.3圖形圖像數(shù)據(jù)表示

3.3.1數(shù)字圖像類型

3.3.21位圖

3.3.38位灰度圖

3.3.424位彩色圖像

3.3.58位彩色圖像

3.3.6其它圖像數(shù)據(jù)類型

3.3.7色彩模式的轉(zhuǎn)換3.4

常見靜態(tài)圖像文件格式3.5常見動態(tài)圖像文件格式3.6

多媒體數(shù)據(jù)壓縮技術(shù)

3.6.1

信息、數(shù)據(jù)與編碼

3.6.2數(shù)據(jù)壓縮的條件

3.6.3數(shù)據(jù)壓縮算法

1圖像的數(shù)字化3.1圖像的數(shù)字化

圖像數(shù)字化:將模擬式的連續(xù)圖像離散化,轉(zhuǎn)換為數(shù)字圖像,是數(shù)字圖像處理的先決條件。

模擬圖像:日常生活中見到的各種照片、圖片、廣告畫等一般是連續(xù)形式的模擬圖像。

數(shù)字圖像:計(jì)算機(jī)能處理的,以數(shù)字格式存儲的圖像。圖像數(shù)字化過程:“采樣”和“量化”。圖像數(shù)字化后表示形式:

連續(xù)圖像數(shù)字化后,用由離散量組成的一個矩陣g(i,j)表示。

g(1,1)g(1,2)……g(1,N)g(2,1)g(2,2)……g(2,N)G=

……

……

g(M,1)g(M,2)……g(M,N)矩陣中每個元素稱為像素或圖像元素。g(i,j)代表點(diǎn)(i,j)的灰度值,即亮度值。幾點(diǎn)說明:①

g(i,j)取值范圍:0<g(i,j)<∞。②

數(shù)字化采樣一般是按正方形點(diǎn)陣取樣。如圖:采樣網(wǎng)格:③

表示形式

黑白圖像:g(i,j),g(i,j)的值是點(diǎn)(i,j)的灰度級值;

彩色圖像:g(i,j,λ),“λ”是波長,反映色彩變化;

運(yùn)動圖像(時間域上連續(xù)的圖像):

g(i,j,λ,t),“t”反映時間變化。2采樣

圖像在空間的離散化,用空間上部分點(diǎn)的灰度值代表圖像,這些點(diǎn)稱為采樣點(diǎn)。采樣步驟(靜態(tài)圖像):①

先沿垂直方向,按一定間隔取出各水平線上灰度值的一維掃描;②

對一維掃描線信號沿水平方向,按一定間隔,取出垂直線的灰度值,得到離散信號。運(yùn)動圖像:先在時間軸上采樣,再進(jìn)行靜態(tài)圖像的采樣。采樣示意圖采樣時,若每行像素為M個,每列像素為N個,則圖像大小為M×N個像素。采樣定理:若采樣頻率是圖像變化頻率的兩倍,就能無失真重建原圖。一般,圖像中細(xì)節(jié)越多,采樣間隔應(yīng)該越小。采樣列采樣行像素行間隔采樣列間隔3量化

把采樣后所得的各像素的灰度值或顏色樣本從模擬量轉(zhuǎn)換到離散量的過程。連續(xù)灰度值Z

灰度標(biāo)尺Zi+1ZiZi-1qi+1qiqi-1量化值q(整數(shù))灰度量化255254…128127…10量化為8bit二進(jìn)制數(shù)3.2顏色的基本概念3.2.1顏色的基本知識1人類視覺系統(tǒng)工作原理眼睛的工作原理與照相機(jī)一樣,鏡頭聚焦在圖像上,并投射在視網(wǎng)膜上(上下和左右顛倒)。桿狀細(xì)胞產(chǎn)生圖像的灰色陰影,錐體細(xì)胞產(chǎn)生顏色信號;眼中錐體細(xì)胞約6百萬個,分為紅、綠、藍(lán)三種;

R、G、B三種錐體細(xì)胞比例約:40:20:1,由此產(chǎn)生的非彩色信號比例約:2R+G+B/20

眼睛錐體細(xì)胞對光譜敏感度函數(shù)通常不用RGB等字母來表示。一個波長為λ的激光可以刺激一定數(shù)量的神經(jīng)細(xì)胞,產(chǎn)生反應(yīng)。說明:

E(λ):光源函數(shù)

S(λ):反射函數(shù)

C(λ):顏色信號,

C(λ)=E(λ)S(λ)●

qR,G,B(λ):錐體細(xì)胞光譜敏感度函數(shù)2顏色的三特性

●色調(diào)(Hue)顏色的外觀,用于區(qū)別顏色種類,反映該顏色最接近什么樣的光譜波長。如:紅、橙、黃、綠、青、藍(lán)、紫??梢姽獠ㄩL范圍:380~780nm

飽和度(Saturation)顏色的純度,反映顏色中灰色成分的多少?;疑煞衷缴?,飽和度越高,顏色越深。

亮度(Brightness)顏色中光的強(qiáng)度。亮度越低,越接近黑色;反之,則對應(yīng)白色。顏色紡錐體亮度公式

Y——白;R——紅;

G——綠;B——藍(lán)●

NTSC彩色電視制式:

Y=0.299R+0.587G+0.114B●

PAL電視制式:

Y=0.222R+0.707G+0.071B色調(diào)不同:飽和度不同:亮度不同:3三種互補(bǔ)色三種基色:紅(R)、綠(G)、藍(lán)(B)

國際標(biāo)準(zhǔn)照明委員會CIE規(guī)定三原色光波長:紅色——700nm綠色——546.1nm

藍(lán)色——435.8nm三色原理:自然界的所有色彩都可以由三原色按不同的比例混合得到。三種原色是互相獨(dú)立的,它們中任何一種顏都不能用另外兩種顏色混合得到。三種互補(bǔ)色:紅——青(Cyan)綠——品紅(Magenta)藍(lán)——黃(Yellow)3.2.2顏色空間表示

顏色空間:人們組織和表示顏色的方法,也稱顏色度量體系、顏色制或顏色體制。3.2.3顏色空間從技術(shù)角度的分類從技術(shù)角度分:1)計(jì)算機(jī)圖形顏色空間如:RGB、CMYK、HSB、HIS等2)電視系統(tǒng)顏色空間如:YUV、YIQ等3)與設(shè)備無關(guān)的顏色空間如:CIELab、CIEXYZ等1CRT顯示器的RGB顏色模型

利用R、G、B三種基色光按不同的比例相加產(chǎn)生顏色。稱為“相加混色模式”。

配色方程式:

F=r[R]+g[G]+b[B]

說明:F表示任意彩色光;

r、g、b表示三種基色所占比例,r+g+b=1;

r[R]、g[G]、b[B]為構(gòu)成F色光的三色分量。2相減混色顏色空間:CMY顏色模型

相減混色顏色空間

印刷、彩色打印機(jī)采用的顏色空間。利用CMYK四種顏色光線相減產(chǎn)生顏色,稱為“相減混色模式”。2相減混色顏色空間:CMY顏色模型

RGB到CMY的轉(zhuǎn)換

RGB→CMY公式:CMY→RGB公式:

3視頻中的顏色模型

目前世界上流行的三種彩色電視制式:●

NTSC制:“正交平衡調(diào)幅制”,1952年美國制定。美國、加拿大、日本、韓國、臺灣采用。●

PAL制:“逐行倒相正交平衡調(diào)幅制”,1962年西德制定。德國、英國、中國、朝鮮等采用?!?/p>

SECAM制:“順序傳送彩色與存儲制”,法國制定。法國、前蘇聯(lián)及東歐國家采用。不同的電視制式采用的顏色空間不同:

PAL和SECAM制:采用YUV顏色空間

NTSC制:采用YIQ顏色空間

數(shù)字電視系統(tǒng):采用YCrCb或Y‘PbPr顏色空間4CIE顏色系統(tǒng)

CIE召開的顏色科學(xué)史上兩次重要會議:

第一次會議(1931年):

StandardObserver標(biāo)準(zhǔn):用顏色匹配函數(shù)表示

StandardIlluminants

●CIEXYZ基色系統(tǒng)

CIExyY

顏色空間

CIE色度圖(CIEchromaticitydiagram)

第二次會議(1976年):

CIE1976L*a*b*ColorModel(或CIELAB)

CIELUV

CIE色度圖

將每個三色矢量(X,Y,Z)值投影在連接(0,0,1),(0,1,0),(1,0,0)三點(diǎn)所形成的平面上,形成CIE色度圖。EE說明:1、圖中間E點(diǎn)位置,坐標(biāo)(0.33,0.33),是一個典型的白點(diǎn)(whitepoint)。2、光譜軌跡上的色度(如圖所示“馬蹄狀”)是最飽和的純色彩。最接近白點(diǎn)的顏色是比較不飽和的顏色。CIE1976年的重要成果

以“對色視覺理論為基礎(chǔ):基色有紅、黃、綠和藍(lán)四種,分別組成紅-綠、黃-藍(lán)兩對對立色調(diào),而黑-白是另外一對。5L*a*b*顏色系統(tǒng)以“對色視覺理論(opponentcolortheoryofvision)”為基礎(chǔ):基色有紅、黃、綠和藍(lán)四種,分別組成紅-綠、黃-藍(lán)兩對對立色調(diào),而黑-白是另外一對。對色視覺理論定義顏色空間:

L*:光亮度,值從0~100a*:紅-綠軸,值從0~10b*:黃-藍(lán)軸,值從0~106超出范圍的顏色對超出范圍顏色的處理方法:方法一:利用最接近范圍內(nèi)可用的色彩,如下圖;方法二:挑選接近的互補(bǔ)色。7YUV顏色模型

YUV編碼方式

:①Y——亮度信號

YUV將一個亮度信號編碼,即Y'。②U,V——色差信號色差是在相同亮度下,彩色與參考白色的差異,分別用U,V表示兩個彩色分量。

說明:●亮度信號Y構(gòu)成黑白灰度圖;●色差U,V信號分別構(gòu)成的兩幅單色圖●

圖案彼此是相互獨(dú)立的。YUV信號轉(zhuǎn)換過程:彩色圖像信號RGB信號

R0G0B0三分量信號

亮度信號Y、色差信號R-Y和B-YYUV信號

分色棱鏡分解放大、γ校正

矩陣變換

編碼

同一信道發(fā)送

RGB與YUV顏色空間的轉(zhuǎn)換關(guān)系:(4.27)(4.28)

YUV定義U、V兩個色差信號分別為:RGB與YUV之間非線性信號轉(zhuǎn)換關(guān)系:亮度和色度分離的優(yōu)點(diǎn):

1)亮度信號Y和色差信號U、V相對獨(dú)立,可以在黑白電視上接收彩色電視信號。

2)能更有效地壓縮圖像的數(shù)據(jù)量。人眼對彩色圖像分辯力低于亮度分辨力,對彩色信號可采用較低的壓縮比。常用壓縮比:

①Y:U:V=8:4:4

每個亮度信號Y用一個字節(jié)(256級)表示;每兩個U、V色差信號用一個字節(jié)表示;

②Y:U:V=8:2:2

每個亮度信號Y用一個字節(jié)(256級)表示;每四個U、V色差信號用一個字節(jié)表示;8YIQ顏色模型

YIQ編碼方式

:①

Y——亮度信號②

I,Q——色差信號

說明:●

Y’不變;●

I及Q是將U、V旋轉(zhuǎn)33度后的值;●

如下頁圖所示。9YCbCr顏色模型一個國際性的標(biāo)準(zhǔn)清晰度電視圖像數(shù)字化標(biāo)準(zhǔn)。由于Recommendation601標(biāo)準(zhǔn)定義了8-bit的編碼,最大Y’值只有219,最小值+16,CbandCr有正負(fù)112的范圍,還有位移的范圍是+128。假使R’、G’、B’是界于[0,+1]的浮點(diǎn)數(shù),然后我們可以獲得Y’,Cb,Cr在[0,255]之間的值。3.3圖形圖像數(shù)據(jù)表示3.3.1數(shù)字圖像類型真彩色圖像(TrueColor)索引色圖像(IndexColor)灰度圖(GrayScale)線畫稿(LineArt)靜態(tài)圖動態(tài)圖位圖(Bitmap)矢量圖(Vector)①矢量圖(Vector):用一系列繪圖指令,通過數(shù)學(xué)方式繪制的曲線及其它幾何體組成的圖形。

優(yōu)點(diǎn):文件數(shù)據(jù)量很小;圖像質(zhì)量與分辨率無關(guān);易于對各個成分進(jìn)行移動、縮放、旋轉(zhuǎn)和扭曲等變換,適于描述由多種比較規(guī)則的圖形元素構(gòu)成的圖形。

缺點(diǎn):圖像不很逼真,不易制作色彩變化豐富的圖像;不易在不同的軟件間交換文件。

矢量圖文件格式:3DS,DXF,WMF等。②位圖(Bitmap):通過像素點(diǎn)表示的圖像。每個像素點(diǎn)具有顏色屬性和位置屬性??蓮臄?shù)碼相機(jī)、掃描儀或某些繪圖軟件獲得。優(yōu)點(diǎn):色彩豐富,可直接、快速地顯示或印出。缺點(diǎn):存儲量大,一般需要壓縮存儲。分辨率的大小決定位圖圖象的大小,低分辨率的圖象放大后會模糊不清。位圖文件格式:GIF、JPG、BMP、TIF等。用一位二進(jìn)制數(shù)的顏色模式表現(xiàn)圖像,只有黑白兩種顏色,通常也被稱為“黑白藝術(shù)”、“位圖藝術(shù)”、“一位元藝術(shù)”。3.3.21位圖

4.3.38位灰度圖

用8bit二進(jìn)制數(shù)表示像素灰度級,像素取值介于黑和白之間的256種灰度中的一種。只有灰度顏色而沒有彩色?!岸怠眻D像“灰度”圖像屏幕顯示分辨率:顯示器屏幕上每單位長度顯示的像素?cái)?shù)量,即水平與垂直方向的像素個數(shù),表示顯示器屏幕上的最大顯示區(qū)域。單位:每英寸點(diǎn)數(shù)(dpi)。屏幕分辨率由計(jì)算機(jī)的顯卡來決定。打印機(jī)分辨率:又稱輸出分辨率,指打印機(jī)輸出圖像時,每英寸的點(diǎn)數(shù)(像素)。決定輸出圖像的質(zhì)量。單位:DPI。打印機(jī)分辨率可達(dá)300dpi,甚至720dpi。像素分辨率:指像素點(diǎn)本身的寬和高之比,一般為1:1。像素深度:存儲每個像素所用的二進(jìn)制位數(shù)。像素深度決定每幅圖像顏色數(shù)。例如:用RGB三個分量表示顏色,若每個分量用8位二進(jìn)制數(shù)表示,一個顏色占24位二進(jìn)制數(shù),則像素深度為24。多媒體中至少要用8位——256種顏色。顏色深度顏色總數(shù)圖像名稱12單色圖像416索引16色圖像8256索引256色圖像1665536HI—Color

圖像2416672216TrueColor

圖像也稱作真彩色圖。每個像素由代表RGB的三個字節(jié)組成,每個字節(jié)能表示這種顏色0~255之間的不同亮度值。三個字節(jié)組合起來共24位,即每個像素的顏色用24位二進(jìn)制來表示,可以產(chǎn)生1670萬種不同顏色。用這種方式獲得的顏色通常稱為RGB顏色。這種方式所表達(dá)的顏色遠(yuǎn)遠(yuǎn)超出了人眼所能辨別的范圍,故稱為“真彩色”。3.3.424位彩色圖像

即索引圖像(Index),也稱為“映射顏色”。

原理:預(yù)先定義一個顏色表——彩色碼表。表中的每種顏色有一個索引號。當(dāng)顯示一幅彩色圖像時,先將圖片中像素值經(jīng)過計(jì)算,轉(zhuǎn)換成彩色碼表中對應(yīng)的顏色索引號,然后根據(jù)索引值,在表中找到可用的最接近的色彩,顯示出來。

特點(diǎn):圖像顯示的顏色數(shù)量有限,一幅索引顏色的圖像最多只能顯示256種顏色;文件較小。3.3.58位彩色圖像

雙色調(diào)圖像模式:通過2-4種自定油墨創(chuàng)建雙色調(diào)圖像。3.3.6其它圖像數(shù)據(jù)類型

多通道模式:每個通道256級灰度。在進(jìn)行特殊打印時,多通道圖像十分有用。3.3.7色彩模式的轉(zhuǎn)換

RGB色彩模式轉(zhuǎn)換成位圖

:先要將色彩模式轉(zhuǎn)換成灰度模式,然后才可完成位圖模式的轉(zhuǎn)換。RGB模式轉(zhuǎn)換成CMYK模式:必須經(jīng)過校樣顏色、色域警告和色彩校正的設(shè)置,才能轉(zhuǎn)換成CMYK

模式。3.4常見靜態(tài)圖像文件格式

圖像數(shù)據(jù)量大小=像素總數(shù)×圖像深度÷8圖像文件大小用字節(jié)表示圖像文件大小時,一幅未經(jīng)壓縮的數(shù)字圖像的數(shù)據(jù)量大小計(jì)算如下:例如:一幅640×480的256色圖像為

640×480×8/8=307200字節(jié)①GIF格式:索引圖像,CompuServe公司開發(fā)。稱圖像互換格式(GraphicInterchangeFormat)。

優(yōu)點(diǎn):文件小,適合表現(xiàn)色彩不豐富的圖像,支持交錯,透明顏色及動畫(GIF89a)效果。

交錯:即圖象下載時從模糊逐漸到清晰的過程。對圖像進(jìn)行交錯處理之后,顯示圖像時不再嚴(yán)格地從上到下,一行一行像素顯示,而是每隔八行處理一次,然后再填補(bǔ)其間的空隙直到清晰為止。用戶可以盡早看到圖像全局。版本:版本號GIF87a是1987年開,描述單一(靜止)圖像;

1989年擴(kuò)充版本GIF89a,支持透明顏色和動畫,描述多幀圖像。②

BMP格式:

Windows采用的圖像文件存儲格式。文件描述單一(靜止)圖像,支持顏色數(shù)有2、16、256、16777216種。優(yōu)點(diǎn):采用的是無損壓縮,因此圖像完全不失真。缺點(diǎn):圖像文件的尺寸較大,且不支持含Alpha通道的圖像信息;不適于網(wǎng)絡(luò)傳送,不適于提供印刷文件。③

JPEG格式:“聯(lián)合圖像專家組”制定。

聯(lián)合圖像專家組(JointPhotographicExpertsGroup):由“國際標(biāo)準(zhǔn)化組織ISO”和“國際電工技術(shù)委員會IEC”組成的小組,負(fù)責(zé)制定靜態(tài)數(shù)字圖像數(shù)據(jù)壓縮編碼標(biāo)準(zhǔn)。這個專家組開發(fā)的算法稱為JPEG算法(標(biāo)準(zhǔn)),是國際上通用的標(biāo)準(zhǔn)。最新的JPEG標(biāo)準(zhǔn)是JPEG2000。優(yōu)點(diǎn):支持16M色彩(24位色);采用有損壓縮編碼形式,數(shù)據(jù)量小;常用于色彩比較豐富的圖像壓縮,對顏色數(shù)較少的圖像壓縮沒有優(yōu)勢。缺點(diǎn):經(jīng)解壓縮,方可顯示圖像,顯示速度慢。④

TIFF格式:

TagImageFileFormat,Aldus公司開發(fā),用于精確描述圖像的場合。●使用要點(diǎn)

(1)平面設(shè)計(jì)作品的最佳表現(xiàn)形式

(2)用于提供印刷文件

(3)不適于網(wǎng)絡(luò)傳送文件頭標(biāo)識信息區(qū)圖像數(shù)據(jù)●特點(diǎn)

(1)擴(kuò)展名采用“.tif”(2)文件描述單一(靜止)圖像

(3)彩色模式:21(單色)

~232(4)支持多平臺(PC&Macintosh)(5)可采用多種壓縮數(shù)據(jù)格式⑤

PNG格式:

PortableNetworkGraphicFormat,流式網(wǎng)絡(luò)圖形格式,這個名稱來源于非官方的“PNG'sNotGIF”,是一種位圖文件存儲格式?!裉攸c(diǎn)使用彩色查找表,可支持256種顏色的彩色圖像;圖像文件格式允許連續(xù)讀出和寫入圖像數(shù)據(jù);采用逐次逼近顯示的方式;獨(dú)立于計(jì)算機(jī)軟硬件環(huán)境;使用無損壓縮。⑥

EXIF格式:

ExchangeableImageFile,可交換圖像文件,是專門為數(shù)碼相機(jī)的照片設(shè)定的。

Exif

文件實(shí)際是JPEG文件的一種,用戶可以使用任何支持JPEG格式的圖像工具軟件觀看或修改Exif文件,但打開時可能看不到Exif信息。

EXIF信息就是由數(shù)碼相機(jī)采集一系列的信息,然后放置在JPEG/TIFF文件的頭部。即EXIF信息是鑲嵌在JPEG/TIFF圖像文件格式內(nèi)的,包括攝影時的光圈、快門、ISO、日期時間,相機(jī)品牌型號,色彩編碼,拍攝時錄制的聲音GPS等一組拍攝參數(shù)。⑦

PDF格式:是由Adobe公司推出的專為網(wǎng)上出版而制訂的電子文件格式,可以覆蓋矢量式圖像和點(diǎn)陣式圖像,并支持超級鏈接。Adobe公司設(shè)計(jì)PDF文件格式的目的是為了支持跨平臺上的。

●特點(diǎn)可以保存多頁信息,包含圖形和文本;這種文件格式與操作系統(tǒng)平臺無關(guān);可以不依賴操作系統(tǒng)的語言和字體及顯示設(shè)備;使用了工業(yè)標(biāo)準(zhǔn)的壓縮算法。⑧

WMF格式:

WindowsMetafile的縮寫,簡稱圖元文件,是微軟公司定義的一種Windows平臺下的圖形文件格式,屬于矢量文件格式。

●特點(diǎn)文件短小、圖案造型化;可以用ACDSEE編輯;圖形往往較粗糙。3.5常見動態(tài)圖像文件格式

動態(tài)圖像由多幅連續(xù)的圖像序列構(gòu)成,圖像沿時間軸以Δt的間隔排列。當(dāng)Δt≤視覺滯留時間,就會產(chǎn)生動感?!駝討B(tài)原理●動態(tài)圖像的特點(diǎn)1)具有時間上的連續(xù)性。2)具有時間上的延續(xù)性。3)具有幀之間的相關(guān)性。4)具有強(qiáng)烈的實(shí)時性。組合位圖數(shù)據(jù)調(diào)色盤數(shù)據(jù)速度參數(shù)壓縮算法●

動態(tài)圖像文件構(gòu)成①M(fèi)PEG/MPG/DAT格式:由ISO和IEC組成的一個專家組,稱為“活動圖像專家組”。負(fù)責(zé)開發(fā)電視圖像數(shù)據(jù)和聲音數(shù)據(jù)的編碼、解碼和它們的同步等標(biāo)準(zhǔn)。已有的MPEG標(biāo)準(zhǔn):

MPEG-1:數(shù)字電視標(biāo)準(zhǔn)

MPEG-2:數(shù)字電視標(biāo)準(zhǔn)

MPEG-4:多媒體應(yīng)用標(biāo)準(zhǔn)

MPEG-7:多媒體內(nèi)容描述接口標(biāo)準(zhǔn)

MPEG-1數(shù)字電視標(biāo)準(zhǔn):1992年正式發(fā)布。分三個組成部分:視頻、音頻和系統(tǒng)。廣泛應(yīng)用在VCD的制作和在網(wǎng)絡(luò)上傳輸?shù)臄?shù)字影視上。

MPEG-1壓縮算法,可把一部120分鐘長的電影壓縮到1.2GB左右。

MPEG-2數(shù)字電視標(biāo)準(zhǔn):應(yīng)用在DVD制作,以及HDTV(高清晰電視廣播)和一些高要求視頻編輯、處理上。使用MPEG-2的壓縮算法壓縮一部120分鐘長的電影可以壓縮到5-8GB大小,但它的圖像質(zhì)量是MPEG-1無法相比的。名稱MPEG-1MPEG-2(基本型)標(biāo)準(zhǔn)化時間1992年1994年主要應(yīng)用CD-Rom上的數(shù)字電視,VCD數(shù)字TV、DVD空間分辨率CIF格式(1/4TV),288×360像素TV,(576×720)像素時間分辨率25~30幀/秒50-60場/秒位速率5Mb/s15Mb/s質(zhì)量相當(dāng)于VHS相當(dāng)于NTSC/PAL電視壓縮率20~3030~40MPEG-1和MPEG-2的編碼參數(shù)②

AVI格式:

AudioVideoInterleave,音頻視頻交互。由微軟公司制定的動態(tài)影像標(biāo)準(zhǔn),在Windows應(yīng)用程序中較常見。

特點(diǎn):●

AVI格式的文件不需要專門的硬件支持就能播放和存儲,可把視頻信號和音頻信號同時保存在文件中。●

采用320×240的顯示尺寸,擴(kuò)展名為“.avi”。●利用視頻編輯軟件,可以進(jìn)行剪輯、合成、配解說詞等多種編輯?!?/p>

PowerPoint可以播放AVI視頻圖像。利用高級程序設(shè)計(jì)語言,可定義、調(diào)用和播放AVI視頻文件。③

FLI/FLC格式:

Autodesk公司開發(fā)的文件格式,用于存儲一組位圖圖像。FLI和FLC是英文Flicks的不同縮寫形式,意為“電影”:

FLC格式采用幀與幀之間求差的算法以及運(yùn)算長度壓縮算法進(jìn)行數(shù)據(jù)的壓縮和解壓縮。FLC格式的動畫●特點(diǎn):畫面尺寸隨意、數(shù)據(jù)量小、實(shí)時性好、動畫演播平穩(wěn)等。

FLC格式不支持同步聲音。④

RA/RM/RAM格式:

RealNetworks公司制定。通過RealPlayer在Internet上進(jìn)行實(shí)況轉(zhuǎn)播的音頻/視頻文件。是視頻流技術(shù)的始創(chuàng)者。

特點(diǎn):可以在用56KMODEM撥號上網(wǎng)的條件實(shí)現(xiàn)不間斷的視頻播放,圖像質(zhì)量比VCD差。⑤

MOV格式:由Apple公司制定。能被QuickTime支持的數(shù)字視頻格式,提供1/4屏大小,已成為因特網(wǎng)實(shí)時動態(tài)圖像標(biāo)準(zhǔn)。⑥

WMV格式:一種流媒體技術(shù)標(biāo)準(zhǔn)。

優(yōu)點(diǎn):可擴(kuò)充的媒體類型、本地或網(wǎng)絡(luò)回放、可伸縮的媒體類型、流的優(yōu)先級化、多語言支持等。⑧

DIR格式:由Macromedia公司的Director動畫設(shè)計(jì)軟件產(chǎn)生的動態(tài)影像文件。⑦

ASF格式:是微軟為了和Realplayer競爭而發(fā)展出來的一種可以直接在網(wǎng)上觀看視頻節(jié)目的文件壓縮格式。使用MPEG4的壓縮算法,壓縮率和圖像的質(zhì)量較好。質(zhì)量比VCD差,比RAM格式好。3.6多媒體數(shù)據(jù)壓縮技術(shù)

3.6.1信息、數(shù)據(jù)與編碼1.信息和熵●信息量的大小和消息有一定的關(guān)系。在數(shù)學(xué)上,消息是其出現(xiàn)概率的單調(diào)下降函數(shù)?!裥畔⒘浚簽榱藦腘個相等的可能事件中挑選出一個事件所需的信息度量和含量,所提問“是或否”的次數(shù)。要從256個數(shù)中選定某一個數(shù),可以先提問“是否大于128?”例例●隨著每次詢問,有半數(shù)的可能事件被取消,這個過程由公式表示:設(shè):從N個數(shù)中選定任意一個數(shù)x的概率為p(x),假定選定任意一個數(shù)的概率都相等,即p(x)=1/N,則信息量為:log2256=8bit求信息的“熵”(熵是平均信息量),信息源X的符號集為xi(i=1,2,…,N)。設(shè):xi出現(xiàn)的概率為p(xi),則信息源X的熵為:

I[p(x)]=log2N=-log21/N=-log2p(x)H(x)=P(xi

)log2p(xi)∑P(xi

)I[p(xi

)]=-∑ni=1ni=1信息與數(shù)據(jù)2.I(ai

)=-log2Pi(i=1,2,…,r)公式中,Pi(i

=1,2,…,r)是隨機(jī)消息組合X{a1,a2,…,ar}中的消息ai(i

=1,2,…,r)的先驗(yàn)概率。而I(ai)(i=1,2,…,r)在X的先驗(yàn)概率空間P{p1,p2,…,pr}中的統(tǒng)計(jì)平均值為信息源X的熵:H(X)=H{p1,p2,…,pr}=-Pilog2pi∑ni=1信息可以用函數(shù)表示:1)文本——假設(shè)屏幕顯示分辨率為1024×768,字符為16×16點(diǎn)陣,每個字符用4個字節(jié)表示,則:(1024/16)×(768/16)×4B=12288B2)圖像——假定8位彩色圖像顯示在1024×768分辨率的屏幕上,則:

1024×768×log2256=768KB3)音頻——假定模擬聲音頻率22050Hz,其字采樣頻率44100Hz,采樣精度為16bit,雙聲道立體聲模式,則1min所需數(shù)據(jù)量為:

44100Hz×2B×2×60s=10MB/min4)視頻——采用帶寬為5MHz的PAL制視頻信號,掃描速度25幀/s,樣本寬度24bit,采樣頻率最低10MHz,則:

10÷25×24=9.6Mbit多媒體信息的數(shù)據(jù)量3.數(shù)據(jù)壓縮的條件3.6.2●

數(shù)據(jù)冗余度●

信息傳輸與存儲的限制■44.1kHz/Stereo1.3MB■22.0kHz/Mono0.3MB■Stop重復(fù)數(shù)據(jù)可忽略數(shù)據(jù)●

人類不敏感因素224顏色(16,777,216色)28顏色(256色)●音頻不敏感因素(試聽)●

顏色不敏感因素?cái)?shù)據(jù)冗余1●

冗余基本概念●

冗余——信息所具有的各種性質(zhì)中多余的無用空間●

冗余度——多余的無用空間的程度I=D-duI—信息量D—數(shù)據(jù)量du—冗余量●

信息量與冗余的關(guān)系數(shù)據(jù)冗余1●

冗余分類●

空間冗余——規(guī)則物體的物理相關(guān)性。靜態(tài)圖像中最常見?!?/p>

時間冗余——視頻與動畫畫面間的相關(guān)性?!?/p>

統(tǒng)計(jì)冗余——具有空間冗余和時間冗余?!?/p>

結(jié)構(gòu)冗余——規(guī)則紋理、相互重疊的結(jié)構(gòu)表面?!?/p>

信息熵冗余——編碼冗余?!?/p>

視覺冗余——人的視覺系統(tǒng)對圖像的敏感性是非均勻和非線性的?!?/p>

知識冗余——可以憑借經(jīng)驗(yàn)識別的?!?/p>

其他冗余——上述7種以外的冗余。數(shù)據(jù)壓縮算法3.6.31數(shù)據(jù)壓縮算法分類●

無損壓縮編碼

——壓縮數(shù)據(jù)還原后,與原始數(shù)據(jù)一致,無損失?;舴蚵幋a行程編碼算術(shù)編碼……●

有損壓縮編碼

——壓縮后再還原的數(shù)據(jù)有損失。預(yù)測編碼變換編碼統(tǒng)計(jì)編碼行程編碼算數(shù)編碼LZW編碼……預(yù)測編碼原理2②.預(yù)測編碼的應(yīng)用預(yù)測編碼用于圖像的傳輸和存儲。對于連續(xù)的多幀圖像,新一幀通常保留前一幀的部分內(nèi)容。首先存儲當(dāng)前內(nèi)容,如像點(diǎn)、幀或線。然后與下一幀圖像進(jìn)行比較(預(yù)測),把不同點(diǎn)存儲或傳輸,而相同點(diǎn)則是數(shù)據(jù)冗余,予以剔除?!耦A(yù)測編碼——有損壓縮編碼,主要對統(tǒng)計(jì)冗余進(jìn)行壓縮。①.預(yù)測編碼的基本原理用原樣本值對新樣本進(jìn)行預(yù)測,得到新樣本的預(yù)測值。接著,取新樣本的實(shí)際值和預(yù)測值進(jìn)行比較,二者相減得到差值,再對差值進(jìn)行編碼。DPCM預(yù)測壓縮算法③.●工作原理首先比較相鄰的兩個像素,如果存在差異,則傳送差異之處的差值;若無差異,則不傳送差值。④.ADPCM自適應(yīng)差分編碼ADPCM,自適應(yīng)差分編碼調(diào)制編碼,具有自適應(yīng)特性,即預(yù)測器的預(yù)測系數(shù)和量化參數(shù),能根據(jù)圖像的局部區(qū)域分布特點(diǎn)而自動調(diào)整。ADPCM是一種針對16bits(或8bits)聲音波形數(shù)據(jù)的一種有損壓縮算法,它將聲音流中每次采樣的16bit數(shù)據(jù)以4bit存儲,所以壓縮比為1:4。該編碼主要用于對中等質(zhì)量的音頻信號進(jìn)行高效率壓縮,如語音信號、調(diào)幅廣播信號的壓縮等?!?/p>

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論