第2章數(shù)字圖像識別技術(shù)_第1頁
第2章數(shù)字圖像識別技術(shù)_第2頁
第2章數(shù)字圖像識別技術(shù)_第3頁
第2章數(shù)字圖像識別技術(shù)_第4頁
第2章數(shù)字圖像識別技術(shù)_第5頁
已閱讀5頁,還剩97頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第2章數(shù)字圖像識別技術(shù)第一頁,共118頁。特性:客觀存在的,像是人的感覺,圖像則是二者的結(jié)合,因此,是客觀實體的原型.包含了巨大的信息量圖像的傳播雖然比語言文字的傳播要復(fù)雜得多,但它能提供比較直觀的模型,這不是語言文字的描述所能達(dá)到的。第二頁,共118頁。圖像的產(chǎn)生:

如工程技術(shù)人員以直尺和圓規(guī)來繪制各種圖紙,美術(shù)家用畫筆來復(fù)制客觀世界,電視用畫面來反映實地場景。

第三頁,共118頁。

識別:直接由人工或識別系統(tǒng)識別:經(jīng)過處理,改善質(zhì)量或提取出圖像的某些數(shù)據(jù)特征后才能識別。第四頁,共118頁。2.1.2數(shù)字圖像處理發(fā)展概況1.數(shù)字圖像處理(DigitalImageProcessing)含義:

又稱為計算機(jī)圖像處理,它是指將圖像信號轉(zhuǎn)換成數(shù)字信號并利用計算機(jī)對其進(jìn)行處理的過程。第五頁,共118頁。2.發(fā)展最早出現(xiàn)于20世紀(jì)50年代:計算機(jī)來處理圖形學(xué)科大約形成于20世紀(jì)60年代初期。首次獲得實際成功應(yīng)用是美國噴氣推進(jìn)實驗室1972年英國EMI公司用于頭顱診斷的X射線計算機(jī)斷層攝影裝置,也就是我們通常所說的CT(ComputerTomograph)---1979年,這項無損傷診斷技術(shù)獲得了諾貝爾獎.從70年代中期開始理論和應(yīng)用研究:視覺計算理論

第六頁,共118頁。左邊是嫦娥一號衛(wèi)星傳回的第一幅月面圖像。右邊是第一幅月面圖像的飛行效果圖。航天和航空技術(shù)方面的應(yīng)用數(shù)字圖像處理技術(shù)第一幅月面圖像就是我們對月球的直觀感受和初步認(rèn)識。一、圖像信息處理基礎(chǔ)知識2.1.3數(shù)字圖像處理的應(yīng)用1第七頁,共118頁。2.1.3數(shù)字圖像處理的應(yīng)用“嫦娥一號”第一幅月面圖像處理的過程如下:航天和航空技術(shù)方面的應(yīng)用數(shù)字圖像處理技術(shù)第八頁,共118頁。遙感和航空測量遙感:主要用于資源、礦藏勘探、國土規(guī)劃、高速公路選線、災(zāi)害調(diào)查、農(nóng)作物估產(chǎn)、氣象預(yù)報以及軍事目標(biāo)監(jiān)視等。氣象衛(wèi)星云圖土地變化監(jiān)測圖云南省大理州森林火災(zāi)的遙感圖二、數(shù)字圖像處理的應(yīng)用2.1.3數(shù)字圖像處理的應(yīng)用第九頁,共118頁。生物醫(yī)學(xué)領(lǐng)域應(yīng)用三維快速血管造影成像頭部CT主要應(yīng)用如X射線層析攝影(CT)、核磁共振(MRI)、超聲成像、血管造影、細(xì)胞和染色體自動分類等。這些技術(shù)和設(shè)備大大提高了治療診斷水平,減輕了病人的痛苦。22.1.3數(shù)字圖像處理的應(yīng)用第十頁,共118頁。以下是一個將圖像處理應(yīng)用于臨床醫(yī)學(xué)的例子――CT腦血管醫(yī)學(xué)圖像三維重建。重建的腦血管三維圖像加入對比劑腦血管掃描圖像依次為第1層,第2層,第3層腦血管腦血管邊緣提取依次為第1層,第2層,第3層腦血管生物醫(yī)學(xué)領(lǐng)域應(yīng)用22.1.3數(shù)字圖像處理的應(yīng)用第十一頁,共118頁。通信工程常見的數(shù)字圖像和數(shù)字視頻設(shè)備如可視電話、會議電視、衛(wèi)星電視、數(shù)字電視、高清晰度電視、VCD、DVD等會議電視終端可視電話衛(wèi)星電視接收器32.1.3數(shù)字圖像處理的應(yīng)用第十二頁,共118頁?;贖.323標(biāo)準(zhǔn)的遠(yuǎn)程教學(xué)組網(wǎng)圖二、數(shù)字圖像處理的應(yīng)用2.1.3數(shù)字圖像處理的應(yīng)用第十三頁,共118頁。工業(yè)與交通應(yīng)用該領(lǐng)域的應(yīng)用從70年代起取得了迅速的發(fā)展,主要有產(chǎn)品質(zhì)量檢測、生產(chǎn)過程的自動控制、CAD/CAM等。檢查瓶裝液體容量是否合格智能交通控制42.1.3數(shù)字圖像處理的應(yīng)用第十四頁,共118頁。汽車牌照識別系統(tǒng)圖2.1.3數(shù)字圖像處理的應(yīng)用第十五頁,共118頁。交通視頻監(jiān)控系統(tǒng)圖2.1.3數(shù)字圖像處理的應(yīng)用第十六頁,共118頁。軍事公安軍事目標(biāo)的偵察、制導(dǎo)和警戒系統(tǒng)、自動滅火器的控制及反偽裝等等都需要用到圖像處理技術(shù);公安部門的現(xiàn)場照片、指紋、虹膜、面部、手跡、印章等的處理和辨識也要借助圖像處理。導(dǎo)彈制導(dǎo)指紋門鎖52.1.3數(shù)字圖像處理的應(yīng)用第十七頁,共118頁。虹膜識別系統(tǒng)框圖二、數(shù)字圖像處理的應(yīng)用2.1.3數(shù)字圖像處理的應(yīng)用第十八頁,共118頁。生物識別技術(shù)的重要分支――自動指紋識別系統(tǒng)下圖是指紋圖像預(yù)處理各階段的結(jié)果:指紋原始圖像濾波后圖像二值化圖像細(xì)化圖像二、數(shù)字圖像處理的應(yīng)用2.1.3數(shù)字圖像處理的應(yīng)用第十九頁,共118頁。機(jī)器視覺

機(jī)器視覺主要用于軍事偵察、危險環(huán)境的自主機(jī)器人,郵政、醫(yī)院和家庭服務(wù)的智能機(jī)器人,裝配線工件識別、定位,太空機(jī)器人的自動操作等。

ASIMO踢球ASIMO上樓梯62.1.3數(shù)字圖像處理的應(yīng)用第二十頁,共118頁。虛擬現(xiàn)實當(dāng)人們通過虛擬現(xiàn)實瀏覽、觀賞時就如身臨其境一般,并且可以選擇任一角度,觀看任一范圍內(nèi)的場景或選擇觀看物體的任一角度。虛擬漫游技術(shù)是虛擬現(xiàn)實(VR)技術(shù)的重要分支,在建筑、旅游、游戲、航空航天、醫(yī)學(xué)等多種行業(yè)發(fā)展很快。VR的相關(guān)設(shè)備72.1.3數(shù)字圖像處理的應(yīng)用第二十一頁,共118頁。故宮VR——《紫禁城?天子的宮殿》中的一景

2.1.3數(shù)字圖像處理的應(yīng)用第二十二頁,共118頁。電腦游戲中的建筑場景漫游2.1.3數(shù)字圖像處理的應(yīng)用第二十三頁,共118頁。2.1.4數(shù)字圖像處理主要研究的內(nèi)容圖像變換圖像編碼壓縮圖像增強(qiáng)和復(fù)原圖像分割圖像描述圖像分類(識別)第二十四頁,共118頁。(1)圖像變換傅里葉變換、沃爾什變換、離散余弦變換等間接處理技術(shù),將空間域的處理變換為變換域處理。將空間域的圖像通過變換轉(zhuǎn)換到頻率域

第二十五頁,共118頁。(2)圖像編碼壓縮圖像編碼壓縮技術(shù)可減少描述圖像的數(shù)據(jù)量,以便節(jié)省圖像傳輸、處理時間和減少所占用的存儲器空間。第二十六頁,共118頁。(3)圖像增強(qiáng)和復(fù)原圖像編碼壓縮技術(shù)可減少描述圖像的數(shù)據(jù)量,以便節(jié)省圖像傳輸、處理時間和減少所占用的存儲器空間。第二十七頁,共118頁。

彩色圖像增強(qiáng)舉例左圖:原始圖像,細(xì)節(jié)不清晰,偏色右圖:增強(qiáng)后的圖像第二十八頁,共118頁。圖像復(fù)原舉例被正弦噪聲污染的圖像;(b)圖(a)的頻譜;(c)巴特沃斯帶阻濾波器;(d)濾波效果。第二十九頁,共118頁。圖像復(fù)原第三十頁,共118頁。(4)圖像分割圖像分割是將圖像中有意義的特征部分提取出來,其有意義的特征有圖像中的邊緣、區(qū)域等,這是進(jìn)一步進(jìn)行圖像識別、分析和理解的基礎(chǔ)。第三十一頁,共118頁。醫(yī)學(xué)圖像處理—銳化第三十二頁,共118頁。影視圖像處理

—由黑白圖像轉(zhuǎn)換的偽彩色圖像第三十三頁,共118頁。(5)圖像描述圖像描述是圖像識別和理解的必要前提。一般圖像的描述方法采用二維描述,他有邊界描述和區(qū)域描述。(6)圖像識別圖像分類(識別)屬于模式識別的范疇,其主要內(nèi)容是圖像經(jīng)過某些預(yù)處理后,進(jìn)行圖像分割和特征提取,從而進(jìn)行判決分類。第三十四頁,共118頁。視頻字幕識別第三十五頁,共118頁。舉例:圖像識別

圖5-12美國警方采用圖像識別系統(tǒng)辨別罪犯,該系統(tǒng)每分鐘以1500萬畫面的速率進(jìn)行面部匹配第三十六頁,共118頁。舉例:人臉識別第三十七頁,共118頁。2.1.5數(shù)字圖像處理的基本特點(diǎn)信息量大數(shù)字圖像處理占用的頻帶較寬數(shù)字圖像中各個像素相關(guān)性大主觀性第三十八頁,共118頁。2.1.6數(shù)字圖像處理的優(yōu)點(diǎn)再現(xiàn)性好處理精度高適用面寬靈活性高第三十九頁,共118頁。2.2數(shù)字圖像處理基礎(chǔ)

為了方便地處理數(shù)字圖像,根據(jù)數(shù)字圖像的特性將其分成不同的類型。靜態(tài)圖像可分為矢量(Vector)圖和位圖(Bitmap),位圖也稱為柵格圖像。

矢量圖是用一系列繪圖指令來表示一幅圖,如AutoCAD中的繪圖語句。這種方法的本質(zhì)是用數(shù)學(xué)(更準(zhǔn)確地說是幾何學(xué))公式描述一幅圖像。圖像中每一個形狀都是一個完整的公式,稱為一個對象。對象是一個封閉的整體,所以定義圖像上對象的變化和對象與其他對象的關(guān)系對計算機(jī)來說是簡單的,所有這些變化都不會影響到圖像中的其他對象。第四十頁,共118頁。公式化表示圖像使得矢量圖具有兩個優(yōu)點(diǎn):一是它的文件數(shù)據(jù)量很小;二是圖像質(zhì)量與分辨率無關(guān),這意味著無論將圖像放大或縮小了多少次,圖像總是以顯示設(shè)備允許的最大清晰度顯示。在計算機(jī)計算與顯示一幅圖像時,也往往能看到畫圖的過程。但是,矢量圖有一個明顯的缺點(diǎn),就是不易制作色調(diào)豐富或色彩變化太多的圖像,而且繪出來的圖像不是很逼真,同時也不易在不同的軟件間交換文件。第四十一頁,共118頁。

位圖是通過許多像素點(diǎn)表示一幅圖像,每個像素具有顏色屬性和位置屬性。位圖可以從傳統(tǒng)的相片、幻燈片上制作出來或使用數(shù)字相機(jī)得到,也可以利用Windows的畫筆(Painbrush)用顏色點(diǎn)填充網(wǎng)格單元來創(chuàng)建位圖。位圖又可以分成如下四種:線畫稿(LineArt)、灰度圖像(GrayScale)、索引顏色圖像(IndexColor)和真彩色圖像(TrueColor)。第四十二頁,共118頁。

1.線畫稿

線畫稿只有黑白兩種顏色,這種形式通常也稱為“黑白藝術(shù)”、“位圖藝術(shù)”、“一位元藝術(shù)”。用掃描儀掃描圖像,當(dāng)設(shè)置成LineArt格式時,掃描儀以一位顏色模式來看待圖像。若樣點(diǎn)顏色為黑,則掃描儀將相應(yīng)的像素位元置為0,否則置為1。線畫稿適合于由黑白兩色構(gòu)成而沒有灰度陰影的圖像。第四十三頁,共118頁。

2.灰度圖像在灰度圖像中,像素灰度級用8bit表示,所以每個像素都是介于黑色和白色之間的256(28=256)種灰度中的一種?;叶葓D像只有灰度顏色而沒有彩色。我們通常所說的黑白照片,其實包含了黑白之間的所有灰度色調(diào)。從技術(shù)上來說,就是具有從黑到白的256種灰度色域的單色圖像。第四十四頁,共118頁。不同空間分辨率圖像(灰度級為8比特)1024×1024;(b)~(f)的原始空間分辨率依次為512×512,256×256,128×128,64×64,32×32像素。第四十五頁,共118頁。(a)453×374,256灰度級圖像;(b)~(d)保持空間分辨率不變,以灰度級為128,64和32顯示的圖像第四十六頁,共118頁。(續(xù))(e)~(h)以16,8,4和2灰度級顯示的圖像第四十七頁,共118頁。

3.索引圖像

在介紹索引圖像之前,我們首先了解PC機(jī)是如何處理顏色的。大多數(shù)掃描儀都是以24位模式對圖像進(jìn)行采樣,用這種方式獲得的顏色通常稱為RGB顏色。顏色深度為每像素24位的數(shù)字圖像是目前所能獲取、瀏覽和保存的顏色信息最豐富的彩色圖像,由于它所表達(dá)的顏色遠(yuǎn)遠(yuǎn)超出了人眼所能辨別的范圍,故將其稱為“真彩色”。在真彩色出現(xiàn)之前,由于技術(shù)上的原因,計算機(jī)在處理時并沒有達(dá)到每像素24位的真彩色水平,為此人們創(chuàng)造了索引顏色。索引顏色通常也稱為映射顏色,在這種模式下,顏色都是預(yù)先定義的,并且可供選用的一組顏色也很有限,索引顏色的圖像最多只能顯示256種顏色。一幅索引顏色圖像在圖像文件里定義,當(dāng)打開該文件時,構(gòu)成該圖像具體顏色的索引值就被讀入程序里,然后根據(jù)索引值找到最終的顏色。第四十八頁,共118頁。

4.真彩色圖像真彩色圖像將像素的色彩能力推向了頂峰?!罢娌噬笔荝GB顏色的另一種流行的叫法。從技術(shù)角度考慮,真彩色是指寫到磁盤上的圖像類型,而RGB顏色是指顯示器的顯示模式。RGB圖像的顏色是非映射的,它可以從系統(tǒng)的“顏色表”里自由獲取所需的顏色,這種圖像文件里的顏色直接與PC機(jī)上的顯示顏色相對應(yīng)。在真彩色圖像中,每一個像素由紅、綠和藍(lán)三個字節(jié)組成,每個字節(jié)為8bit,表示0到255之間的不同的亮度值,這三個字節(jié)組合可以產(chǎn)生1670萬種不同的顏色。第四十九頁,共118頁。索引圖像、RGB彩色圖像第五十頁,共118頁。位圖的有關(guān)術(shù)語

1.像素(Pixel)、點(diǎn)(Dot)和樣點(diǎn)(Sample)在計算機(jī)中,圖像是由顯示器上許多光點(diǎn)組成的,將顯示在顯示器上的這些點(diǎn)(光的單元)稱為像素。像素的分割有不同的方法,實際常用正方形網(wǎng)格點(diǎn)陣分割方案,這是因為其像素網(wǎng)格點(diǎn)陣規(guī)范,易于在圖像輸入、輸出設(shè)備上實現(xiàn)。在計算機(jī)圖像處理中,還常用到點(diǎn)和樣點(diǎn)這些術(shù)語。像素、點(diǎn)和樣點(diǎn)是在計算機(jī)上對不同階段的圖像進(jìn)行度量的稱謂,這幾個術(shù)語很容易混淆,故特一一做介紹。第五十一頁,共118頁。

首先說明樣點(diǎn)和點(diǎn)的概念。掃描一幅圖像時,需設(shè)置掃描儀的分辨率(Resolution),分辨率決定了掃描儀從源圖像里每英寸取多少個樣點(diǎn)。掃描儀將源圖像看成由大量的網(wǎng)格組成,然后在每一個網(wǎng)格里取出一點(diǎn),用該點(diǎn)的顏色值來代表這一網(wǎng)格里所有點(diǎn)的顏色值,這些被選中的點(diǎn)就是樣點(diǎn)。掃描儀的分辨率單位為dpi(每英寸點(diǎn)數(shù)),但激光打印機(jī)的dpi與掃描儀的dpi(樣點(diǎn))是不同的。實際上,以150dpi分辨率掃描的圖像,它的效果相當(dāng)于激光打印機(jī)的1200dpi的效果。像素并不像“克”和“厘米”那樣是絕對的度量單位,而是可大可小的。如果獲取圖像時的分辨率較低(如50dpi),則顯示該圖像時,每英寸所顯示的像素個數(shù)也很少,這樣就會使像素變得較大。第五十二頁,共118頁。

2.分辨率1)圖像分辨率

圖像分辨率是指每英寸圖像含有多少個點(diǎn)或像素,分辨率的單位為dpi。例如,250dpi表示的就是該圖像每英寸含有250個點(diǎn)或像素。在數(shù)字圖像中,分辨率的大小直接影響到圖像的質(zhì)量。分辨率越高,圖像細(xì)節(jié)越清晰,但產(chǎn)生的文件尺寸大,同時處理的時間也就越長,對設(shè)備的要求也就越高。所以在制作圖像時要根據(jù)需要來選擇分辨率。另外,圖像的尺寸、圖像的分辨率和圖像文件的大小三者之間有著密切的聯(lián)系。圖像的尺寸越大,圖像的分辨率越高,圖像文件也就越大。所以,調(diào)整圖像的大小和分辨率即可改變圖像文件的大小。第五十三頁,共118頁。圖一:30ppi 圖二:300ppi 圖三:偽300ppi思考:為什么要用高分辨率的數(shù)碼相機(jī)第五十四頁,共118頁。

2)屏幕分辨率

顯示器上每單位長度顯示的像素或點(diǎn)的數(shù)量稱為屏幕分辨率。通常以每英寸點(diǎn)數(shù)(ppi)來表示。屏幕分辨率取決于顯示器的大小及其像素設(shè)置。屏幕分辨率由計算機(jī)的顯示卡決定,標(biāo)準(zhǔn)的VGA顯示卡的分辨率是640×480,即水平方向640點(diǎn)(像素),垂直方向480點(diǎn)(像素)?,F(xiàn)在高性能的顯示卡已支持2560×1600點(diǎn)以上的分辨率。第五十五頁,共118頁。

3)打印機(jī)分辨率

打印機(jī)分辨率又稱輸出分辨率,是指打印機(jī)輸出圖像時每英寸的點(diǎn)數(shù)(dpi)。打印機(jī)分辨率也決定了輸出圖像的質(zhì)量,打印機(jī)分辨率越高,可以減少打印的鋸齒邊緣,在灰度的半色調(diào)表現(xiàn)上也會較為平滑。打印機(jī)的分辨率可達(dá)300dpi,甚至720dpi(需用特殊紙張);而較老機(jī)型的激光打印機(jī)分辨率通常在300~360dpi之間,由于超微細(xì)碳粉技術(shù)的成熟,新的激光打印機(jī)的分辨率可達(dá)600~1200dpi,作為專業(yè)排版輸出已經(jīng)綽綽有余了。第五十六頁,共118頁。

4)掃描儀分辨率

掃描儀分辨率的表示方法與打印機(jī)相類似,一般也用dpi表示,不過這里的點(diǎn)是樣點(diǎn),與打印機(jī)的輸出點(diǎn)是不同的。一般掃描儀提供的方式是水平分辨率要比垂直分辨率高。臺式掃描儀的分辨率可以分為光學(xué)分辨率和輸出分辨率。光學(xué)分辨率是指掃描儀硬件所真正掃描到的圖像分辨率,目前市場上的產(chǎn)品,其光學(xué)分辨率可達(dá)800~1200dpi以上。輸出分辨率是通過軟件強(qiáng)化以及內(nèi)插補(bǔ)點(diǎn)之后產(chǎn)生的分辨率,大約為光學(xué)分辨率的3~4倍。所以當(dāng)你見到號稱分辨率高達(dá)4800dpi或6400dpi的掃描儀時,這一定指的是輸出分辨率。第五十七頁,共118頁。顯示與文件的對應(yīng)關(guān)系若圖像分辨率比顯示分辨率高,則顯示出的圖像比實際圖像大。若圖像分辨率比顯示分辨率低,則顯示出的圖像比實際圖像小。圖片1:640像素*480像素*72ppi(22.58cm*16.93cm)圖片2:320像素*240像素*36ppi(22.58cm*16.93cm)利用photoshop軟件對比圖片1和圖片2。(請課后實驗之)第五十八頁,共118頁。2.2.2圖像數(shù)字化技術(shù)圖像處理方法模擬式:原理數(shù)字式:

過程:采樣量化

第五十九頁,共118頁。1采樣圖像在空間上的離散化稱為采樣。也就是用空間上部分點(diǎn)的灰度值代表圖像,這些點(diǎn)稱為采樣點(diǎn)。由于圖像是一種二維分布的信息,為了對它進(jìn)行采樣操作,需要先將二維信號變?yōu)橐痪S信號,再對一維信號完成采樣。具體做法是,先沿垂直方向按一定間隔從上到下順序地沿水平方向直線掃描,取出各水平線上灰度值的一維掃描。而后再對一維掃描線信號按一定間隔采樣得到離散信號,即先沿垂直方向采樣,再沿水平方向采樣這兩個步驟完成采樣操作。對于運(yùn)動圖像(即時間域上的連續(xù)圖像),需先在時間軸上采樣,再沿垂直方向采樣,最后沿水平方向采樣由這三個步驟完成。第六十頁,共118頁。圖5-13圖像采樣就是在水平方向和垂直方向上等間隔地將圖像分割成矩形網(wǎng)狀結(jié)構(gòu)第六十一頁,共118頁。圖5-14不同采樣精度所獲得的圖像分辨率不同第六十二頁,共118頁。對一幅圖像采樣時,若每行(即橫向)像素為M個,每列(即縱向)像素為N個,則圖像大小為M×N個像素。在進(jìn)行采樣時,采樣點(diǎn)間隔的選取是一個非常重要的問題,它決定了采樣后圖像的質(zhì)量,即忠實于原圖像的程度。采樣間隔的大小選取要依據(jù)原圖像中包含的細(xì)微濃淡變化來決定。一般,圖像中細(xì)節(jié)越多,采樣間隔應(yīng)越小。根據(jù)一維采樣定理,若一維信號g(t)的最大頻率為ω,以T≤1/2ω為間隔進(jìn)行采樣,則能夠根據(jù)采樣結(jié)果g(iT)(i=…,-1,0,1,…)完全恢復(fù)g(t),即式中第六十三頁,共118頁。圖2-2采樣示意圖第六十四頁,共118頁。2量化模擬圖像經(jīng)過采樣后,在時間和空間上離散化為像素。但采樣所得的像素值(即灰度值)仍是連續(xù)量。把采樣后所得的各像素的灰度值從模擬量到離散量的轉(zhuǎn)換稱為圖像灰度的量化。圖2-3(a)說明了量化過程。若連續(xù)灰度值用z來表示,對于滿足zi≤z≤zi+1的z值,都量化為整數(shù)qi。qi稱為像素的灰度值,z與qi的差稱為量化誤差。一般,像素值量化后用一個字節(jié)8bit來表示。如圖2-3(b)所示,把由黑—灰—白的連續(xù)變化的灰度值,量化為0~255共256級灰度值,灰度值的范圍為0~255,表示亮度從深到淺,對應(yīng)圖像中的顏色為從黑到白。第六十五頁,共118頁。圖2-3量化示意圖(a)量化;(b)量化為8bit第六十六頁,共118頁。連續(xù)灰度值量化為灰度級的方法有兩種,一種是等間隔量化,另一種是非等間隔量化。等間隔量化就是簡單地把采樣值的灰度范圍等間隔地分割并進(jìn)行量化。對于像素灰度值在黑—白范圍較均勻分布的圖像,這種量化方法可以得到較小的量化誤差。該方法也稱為均勻量化或線性量化。為了減小量化誤差,引入了非均勻量化的方法。非均勻量化是依據(jù)一幅圖像具體的灰度值分布的概率密度函數(shù),按總的量化誤差最小的原則來進(jìn)行量化。具體做法是對圖像中像素灰度值頻繁出現(xiàn)的灰度值范圍,量化間隔取小一些,而對那些像素灰度值極少出現(xiàn)的范圍,則量化間隔取大一些。由于圖像灰度值的概率分布密度函數(shù)因圖像不同而異,所以不可能找到一個適用于各種不同圖像的最佳非等間隔量化方案。因此,實用上一般都采用等間隔量化。第六十七頁,共118頁。3采樣與量化參數(shù)的選擇一幅圖像在采樣時,行、列的采樣點(diǎn)與量化時每個像素量化的級數(shù),既影響數(shù)字圖像的質(zhì)量,也影響到該數(shù)字圖像數(shù)據(jù)量的大小。假定圖像取M×N個樣點(diǎn),每個像素量化后的灰度二進(jìn)制位數(shù)為Q,一般Q總是取為2的整數(shù)冪,即Q=2k,則存儲一幅數(shù)字圖像所需的二進(jìn)制位數(shù)b為(2-2)字節(jié)數(shù)B為(2-3)第六十八頁,共118頁。對一幅圖像,當(dāng)量化級數(shù)Q一定時,采樣點(diǎn)數(shù)M×N對圖像質(zhì)量有著顯著的影響。如圖2-4所示,采樣點(diǎn)數(shù)越多,圖像質(zhì)量越好;當(dāng)采樣點(diǎn)數(shù)減少時,圖上的塊狀效應(yīng)就逐漸明顯。同理,當(dāng)圖像的采樣點(diǎn)數(shù)一定時,采用不同量化級數(shù)的圖像質(zhì)量也不一樣。如圖2-5所示,量化級數(shù)越多,圖像質(zhì)量越好,當(dāng)量化級數(shù)越少時,圖像質(zhì)量越差,量化級數(shù)最小的極端情況就是二值圖像,圖像出現(xiàn)假輪廓。第六十九頁,共118頁。圖2-4不同采樣點(diǎn)數(shù)對圖像質(zhì)量的影響(a)原始圖像(256×256);(b)采樣圖像1(128×128);(c)采樣圖像2(64×64);(d)采樣圖像3(32×32);(e)采樣圖像4(16×16);(f)采樣圖像5(8×8)第七十頁,共118頁。圖2-5不同量化級別對圖像質(zhì)量的影響(a)原始圖像(256色);(b)量化圖像1(64色);(c)量化圖像2(32色);(d)量化圖像3(16色);(e)量化圖像4(4色);(f)量化圖像5(2色)第七十一頁,共118頁。1973年的夏天,美國南加州大學(xué)信號與圖像處理研究所里,年輕的助理教授亞歷山大(AlexanderSawchuk)和研究員威廉(WilliamPratt)第七十二頁,共118頁。低bit量化的偽輪廓現(xiàn)象示意圖第七十三頁,共118頁。低采樣率導(dǎo)致圖像細(xì)節(jié)丟失第七十四頁,共118頁。一般,當(dāng)限定數(shù)字圖像的大小時,為了得到質(zhì)量較好的圖像可采用如下原則:(1)對緩變的圖像,應(yīng)該細(xì)量化,粗采樣,以避免假輪廓。(2)對細(xì)節(jié)豐富的圖像,應(yīng)細(xì)采樣,粗量化,以避免模糊(混疊)。對于彩色圖像,是按照顏色成分——紅(R)、綠(G)、藍(lán)(B)分別采樣和量化的。若各種顏色成分均按8bit量化,即每種顏色量級別是256,則可以處理256×256×256=16777216種顏色。第七十五頁,共118頁。4圖像數(shù)字化設(shè)備將模擬圖像數(shù)字化成為數(shù)字圖像,需要某種圖像數(shù)字化設(shè)備。常見的數(shù)字化設(shè)備有數(shù)字相機(jī)、掃描儀、數(shù)字化儀等。

1.圖像數(shù)字化設(shè)備的組成如前所述,采樣和量化是數(shù)字化一幅圖像的兩個基本過程。即把圖像劃分為若干圖像元素(像素)并給出它們的地址(采樣);度量每一像素的灰度,并把連續(xù)的度量結(jié)果量化為整數(shù)(量化);最后將這些整數(shù)結(jié)果寫入存儲設(shè)備。為完成這些功能,圖像數(shù)字化設(shè)備必須包含以下五個部分:第七十六頁,共118頁。

(1)采樣孔(Samplingaperture):使數(shù)字化設(shè)備能夠單獨(dú)地觀測特定的圖像元素而不受圖像其他部分的影響。

(2)圖像掃描機(jī)構(gòu):使采樣孔按照預(yù)先確定的方式在圖像上移動,從而按順序觀測每一個像素。

(3)光傳感器:通過采樣檢測圖像的每一像素的亮度,通常采用CCD陣列。

(4)量化器:將傳感器輸出的連續(xù)量轉(zhuǎn)化為整數(shù)值。典型的量化器是A/D轉(zhuǎn)換電路,它產(chǎn)生一個與輸入電壓或電流成比例的數(shù)值。

(5)輸出存儲裝置:將量化器產(chǎn)生的灰度值按適當(dāng)格式存儲起來,以用于計算機(jī)后續(xù)處理。第七十七頁,共118頁。

2.圖像數(shù)字化設(shè)備的性能雖然各種數(shù)字化設(shè)備的組成不相同,但可從如下幾個方面對其性能進(jìn)行比較。

1)像素大小采樣孔的大小和相鄰像素的間距是兩個重要的性能指標(biāo)。如果數(shù)字化設(shè)備是在一個放大率可變的光學(xué)系統(tǒng)上,那么對應(yīng)于輸入圖像平面上的采樣點(diǎn)大小和采樣間距也是可變的。

2)圖像大小圖像大小即數(shù)字化設(shè)備所允許的最大輸入圖像的尺寸。第七十八頁,共118頁。

3)線性度對光強(qiáng)進(jìn)行數(shù)字化時,灰度正比于圖像亮度的實際精確程度是一個重要的指標(biāo)。非線性的數(shù)字化設(shè)備會影響后續(xù)過程的有效性。能將圖像量化為多少級灰度也是非常重要的參數(shù)。圖像的量化精度經(jīng)歷了早期的黑白二值圖像、灰度圖像及現(xiàn)在的彩色及真彩色圖像。當(dāng)然,量化精度越高,存儲像素信息需要的字節(jié)數(shù)也越大。第七十九頁,共118頁。

4)噪聲數(shù)字化設(shè)備的噪聲水平也是一個重要的性能參數(shù)。例如,數(shù)字化一幅灰度值恒定的圖像,雖然輸入亮度是一個常量,但是數(shù)字化設(shè)備中固有的噪聲卻會使圖像的灰度發(fā)生變化。因此數(shù)字化設(shè)備所產(chǎn)生的噪聲是圖像質(zhì)量下降的根源之一,應(yīng)當(dāng)使噪聲小于圖像內(nèi)的反差點(diǎn)(即對比度)。第八十頁,共118頁?;叶葓D像顯示第八十一頁,共118頁。第八十二頁,共118頁。位平面第八十三頁,共118頁。抖動技術(shù)第八十四頁,共118頁。2.2.3圖像數(shù)字化設(shè)備的功能圖像輸入設(shè)備主要有:(1)基于CCD光電耦器件的輸入設(shè)備A、攝像機(jī)、數(shù)字?jǐn)z像機(jī)B、數(shù)字相機(jī)C、平板掃描儀第八十五頁,共118頁?;诠怆姳对龉艿妮斎朐O(shè)備

--滾筒掃描儀采樣孔(aperturesampleing)圖像掃描機(jī)構(gòu)光傳感器量化器:A/D轉(zhuǎn)換電路輸出存儲裝置第八十六頁,共118頁。2.2.4數(shù)字圖像的圖像文件格式國際標(biāo)準(zhǔn):TIF(TagImage)、JPEG(JointPhotographer’sExpertsGroup)互聯(lián)網(wǎng)用:GIF(GraphicsInterchangeFormat)、JPEG、PNG印刷用:TIF、JPG、TAG、PCX第八十七頁,共118頁。2.2.4.1BMP圖像文件格式第八十八頁,共118頁。BMP文件結(jié)構(gòu)第八十九頁,共118頁。第一部分為位圖文件頭BITMAP,它是一個結(jié)構(gòu)體,其定義如下:

typedefstructtagBITMAP{WORD bfType;DWORD bfSize;WORD bfReserved1;WORD bfReserved2;DWORD bfOffBits;}BITMAP;這個結(jié)構(gòu)的長度是固定的,為14個字節(jié)(WORD為無符號16位二進(jìn)制整數(shù),DWORD為無符號32位二進(jìn)制整數(shù))。第九十頁,共118頁。第二部分為位圖信息頭BITMAPINFOHEADER,也是一個結(jié)構(gòu),其定義如下:typedefstructtagBITMAPINFOHEADER{DWORD biSize;LONG biWidth;LONG biHeight;WORD biPlanes;WORD biBitCount;DWORD biCompression;DWORD biSizeImage;LONG biXPelsPerMeter;LONG biYPelsPerMeter;DWORD biClrUsed;DWORD biClrImportant;}BITMAPINFOHEADER;第九十一頁,共118頁。這個結(jié)構(gòu)的長度是固定的,為40個字節(jié)(LONG為32位二進(jìn)制整數(shù))。其中,biCompression的有效值為BI_RGB、BI_RLE8、BI_RLE4、BI_BITFIELDS,這都是一些Windows定義好的常量。由于RLE4和RLE8的壓縮格式用的不多,今后僅討論biCompression的有效值為BI_RGB,即不壓縮的情況。第九十二頁,共118頁。第三部分為調(diào)色板(Palette),當(dāng)然,這里是對那些需要調(diào)色板的位圖文件而言的。真彩色圖像是不需要調(diào)色板的,BITMAPINFOHEADER后直接是位圖數(shù)據(jù)。調(diào)色板實際上是一個數(shù)組,共有biClrUsed個元素(如果該值為零,則有2的biBitCount次方個元素)。數(shù)組中每個元素的類型是一個RGBQUAD結(jié)構(gòu),占4個字節(jié),其定義如下:typedefstructtagRGBQUAD{BYTErgbBlue; //該顏色的藍(lán)色分量

BYTErgbGreen; //該顏色的綠色分量

BYTErgbRed; //該顏色的紅色分量

BYTErgbReserved; //保留值}RGBQUAD;第九十三頁,共118頁。第四部分就是實際的圖像數(shù)據(jù)。對于用到調(diào)色板的位圖,圖像數(shù)據(jù)就是該像素顏色在調(diào)色板中的索引值,對于真彩色圖像,圖像數(shù)據(jù)就是實際的R、G、B值。下面就2色、16色、256色和真彩色位圖分別介紹。對于2色位圖,用1位就可以表示該像素的顏色(一般0表示黑,1表示白),所以一個字節(jié)可以表示8個像素。對于16色位圖,用4位可以表示一個像素的顏色,所以一個字節(jié)可以表示2個像素。對于256色位圖,一個字節(jié)剛好可以表示1個像素。第九十四頁,共118頁。2.2.4.2其他文件格式

1.TIF圖像文件格式標(biāo)記圖像文件格式TIF(TagImage),它是現(xiàn)存圖像文件格式中最復(fù)雜的一種,它提供存儲各種信息的完備的手段,可以存儲專門的信息而不違反格式宗旨,是目前流行的圖像文件交換標(biāo)準(zhǔn)之一。TIF格式文件的設(shè)計考慮了擴(kuò)展性、方便性和可修改性,因此非常復(fù)雜,要求用更多的代碼來控制它,結(jié)果導(dǎo)致文件讀寫速度慢,TIF代碼也很長。TIF文件由文件頭、參數(shù)指針表與參數(shù)域、參數(shù)數(shù)據(jù)表和圖像數(shù)據(jù)4部分組成。如表2-2~表2-4所示。第九十五頁,共118頁。1)文件頭表2-2TIF文件文件頭結(jié)構(gòu)第九十六頁,共118頁。2)參數(shù)指針表2-3TIF文件參數(shù)指針表由一個2字節(jié)的整數(shù)和其后的一系列12字節(jié)參數(shù)域構(gòu)成,最后以一個長整型數(shù)結(jié)束。若最后的長整型數(shù)為0,表示文件的參數(shù)指針表到此為至,否則該長整數(shù)為指向下一個參數(shù)指針表的偏移。第九十七頁,共118頁。3)參數(shù)塊結(jié)構(gòu)表2-4TIF文件參數(shù)塊結(jié)構(gòu)第九十八頁,共118頁。TIFF文件格式第九十九頁,共118頁。

2.GIF圖像文件格式

CompuServe開發(fā)的圖形交換文件格式GIF(GraphicsInterchangeFormat),目的是在不同的系統(tǒng)平臺上交流和傳輸圖像。它是在Web及其他聯(lián)機(jī)服務(wù)上常用的一種文件格式,用于超文本標(biāo)記語言(HTML)文檔中的索引顏色圖像,但圖像最大不能超過64M,顏色最多為256色。GIF圖像文件采取LZW壓縮算法,存儲效率高,支持多幅圖像定序或覆蓋,交錯多屏幕繪圖以及文本覆蓋。GIF主要是為數(shù)據(jù)流而設(shè)計的一種傳輸格式,而不是作為文件的存儲格式。換句話說,它具有順序的組織形式。GIF有五個主要部分以固定順序出現(xiàn),所有部分均由一個或多個塊(block)組成。每個塊第一個字節(jié)中存放標(biāo)識碼或特征碼標(biāo)識。這些部分的順序為:文件標(biāo)志塊、邏輯屏幕描述塊、可選的“全局”色彩表塊(調(diào)色板)、各圖像數(shù)據(jù)塊(或?qū)S玫膲K)以及尾塊(結(jié)束碼)。GIF圖像文件格式如表2-5所示。第一百頁,共118頁。第一百零一頁,共118頁。GIF文件格式第一百零二頁,共118頁。

3.PCX文件

PCX文件格式由ZSoft公司設(shè)計,最早使用的圖像文件格式之一,由各種掃描儀掃描得到的圖像幾乎都能保存成PCX格式。PCX支持256種顏色,不如TARGA或TIF等格式功能強(qiáng),但結(jié)構(gòu)較簡單,存取速度快,壓縮比適中,適合于一般軟件的使用。

PCX格式常用于IBMPC兼容計算機(jī)。大多數(shù)PC軟件支持PCX格式的第5版。第3版文件使用標(biāo)準(zhǔn)的VGA調(diào)色板,不支持自定義調(diào)色板。

PCX格式支持RGB、索引顏色、灰度和位圖顏色模式,但不支持alpha通道。PCX支持RLE壓縮方法,圖像顏色的位數(shù)可以是1、4、8或24。第一百零三頁,共118頁。

PCX圖像文件由三個部分組成:文件頭、圖像數(shù)據(jù)和256色調(diào)色板。PCX的文件頭有128個字節(jié),它包括版本號,被打印或掃描的圖像的分辨率(dpi)及大小(單位為像素),每掃描行的字節(jié)數(shù),每像素包含的位數(shù)據(jù)和彩色平面數(shù)。位圖數(shù)據(jù)用行程長度壓縮算法記錄數(shù)據(jù)。第一百零四頁,共118頁。

4.JPEG圖像格式

JPEG(JointPhotogr

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論