第2章圖像視覺基礎及數學基礎_第1頁
第2章圖像視覺基礎及數學基礎_第2頁
第2章圖像視覺基礎及數學基礎_第3頁
第2章圖像視覺基礎及數學基礎_第4頁
第2章圖像視覺基礎及數學基礎_第5頁
已閱讀5頁,還剩79頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第2章圖像視覺基礎與數學基礎

2.1光度學及色度學原理1.色彩的基本屬性

色彩是光的物理屬性和人眼的視覺屬性的綜合反映。人眼對發(fā)光體或不發(fā)光體的色彩感覺,分別是因為不同光譜波長的輻射光或反射光刺激人眼視網膜內的感受器(視色素)使之興奮的結果。

色彩具有三個基本屬性:色調、飽和度和亮度。色調是與混合光譜中主要光波長相聯系的。(紅、綠、藍)飽和度表示顏色的深淺程度,與一定色調的純度有關,純光譜色是完全飽和的,隨著白光的加入飽和度逐漸減少。(如深紅、淺紅等)亮度與物體的反射率成正比。顏色中摻入白色越多就越明亮,摻入黑色越多亮度越小。2.顏色視覺(1)顏色的基礎知識顏色的本質:不同頻率的電磁波。人的腦和眼將不同頻率的電磁波感知為不同的顏色。人感受到的不透明物體顏色主要取決于反射光的特性,如果物體比較均衡的反射各種光譜,則人看到的物體是白色的;如果物體對某些光譜反射的較多,則人看到的物體就呈現相對應的顏色。

顏色與彩色:

顏色可分為無彩色和有彩色兩大類。無彩色:白色、黑色和各種深淺程度不同的灰色。彩色:除去黑白系列以外的各種顏色。

三基色:

實驗證明,任何色彩都可以由不同比例的三種獨立的基本彩色型混合而得到。這三種相互獨立的彩色稱為三基色。相加混合法的三基色是:紅、綠、藍,它們之間的任意一組混合都可以得到一種新的彩色。光的三原色印刷三原色三原色原理:任何顏色都可以用3種不同的基本顏色按不同的比例混合得到。標準三基色:國際照明委員會(CIE)規(guī)定:紅色(R):波長為700nm;綠色(G):波長為546.1nm;藍色(B):波長為435.8nm。紅綠藍三原色按照比例混合可以得到各種顏色,其配色方程為:(2)顏色模型:

所有顏色都可以看作3個基本顏色:紅(R)、綠(G)、藍(B)的不同組合。

(i)RGB模型RGB模型面向彩色顯示器或打印機等設備。RGB彩色立方體B(0,0,1)白灰黑GR(1,0,0)(0,1,0)0藍綠紅(ii)HSI模型:

基于區(qū)分顏色的3種基本特征量,即:色調(hue)飽和度(saturation)和亮度(intensity)

。適合人的視覺系統(tǒng)。HSI格式可以用一個圓柱體表示:圓柱體橫截面形成彩色環(huán);色度由角度表示;飽和度由半徑上的點至圓心的距離表示,圓周上的顏色其飽和度為1,圓心的飽和度為0;圓柱的軸線表示亮度,底部的亮度最低,頂部的亮度最高。亮度色調飽和度HSI模型的特點:(1)亮度(I)分量與圖像的彩色信息無關;反映物體的明暗程度;(2)色調(H)和飽和度(S)分量與人感受顏色的方式緊密相連。適用:

借助人的視覺系統(tǒng)來感知彩色特性的圖像處理算法,面向以彩色處理為目的的應用,如:動畫中的彩色圖形。

(3)RGB模型與HSI模型之間轉換

(i)從RGB轉換到HSI色度用H表示,飽和度用S表示,亮度用I表示。

(ii)從HSI轉換到RGB分3段:

當H在[0°,120°]之間:當H在[120°,240°]之間:當H在[240°,360°]之間:2.2人眼視覺基礎1.亮度和顏色感覺的視覺特性刺激強度與感覺的關系:人眼的視覺效果是由可見光刺激人眼引起的。如果光的輻射功率相同而波長不同,則引起的視覺效果也不同。例:在等能量分布的光譜中,人眼感覺最暗的是紅色,其次是藍色和紫色,最亮的是黃綠色。相對視敏函數:

反映人眼對不同波長的光的敏感程度。當光的輻射功率相同時,波長λ為555nm的黃綠光的主觀感覺最亮。以視敏度K(555)為基礎,把任意波長為λ的光的主觀感覺亮度稱為波長λ的光的視敏度K(λ)。因此,任意波長光的相對視敏度函數(相對視敏度)。即為:亮度適應和顏色適應:

人的視覺系統(tǒng)能適應的亮度范圍是很大的(1010量級),但是人眼并不能同時感受很寬的亮度范圍;客觀亮度相同時,當背景亮度不同時,主觀感受的亮度也不同。人眼的明暗感覺是相對的。亮度適應性:在外界光線的亮度發(fā)生變化時,人眼的感受性也會發(fā)生變化。從明亮處到昏暗處的視覺適應性稱為暗適應性;從暗環(huán)境到明環(huán)境適應性為亮適應性。亮度對比和顏色對比:視覺的主觀亮度取決于視野中心(目標)與周圍環(huán)境之間光照的相對強度。(1)馬赫帶效應

馬赫帶:在視覺圖像的明暗過渡帶的兩側看到的亮帶與暗帶。(2)同時對比度現象此現象表明人眼對某個區(qū)域感覺到的亮度不僅僅依賴它的強度,而與環(huán)境亮度有關。同時對比度示例圖馬赫帶效應:基于視覺系統(tǒng)有趨向于過高或過低估計不同亮度區(qū)域邊界值的現象(如圖)。2.視覺的空間性質視覺的空間頻率特性:空間頻率是指視像空間變化的快慢。明亮的圖像(清晰明快的畫面)意味著有大量的高頻空間成分;模糊的圖像只有低頻空間成分。3.視覺的時間特性使視覺圖像建立起來是需要時間的,而視覺圖像建立起來之后,即使把目標圖像拿走,視覺反應也要持續(xù)一段時間。因此而產生視覺的運動感覺。運動感覺:視覺的運動感覺與人對刺激信號的反應有關。刺激信號的出現與消失或改變都影響反應時間。光消失反應比光出現反應時間短;光強度增加比光強度減弱時間長。視覺運動的規(guī)律(習慣):

①人眼的水平運動比垂直運動快,更易跟蹤水平運動的物體;②看圓形的畫面總是習慣沿順時針方向看,所以對順時針方向運動的物體的反應較逆時針運動物體快;③在偏離距離相同的情況下,人眼對視野中四個象限的觀察率依次為:左上、右上、左下、右下;④視線習慣于從左到右和從上到下看等。4.主觀輪廓和空間錯覺主觀輪廓:指實際上并不存在、只是主觀上認為存在的某景物的輪廓線。它是從整個圖形數據得到的概念(如圖)。主觀輪廓視覺效果圖

空間錯覺:物體的整體面貌和結構強烈地影響著人們對它的感知。通常有兩類:基于形狀和方向;基于長度和面積。兩條紅線是否一樣長?大個子在追小個子?1.請解釋馬赫帶效應,馬赫帶效應和同時對比度反映了什么共同的問題?

它們都反映了人類視覺感知的主觀亮度并不是物體表面照度的簡單函數。2.色彩具有那幾個基本屬性?描述這些基本屬性的含義。3.什么是視覺的空間頻率特性?什么是視覺的時間特性?4.顏色模型有哪幾種?思考題:2.3數字圖像處理的數學基礎2.3.1線性系統(tǒng)1.線性系統(tǒng):線性系統(tǒng)具有疊加性。2.移不變系統(tǒng)3.線性移不變系統(tǒng)2.3.2卷積與濾波1.卷積定義:2.卷積性質:(1)交換率:(2)結合律:(3)分配律:(4)求導:3.離散卷積4.濾波

數學上的卷積運算在信號處理和圖像處理中被稱為濾波。這樣,線性移不變系統(tǒng)的輸出可以通過輸入信號與一表征系統(tǒng)特性的函數的卷積得到。——系統(tǒng)中的沖激響應2.3.3二維線性系統(tǒng)1.空間不變的線性系統(tǒng)設某系統(tǒng),若輸入產生輸出即:或用空間矢量記為:當它具有以下性質時,則稱該系統(tǒng)為二維線性系統(tǒng)。對于二維線性系統(tǒng):若即則稱該系統(tǒng)為空間不變的線性系統(tǒng)。二維線性移不變系統(tǒng)的輸出也可以通過輸入信號與表征系統(tǒng)特性的沖激響應函數h(x,y)的二維卷積得到,即:離散二維卷積形式為:2.二維線性系統(tǒng)的算子描述

二維線性系統(tǒng)常用的算子:梯度算子(一階微分算子)包括羅伯特算子(Robert)、索貝爾算子(Sobel)、浦瑞維特算子(Prewitt)等。2.3.4數字圖像的數學表示1.連續(xù)模型:一幅圖像以灰度G在(x,y)二維空間的連續(xù)變化來描述,即:圖像=G(x,y)2.離散模型:連續(xù)圖像經過采樣和量化后,輸入計算機后即為它的離散形式,即為數字圖像。它是一個矩陣。3.隨機場模型:一個多維的隨機過程被稱為隨機場。圖像隨機場模型是把每一個像素都看作一個隨機過程而形成的。在隨機場模型中,一幅圖像可用一個聯合概率密度來表達:式中:為不同平面上的像素。圖像的隨機場模型yyy???

F(r,Gi)xxxGiG2G1r2.3.5灰度直方圖1.定義(2種)(i)灰度直方圖反映的是一幅圖像中各灰度級像素出現的頻率。Vii(ii)用閾值面積表示

一幅連續(xù)圖像中被具有灰度級D的所有輪廓線所包圍的面積,稱為它的閾值面積函數A(D)。2.直方圖的性質(1)灰度直方圖只能反映圖像的灰度分布情況,而不能反映圖像的位置,即失去了像素的位置信息。(2)一幅圖像對應唯一的灰度直方圖,反之不成立。不同的圖像可對應相同的直方圖。I(3)一幅圖像分成多個區(qū)域,多個區(qū)域的直方圖之和即為整個圖像的直方圖。IIIII3.直方圖的作用(應用)(1)檢查數字化參數(可判斷圖像量化是否恰當)一般來說,數字化獲取的圖像應該利用全部可能的灰度級,其許可范圍在[0,255]。0255(a)恰當量化充分利用了允許的灰度范圍。(b)未能有效利用動態(tài)范圍(少于256)S、E部分未有效利用255S0E灰度級數少于256,對比度減小,丟失的信息將不能恢復,除非重新量化。(c)超過了動態(tài)范圍E0S255超出數字化器所能處理的范圍,超出部分被置為0或256,亮度差別消失,信息丟失。(2)選擇邊界閾值

邊界閾值可以確定物體的邊界,利用直方圖即是一個合理的技術。例:假定一幅圖像背景是淺色的,其中有一個深色的物體,它的直方圖如圖選擇谷值(T)作為灰度閾值得到物體邊界0T255背景物體頻率灰度2.3.6數字圖像顯示1.數字圖像的屏幕顯示幀緩存:

在計算機中設有專用于存儲圖像信息的幀緩沖存儲器,計算機時時監(jiān)控這個存儲器,如果存儲器內被填充圖像數據,該數據就會自動地由光柵掃描方式映射到屏幕上,形成圖像。幀緩沖器中的每一位對應于屏幕上的一個點,當一個位上的數據被置為1時,屏幕上的對應位置上就會出現一個亮點,而當位上的數據為0時,屏幕上的對應位置就是一個暗點。計算機被啟動時,幀緩沖存儲器所有的位上都自動地被置為0,只有當輸入圖象或圖形數據后,幀緩沖存儲器中的某些位才被置為1。位平面:

顯示一幅二值圖像需要的幀緩存容量被稱為一個位平面。(每個像素占用1位)。注意:每一個像素上的數據在幀緩存上是以位(bit)為單位描述的,而計算機中的數據輸入輸出都是以字節(jié)(byte)為單位的,因此,圖像數據中的每一個字節(jié)對應著畫面上橫向排列的8個像素。2.數字圖像的顯示

決定圖像顯示系統(tǒng)質量的最重要的顯示特性是圖像的大小、光度分辨率、低頻響應、高頻響應、點間距和噪聲特性。1.顯示圖像的大小

系統(tǒng)顯示圖像大小的能力包括兩部分。第一是顯示器自身的物理尺寸,它應該足夠大,能方便的觀察和理解所顯示的圖像。第二是顯示系統(tǒng)能處理的最大數字圖像的大小。顯示器必須與待顯示的最大圖像的行數和每行像素數相適應。2.光度分辨率

系統(tǒng)在每個像素位置產生正確的亮度或光密度的精度。特別是系統(tǒng)能產生的離散灰度級數目。3.低頻響應

顯示系統(tǒng)再現大塊灰度級即平坦區(qū)域的能力。希望平坦區(qū)域以均勻一致的亮度顯示出來。4.高頻響應

圖像中的高頻通常反映圖像的邊緣,一個顯示系統(tǒng)再現直線圖案的好壞反映了其顯示圖像細節(jié)的能力。5.點間距的選擇

顯示點間距越小,均勻區(qū)域的平坦性越好;而點間距越大越能更好的再現圖像細節(jié)的對比。6.噪聲

顯示系統(tǒng)的電子噪聲會引起顯示點亮度與位置兩方面的變化,即幅值噪聲和位置噪聲兩種。(1)幅值噪聲

亮度通道的隨機噪聲會產生一種“胡椒加鹽”的效果(即黑白噪聲點),在平坦區(qū)域中尤其明顯。如果噪聲是周期性的并且與水平或垂直偏轉信號同步,它會產生條狀圖案。如果所有噪聲(包括隨機的和周期性的)幅值都低于一個灰度級,那么總的顯示效果影響不大。(2)位置噪聲

來自偏轉電路使點顯示間距不均勻。要得到好的顯示必須精確控制像素的位置。2.3.7圖像的統(tǒng)計特征1.圖像的基本統(tǒng)計分析量設數字圖像為f(i,j),大小為M×N,(1)圖像的信息量:表示圖像所含信息的多少。

一幅圖像如果有q種灰度值,并且出現的概率分別為p1,p2,p3,…,pq,則根據香農定理圖像的信息量用

熵H表示為:例:統(tǒng)計下面圖像的灰度直方圖,并計算熵01321321057625671606163426753565322726162650275012321212312312210:5個1:12個2:16個3:8個4:1個5:7個6:10個7:5個P1=5/64P2=12/64P3=16/64P4=8/64P5=1/64P6=7/64P7=10/64P8=5/640132132105762567160616342675356532272616265027501232121231231221(3)圖像灰度中值

圖像所有灰度級中處于中間的值,當灰度數為偶數時,則取中間的兩個灰度值的平均值。(4)圖像灰度眾數

圖像中出現次數最多的灰度值,它反映一幅圖像中密度占優(yōu)的物體的灰度特征。(2)圖像灰度的平均值一幅圖像中所有像元灰度值的算術平均值,反映圖像中不同物體的平均反射強度。(5)圖像灰度方差

反映各像元灰度值與圖像平均灰度值的總的離散程度。方差越大,說明圖像信息量越大。(6)圖像灰度值域

圖像最大灰度值和最小灰度值的差值。2.圖像的直方圖特征

圖像中所有灰度值的概率分布。3.多維圖像的統(tǒng)計特征(彩色圖像特征)

反映一幅圖像的多個波段之間的關系(如彩色圖像是三個波段;一幅遙感圖像包含七個波段)。(1)協方差:反映一幅圖像中的N個波段灰度值與其平均值之間的關系。(1)協方差計算公式:(2)相關系數:圖像波段間的相關程度的統(tǒng)計量。反映兩個波段圖像所含信息的重疊程度,當相關系數為1時,表明表明兩幅圖像完全重疊。相關矩陣為:4.連續(xù)傳輸的數字圖像的統(tǒng)計特性對于連續(xù)傳輸的數字圖像,不能確切地規(guī)定圖像性質,但是可以把它看成隨機信號來處理。一般用振幅或相位分布函數、概率密度函數、相關矩、中心矩和功率譜等數學特征來表征。圖像的振幅分布特性:圖像的振幅分布特性用圖像信號振幅分布函數表述,圖像信號振幅分布函數是指圖像信號g(x,y)的值小于某一給定值z的概率:振幅密度函數:對振幅分布函數進行微分就得到振幅密度函數,即:圖像的振幅譜:圖像信號g(x,y)的傅里葉變換。即:能量譜:圖像信號g(x,y)具有的能量為:2.3.8數字圖像處理中的基本運算1.圖像處理的基本功能形式單幅圖像→單幅圖像將原始圖像對比度增強、消除噪音、增加亮度等。多幅圖像→單幅圖像單(或多)幅圖像→數字或符號等統(tǒng)計量或特征量的測量編碼表示描述圖像圖像特征提取圖像2.點運算點運算:對數字圖像中像素點的操作。點運算不改變圖像內的空間關系。點運算使圖像數據占據的灰度范圍發(fā)生改變。對比度增強或對比度拉伸:一幅圖像通過點運算將其灰度范圍擴大,該方法稱為對比度增強。方法:線性灰度變換(線性點運算)和非線性點運算。點運算應用:(1)對比度增強(灰度變換)例1:線性灰度變換設輸入的灰度級為DA,輸出的灰度級為DB,灰度變換函數為:0255aDAa′b′bDB255a) b)

a)原圖b)對比度擴展后的圖圖像的對比度擴展①當a=1,b=0時,為將輸入圖像復制為輸出圖像;②當a>1時,輸出圖像對比度增大,輸出灰度范圍變大,

DA灰度范圍[a,a′],DB灰度范圍[b,b′]③當a<1時,輸出圖像對比度減小,輸出灰度范圍減小;④當a=1,b≠0時,使所有圖像的灰度值上移或下移,其效果是圖像顯示為更亮或更暗;⑤當a=-1,b=0時,暗區(qū)將變亮,亮區(qū)將變暗。實現圖像求補(求反)。討論:用直接灰度變換增強圖像例2:非線性灰度變換用非線性函數(如對數函數、指數函數等)作為映射函數時,可實現圖像灰度的非線性點運算。2552550①對數變換:作用:對圖像的低灰度區(qū)進行較大拉伸,對高灰度區(qū)壓縮,變換后圖象灰度分布與人的視覺特性相匹配。其中,a,b,c為調整曲線位置和形狀的參數。a) b)a)原圖b)進行動態(tài)范圍壓縮后的圖圖像的動態(tài)范圍壓縮255255②指數變換:0作用:對圖像的高灰度區(qū)給予較大拉伸。其中,a,b,c為調整曲線位置和形狀的參數。(4)裁減將圖像感興趣的部分的灰度級變換到[0,255]范圍內,而其他部分則被裁減掉。(3)輪廓線通過點運算為圖像加上輪廓線,即進行閾值化。(2)變換灰度單位

用灰度反映物理特性,如光照強度、光密度等。即通過點運算實現光學標定和現實標定等。0圖2a1a2a3DB255255DA分段線性變換,即各段線性函數不同。a) b)a)原圖 b)進行分段線性變換后的圖圖像的分段線性變換3.代數運算代數運算:

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論