版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、 基于Gabor紋理特征的人臉識別系統(tǒng)設(shè)計與實現(xiàn)摘要2Abstract21 緒論31.1 研究背景及意義31.2 國內(nèi)外研究現(xiàn)狀及發(fā)展趨勢51.3 人臉識別的常用方法61.4 本論文的主要研究工作82 Gabor特征提取算法的實現(xiàn)102.1 Gabor小波簡介102.2 人臉圖像的Gabor特征133 奇異值特征提取算法的實現(xiàn)163.1 人臉圖像的奇異值特征163.2 奇異值特征向量的重要性質(zhì)184 Gabor特征與奇異值特征融合的實現(xiàn)224.1 圖像融合的概念和意義224.2 圖像融合關(guān)鍵技術(shù)的發(fā)展254.3 最近鄰分類規(guī)則284.4 實驗結(jié)果及分析29結(jié) 論32參 考 文 獻(xiàn)33附錄38附
2、錄 A 提取人臉圖像的Gabor特征的源代碼38附錄 B 對每幅人臉圖像進(jìn)行處理的源代碼39附錄 C 最近鄰分類的源代碼41附錄 D 程序執(zhí)行主線源代碼42摘要 由于人臉識別技術(shù)在安全、金融、法律 實施和軍事上有廣闊的潛在應(yīng)用前景,近二十年來,人臉識別已經(jīng)成為計算機(jī)視覺領(lǐng)域的研究熱門之一并且促進(jìn)了多門相關(guān)學(xué)科的發(fā)展。隨著人臉識別技術(shù)的不斷發(fā) 展,更大的圖像庫,更高的識別率,更快的識別速度成為人臉識別技術(shù)新的發(fā)展方向,目前已經(jīng)有相當(dāng)成熟的人臉識別技術(shù)應(yīng)用于實際生活當(dāng)中。鑒于基于像素模式 的紋理特征(PPBTF)已經(jīng)成功地應(yīng)用于人臉表情識別,本文將它應(yīng)用于人臉識別,并在此基礎(chǔ)上提出了一種新的人臉特
3、征表示方法基于Gabor像素模 式的紋理特征(GPPBTF)。Gabor特征能夠精確的提取圖像的局部特征,且對位移、形變、旋轉(zhuǎn)、尺度變化和光照變化都具有一定的魯棒性。PPBTF 特征能夠有效的描述圖像的紋理特征,對光照影響不敏感,計算速度快,耗時少。本文把Gabor特征和PPBTF特征的優(yōu)點(diǎn)相結(jié)合,得到基于Gabor像素 模式的紋理特征(GPPBTF)。基于核函數(shù)零空間Fisher判決分析(NKFDA)的分類方法已經(jīng)成功地應(yīng)用于人臉識別。該方法能夠把特征向量映射到 核函數(shù)零空間,在得到更具判別力的判別向量的同時減小了特征向量的維數(shù)。本文提出了一種基于多NKFDA分類器相結(jié)合的分類方法,有效地解
4、決了超高維向量 向低維空間投影丟失判決信息的難題,提高了分類的準(zhǔn)確性。本文將Gabor像素模式的紋理特征(GPPBTF)和多NKFDA分類器相結(jié)合的分類方法應(yīng)用 于FERET人臉識別測評,取得了較高的識別率。 關(guān)鍵詞:人臉識別; Gabor ,紋理特征; 小波變換; NKFDA; 多分類器 Abstract Face recognition has been one of the hottest research topics in computer vision for recent two decades due to wide potential applications in secu
5、rity,finance,law enforcement and military.Its research achievements promote the development of correlative disciplines.With the continuous development of face recognition technology,the larger image library,the higher recognition rate,the faster the rate of identification has become the new directio
6、n of face recognition technology.At present,there are already quite mature face recognition technologies using in real life.Since Pixel-pattern-based texture feature(PPBTF) has been applied to real-time facial expression recognition system successfully,we use it in face recognition and propose a nov
7、el face representation approach,Gabor Pixel-Pattern-Based Texture Feature(GPPBTF).Gabor wavelets can extract images local information exactly and is robustness to displacement, deformation,rotation,scaling and illumination variances.PPBTF can describe images texture information and is insensitive to
8、 illumination and time saving.This paper combines Gabor wavelets and PPBTFs advantages to represent face image.The combining operator is termed as Gabor Pixel-Pattern-Based Texture Feature(GPPBTF).Null Space-based Kernel Fisher Discriminant Analysis(NKFDA) has been used in face recognition successfu
9、lly.NKFDA can map the feature vector into null space of kernel function to get more effective discriminant features and reduce the dimension of feature vector.This paper proposed a method based on multiple NKFDAs to classify the face images which solve the problem of losing useful information when m
10、apping the high dimension vector into low dimension space.This paper proposes a method which combines GPPBTF and multiple NKFDAs to classify the face images on FERET database.This method achieves higher recognition accuracy. Key words: Face Recognition; Gabor;Texture Feature; Gabor Wavelet; NKFDA; M
11、ulti-classifier;1 緒論1.1 研究背景及意義人臉識別是生物特性鑒別技術(shù)的一個主要方向,它涉及圖像處理,模式識別,計算機(jī)視覺等多個研究領(lǐng)域,具有十分廣泛的應(yīng)用前景,多年來一直是一個研究熱點(diǎn)。相對于其它人體生物特征識別技術(shù),如指紋識別、虹膜識別、掌紋識別,人臉識別技術(shù)是最直接、最自然、最容易被人接受的。與其它技術(shù)相比,它具有侵犯性小、較少需要或不需要用戶的主動配合、樣本采集方便、應(yīng)用場合廣泛、潛在的數(shù)據(jù)資源豐富、設(shè)備成本低等優(yōu)點(diǎn)1。人臉識別系統(tǒng)具備操作及流程簡單、適用面廣、支持一對一或一對多比對、支持多點(diǎn)同時采集比對、帶有數(shù)據(jù)庫支持記錄及查詢功能,對采集現(xiàn)場環(huán)境要求較低,可在極短
12、的時間里判斷出進(jìn)出者的身份是否合法,杜絕使用他人鑰匙、密碼、磁卡等非法進(jìn)入。人臉識別技術(shù)的安全性、可靠性較高,且擁有廣泛的市場需求,它可以應(yīng)用于公安部門的犯人檔案管理、犯人辨認(rèn)查找、刑偵破案、安全驗證系統(tǒng)、信用卡驗證、醫(yī)學(xué)、檔案管理、視頻會議、人機(jī)交互系統(tǒng)、證件核對、保安監(jiān)視、門禁控制及至自動柜員機(jī)(ATM)等多種場合2。人臉識別對人類來說是件自然而然的事情,但對計算機(jī)而言,人臉識別卻遠(yuǎn)非一個已解決的課題。所有的人臉都具有相似的結(jié)構(gòu),在紋理上也十分相近。另外圖像受光照、成像角度及成像距離等外界條件影響,具有“一人千面”的特點(diǎn),欲建立一種具有各種不變性的描述模型還是比較困難的。此外,人臉識別技術(shù)
13、研究與相關(guān)科學(xué)的發(fā)展及人腦的認(rèn)識程度緊密相關(guān)3。諸多因素都使人臉識別研究成為一項極富挑戰(zhàn)性的課題,一方面信息化進(jìn)程的日益加快,電子商務(wù)、重要場所的安全認(rèn)證、智能化環(huán)境等許多應(yīng)用領(lǐng)域?qū)εc人臉有關(guān)的信息處理提出了迫切要求;另一方面,硬件和軟件技術(shù)的發(fā)展,為滿足實際應(yīng)用系統(tǒng)對人臉檢測、跟蹤及識別技術(shù)的實時化要求提供了可能性2。所以,人臉識別的研究不僅涉及心理學(xué)、生理學(xué)、人工智能、模式識別、計算機(jī)視覺、圖像分析與處理等多個學(xué)科領(lǐng)域,更是模式識別、人工智能和計算機(jī)視覺的典型案例之一2。對這一問題的研究和解決,有助于對其他對象識別問題的研究分析和解決,人臉識別也因此成為這些基礎(chǔ)研究領(lǐng)域的重要課題之一,具有
14、重要的理論研究價值。1.2 國內(nèi)外研究現(xiàn)狀及發(fā)展趨勢近30年來,人臉自動識別的研究取得了很大的進(jìn)展,從工程索引(EI)上檢索到的相關(guān)文獻(xiàn)已達(dá)數(shù)千篇,包括IEEE PAMI在內(nèi)的重要國際期刊也有專欄甚至專刊報道人臉識別的最新研究進(jìn)展,同時還出現(xiàn)了專門的國際學(xué)術(shù)會議,如人臉手勢識別國際學(xué)術(shù)會議1。目前人臉識別領(lǐng)域內(nèi)最著名的國際研究機(jī)構(gòu)包括:美國麻省理工學(xué)院媒體實驗室及人工智能實驗室、南加州大學(xué)、CMU卡內(nèi)基梅隆機(jī)器人研究及交互系統(tǒng)實驗室、馬里蘭大學(xué)等。另外,一些國家或地區(qū)也有不少研究機(jī)構(gòu)在人臉識別領(lǐng)域進(jìn)行了大量的研究工作4。90年代中后期以來,國內(nèi)的許多研究機(jī)構(gòu)在自然科學(xué)基金、863計劃、攀登計劃
15、等資助下,開始了對人臉識別的研究。其中主要包括清華大學(xué)計算機(jī)系、自動化系、電子系以及哈爾濱工業(yè)大學(xué)、南京理工大學(xué)信息學(xué)院、中科院自動化所、上海交通大學(xué)圖像處理與模式識別研究所、中山大學(xué)數(shù)學(xué)系等,他們在人臉識別研究領(lǐng)域都進(jìn)行了許多很有意義的嘗試,積累了經(jīng)驗5。中科院計算所人臉識別研究小組2001年5月與專門從事人臉識別商業(yè)系統(tǒng)開發(fā)和銷售的四川成都銀晨網(wǎng)訊科技全面合作,在北京成立了ICT-YCNC人臉識別聯(lián)合實驗室,專門研究和開發(fā)商業(yè)人臉識別系統(tǒng)。一年來,實驗室在實時人臉檢測與跟蹤、人臉識別、人臉確認(rèn)等方面進(jìn)行了大量卓有成效的研究,并開發(fā)了一套具有良好魯棒性的實時人臉檢測系統(tǒng);提出了一種新的基SF
16、S的人臉識別方法,并基于該方法開發(fā)了一套實時人臉識別確認(rèn)系統(tǒng),目前已通過系統(tǒng)測試,并進(jìn)入產(chǎn)品開發(fā)階段。另外,實驗室以成熟的“特征臉”人臉識別技術(shù)為基礎(chǔ),對其進(jìn)行了很多改進(jìn)和擴(kuò)充,嘗試了基于人工神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)、線性判別分析、基于GMM的雙子空間人臉識別方法等,研究了基于Gabor小波變換和彈性圖匹配的人臉識別技術(shù),以及基于統(tǒng)計模型的人臉識別方法等5。1.3 人臉識別的常用方法(1)基于幾何特征的方法幾何特征最早是用于人臉識別的。人臉由眼睛、鼻子、嘴巴、下巴等部件構(gòu)成,正因為這些部件的形狀、大小和結(jié)構(gòu)上的各種差異才使得世界上每個人臉千差萬別,因此對這些部件的形狀和結(jié)構(gòu)關(guān)系的幾何描述,可以作為
17、人臉識別的重要特征。將人臉用一個幾何特征矢量表示,用模式識別中層次聚類的思想設(shè)計分類器達(dá)到識別目的6。這就要求選取的幾何特征矢量具有一定的獨(dú)特性,能夠反映不同人臉之間的差別,同時又具有一定的彈性,以消除時間跨度、光照等的影響。幾何特征矢量是以人臉器官的形狀和幾何關(guān)系為基礎(chǔ)的特征矢量,其分量通常包括人臉指定兩點(diǎn)間的歐式距離、曲率、角度等6。(2)基于彈性模型匹配方法彈性模型匹配方法的思想是將人臉上的一些特征點(diǎn)作為基準(zhǔn)點(diǎn)構(gòu)成彈性圖,每個基準(zhǔn)點(diǎn)存儲一串具有代表性的特征矢量,采用分級結(jié)構(gòu)的彈性圖,去除一些冗余節(jié)點(diǎn),形成稀疏的人臉描述結(jié)構(gòu)7。通過測試樣本和特征樣本的彈性匹配來完成識別。彈性模型匹配方法有
18、很多,例如:在人臉圖像上放置一組矩形網(wǎng)格節(jié)點(diǎn),每個節(jié)點(diǎn)的特征用該節(jié)點(diǎn)處的多尺度Gabor幅度特征描述,各節(jié)點(diǎn)之間的連接關(guān)系用幾何距離表示,從而構(gòu)成基于二維拓?fù)鋱D的人臉描述,根據(jù)兩個圖像中各節(jié)點(diǎn)和連接之間的相似性進(jìn)行人臉識別。還有將人臉圖像表示為可變形的3D網(wǎng)格表面,將人臉匹配問題轉(zhuǎn)換為曲面匹配問題,利用有限元分析的方法進(jìn)行曲面變形,根據(jù)兩幅圖像之間變形匹配的程度識別人臉等。(3) 神經(jīng)網(wǎng)絡(luò)方法目前神經(jīng)網(wǎng)絡(luò)方法在人臉識別中的研究方興未艾。Valentin8,9提出一種方法,首先提取人臉的50個主元,然后用自相關(guān)神經(jīng)網(wǎng)絡(luò)將它映射到5維空間中,再用一個普通的多層感知器進(jìn)行判別,對一些簡單的測試圖像效
19、果較好;Intrator8,9等提出了一種混合型神經(jīng)網(wǎng)絡(luò)來進(jìn)行人臉識別,其中非監(jiān)督神經(jīng)網(wǎng)絡(luò)用于特征提取,而監(jiān)督神經(jīng)網(wǎng)絡(luò)用于分類。Lee8,9等將人臉的特點(diǎn)用六條規(guī)則描述,然后根據(jù)這六條規(guī)則進(jìn)行五官的定位,將五官之間的幾何距離輸入模糊神經(jīng)網(wǎng)絡(luò)進(jìn)行識別,效果較一般的基于歐氏距離的方法有較大改善;Laurence8,9等采用卷積神經(jīng)網(wǎng)絡(luò)方法進(jìn)行人臉識別,由于卷積神經(jīng)網(wǎng)絡(luò)中集成了相鄰像素之間的相關(guān)性知識,從而在一定程度上獲得了對圖像平移、旋轉(zhuǎn)和局部變形的不變性,因此得到非常理想的識別結(jié)果。神經(jīng)網(wǎng)絡(luò)方法在人臉識別上的應(yīng)用比起前述幾類方法來有一定的優(yōu)勢,因為對人臉識別的許多規(guī)律或規(guī)則進(jìn)行顯性的描述是相當(dāng)困
20、難的,而神經(jīng)網(wǎng)絡(luò)方法則可以通過學(xué)習(xí)的過程獲得對這些規(guī)律和規(guī)則的隱性表達(dá),它的適應(yīng)性更強(qiáng),一般也比較容易實現(xiàn)。(4)基于線性和非線性子空間的方法基于子空間的方法是基于圖像像素本身的,主要是利用計算模板和圖像灰度的自相關(guān)性來實現(xiàn)識別功能,一般來說模板匹配法要優(yōu)于基于幾何特征法10。目前,在諸多子空間方法中,應(yīng)用最廣泛的是特征臉法(PCA),這是針對人臉整體特征的研究,利用Karhunen-Lobve變換原理,將圖像表示為一些低維的正交基組成的子空間,然后采用最小距離準(zhǔn)則進(jìn)行人臉識別。線性判別分析(LDA)是一種較為普遍的用于特征提取的線性分類方法。它使投影后的模式樣本的類間散布矩陣最大而類內(nèi)散布矩
21、陣最小,也就是說,投影后保證模式樣本在新的空間中有最大的類間距離和最小的類內(nèi)距離,即模式在該空間中有最佳的可分離性。線性判別分析提取的特征向量集強(qiáng)調(diào)的是不同人臉的差異而不是照明條件、人臉表情和方向的變化。因而,采用此方法對光照條件、人臉姿態(tài)等的變化不太敏感,從而有助于提高識別效果。但是傳統(tǒng)的算法常常遇到的一個問題是樣本類內(nèi)散度矩陣通常是奇異的,即“小樣本集合問題”。針對這一問題已有了許多改進(jìn)方法并取得了很好的識別效果。獨(dú)立分量分析(ICA)是一種很有效的提取方法。與PCA相比,ICA有兩個優(yōu)勢:一是ICA獲得的獨(dú)立分量不需要滿足正交關(guān)系,能夠消除象素間的高階統(tǒng)計相關(guān)性,而PCA只能消除象素間的
22、二階統(tǒng)計相關(guān)性;二是ICA獲得的一組矢量比本征矢量更具空間局部描述性,具有更好的人臉描述能力。借鑒SVM的Kernel方法,PCA、LDA和ICA等都被擴(kuò)展到了核空間。與線性子空間方法相比,基于Kernel的方法獲得了更好的識別效果11,12。(5)其他方法Brunelli等對模板匹配方法作了大量實驗,結(jié)果表明在尺度、光照、旋轉(zhuǎn)角度等各種條件穩(wěn)定的情況下,模板匹配的效果優(yōu)于其他方法,但它對光照、旋轉(zhuǎn)和表情變化比較敏感,影響了它的直接使用。Goudail等人采用局部自相關(guān)性作為人臉識別的判斷依據(jù),它具有平移不變性,在臉部表情變化時比較穩(wěn)定。在最近的一些工作中,Benarie等提出VFR的表示框架
23、并將它用于人臉識別的工作中,Lam等人研究了不同視點(diǎn)下的人臉匹配和識別問題,Vetter等人討論了由單幅人臉圖像生成其他視點(diǎn)的人臉圖像的可能性,Mirhosseini等則探討了多種信息融合的人臉識別方法13。1.4 本論文的主要研究工作本論文主要研究一種應(yīng)用于人臉識別的特征融合算法,該算法提取人臉圖像中關(guān)鍵特征點(diǎn)的Gabor特征作為局部特征,提取人臉圖像的奇異值特征作為全局特征,對這兩類特征利用串行融合算法進(jìn)行融合,并利用最近鄰分類規(guī)則將圖像進(jìn)行分類。本論文研究內(nèi)容的主要流程如圖1.1所示。奇異值提取Gabor特征提取輸入人臉圖像輸入人臉圖像串行融合最近鄰分類輸出分類結(jié)果圖1.1 特征融合算法
24、的主要流程2 Gabor特征提取算法的實現(xiàn)2.1 Gabor小波簡介由于Gabor特征對光照、姿態(tài)具有一定的魯棒性7,13,因此Gabor特征在人臉識別領(lǐng)域的應(yīng)用非常廣泛,目前已經(jīng)成為了最為主流的人臉特征抽取方法。Gabor特征具有良好的空間局部性和方向選擇性7,13,可以很好的描述圖像的紋理信息,因此許多人臉識別算法都采用Gabor特征作為識別特征。EGM是最早應(yīng)用Gabor特征進(jìn)行人臉識別的算法之一,該算法僅對人臉圖像中部分關(guān)鍵特征點(diǎn)進(jìn)行Gabor變換,并將人臉描述為以這些特征點(diǎn)位置為頂點(diǎn)、以其Gabor變換系數(shù)為頂點(diǎn)屬性、以其關(guān)鍵點(diǎn)位置關(guān)系為邊屬性的屬性圖,從而將人臉識別問題轉(zhuǎn)化為圖匹配
25、問題。通過合理的選擇特征點(diǎn)的位置,彈性圖可以很好地同時對人臉的關(guān)鍵局部特征及其它們之間的關(guān)系進(jìn)行建模,從而既利用了人臉的圖像亮度分布特征,又利用了面部結(jié)構(gòu)信息。GWN方法從最佳描述的角度,通過一個優(yōu)化過程完全自動地確定特征位置及其相應(yīng)的小波參數(shù),并最終用這些參數(shù)作為人臉的描述來進(jìn)行人臉識別。但GWN是一種基于參數(shù)優(yōu)化的建模方法,計算復(fù)雜度很高,其用于人臉識別的有效性還需要更多的實踐檢驗。GFC算法的基本思想是在粗略對齊人臉圖像的前提下,逐像素計算每個像素點(diǎn)的多方向、多尺度Gabor變換特征,形成Gabor特征的人臉表示,然后進(jìn)一步用Fisher判別分析法提取特征,為了解決逐像素Gabor特征維
26、數(shù)過高的問題,Liu采用了簡單的下采樣處理方法。AdaGabor算法采用AdaBoost算法對高維Gabor特征進(jìn)行選擇的降維,該方法采用機(jī)器學(xué)習(xí)的方法更加客觀地利用Gabor特征,從而能在有效降維的同時提高識別性能。Gabor小波與人類視覺系統(tǒng)中簡單細(xì)胞的視覺刺激響應(yīng)非常相似。它在提取目標(biāo)的局部空間和頻率域信息方面具有良好的特性。雖然Gabor小波本身并不能構(gòu)成正交基,但在特定參數(shù)下可構(gòu)成緊框架。Gabor小波對于圖像的邊緣敏感,能夠提供良好的方向選擇和尺度選擇特性,而且對于光照變化不敏感,能夠提供對光照變化良好的適應(yīng)性14。上述特點(diǎn)使Gabor小波被廣泛應(yīng)用于視覺信息理解。二維Gabor小
27、波變換15是在時頻域進(jìn)行信號分析處理的重要工具,其變換系數(shù)有著良好的視覺特性和生物學(xué)背景,因此被廣泛應(yīng)用于圖像處理、模式識別等領(lǐng)域。與傳統(tǒng)的傅立葉變換相比,Gabor小波變換具有良好的時頻局部化特性。即非常容易地調(diào)整Gabor濾波器的方向、基頻帶寬及中心頻率從而能夠最好的兼顧信號在時空域和頻域中的分辨能力;Gabor小波變換具有多分辨率特性即變焦能力。即采用多通道濾波技術(shù),將一組具有不同時頻域特性的Gabor小波應(yīng)用于圖像變換,每個通道都能夠得到輸入圖像的某種局部特性,這樣可以根據(jù)需要在不同粗細(xì)粒度上分析圖像。此外,在特征提取方面,Gabor小波變換與其它方法相比:一方面其處理的數(shù)據(jù)量較少,能
28、滿足系統(tǒng)的實時性要求;另一方面,小波變換對光照變化不敏感,且能容忍一定程度的圖像旋轉(zhuǎn)和變形,當(dāng)采用基于歐氏距離進(jìn)行識別時,特征模式與待測特征不需要嚴(yán)格的對應(yīng),故能提高系統(tǒng)的魯棒性16,17。 無論從生物學(xué)的角度還是技術(shù)的角度,Gabor特征都有很大的優(yōu)越性。Jones和Palmer的研究表明18,在基本視覺皮層里的簡單細(xì)胞的感受野局限在很小的空域范圍內(nèi),并且高度結(jié)構(gòu)化。Gabor變換所采用的核(Kernels)與哺乳動物視覺皮層簡單細(xì)胞2D感受野剖面(Profile)非常相似,具有優(yōu)良的空間局部性和方向選擇性,能夠抓住圖像局部區(qū)域內(nèi)多個方向的空間頻率(尺度)和局部性結(jié)構(gòu)特征。這樣,Gabor分
29、解可以看作一個對方向和尺度敏感的有方向性的顯微鏡。同時,二維Gabor函數(shù)也類似于增強(qiáng)邊緣以及峰、谷、脊輪廓等底層圖像特征,這相當(dāng)于增強(qiáng)了被認(rèn)為是面部關(guān)鍵部件的眼睛、鼻子、嘴巴等信息,同時也增強(qiáng)了諸于黑痣、酒窩、傷疤等局部特征,從而使得在保留總體人臉信息的同時增強(qiáng)局部特性成為可能18。圖2.1即顯示了這一結(jié)論。圖2.1中的每一列代表一組實驗,其中第一行代表脊椎動物的視覺皮層感受野,第二行是Gabor濾波器,第三行是兩者的殘差??梢妰烧呦嗖顦O小。Gabor濾波器的這一性質(zhì),使得其在視覺領(lǐng)域中經(jīng)常被用來作圖像的預(yù)處理。圖2.1 Gabor濾波器和脊椎動物視覺皮層感受野響應(yīng)的比較從圖像處理的角度來看
30、,Gabor特征有如下好處:(1)Gabor核函數(shù)由于去掉了直流分量,因此對局部光照的變化不敏感,常常被用在要求對光照有適應(yīng)性的場合;(2)Gabor濾波結(jié)果可以反映圖像不同尺度、不同方向上的灰度分布信息。一般說來,大尺度濾波可以反映全局性較強(qiáng)的信息,同時可以掩蓋圖像中噪聲的影響;小尺度可以反映比較精細(xì)的局部結(jié)構(gòu),但容易受到噪聲影響。小波核函數(shù)在空域和頻域上都有一定的局域性,這使得其對平移、拉伸、旋轉(zhuǎn)和尺度變換都具有一定的魯棒性。雖然平移變換對復(fù)向量的相位有一定影響,但在人臉識別這個問題中,平移對結(jié)果的影響是要考慮的,Gabor特征仍然具有很好的刻畫特性。正是由于Gabor特征的這些特性,使得
31、其在人臉識別中得到了非常廣泛的應(yīng)用。2.2 人臉圖像的Gabor特征二維Gabor小波的定義為:(2.1)式中:是與小波頻率帶寬有關(guān)的常數(shù);為空間位置坐標(biāo);確定了Gabor內(nèi)核的方向和尺度。在采用8個方向和5個尺度的采樣時,某人方向和尺度上的可以寫為。其中為采樣尺度,為尺度標(biāo)號;為采樣方向,為方向標(biāo)號。為最大頻率,是頻域中的內(nèi)核間隔因子。令參數(shù)、,可以獲得較好的小波表征和辨別效果。Gabor變換與Gabor內(nèi)核的卷積為: (2.2)設(shè)的幅值和相位分別為和,則。組合不同尺度和方向的,構(gòu)成圖像在位置處的Gabor特征矢量。定義Gabor特征和在不考慮相位差時的相似性為: (2.3)在提取人臉圖像的
32、Gabor特征時,通常采用多個在不同尺度和方向上的Gabor濾波器組成濾波器組,并根據(jù)圖像的特點(diǎn)和神經(jīng)生理學(xué)的結(jié)論來選擇參數(shù)。通常研究采用共包括8個方向(;)和5個尺度(;)的Gabor濾波器組,并令,使濾波器的帶寬約為1倍頻程。由于Gabor特征具有良好的空間局部性和方向選擇性,而且對光照、姿態(tài)具有一定的魯棒性,因此在人臉識別中獲得了成功的應(yīng)用。然而,大部分基于Gabor特征的人臉識別算法中,只應(yīng)用了Gabor幅值信息,而沒有應(yīng)用相位信息,主要原因是Gabor相位信息隨著空間位置呈周期性變化,而幅值的變化相對平滑而穩(wěn)定。所以本論文將輸入圖像依次與濾波器組的各個濾波器進(jìn)行卷積,并取其幅值作為輸
33、出,即 , (2.4)設(shè)圖像的大小為,通過40個濾波器得到Gabor特征的維數(shù)高達(dá),計算量很大,且由于Gabor特征在相鄰像素間是高度相關(guān)和冗余的,所以通常只需要稀疏的提取部分節(jié)點(diǎn)上的Gabor特征。一個人臉圖像經(jīng)Gabor變換后就得到幅值特征和相位特征的維數(shù)都是,計算量很大,而且Gabor特征在相鄰像素間是高度相關(guān)的,所以必須對Gabor特征進(jìn)行降維。本論文所采用的降維方法就是對Gabor變換系數(shù)進(jìn)行簡單的下采樣,如對Gabor特征進(jìn)行固定行固定列均勻分布采樣。提取單幅人臉圖像的Gabor特征的基本步驟如下:(1) 劃分Gabor特征的采樣點(diǎn)本論文劃分的采樣點(diǎn)的個數(shù)為40*30 =1200個
34、,采樣點(diǎn)數(shù)目較多,目的是為了得到更加清晰的Gabor圖像。劃分采樣點(diǎn)后的人臉圖像如圖2.2所示: 圖2.2(a) 原人臉圖像 圖2.2(b) 劃分采樣點(diǎn)后的人臉圖像由于得到的Gaobr特征的維數(shù)較大,下面實驗將采用均勻下采樣對Gaobr特征進(jìn)行處理,從而達(dá)到降維的目的。(2) 提取人臉圖像的Gabor特征 本文采用40*30 =1200個規(guī)則分布的采樣點(diǎn),在采樣點(diǎn)上提取各個濾波器輸出的值,聯(lián)合起來組成列向量,從而得到每幅圖像的Gabor特征向量,并以此作為該人臉圖像的局部特征向量。得到的人臉圖像的Gabor特征如下圖所示: 圖2.3(a) 單幅人臉圖像的Gabor幅值特征 圖2.3(b) 單幅
35、人臉圖像的Gabor相位特征由以上圖像可見,與原圖灰度值隨位置的變換相比,濾波器輸出的幅值隨位置的變化要更小更不敏感;Gabor相位信息隨著空間位置呈周期性變化,而幅值的變化相對平滑而穩(wěn)定。因此,即使采樣點(diǎn)稍有偏移也不會使提取出的特征值發(fā)生太大變化。也就是說,Gabor特征具有良好的空間局部性和方向選擇性,而且對光照、姿態(tài)具有一定的魯棒性,可以容忍更大的器官定位和對齊誤差。3 奇異值特征提取算法的實現(xiàn)3.1 人臉圖像的奇異值特征一個典型的模式分類系統(tǒng)包括預(yù)處理、特征提取、分類三部分。一個理想的特征提取器應(yīng)該產(chǎn)生一個表達(dá),以使得后續(xù)分類器的工作變得簡單。通常情況下,特征的數(shù)目幾乎總是少于用于描述
36、完整的感興趣的目標(biāo)所需的數(shù)據(jù)量,特征選擇和特征提取的基本任務(wù)是如何從許多特征中找出那些有效的特征。特征提取是模式識別中的關(guān)鍵,其目的是獲取特征數(shù)目少而分類錯誤概率小的特征向量19。由于在很多實際問題中常常不容易找到那些最重要的特征,或者受條件限制不能對它們進(jìn)行測量,這就使特征提取的任務(wù)復(fù)雜化而成為模式識別系統(tǒng)最困難的任務(wù)之一。特征提取的目的是獲取一組“少而精”的分類特征。從統(tǒng)計特征方法考慮,目前用于圖像識別的特征提取方法一般可以分為:(1)直觀性特征:如圖像的邊沿、輪廓、紋理和區(qū)域等。這些都屬于圖像灰度的直觀特征,物理意義明確,提取比較容易。(2)灰度的統(tǒng)計特征:如灰度直方圖特征,將圖像看作一
37、種二維隨機(jī)過程,引入統(tǒng)計上的各階矩陣作為特征來描述和分析圖像是目前普遍采用的方法。眾所周知的有Zerk 矩等。(3)變換系數(shù)特征:對圖像進(jìn)行各種數(shù)學(xué)變換,可以將變換的系數(shù)作為圖像的一種特征,如離散余弦變換、傅立葉變換、霍夫變換等在圖像特征抽取方面均有廣泛的應(yīng)用。(4)代數(shù)特征:反映了圖像的一種內(nèi)在屬性,將圖像作為矩陣看待,可對其進(jìn)行各種代數(shù)變換,或進(jìn)行各種矩陣分解,由于矩陣的特征向量反映了矩陣的一種代數(shù)屬性,并且具有不變性,因此可以用來作為圖像特征。如KL變換或主分量分析,實際上就是以協(xié)方差矩陣的特征向量作為空間基底的一種代數(shù)特征提取?;谄娈愔堤卣鞯娜四樧R別方法是由Hong首先提出來的。他們
38、將人臉特征分為視覺特征、統(tǒng)計特征、變換系數(shù)特征以及代數(shù)特征四類,代數(shù)特征反映了圖像的本質(zhì)屬性。因為圖像本身的灰度分布描述了圖像的內(nèi)在信息,所以可以將圖像作為矩陣看待,進(jìn)行各種代數(shù)和矩陣變換后提取的代數(shù)特征是人臉的表征。奇異值分解是求解最小二乘問題的一種有效工具,在數(shù)據(jù)壓縮、圖像處理以及模式識別等方面得到了廣泛應(yīng)用,為提取人臉代數(shù)特征提供了一種有效的手段。矩陣的奇異值特征是一種有效的代數(shù)特征抽取方法20。奇異值之所以能夠作為一種特征在圖像識別中應(yīng)用,其理論依據(jù)是:圖像的奇異值具有良好的穩(wěn)定性;奇異值反映了圖像的一種代數(shù)本質(zhì),這種本質(zhì)不是直觀的,而是一種內(nèi)在屬性;奇異值具備代數(shù)和幾何上的不變性。因
39、此,矩陣的奇異值分解(SVD)是一種有效的代數(shù)特征抽取方法,已經(jīng)在圖像數(shù)據(jù)壓縮、信號處理和模式識別中得到了廣泛的應(yīng)用19。許多研究表明,矩陣的奇異值分解(SVD)是一種有效的代數(shù)特征抽取方法,已經(jīng)在圖像數(shù)據(jù)壓縮、信號處理和模式識別中得到了廣泛的應(yīng)用。任何一個實對稱方陣都可經(jīng)正交變換轉(zhuǎn)化為對角陣,對于任意實矩陣,則可利用奇異值分解(SVD)將其轉(zhuǎn)化為對角陣。定理(SVD) 令是實矩陣(不失一般性,設(shè)),且,則存在兩個正交矩陣和及對角陣使下式成立: (3.1)其中,而稱為矩陣的奇異值,是并且也是的非零特征值的全體,而為的個零特征值。,分別是和對應(yīng)于非零特征值的特征向量。是為了表達(dá)上的方便而引入的個
40、向量,可以設(shè)想它是對應(yīng)于的特征向量。同理,為對應(yīng)于的特征向量。將式(5)寫成卷積的形式: (3.2)如果矩陣代表一幅人臉圖像,式(6)就是對該人臉圖像進(jìn)行了正交分解,將矩陣中主對角線上的奇異值元素連同中剩余的個0構(gòu)成一個維列向量: (3.3)其中,為中第一個階子式,列向量,稱為的奇異值特征向量(SV特征向量)。對于任何實矩陣,在的限制下,奇異值對角矩陣是唯一的,因此,原人臉圖像對應(yīng)于唯一的SV向量。3.2 奇異值特征向量的重要性質(zhì)奇異值特征向量具有下列的重要性質(zhì)20,21:用SV特征向量來描述人臉圖像是穩(wěn)定的;SV特征向量的轉(zhuǎn)置不變性(即對圖像矩陣作轉(zhuǎn)置運(yùn)算,SV特征向量不變)、旋轉(zhuǎn)不變性(即
41、對圖像矩陣作旋轉(zhuǎn)運(yùn)算,SV特征向量不變)、位移不變性(即對圖像矩陣作行或列的置換運(yùn)算,SV特征向量不變)、鏡像變換不變性等。下面對各性質(zhì)進(jìn)行證明。(1)奇異值特征向量的穩(wěn)定性由于SV特征向量與原始人臉圖像的一一對應(yīng)關(guān)系,因此可用SV特征向量描述人臉圖像。顯然,能采用SV特征向量描述人臉圖像的另一個關(guān)心的主要問題在于SV特征向量是否穩(wěn)定;即當(dāng)圖像的灰度出現(xiàn)小的變化時,其SV特征向量是否會出現(xiàn)大的變化,若不出現(xiàn)大的變化,則稱為之穩(wěn)定的。SVD擾動分析表明,SV特征具有良好的穩(wěn)定性,下面的定理說明了這一點(diǎn)。記是所有階實矩陣的全體。定理 設(shè)的奇異值分別是,則對于任何一種酋不變范數(shù),有 (3.4)定理中
42、的酋不變范數(shù)如果取為Frobenius范數(shù),則8式成為 (3.5)如果取為譜范數(shù),則8式成為 , (3.6)由于奇異值特征向量具有良好的穩(wěn)定性,所以它對圖像噪音、圖像光照條件變化引起的灰度變化具有不敏感的特性。(2)奇異值特征向量的轉(zhuǎn)置不變性根據(jù)SVD定理,有可見,和有相同的奇異值,即對應(yīng)同一個奇異值特征向量。(3)奇異值特征向量的旋轉(zhuǎn)不變性首先引入初等正交變換,形如的方陣稱為初等正交矩陣,或Householder變換,其中為單位矩陣,是實維單位列向量。任一旋轉(zhuǎn)變換矩陣都可以分解為兩個正交矩陣的乘積。設(shè)原始圖像矩陣為,對其作旋轉(zhuǎn)變換相對于對左乘一正交矩陣,得到的圖像為。于是有 (3.7)其中。
43、可見對的正交變換導(dǎo)致了對(或)作正交相似變換,由于和有相同的特征根,因此圖像和旋轉(zhuǎn)后的圖像有相同的奇異值特征向量。(4)奇異值特征向量的位移不變性對圖像的位移變化歸結(jié)為對圖像矩陣做行(或列)的置換,變換矩陣的第,兩行等價于在該矩陣的左邊乘上矩陣 其中和分別表示單位矩陣第列和第列,變換后的矩陣為。已知,于是的特征方程為上式左邊可簡化為 所以,原始圖像與其變換兩行后的圖像有相同的SV特征向量。同理可證隊列的置換也有相同的結(jié)果。(5)奇異值特征向量的鏡像變換不變性若對于任何一個垂直于的向量,存在有關(guān)系,其中是實常數(shù),則稱變換為鏡像變換。Householder變換的矩陣為,對于任何一垂直于的向量,有。
44、因此,Householder變換是一種鏡像變換。根據(jù)性質(zhì)(3)的推導(dǎo)可知,奇異值特征向量具有鏡像變換不變性。對于圖像的任何一種特征抽取,都要求抽取的特征具有代數(shù)和幾何上的不變性。由于SV特征在描述人臉圖像是穩(wěn)定的,并具有轉(zhuǎn)置不變性、旋轉(zhuǎn)不變性、位移不變性、鏡像變換不變性等重要性質(zhì),因此奇異值特征可以作為人臉圖像的一種有效的代數(shù)特征描述。由于整體圖像的奇異值向量反映的是圖像整體的統(tǒng)計特征,對細(xì)節(jié)的描述還不夠,而增加圖像的尺寸,并不能明顯地提高識別率,因為奇異值向量的識別特征是由前面幾個較大的奇異值決定的。針對這個問題本論文所應(yīng)用的具體的奇異值分解(SVD)的方法為:對整幅圖像進(jìn)行奇異值分解,截取
45、該向量的前10個較大的奇異值組成一個新的向量,作為該圖像的整體特征向量;從而得到了該圖像的一個奇異值向量,并以此做為該圖像的全局特征向量。4 Gabor特征與奇異值特征融合的實現(xiàn)4.1 圖像融合的概念和意義 多傳感器圖像融合技術(shù)最早是被應(yīng)用于遙感圖像的分析和處理中22。1979年,Daliy23等人首先把雷達(dá)圖像和Landsat-MSS(Multispectrai Scanner即多譜掃描儀)圖像的復(fù)合圖像應(yīng)用于地質(zhì)解釋,其處理過程可以看作是最簡單的圖像融合。1981年,Laner23和Todd23進(jìn)行了Landsat-RBV(Return Beam Vidicon)和MSS圖像數(shù)據(jù)的融合實驗
46、。到80年代末,人們才開始將圖像融合技術(shù)應(yīng)用于一般圖像處理(可見光圖像、紅外圖像等)。90年代以后,圖像融合技術(shù)的研究呈不斷上升趨勢,應(yīng)用的領(lǐng)域也遍及圖像處理、紅外圖像處理、醫(yī)學(xué)圖像處理等。尤其是近幾年,多傳感器(多源)圖像融合技術(shù)已成為計算機(jī)視覺、自動目標(biāo)識別、機(jī)器人、軍事應(yīng)用等領(lǐng)域的研究熱點(diǎn)問題。在民用方面,多傳感器圖像融合已在遙感、智能機(jī)器人領(lǐng)域得到應(yīng)用24。例如,美國于1997年在火星著陸的“火星探路者”機(jī)器人身上安裝了5個激光束投影儀、兩個CCD攝像機(jī)、多個關(guān)節(jié)傳感器和加速度傳感器。由于光從地球到火星的時間就達(dá)11分鐘,所以在不少時間段內(nèi)該機(jī)器人必須能夠自主工作(無需來自地球的控制)
47、。火星探路者是多傳感器融合應(yīng)用的典型例子。近年來已有多顆遙感雷達(dá)衛(wèi)星JERS-1,ERS-1,Radarsat等發(fā)射升空,在國民經(jīng)濟(jì)生活中起到了非常重要的作用。此外,多傳感器圖像融合技術(shù)在醫(yī)學(xué)、制造業(yè)等方面也具有巨大的應(yīng)用潛力。在制造業(yè)領(lǐng)域,圖像融合技術(shù)可用于產(chǎn)品的檢測、材料探傷、復(fù)雜設(shè)備診斷、制造過程監(jiān)視、生產(chǎn)線上復(fù)雜設(shè)備和工件的安裝等。在醫(yī)學(xué)上,圖像融合可通過CT和核磁共振(NMR)圖像的融合幫助醫(yī)生對疾病進(jìn)行準(zhǔn)確診斷,圖像融合還可用于計算機(jī)輔助顯微手術(shù)。在圖像和信息加密方面,通過圖像融合也可以實現(xiàn)數(shù)字圖像的隱藏以及數(shù)字水印的圖像植入。另外,圖像融合也可用于交通管理和航空管制。國內(nèi)眾多的科
48、研工作者以及科研機(jī)構(gòu)都在軍事、生物學(xué)、遙感、醫(yī)學(xué)以及工業(yè)生產(chǎn)方面對圖像融合進(jìn)行了探索,但多數(shù)研究仍處于實驗室階段。其中涉及圖像配準(zhǔn)技術(shù)的研究,金字塔圖像融合技術(shù)、小波變換圖像融合技術(shù)、對比度調(diào)制技術(shù)、彩色空間變換融合技術(shù)以及整個融合系統(tǒng)的研究。隨著神經(jīng)網(wǎng)絡(luò)和模糊理論的發(fā)展,也出現(xiàn)了采用自組織神經(jīng)網(wǎng)絡(luò)和模糊集理論進(jìn)行圖像融合的算法,但目前仍處于探索的初期,有待于進(jìn)一步研究??偟目磥恚瑹o論國內(nèi)還是國外,都對圖像融合技術(shù)的研究予以極大的興趣??梢韵嘈?,隨著對多傳感器圖像融合技術(shù)研究的不斷深入,人們對圖像融合技術(shù)會越來越關(guān)注,也就會有更多的專家學(xué)者加入圖像融合研究的隊伍,其技術(shù)將會有很大發(fā)展,而它的應(yīng)
49、用前景也會越來越廣闊。圖像融合是將相同目標(biāo)源的多張圖像融合成一張圖像,它能提取比單一圖像更多的信息。圖像融合技術(shù)可以從多幅圖像中提取單一圖像更為準(zhǔn)確可靠的信息,各幅單一圖像提供的是被測對象各個側(cè)面的信息,綜合這些信息能獲得被測對象全面的信息。另外,各幅圖像中有用信息之間是相關(guān)的,而干擾不具有這種關(guān)聯(lián)性,因此通過融合處理可以排除干擾。圖像融合是指將多源信道所采集到的關(guān)于同一目標(biāo)的圖像或同一信道在不同時刻獲得的同一目標(biāo)的圖像經(jīng)過一定的圖像處理,提取各自信道的信息,最后綜合成一幅圖像以供觀察或進(jìn)一步處理的過程24。根據(jù)融合處理的數(shù)據(jù)類型和應(yīng)用場合,圖像融合系統(tǒng)可以分為以下三種形式25:(1)時間融合
50、:指對來自同一傳感器的、對同一目標(biāo)或場景在不同時間的一系列圖像進(jìn)行融合處理。(2)空間融合:指在同一時刻,對來自多個相同(空間位置不同)或不同傳感器的圖像進(jìn)行融合處理。(3)時空融合:指在一段時間內(nèi),對來自多個相同(空間位置不同)或不同傳感器的圖像進(jìn)行融合處理。圖像融合以圖像作為研究和處理對象,它把對同一目標(biāo)或場景用不同傳感器所獲得的圖像,或同一傳感器以不同方式所獲得的多重圖像根據(jù)需要通過融合規(guī)則合成為一幅圖像,在這一幅圖像中能反映多重原始圖像中的信息,以達(dá)到對目標(biāo)和場景的綜合描述,以及精確的分析判斷。有效地提高圖像信息的利用率、系統(tǒng)對目標(biāo)探測識別的可靠性及系統(tǒng)的自動化程度。其目的是將單一傳感
51、器的多波段信息或不同類型傳感器所提供的信息加以綜合,消除多傳感器信息之間可能存在的冗余和矛盾,減少或抑制對被感知對象或環(huán)境解釋中可能存在的多義性、不完全性、不確定性和誤差,以增強(qiáng)影像中信息的透明度,改善解譯的精度、可靠性以及使用率,以形成對目標(biāo)清晰、完整、準(zhǔn)確的信息描述。與采用單一傳感器圖像相比,來自多個傳感器的圖像所提供的信息具有冗余性和互補(bǔ)性,因而具有以下優(yōu)點(diǎn):(1)擴(kuò)展了系統(tǒng)覆蓋范圍,能夠更準(zhǔn)確地獲得被測對象或環(huán)境信息,并且具有比任何單一傳感器獲得的信息更高的精度與可靠性,提高了空間分辨率;(2)縮短了系統(tǒng)的響應(yīng)時間,能以更少的時間,更少的代價獲得與單一傳感器系統(tǒng)相同的信息;(3)通過各
52、傳感器性能的互補(bǔ),獲得單一傳感器所不能獲得的獨(dú)立的特征信息;(4)根據(jù)系統(tǒng)的先驗知識,通過融合處理可以實現(xiàn)分類、識別、決策等單一傳感器系統(tǒng)無法完成的任務(wù);(5)提高了系統(tǒng)可靠性和魯棒性,因為數(shù)據(jù)是從多個(種)傳感器得到,系統(tǒng)的性能得到了提高,當(dāng)一個或多個傳感器失效或出錯時,系統(tǒng)仍然能夠繼續(xù)工作,并自動降到較低級別上進(jìn)行處理。圖像融合關(guān)鍵的技術(shù)包括三個方面:圖像配準(zhǔn)、圖像融合及處理以及圖像的顯示。(1)圖像配準(zhǔn)技術(shù)對于任何一種多傳感器融合,數(shù)據(jù)的關(guān)聯(lián)和配準(zhǔn)都是融合的基礎(chǔ)。對于具有不同分辨率、視場或更新率的圖像,其配準(zhǔn)是相對困難的。配準(zhǔn)通常分為粗配準(zhǔn)(宏配準(zhǔn))和細(xì)配準(zhǔn)(微配準(zhǔn)),粗配準(zhǔn)是對于不同傳
53、感器的視場進(jìn)行配準(zhǔn),細(xì)配準(zhǔn)是在像素級基礎(chǔ)上的配準(zhǔn)。(2)圖像融合及處理圖像融合的核心內(nèi)容是融合算法。目前,基于小波變換的算法己經(jīng)成為研究的主流,但并不是唯一的方法,伴隨著它發(fā)展的還有基于證據(jù)理論的圖像融合方法、偽彩色融合方法、彩色空間變換法、對比度調(diào)制技術(shù)等。近年來,隨著神經(jīng)網(wǎng)絡(luò)和模糊理論的發(fā)展,又出現(xiàn)了基于神經(jīng)網(wǎng)絡(luò)的圖像融合技術(shù)以及基于模糊理論的圖像融合技術(shù)等。(3)偽彩色顯示技術(shù)通常融合后的圖像采用灰度顯示;把灰度圖像中像素的灰度值與彩色空間中的各種顏色建立起一一對應(yīng)的函數(shù)關(guān)系,將灰度圖像轉(zhuǎn)換到彩色空間。這樣可以使某些細(xì)節(jié)更容易從背景中識別出來。圖像融合的信息源可以是多種圖像傳感器的組合,
54、基本上幾乎所有的成像傳感器都可以作為圖像融合的信息源,所以圖像融合技術(shù)獲得了廣泛的應(yīng)用,其應(yīng)用領(lǐng)域包括醫(yī)學(xué)、遙感、夜視系統(tǒng)、目標(biāo)識別和各類作戰(zhàn)系統(tǒng)等。4.2 圖像融合關(guān)鍵技術(shù)的發(fā)展隨著科學(xué)的發(fā)展和技術(shù)的進(jìn)步,采集圖像數(shù)據(jù)的手段不斷完善,出現(xiàn)了各種新的圖像獲取技術(shù)。但是,目前作為信息輸出源的各種傳感器的性能還不能完全滿足人們的要求,這一方面是由于受到獲取技術(shù)本身發(fā)展水平的限制,另一方面是因為任何一種獲取技術(shù)都有一定的精度和適用范圍且其信號都要受到周圍環(huán)境的干擾。也就是說,一幅圖像只能提供部分的、不完全精確的信息,因此不能排除對未知或部分未知環(huán)境描述的多義性。這就產(chǎn)生了如何從多幅圖像中恢復(fù)原始圖像
55、的問題,即圖像融合技術(shù)的問題。它的優(yōu)越性非常明顯,其作用類似于人腦在視覺產(chǎn)生過程中的作用,具有時空覆蓋寬、目標(biāo)分辨率高、重構(gòu)性好、冗余性、互補(bǔ)性等突出的優(yōu)越性2,26。從一般的角度出發(fā),圖像融合就是圖像信息的綜合處理過程,即將來自不同源、不同媒質(zhì)、不同時間、不同表示方法的圖像數(shù)據(jù)和圖像信息按照一定的準(zhǔn)則,結(jié)合知識庫,分析、綜合為一個全面的情報,最后得到對被感知圖像的更為精確的描述,并在此基礎(chǔ)上為用戶提供需求信息,諸如決策、任務(wù)等。本質(zhì)上來說它是一種數(shù)據(jù)綜合和處理技術(shù),其中涉及到模式識別、決策理論、估計理論、計算機(jī)科學(xué)、人工智能和神經(jīng)網(wǎng)絡(luò)、模糊數(shù)學(xué)等理論。高效的圖像融合方法可以根據(jù)需要綜合處理多
56、源通道的信息,從而有效地提高圖像信息的利用率、系統(tǒng)對目標(biāo)探測識別的可靠性及系統(tǒng)的自動化程度1,27。其目的是將單一傳感器的多波段信息或不同類型傳感器所提供的信息加以綜合,消除多傳感器信息之間可能存在的冗余和矛盾,減少或抑制對被感知對象或環(huán)境解釋中可能存在的多義性、不完全性、不確定性和誤差,以增強(qiáng)影像中信息的透明度,改善解譯的精度、可靠性以及使用率,以形成對目標(biāo)清晰、完整、準(zhǔn)確的信息描述。從融合算法角度來講,融合算法經(jīng)過了由簡單的合成方法到基于Bayesian優(yōu)化方法的圖像融合再到基于多分辨率分析的圖像融合算法的過程28。(1)簡單的圖像融合這種融合方法實現(xiàn)起來非常容易,只需要對不同來源的圖像進(jìn)行加減、選取大值或小值、平均或者其他簡單的線性、非線性合并運(yùn)算。該方法直接在圖像域上進(jìn)行計算,對于某些情況下的應(yīng)用已經(jīng)足夠,但融合效果很差,往往丟掉了源圖像的重要細(xì)節(jié)特征,這是因為它沒有對圖像特征和視覺特性加以考慮,不能起到合并冗余信息,提取有用特征信息的作用。(2)基于Bayesian優(yōu)化方法的圖像融合該方法把圖像融合
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024版汽車租賃含駕駛員合同
- 2024電子商務(wù)法務(wù)支持協(xié)議
- 2024年北師大版九年級科學(xué)上冊階段測試試卷含答案
- 2025年北師大版七年級物理下冊階段測試試卷含答案
- 2024幼兒園教育機(jī)構(gòu)股權(quán)轉(zhuǎn)讓與教育品牌共享合作協(xié)議3篇
- 2025年魯教五四新版九年級生物下冊月考試卷
- 2025年滬科版六年級語文上冊月考試卷含答案
- 2025年魯教版選修4化學(xué)下冊階段測試試卷含答案
- 多元協(xié)作推動山區(qū)教育發(fā)展的策略與路徑優(yōu)化
- 第五單元(整體說課稿)-2024-2025學(xué)年九年級語文下冊大單元教學(xué)名師備課系列(統(tǒng)編版)
- 牛頓迭代的并行化算法
- 2024秋期國家開放大學(xué)本科《國際私法》一平臺在線形考(形考任務(wù)1至5)試題及答案
- 2023-2024學(xué)年安徽省淮北市烈山區(qū)八年級(上)期末物理試卷
- 建筑垃圾清理運(yùn)輸服務(wù)方案
- 2022-2023年北京版數(shù)學(xué)三年級上冊期末考試測試卷及答案(3套)
- 《籃球高運(yùn)球和低運(yùn)球》教案(共三篇)
- 什么是民營經(jīng)濟(jì)
- PowerPoint使用詳解課件
- 四川省2021-2022學(xué)年物理高一下期末監(jiān)測試題含解析
- “婦科護(hù)理三基三嚴(yán)”考試試題及答案
- 系統(tǒng)遷移方案
評論
0/150
提交評論