基于Gabor小波的人臉特征提取算法研究與仿真論文_第1頁
基于Gabor小波的人臉特征提取算法研究與仿真論文_第2頁
基于Gabor小波的人臉特征提取算法研究與仿真論文_第3頁
基于Gabor小波的人臉特征提取算法研究與仿真論文_第4頁
基于Gabor小波的人臉特征提取算法研究與仿真論文_第5頁
已閱讀5頁,還剩46頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、Southwest university of science and technology 本科畢業(yè)設(shè)計(jì)(論文)題目名稱:基于Gabor小波的人臉特征提取算法研究與仿真51 / 51基于Gabor小波的人臉特征提取算法研究與仿真摘要:人臉識(shí)別技術(shù)是模式識(shí)別與人工智能的研究熱點(diǎn)之一。在生物特征識(shí)別中,人臉識(shí)別占有極為重要的地位。它在訪問控制、司法應(yīng)用、電子商務(wù)和視頻監(jiān)控等領(lǐng)域都有廣泛的應(yīng)用。人臉特征提取是人臉識(shí)別過程的核心,特征提取的有效性直接影響到分類的速度和識(shí)別的性能。本論文的主要研究容包括以下方面:(1)基于Gabor變換的人臉特征提取算法。通過對(duì)人臉傅里葉變換和Gabor變換的實(shí)驗(yàn)比較

2、,證明了Gabor變換在提取人臉特征方面具有很大的優(yōu)越性。接著,介紹了Gabor小波變換的快速算法。 (2)針對(duì) Gabor小波的缺點(diǎn),引進(jìn)LBP算子,該算子的使用能有效的克服Gabor小波變換的缺點(diǎn)。另外還詳細(xì)介紹了如何提取“特征臉”的原理和實(shí)現(xiàn)過程,對(duì)Gabor濾波器參數(shù)的選擇問題也作了詳細(xì)說明。(3) 針對(duì)Gabor和LBP提取的人臉特征向量維數(shù)過高問題,本文分別采用了LPP和PCA降維算法來進(jìn)行降維。(4)對(duì)最后提取的人臉特征通過計(jì)算特征向量的距離來量化查詢圖像和圖像庫中每幅圖像間的相似程度。該部分主要是將提取出來的人臉特征向量進(jìn)行驗(yàn)證,并對(duì)兩種不同降維方法做比較。本文最后是在orl和

3、yale兩個(gè)人臉圖庫做仿真實(shí)驗(yàn)。實(shí)驗(yàn)表明,采用用LPP降維得到的相似度要遠(yuǎn)高于使用PCA降維結(jié)果。關(guān)鍵詞:人臉識(shí)別;Gabor小波變換;LBP;距離測(cè)度Facial feature extraction algorithm research and simulation based on Gabor waveletsAbstract:Face Recognition Technology(FRT)is emerging as an active research area in the fiel

4、d of patternrecognition and artificial intelligence.As a biometric technology,FRT has numerous applications such asaccess control,law enforcement,e-commerce,video surveillance and so on. Face feature extraction is the core of recognition task,whichdirectly impact on classification velocity and face

5、recognition ability.The main contributions of this work are listed as follows:(1)Face feature extraction algorithm based on Gabor transform is introduced.Compared with Fourier transform,Gabor transform is proved to be better in face feature extraction.And then,A fast algorithm of Gabor Transform is

6、introduced.(2) According to the disadvantages of Gabor wavelet,This paper introduced LBP operator, the operator can overcome the faultsofGabor wavelet transform effectively . Also it introduced the principle and realization processhow to extract "features face"in detailed, and the selectio

7、n of parameters of Gabor filter are detailed instructions.(3) For the problem to the face feature vector high dimension in Gabor and LBP extraction ,this paper used the LPP and PCA dimension reduction algorithm reduced the dimension.(4) In thefinal face feature extraction ,By calculating the distanc

8、e of the feature vector to lookthe similarity betweenthe image to inquire and each image in image database. This part ismainly to verify the extracted face feature vector , and to comparetwo different dimension reduction method .Finally, This paper do the simulation experiment in the orl and yale tw

9、o face database . The experimentresults show that the LPP dimension reduction method is better than PCA dimension reduction method.Key words: Face recognition; Gabor wavelet transform; LBP; Distance measure目錄第1章 緒 論51.1 課題的背景和意義51.2 當(dāng)前人臉識(shí)別的國外現(xiàn)狀71.3 課題的總設(shè)計(jì)思路81.4 人臉特征提取的步驟與方法81.4.1 人臉圖像的預(yù)處理91.4.2 基于Ga

10、bor小波算法進(jìn)行人臉特征提取91.4.3 應(yīng)用LBP算子101.4.4 采用PCA和LPP對(duì)提取的特征向量降維,以提高識(shí)別時(shí)間101.4.5 用距離測(cè)度法度量相似度進(jìn)行結(jié)果測(cè)試101.5 本章小結(jié)10第2章 Gabor小波變換112.1引言112.2 Gabor小波變換的定義132.3 Gabor變換在人臉識(shí)別中的應(yīng)用152.4 Gabor濾波器152.4.1 Gabor濾波器參數(shù)的選擇192.4.2 Gabor濾波器的性質(zhì)和計(jì)算方法192.4.3 Gabor變換的人臉特征提取202.5Gabor快速算法圖212.5.1快速傅里葉變換(FFT)222.5.2Gabor變換的快速算法242.6

11、本章小結(jié)25第3章 LBP算法、PCA和LPP降維算法263.1 引言263.2 LBP基本算子263.2.1 改進(jìn)的LBP算子273.3 PCA降維算法的實(shí)現(xiàn)原理283.3.1 PCA的基本概念293.3.2 PCA原理293.3.3 PCA算法303.4 LPP算子降維原理313.4.1 LPP算法降維實(shí)現(xiàn)原理313.5 本章小結(jié)32第四章 距離測(cè)度法度量相似度比較334.1 引言334.2 距離測(cè)量簡介334.3 具體算法344.4 ORL人臉庫實(shí)驗(yàn)分析354.4.1 算法的比較364.5 YALE人臉庫實(shí)驗(yàn)374.6 本章小結(jié)38結(jié) 論39參考文獻(xiàn)40致 42附錄一43附錄二46附錄三

12、47第1章 緒 論1.1 課題的背景和意義在現(xiàn)在這個(gè)信息化的時(shí)代中,身份識(shí)別技術(shù)的應(yīng)用價(jià)值是非常重要的。隨著網(wǎng)絡(luò)技術(shù)的快速發(fā)展,信息安全也顯示出前所未有的重要性。在電子商務(wù)、金融信息、司法安全、網(wǎng)絡(luò)傳輸?shù)雀鱾€(gè)應(yīng)用領(lǐng)域,都需要精確而唯一的身份鑒定1。然而,如今的身份識(shí)別主要依靠、工作證和密碼手段來鑒定一個(gè)人的身份。這些手段具有諸多缺點(diǎn):如不便攜帶、易丟失、易損壞最后導(dǎo)致不可識(shí)別;而密碼手段的缺點(diǎn)更加凸顯:不便記憶,易被破解等。近年來,由于電子商務(wù)的迅猛發(fā)展,偽造制假的手段也是越來越先進(jìn),傳統(tǒng)的身份識(shí)別方法受到了嚴(yán)峻的挑戰(zhàn),對(duì)于科技的發(fā)展和社會(huì)的進(jìn)步顯得有點(diǎn)跟不上腳步。 生物特征識(shí)別技術(shù)(Biom

13、etrics)以其唯一性、高可靠性和穩(wěn)定性成為了人們爭相研究的熱門技術(shù)。所謂生物特征識(shí)別2,就是根據(jù)不同人之間的身體(physical)的或者行為(behavioral)的特征的獨(dú)特性,來唯一地把未知身份識(shí)別出來。身體特征包括:指紋、視網(wǎng)膜、虹膜、人臉等;行為特征包括簽名、聲音、步態(tài)等。有的識(shí)別是幾種特征的結(jié)合,如身份識(shí)別可以結(jié)合人臉和指紋兩個(gè)特征。人臉識(shí)別是身份識(shí)別技術(shù)的一種,它在身份識(shí)別領(lǐng)域的發(fā)展和應(yīng)用方面都有著重大意義:一是可以推進(jìn)對(duì)人類視覺系統(tǒng)本身的認(rèn)識(shí);二是可以滿足人工智能應(yīng)用的需要。采用人臉識(shí)別技術(shù),建立自動(dòng)人臉識(shí)別系統(tǒng),用計(jì)算機(jī)實(shí)現(xiàn)對(duì)人臉圖像的自動(dòng)識(shí)別有著廣闊的應(yīng)用領(lǐng)域和誘人的應(yīng)

14、用前景。而人臉特征提取又是人臉識(shí)別技術(shù)當(dāng)中最重要的步驟,可以這么說,人臉特征提取的優(yōu)劣直接影響到人臉的識(shí)別率。人臉本身的采集方式多樣,既可以是靜態(tài)圖像,也可以是動(dòng)態(tài)圖像。通常我們辨別一個(gè)人是通過我們的眼睛觀察這個(gè)人的臉部特征,恰好人臉識(shí)別和人們通常的識(shí)別相符合,所以很容易被接受。因此,人臉識(shí)別與其相關(guān)技術(shù)的應(yīng)用前景也是生物特征識(shí)別諸多技術(shù)中最被看好的。生物特征識(shí)別在國外起步早,也發(fā)展很快2 。而我國在這方面就起步稍晚,不過發(fā)展卻是極為迅速。人臉識(shí)別是我們?nèi)粘I钪斜夭豢缮俚募寄?,是我們辨認(rèn)一個(gè)人采用的最普遍的生物特征識(shí)別方法。人臉識(shí)別相對(duì)于其它的生物特征識(shí)別技術(shù)來說,具有以下獨(dú)特優(yōu)勢(shì):(1)友

15、好、直觀和方便。人臉識(shí)別由于十分符合人們的習(xí)慣,人們很容易接受和不會(huì)讓人感覺有障礙;(2)對(duì)用戶不會(huì)造成不必要的干擾。因?yàn)槿四樧R(shí)別不需要與相關(guān)設(shè)備直接接觸,也不需要被測(cè)試者需要特定的行為,在這一點(diǎn)上它是區(qū)別于其他任何生物特征技術(shù)的;(3)對(duì)拍攝設(shè)備無要求。只要能照相的設(shè)備,手機(jī)相機(jī)皆可,由于這些設(shè)備目前已普與,故為人臉識(shí)別的廣泛應(yīng)用提供了有力的基礎(chǔ)和保障;1.2 當(dāng)前人臉識(shí)別的國外現(xiàn)狀 在當(dāng)今這個(gè)信息化的時(shí)代,人臉識(shí)別系統(tǒng)在很多領(lǐng)域都有舉足輕重的作用,尤其是用在司法機(jī)關(guān)、網(wǎng)絡(luò)信息安全、司機(jī)駕照驗(yàn)證和事業(yè)單位的考勤等。 前面有說道:雖然我國這方面起步比較晚,但是在這方面發(fā)展卻是非常快的。截至目前

16、,我過在這方面也取得了一定的成就,08年的奧運(yùn)會(huì)就正式啟用了中國自主產(chǎn)權(quán)研發(fā)的人臉識(shí)別系統(tǒng)。另外,由中科院計(jì)算所高文教授主持的國家863項(xiàng)目“面像檢測(cè)與識(shí)別核心技術(shù)”也通過成果鑒定,并初步應(yīng)用,這也就標(biāo)志著我國在人臉識(shí)別這一當(dāng)今熱點(diǎn)科研領(lǐng)域掌握了一定的核心技術(shù)。該系統(tǒng)會(huì)自動(dòng)在人臉上選取103個(gè)點(diǎn),然后通過分析面部皮膚反射屬性、三維結(jié)構(gòu)等特征進(jìn)行識(shí)別,在靜態(tài)場(chǎng)景下識(shí)別準(zhǔn)確率會(huì)達(dá)到96.5。 其實(shí)在早前,科瑞奇技術(shù)開發(fā)股份在2002年開發(fā)了一種人臉鑒別系統(tǒng),對(duì)人臉圖像進(jìn)行處理,排除外界因素,再對(duì)圖像進(jìn)行特征提取和識(shí)別。這對(duì)于人臉鑒別特別有價(jià)值,因?yàn)槿四樿b別通常使用正面照,要鑒別的人臉圖像是不同時(shí)期

17、拍攝的,使用的照相機(jī)不一樣。系統(tǒng)可以接受時(shí)間間隔較長的照片,并能達(dá)到較高的識(shí)別率,在計(jì)算機(jī)中庫藏2300人的正面照片,每人一照片,使用相距1-7年、差別比較大的照片去查詢,首選率可以達(dá)到50%,前20輸出照片中包含有與輸入照片為同一人的照片的概率可達(dá)70%。 在國外,人臉識(shí)別起步就比較早了。最早的自動(dòng)人臉識(shí)別研究論文是 1965年 Chan&Bledsoe 在 Panoramic Research Inc 發(fā)表的技術(shù)報(bào)告,但是由于當(dāng)時(shí)的技術(shù)條件有限,所以取得的成就并不是很顯著。而70年代時(shí),美、英等發(fā)達(dá)國家就已經(jīng)開始重視人臉識(shí)別的研究了,并取得了一定的成績。 從1990年代起,由于社會(huì)

18、的發(fā)展,加上人們對(duì)人臉圖像自動(dòng)識(shí)別的迫切需求,越來越多的外國科研單位開始著手研究,因此人臉模式識(shí)別方法有了較大的突破。1996年美國軍方更是組織了人臉自動(dòng)識(shí)別系統(tǒng)大賽,獲得冠軍的是勒克菲勒大學(xué)的Face1t系統(tǒng)。由此可見,外國的在這方面要比中國早很多,也成熟很多。最近,美國的LAU公司研制的人臉圖像自動(dòng)識(shí)別系統(tǒng),是按照平常人們的生活習(xí)慣(即人眼辨別人臉)的原理,基于生物測(cè)量學(xué)、人像復(fù)原技術(shù)開發(fā)的裝置。用人臉1242個(gè)特征點(diǎn),對(duì)人群中尋找的人進(jìn)行定量定性識(shí)別,已經(jīng)用在機(jī)場(chǎng)、火車站等公共場(chǎng)所和重點(diǎn)控制地區(qū)。另外,國外的一些高校在這方面也取得了顯著的成就,主要是以麻省理工大學(xué)(Massachuset

19、ts Institute of Technology )、卡基梅隆大學(xué)(Carnegie Mellon University)和英國的雷丁大學(xué)(University of Reading)等為首。而公司(Visionics 公司Facelt人臉識(shí)別系統(tǒng)、Viiage的FaceFINDER身份驗(yàn)證系統(tǒng)、Lau Tech 公司Hunter系統(tǒng)、德國的BioID系統(tǒng)等)他們的工程研究工作主要放在公安、刑事方面,在考試驗(yàn)證系統(tǒng)的實(shí)現(xiàn)方面深入研究并不多。1.3 課題的總設(shè)計(jì)思路 本設(shè)計(jì)是基于MATLAB平臺(tái)實(shí)現(xiàn)的人臉特征提取。系統(tǒng)原理框圖如圖1所示: 圖1 系統(tǒng)原理框圖 從系統(tǒng)框圖我們可以知道,人臉特征

20、提取的步驟如下:1)、從圖庫中讀取一圖像,并且對(duì)選取圖像進(jìn)行預(yù)處理;2)、根據(jù)需要設(shè)計(jì)Gabor濾波器參數(shù),并對(duì)處理后的圖像進(jìn)行多方向和多尺度的進(jìn)行濾波;3)、先對(duì)得到的不同方向Gabor對(duì)得到的Gabor濾波圖像分別進(jìn)行LBP運(yùn)算得到紋理圖像特征;4)、然后分別用LPP和PCA對(duì)得到紋理圖像特征向量進(jìn)行降維;5)對(duì)降維得到的人臉特征向量用距離測(cè)度度量相似度進(jìn)行測(cè)試。1.4 人臉特征提取的步驟與方法Chellappa給出的人臉識(shí)別定義是,給出靜態(tài)或者視頻圖像,將其中的一個(gè)或多個(gè)人臉和存儲(chǔ)于數(shù)據(jù)庫中的人臉相比較,確定出圖像或視頻中各個(gè)臉的身份。一般要在輸入之前對(duì)圖像進(jìn)行預(yù)處理,若有人臉存在,則將

21、其從背景中分割出來。一般來說,一個(gè)完整的人臉識(shí)別系統(tǒng)包括。圖像輸入、人臉檢測(cè)/定位、預(yù)處理、特征提取、分類器5部分。1.4.1 人臉圖像的預(yù)處理 在現(xiàn)實(shí)情況下,我們所提取的人臉圖像可能絕大多數(shù)都不是標(biāo)準(zhǔn)格式的,不僅如此,可能還會(huì)受到各種各樣的因素影響,進(jìn)而導(dǎo)致最終的人臉識(shí)別準(zhǔn)確率不是那么高,為了盡可能的減小甚至消除這些情況對(duì)人臉識(shí)別的影響,故而在人臉特征提取之前需要進(jìn)行人臉圖像的預(yù)處理。該步驟主要是對(duì)輸入的人臉圖像進(jìn)行預(yù)處理,目的是消除其他因素的影響,改善圖片質(zhì)量,統(tǒng)一圖像的灰度值與尺寸,為以后的特征提取和人臉分類識(shí)別打好基礎(chǔ)。一般情況下人臉都處在一個(gè)復(fù)雜背景中,所以預(yù)處理的時(shí)候要先進(jìn)行人臉檢

22、測(cè),將人臉部分從復(fù)雜背景中檢測(cè)提取出來,由于本文的研究容只是人臉特征提取部分,故而沒有人臉圖像預(yù)處理部分,而是直接采用已預(yù)處理好的ORL和YALE人臉圖庫。1.4.2基于Gabor小波算法進(jìn)行人臉特征提取 人臉特征提取就是采用某種方法來表示人臉局部特征,當(dāng)然采用的方法不同,所提取的人臉信息也有所不同。 本文研究的基于Gabor小波變換的人臉特征提取的理論依據(jù):任意可以用高斯函數(shù)調(diào)制的復(fù)正弦形式表示的信號(hào)都可以達(dá)到時(shí)域和頻域聯(lián)合不確定關(guān)系的下限。也就是說,可以再時(shí)域和頻域獲得最佳的分辨率。 Gabor濾波器對(duì)人臉圖像的響應(yīng)特性主要體現(xiàn)在邊緣、亮度和位置3方面的特征。圖像的局部灰度值的突變反映的是

23、邊緣特征,輸入信號(hào)和濾波器信號(hào)疊加的結(jié)果就是卷積計(jì)算的輸出,當(dāng)輸入信號(hào)的變化與濾波器信號(hào)的變化相一致時(shí),輸出較強(qiáng),反之亦然。而當(dāng)圖像的邊緣特征方向與二維Gabor濾波器紋理特征方向一致的時(shí)候,二維Gabor小波變換有較強(qiáng)的響應(yīng),如眼睛,鼻子等部位Gabor響應(yīng)輸出較為強(qiáng)烈。通過修改Gabor函數(shù)的參數(shù)sigma,theta,可以獲得不同中心頻率,不同方向上的Gabor濾波器,從而提取到不同尺度和不同局部細(xì)節(jié)的紋理圖像特征。最后考慮到Gabor小波變換不能旋轉(zhuǎn)的缺點(diǎn),故之后用LBP算法將Gabor濾波圖像再分別進(jìn)行特征提取,再將得到的圖像分為互不重疊的區(qū)域,分別對(duì)各個(gè)區(qū)域建立LBP直方圖信息,再

24、將各個(gè)尺度下的LBP直方圖特征進(jìn)行組合匹配連接起來,構(gòu)成人臉圖像的特征向量。其實(shí)在這里對(duì)于Gabor小波變換的人臉特征提取基本上已經(jīng)結(jié)束,但是考慮到這樣提取出來的特征向量維數(shù)會(huì)比較高,計(jì)算起來需要用到的時(shí)間會(huì)很長。所以在最后用到了PCA和LPP對(duì)提取的特征向量進(jìn)行降維,以提高識(shí)別時(shí)間。1.4.3 應(yīng)用LBP算子 在Gabor濾波后再分別進(jìn)行LBP特征提取,是因?yàn)長BP作為一種紋理描述方法,能夠有效地反映人臉圖像的局部特性,也是為了更有效的解決旋轉(zhuǎn)變化、光照變化和尺度變化等圖像分類問題,這也是本設(shè)計(jì)的創(chuàng)新點(diǎn)。1.4.4 采用PCA和LPP對(duì)提取的特征向量降維,以提高識(shí)別時(shí)間 PCA(Princi

25、pal Component Analysis,主成分分析)是一種掌握事物主要矛盾的統(tǒng)計(jì)分析方法,它可以從多元事物中解析出主要影響因素,揭示事物的本質(zhì),簡化復(fù)雜的問題。計(jì)算主成分的目的是將高維數(shù)據(jù)投影到較低維空間。 LPP(Locality Preserving Projection,局部保局投影)作為拉普拉斯特征映射的一種線性逼近可以較好的反映樣本的流形結(jié)構(gòu),已經(jīng)被廣泛的應(yīng)用到圖像檢索和圖像修復(fù)中。局部保持投影(LPP)是比較經(jīng)典的線性方法,著重關(guān)注于數(shù)據(jù)的局部關(guān)系。 1.4.5 用距離測(cè)度法度量相似度進(jìn)行結(jié)果測(cè)試在完成人臉特征的提取后,本設(shè)計(jì)還沒有最終完成,因?yàn)槲覀冞€需要檢測(cè)我們提取的人臉特

26、征是否準(zhǔn)確完善。在這里我使用距離測(cè)度法來度量相似度進(jìn)行結(jié)果檢測(cè)?,F(xiàn)有比較成熟的距離測(cè)度方法主要有以下幾種,如Minkowsky 距離(明氏距離)、Euclidean 距離(歐氏距離)、Mahalanobis 距離(馬氏距離)和Hausdorf距離等。本設(shè)計(jì)將選用歐式距離測(cè)度法來度量人臉相似度進(jìn)行結(jié)果檢測(cè),原因在于歐式距離在一定程度上放大了較大元素誤差在距離,應(yīng)用廣泛。1.5 本章小結(jié)本章主要介紹了此次課題研究的背景和意義、國外在這方面的研究現(xiàn)狀,針對(duì)目前面對(duì)的技術(shù)難題,提出了本課題的研究容和技術(shù)思路,在概述本文主要工作的同時(shí)給出了文章的結(jié)構(gòu)。第2章 Gabor小波變換2.1引言Gabor展開是

27、一種同時(shí)用時(shí)間和頻率表示一個(gè)時(shí)間函數(shù)的方法,而求解Gabor展開系數(shù)的公式被稱為Gabor變換。傳統(tǒng)的Gabor變換的缺點(diǎn)是窗口尺寸一經(jīng)確定就無法更改,因此不具有變焦特性,無法對(duì)信號(hào)進(jìn)行多分辨率分析。為解決這一問題人們將Gabor理論同小波理論相結(jié)合,提出了Gabor小波。Gabor小波具有小波變換的多分辨率特性,同時(shí)具有Gabor函數(shù)本身所具有的局域性和方向性。 標(biāo)準(zhǔn)傅立葉變換是數(shù)字信號(hào)處理的有利工具,然而它只能反映信號(hào)在整個(gè)實(shí)軸的整體性質(zhì),而不能反映信號(hào)在局部時(shí)間圍中的特征。對(duì)于圖像,我們關(guān)心的往往是局部的特征,如圖像邊緣,由于標(biāo)準(zhǔn)傅立葉變換不能同時(shí)在時(shí)域和頻域具有對(duì)信號(hào)的局部分析能力,D

28、ennis Gabor于1946年在他的論文中,為了提取信號(hào)傅立葉變換的局部信息,引入了一個(gè)時(shí)間局部化“窗函數(shù)”,其中參數(shù)用于平移動(dòng)窗以便覆蓋整個(gè)時(shí)域。實(shí)際上,Gabor使用了一個(gè)Gaussian函數(shù)作為窗函數(shù)。因?yàn)橐粋€(gè)Gaussian函數(shù)的傅立葉變換還是一個(gè)Gaussian函數(shù),所以傅立葉逆變換也是局部的。Gabor變換是唯一能夠達(dá)到時(shí)頻測(cè)不準(zhǔn)的下界的函數(shù),是圖像表示中一種較好的模式,它的最大優(yōu)點(diǎn)在于它能夠達(dá)到交叉熵的最低邊緣,能夠最好地兼顧信號(hào)在時(shí)域和頻域的分辨率,而且人類的視覺系統(tǒng)對(duì)于這種函數(shù)有非常好的匹配特性。Gabor函數(shù)的這些特性,使得它在信號(hào)處理中獲得廣泛的應(yīng)用,特別應(yīng)用于低級(jí)視

29、覺如紋理分割、光流估計(jì)、數(shù)據(jù)壓縮和邊緣檢測(cè)等。Gabor變換雖然在一定程度上克服了標(biāo)準(zhǔn)傅立葉變換不具有局部分析能力的缺陷,且能最好地兼顧信號(hào)在時(shí)城和頻域地分辨率,但它同時(shí)也存在著自身不可克服的局限,即當(dāng)窗函數(shù)確定后,窗口的形狀就確定了,因此Gabor變換是一種單一分辨率的分析。 目前Gabor變換和Gabor展開已被公認(rèn)是信號(hào)與圖像表示的最好的方法之一。Gabor變換中要解決的最基本問題是:在給定綜合窗下如何求解分析窗與Gabor變換系數(shù)。Gabor變換廣泛應(yīng)用的困難也就是在于找不到一種簡單的計(jì)算變換系數(shù)的方法,因?yàn)镚abor基本函數(shù)彼此之間互不正交。近十幾年來,圍繞這一問題國外相繼提出了很多

30、解決方法,最主要的有以Bastiaans、Wexler和Qian等人為代表的解析法,Daugman等人提出的神經(jīng)網(wǎng)絡(luò)方法以與Ibrahim等人提出的自適應(yīng)學(xué)習(xí)算法等等。但不論上述哪一種方法,均為復(fù)數(shù)形式的Gabor變換。Gabor基本函數(shù)、Gabor展開系數(shù)、雙正分析窗函數(shù)求解的約束條件式與Gabor展開式都是復(fù)數(shù)形式,計(jì)算量很大。為了簡化Gabor變換的計(jì)算,提出了一種實(shí)數(shù)形式的離散Gabor變換(RDGT)方法,這種方法類似于復(fù)數(shù)形式的離散Gabor變換的解析理論體系,并可采用快速的離散Hartley變換算法計(jì)算Gabor變換系數(shù),尤其是實(shí)數(shù)形式的離散Gabor變換系數(shù)與復(fù)數(shù)形式的離散Ga

31、bor變換系數(shù)的實(shí)部和虛部有著非常簡單的加減關(guān)系,因此前者的計(jì)算完全可以替代后者的計(jì)算,從而達(dá)到大大減小Gabor復(fù)變換系數(shù)計(jì)算量的目的;同樣,在信號(hào)的重建方面,實(shí)數(shù)形式的離散Gabor逆變換也比復(fù)數(shù)形式的離散Gabor逆變換快得多,并且在實(shí)際應(yīng)用中,實(shí)值Gabor變換更方便于軟件和硬件的實(shí)現(xiàn)。2.2 Gabor小波變換的定義 由于Fourier變換存在著不能同時(shí)進(jìn)行時(shí)間和頻率局部分析的缺點(diǎn),1946年Gabor提出了一種加窗的Fourier變換方法,它在非平穩(wěn)信號(hào)分析中起到了很好的作用。在Fourier變換中,把非平穩(wěn)信號(hào)過程看作是一系列短時(shí)平穩(wěn)信號(hào)的疊加,而短時(shí)性是通過時(shí)間上加窗來實(shí)現(xiàn)的。

32、整個(gè)時(shí)域的覆蓋是由參數(shù)的平移達(dá)到的。換句話說,該變換是用一個(gè)窗函數(shù)與信號(hào)相乘實(shí)現(xiàn)在附近開窗和平移,然后施以Fourier變換,這就是Gabor變換也稱短時(shí)Fourier變換或加窗Fourier變換。Gabor變換的定義由下式給出:對(duì)于, (2-1) 其中是積分核。該變換在點(diǎn)附近局部測(cè)量了頻率為的正弦分量的幅度。通常選擇能量集中在低頻處的實(shí)偶函數(shù);Gabor采用高斯(Gauss)函數(shù)作窗的函數(shù),相應(yīng)的Fourier變換以后仍舊是Gauss函數(shù),從而保證窗口Fourier變換在時(shí)域和頻域均有局部化功能。令窗口函數(shù)為,則有 (2-2) 式中a決定了窗口的寬度,的Fourier變換用表示,則有 (2-

33、3) 由以上可以得到 (2-4) 顯然,信號(hào)經(jīng)過Gabor變換按窗口寬度分解了的頻譜,提取出它的局部信息。當(dāng)在整個(gè)時(shí)間軸上平移時(shí),就給出了Fourier的完整變換。相應(yīng)的重構(gòu)公式為: (2-5) 窗口Fourier變換是能量守恒變換,即 (2-6) 這里應(yīng)注意,積分核對(duì)所有和都有一樣的支撐區(qū),但周期數(shù)隨而變化。支撐區(qū)是指一個(gè)函數(shù)或信號(hào)的自變量的定義域,當(dāng)在定義域取值時(shí)的值域不為零,在支撐區(qū)之外信號(hào)或過程下降為零。 為了研究窗口Fourier變換的時(shí)頻局部化特性就要研究和的特性。這里是的Fourier變換。由于Fourier變換是能量守恒的,所以有Parseval定理存在。即: (2-7) 這里

34、的和分別是和的復(fù)共軛函數(shù),當(dāng)為實(shí)數(shù)時(shí),兩種表示是相等的。如果把上述函數(shù)乘積的積分運(yùn)算用積符號(hào)表示,則有 (2-8) 其中和都是在實(shí)數(shù)域的平方可積函數(shù)。由此: (2-9) 當(dāng)時(shí)有:其中叫做的數(shù)。這一表達(dá)式的物理意義是Fourier變換的時(shí)域和頻域的一對(duì)共扼變量具有對(duì)易關(guān)系,從而使Fourier變換與加窗口的Fourier變換具有對(duì)稱性。如果用角頻率變量代替時(shí)間變量,用頻域窗口函數(shù)代替時(shí)域窗口函數(shù)則可得到: (2-10) 這里是時(shí)域窗口函數(shù)的Fourier變換。該式的意義在于頻域中的信號(hào)通過窗口函數(shù)的加窗作用獲得了在頻域附近的局部信息即: (2-11) 如果選用窗口函數(shù)在時(shí)域和頻域均有良好的局部性

35、質(zhì),那么可以說Fourier變換給出了信號(hào)的局部時(shí)一頻分析。這樣就有利于同時(shí)在頻域和時(shí)域提取信號(hào)的精確信息。2.3 Gabor變換在人臉識(shí)別中的應(yīng)用 Campben和Robson提出并在心理學(xué)實(shí)驗(yàn)中證實(shí),人類的視覺具有多通道和多分辨率的特征,因此,近年來基于多通道、多分辨率分析的算法受到廣泛重視11。在諸如信號(hào)檢測(cè)、圖象壓縮、紋理分析、圖象分割和識(shí)別等領(lǐng)域,Gabor小波得到了非常廣泛的應(yīng)用。大量基于簡單細(xì)胞接受場(chǎng)的實(shí)驗(yàn)表明,圖像在視覺皮層的表示存在空域和空頻域分量,并且可以將一幅圖像分解為局部對(duì)稱和反對(duì)稱的基函數(shù)表示,Gabor函數(shù)正是這種基信號(hào)的良好近似。Lee.T.S用ZD一Gabor小

36、波來表征圖像,將Daubeehies的一維框架理論拓展到二維,并證明在一定條件下,ZD一Gabor小波是緊框架,原圖像能從小波系數(shù)重建,因此用小波變換的系數(shù)幅值作為特征來匹配有著良好的視覺特性和生物學(xué)背景,Gabor小波的這些特性使得其對(duì)于亮度和人臉表情的變化不敏感,在人臉識(shí)別和圖像處理中有著廣泛的應(yīng)用。Lades等首先提出用基于Gabor變換的彈性圖匹配算法進(jìn)行人臉識(shí)別。節(jié)點(diǎn)上的Gabor濾波響應(yīng)作為人臉特征,通過特征匹配和節(jié)點(diǎn)幾何位置的匹配實(shí)現(xiàn)人臉識(shí)別。2.4 Gabor濾波器在實(shí)驗(yàn)室中我們用的最多的是Gabor濾波器。根據(jù)Gabor變換的原理和實(shí)際需要,可構(gòu)造不同的Gabor濾波器。Ga

37、bor濾波器在圖像處理中的特征提取、紋理分析和立體視差估計(jì)等方面有許多應(yīng)用。有研究表明神經(jīng)細(xì)胞的感受也可以用Gabor函數(shù)來表示。Gabor濾波能夠體現(xiàn)出不同的方向性和尺度性。Gabor函數(shù)從實(shí)質(zhì)上來說是一個(gè)Gauss函數(shù)窗所限制的濾波函數(shù)。通過定義不同的Gabor函數(shù)核,就可以得到一組Gabor濾波器。Gabor核函數(shù)的定義: (2-12) Gabor濾波可以定義為: (2-13)下面我們對(duì)式(2-12)中的各項(xiàng)參數(shù)作一個(gè)說明:是一個(gè)振蕩函數(shù),實(shí)部為余弦函數(shù),虛部為正弦函數(shù)。是Gauss函數(shù),這實(shí)際上是通過加窗限制了函數(shù)的圍,使其在局部有效。由Gauss函數(shù)的局部性可知,這個(gè)濾波器實(shí)際上抽取

38、x附近的特征,因此可以看作是一種Gabor小波。是直流分量,這樣濾波器就可以不受直流分量大小的影響。向量描述了濾波器對(duì)不同方向和不同尺度的響應(yīng),通過選取一系列的,就得到了一族Gabor濾波器,是一個(gè)常量,和一起刻畫了Gauss窗的波長。這里取=/2,可以表示為:這里 (2-14)選取不同的下標(biāo)可以描述不同的Gauss窗波長,從而控制采樣的尺度。選取不同的下標(biāo)可以描述振蕩函數(shù)不同的振蕩方向,從而控制采樣的方向。我們這里選取=0 ,1,2這樣可以在3個(gè)不同的尺度上采樣。選取=0 ,.,3這樣就可以在4個(gè)不同的方向上采樣13。各個(gè)濾波器窗口的大小為32×32,確定濾波器的所有參數(shù)(可自己決

39、定)后,當(dāng)采取上述的參數(shù)后,可得如下圖2.1的12個(gè)濾波器(圖片源代碼詳見附錄一)。圖2.1 Gabor 3個(gè)尺度4個(gè)方向的濾波器 另外,Gabor函數(shù)是唯一能夠達(dá)到空域和頻域聯(lián)合測(cè)不準(zhǔn)關(guān)系下界的函數(shù),用Gabor函數(shù)形成的二維Gabor濾波器具有在空間域和頻率域同時(shí)取得最優(yōu)局部化的特性,因此能夠很好地描述對(duì)應(yīng)于空間頻率(尺度)、空間位置與方向選擇性的局部結(jié)構(gòu)信息,下面圖2.2、2.3、2.4是Gabor濾波器的原圖特性、空域特性和頻域特性(源代碼詳見附錄二): 圖2.2 Gabor濾波器原圖特性 圖2.3 Gabor濾波器原圖的空域特性 圖2.3 Gabor濾波器原圖的頻域特性2.4.1 G

40、abor濾波器參數(shù)的選擇由于不同,u代表了不同的采樣方式,因此需要保證在不同的尺度和不同方向上的采樣盡量均勻。一些研究表明0, 區(qū)間可以描述所有的方向,因此只需對(duì)區(qū)間0, 進(jìn)行采樣。也就是說:+方向上的濾波完全可以由方向的結(jié)果確定。由于的變化是連續(xù)的,不可能取無窮多個(gè),必須對(duì)其進(jìn)行離散均勻采樣。因此這里我們選取作為采樣間隔,反映了空間尺度上采樣。由于尺度的大小實(shí)際上決定于Gauss窗的大小,而其窗長正比于,由于是在二維上的采樣,因此其面積正比于。為了反映尺度上的合理采樣,實(shí)驗(yàn)表明每次采樣的面積成倍的方式遞減比較合理,是一個(gè)常量,這就要求。Gabor濾波器利用公式定義的卷積,就可以在圖像每個(gè)不同

41、的處得到個(gè)不同復(fù)值的濾波結(jié)果12。2.4.2 Gabor濾波器的性質(zhì)和計(jì)算方法(1)Gabor濾波器的性質(zhì)1 Gabor濾波器具有生物學(xué)的意義。Gabor核函數(shù)與脊椎動(dòng)物大腦視覺區(qū)域皮層細(xì)胞的感受行狀十分類似。2 Gabor濾波器能充分描述圖像的紋理信息。Gabor濾波特性說明了Gabor濾波結(jié)果是描述圖像局部灰度分布的有力工具。因此,圖像的紋理信息可以用Gabor濾波作為特征抽取的方法。3 對(duì)二維Gabor濾波的研究表明,通過恰當(dāng)選擇若干個(gè)Gabor核函數(shù)可以重構(gòu)出原圖像。4 Gabor核函數(shù)由于去掉了直流分量,對(duì)局部光照影響不敏感。這和直接將圖像的灰度特征作為模板相比,優(yōu)勢(shì)是很明顯的。5

42、Gabor濾波結(jié)果可以描述不同方向上灰度的分布信息。6 Gabor濾波結(jié)果可以描述不同尺度上灰度的分布信息。一般來說,大尺度濾波可以描述全局性較強(qiáng)的信息,同時(shí)可以掩蓋掉圖像中噪聲的影響,而小尺度濾波可以描述比較精細(xì)的局部結(jié)構(gòu),受噪聲影響也大。7 核函數(shù)有良好的頻域特性。Gabor核函數(shù)在頻域的形狀和空域的形狀完全一樣。8 Gabor濾波可以容忍圖像有一定的平移、旋轉(zhuǎn)、深度上的轉(zhuǎn)動(dòng)、尺度變化等情況。 (2)Gabor核函數(shù)的計(jì)算方法由于輸入的圖像為灰度圖像,這就是直接的離散化表示。從Gabor核函數(shù)的定義公式可以看出,由于Gauss窗函數(shù)的限制,Gabor核函數(shù)只在一個(gè)局部非零,因此我們只需要對(duì)

43、其局部進(jìn)行離散抽樣即可。抽樣圍的大小由Gauss窗的大小所確定,這里我們?nèi)∽鳛槌闃影霃健?.4.3 Gabor變換的人臉特征提取 根據(jù)以上分析,我們知道Gabor變換在人臉特征提取方面具有很多優(yōu)點(diǎn),前面定義的Gabor小波是一組帶通濾波器,通過參數(shù)的選擇,每一組濾波器具有各自的頻率選擇性和方向選擇性,這樣不同方向和尺度的濾波器覆蓋整個(gè)頻域,從而一幅人臉圖像的Gabor特征表示就是該圖像和一族Gabor小波卷積的結(jié)果。 假設(shè)表示一幅圖像的灰度分布,則其Gabor特征表示為: (2-15) 其中,是Gabor核函數(shù),是尺度,方向的Gabor小波卷積結(jié)果。在這里,我們選用3個(gè)尺度4個(gè)方向的Gabor

44、小波,即0 ,.,2,0,.,3,其于參數(shù)設(shè)為以與為了包含不同的空間尺度和方向的Gabor濾波特征,一般將一幅圖像的所有尺度方向Gabor濾波變換表示成一個(gè)級(jí)聯(lián)的特征矢量。由于一般圖像的維數(shù)比較高,直接將所有尺度、方向的Gabor小波變換特征級(jí)聯(lián)會(huì)導(dǎo)致維數(shù)大而難于處理,因此有必要對(duì)圖像的各個(gè)Gabor小波表示進(jìn)行下采樣處理,假設(shè)下采樣因子為,則一幅圖像的特征矢量為: (2-16) 從特征提取的角度出發(fā),對(duì)人臉圖像的不同尺度不同方向的Gabor濾波可以認(rèn)為是提取了人臉圖像具有不同性質(zhì)的特征,因此對(duì)于本文所采用的3尺度4方向的Gabor小波,可以認(rèn)為其對(duì)人臉圖像的濾波得到了12組具有不同性質(zhì)的特征

45、矢量,一般都將這12組特征矢量簡單級(jí)聯(lián)成一個(gè)長特征矢量,然后在對(duì)該特征矢量進(jìn)行學(xué)習(xí)和識(shí)別分類,而不考慮各組特征矢量的有效性問題,即哪些尺度和方向的Gabor濾波特征更能反應(yīng)人臉之間互相區(qū)別的本質(zhì)特征。以下是Gabor變換人臉提取特征的流程圖: 圖2-2 Gabor變換人臉提取特征流程圖 根據(jù)以上流程圖編寫的程序可以得出一幅經(jīng)過Gabor小波變換后的人臉特征圖像,如圖2-3:圖2-3 ORL人臉原圖和經(jīng)Gabor提后的圖片2.5Gabor快速算法圖 前面我們通過實(shí)驗(yàn)分析了Gabor變換在人臉特征提取中的重要作用,在這一章中,我們就著重介紹Gabor的快速算法。由于我們所說的Gabor變換的快速算

46、法是基于傅里葉快速算法而來的,所以我們先介紹傅里葉快速算法。離散傅里葉變換(DFT)在信號(hào)的頻譜析、系統(tǒng)的分析、設(shè)計(jì)和實(shí)現(xiàn)中得到了廣泛的應(yīng)用,原因之一就是計(jì)算DFT有很多的快速算法,快速傅里葉變換(FFT)算法就是其中之一。在使用數(shù)字信號(hào)處理技術(shù)的各種各樣的應(yīng)用領(lǐng)域里,F(xiàn)FT算法都起著極為重要的作用。設(shè)為N點(diǎn)的有限長序列,則其正變換DFT為:(2-17) 逆變換OFT為:(2-18) 通常我們用算法所需的乘法和加法運(yùn)算次數(shù),來衡量各種算法的復(fù)雜性和效率。這里的通常都是復(fù)數(shù),于是整個(gè)DFT運(yùn)算就需要N2次復(fù)數(shù)乘法和N(N-1)次復(fù)數(shù)加法。因此,直接計(jì)算DFT,乘法和加法的次數(shù)都與N2成正比。 當(dāng)

47、N較大時(shí),計(jì)算量太大,無法得到實(shí)際的應(yīng)用。2.5.1快速傅里葉變換(FFT) 自從1965年圖基(J.W.Tuky)和庫利(T.W.Coody)在計(jì)算機(jī)數(shù)學(xué)(Math puter,Vol.19,1965)雜志上發(fā)表了著名的機(jī)器計(jì)算傅里葉級(jí)數(shù)的一種算法論文之后桑德(G.Sand)、圖基等快速算法相繼出現(xiàn),又經(jīng)人們進(jìn)行改進(jìn),很快的形成一套高效運(yùn)算方法,這就是現(xiàn)在的快速傅立葉變換,簡稱FFT,這種算法使DFT運(yùn)算效率提高1-2個(gè)數(shù)量級(jí),為數(shù)字信號(hào)處理技術(shù)應(yīng)用于各種信號(hào)的實(shí)時(shí)處理創(chuàng)造了良好的條件,大大推動(dòng)了數(shù)字信號(hào)處理技術(shù)的發(fā)展。 快速傅里葉變換的算法有很多,主要的算法有: 時(shí)間抽取(DIT)基-2F

48、FT算法。這種算法是將輸入序列在時(shí)域上的次序按偶數(shù)和奇數(shù)來抽取,對(duì)于任意一個(gè)N =2M點(diǎn)長序列的DFT運(yùn)算,可以采用M次分解,最后分解成2點(diǎn)的DFT運(yùn)算的組合,從而降低了運(yùn)算量。DIT的運(yùn)算量為: 復(fù)數(shù)乘法次數(shù):Mp=(N/2)M=(N/2)log2N 復(fù)數(shù)加法次數(shù):ap=Nlog2N (1)頻域抽取(DIF)基2FFT算法。與DIT算法相對(duì)應(yīng),DIF算法是把頻域輸出X(k)按k是偶數(shù)或是奇數(shù),逐級(jí)分解成2點(diǎn)的DFT運(yùn)算,其原理與DIT算法相對(duì)偶,運(yùn)算量也與DIT算法的一樣,這里不再贅述。 (2)N為復(fù)合數(shù)的FFT算法。這是統(tǒng)一的FFT算法,而前面的DIT算法、DIF算法不過是在輸入序列的列長

49、為N=2的統(tǒng)一FFT算法的特例而已。這種算法是把DFT的運(yùn)算通過分解成很多短長度的DFT來完成的.如果能分解成4點(diǎn)或2點(diǎn)的DFT,因不需要乘法,可減少旋轉(zhuǎn)因子的數(shù)量,運(yùn)算量更少。N為復(fù)合數(shù)時(shí)的FFT算法,采用下標(biāo)映射是個(gè)關(guān)鍵,然后再分別對(duì)列(或行)和行(或列)求小點(diǎn)數(shù)長度的DFT,并用旋轉(zhuǎn)因子做各小點(diǎn)數(shù)DFT間運(yùn)算的媒介,但這同時(shí)也帶來了運(yùn)算量的增加。 若復(fù)合數(shù)N=LM,則其FFT的運(yùn)算量大致為: 復(fù)數(shù)乘法次數(shù):N(M+L+1) 復(fù)數(shù)加法次數(shù):N(M+L-2) 分裂基FFT算法(SRFFT)。這是一種利用將基-2和基-4于變換的不同部位,進(jìn)一步改善固定一基和混合一基的算法,其基本思路是對(duì)偶序號(hào)

50、輸出使用基-2算法,對(duì)奇序列輸出使用基-4算法,將大點(diǎn)數(shù)的DFT逐級(jí)分解成小點(diǎn)數(shù)的DFT運(yùn)算。由于分解的不對(duì)稱性,算法結(jié)構(gòu)比固定-基算法稍微復(fù)雜一些,是目前針對(duì)N =2M的算法中具有最少乘法和加法次數(shù)的,又允許以同址計(jì)算和蝶形方式實(shí)現(xiàn),所以被認(rèn)為是最好的快速傅里葉變換算法。其運(yùn)算量為: 實(shí)數(shù)乘法次數(shù):Nlog2N-3N+4 實(shí)數(shù)加法次數(shù):Nlog2N-3N+4(3)素因子算法(PFA)。當(dāng)復(fù)合數(shù)N可以按照Good映射分解為幾個(gè)互素因子的乘積時(shí),其FFT變換就可以避免旋轉(zhuǎn)因子的影響。PFA算法就是采用了Good映射,將長度為N=N1*N2的一維DFT轉(zhuǎn)換成尺寸為N=N1×N2的二維DF

51、T,然后以行列方式沿每一維采用最有效的算法計(jì)算這個(gè)二維的DFT。該算法的運(yùn)算量為:乘法次數(shù):m(N)=N2m(N1)+N+N1*m(N2)其中m(N)表示計(jì)算N點(diǎn)DFT需要的總乘法次數(shù)。 (4)Winograd傅里葉變換算法(WFTA)。該算法利用了Good映射將長度為“大N”因子的DFT分解成若干“小N”因子的連乘,再利用“小N”因子的DFT,就可以得到“大N”因子的DFT?!靶”因子的DFT是指2,3,4,5,7,8,9和16點(diǎn)的DFT。WFTA算法結(jié)構(gòu)比FFT復(fù)雜的多,程序編譯的時(shí)間也長,但運(yùn)算速度比較快。WFTA算法被證實(shí)為具有最少的乘法和加法次數(shù)的算法,該算法除了用到下標(biāo)映射外,還

52、涉與到數(shù)論和近代數(shù)的知識(shí)。 (5)實(shí)序列的FFT。對(duì)于輸入為實(shí)數(shù)序列的FFT沒有必要專門編寫實(shí)數(shù)據(jù)的FFT,而是直接利用復(fù)數(shù)據(jù)FFT進(jìn)行計(jì)算。利用DFT奇偶對(duì)稱性質(zhì),可以用一個(gè)N點(diǎn)的FFT同時(shí)運(yùn)算兩個(gè)N點(diǎn)實(shí)序列,或者是用一個(gè)N點(diǎn)的FFT運(yùn)算一個(gè)2N點(diǎn)的實(shí)序列。前者是把一個(gè)實(shí)序列作為實(shí)部,同時(shí)另一個(gè)實(shí)序列作為虛部,計(jì)算FFT后再把輸出按奇、偶、虛、實(shí)特性加以分離,后者是將2N長的實(shí)序列的偶序號(hào)置為實(shí)部,奇序號(hào)置為奇部,同樣在計(jì)算FFT后再加以分離。用一個(gè)N點(diǎn)的FFT運(yùn)算一個(gè)2N點(diǎn)的實(shí)序列的運(yùn)算量為: 乘法次數(shù):m2f=N/2(4+log2N) 加法次數(shù):a2f=N(4+log2N)主要有4類計(jì)算

53、二維FFT的方法。即行一列算法、矢量一基算法(VR)、嵌套算法、多項(xiàng)式變換算法。行一列算法實(shí)現(xiàn)最容易,僅要求有效的一維FFT算法即可。而多項(xiàng)式變換因?yàn)榫哂凶畹偷乃阈g(shù)復(fù)雜性,同址計(jì)算的可能性和實(shí)現(xiàn)工作量不大的優(yōu)點(diǎn),受到人們的普遍重視。二維FFT的一個(gè)重要參數(shù)是考慮存儲(chǔ)器的存取次數(shù)。更高維的FFT變換可以類似得到,但在實(shí)際應(yīng)用中采用的不多。2.5.2Gabor變換的快速算法 我們只要把Gabor變換轉(zhuǎn)換成傅立葉形式,根據(jù)FFT快速算法將乘法轉(zhuǎn)換成加法就可以了。下面我們對(duì)其做具體的介紹。DFT的卷積公式定義如下: 若,DFT=X(),DFT=H(),則=IDFTX()H(),但是,我們需要注意的是:

54、進(jìn)行的是循環(huán)卷積,循環(huán)卷積的定義如下:其中:表示的圓周移位序列, 其實(shí)質(zhì)上與的含義類似。從直觀上說,就是對(duì)兩個(gè)卷積的函數(shù)重疊部分以外都用周期延拓的方式填充。 線性卷積的定義如下:從直觀上說,就是當(dāng)兩個(gè)卷積的函數(shù)重疊部分以外都用零填充。在實(shí)際中我們提取特征需要的是線卷積的結(jié)果。如果將序列和都適當(dāng)?shù)难a(bǔ)零,設(shè)長度為I,長度為M,則當(dāng)我們將和都補(bǔ)零到長度為時(shí),圓卷積和線卷積結(jié)果一樣。在實(shí)際實(shí)驗(yàn)中,我們將濾波器組和圖像都補(bǔ)零到256,這樣可以滿足上面的補(bǔ)零要求。在這種情況下,對(duì)于一幅圖像,如果我們的濾波器組是事先計(jì)算好的,則只需要進(jìn)行1個(gè)FFT(對(duì)圖像),40個(gè)乘法(圖像FFT的結(jié)果與濾波器相乘),40

55、個(gè)工FFT(對(duì)相乘結(jié)果進(jìn)行)。同時(shí)256是2的8次冪,2D-FFT的計(jì)算復(fù)雜度為N2log2N。由此,復(fù)雜度大大減少。2.6本章小結(jié)本章主要介紹了Gabor小波變換的具體原理和實(shí)際應(yīng)用,與用于人臉識(shí)別的具體算法。事實(shí)上,Gabor小波變換最主要就是一個(gè)濾波器設(shè)計(jì)的問題,通過采取不同的方向和尺度,不同的波長和頻率,就可以得到不同的濾波器,本文為了減少程序的運(yùn)行時(shí)間,暫時(shí)采用了3尺度,4方向的Gabor小波,同時(shí)取,可以認(rèn)為其對(duì)人臉圖像的濾波得到了12組具有不同性質(zhì)的特征矢量,一般都將這12組特征矢量簡單級(jí)聯(lián)成一個(gè)長特征矢量X,然后在對(duì)該特征矢量X進(jìn)行學(xué)習(xí)和識(shí)別分類,由于一般圖像的維數(shù)比較高,直接將所有尺度、方向的Gabor小波變換特征級(jí)聯(lián)會(huì)導(dǎo)致維數(shù)大而難于處理,因此有必要對(duì)提取的出來的Gabor人臉特向量進(jìn)行降維,以減少它的運(yùn)算量。第3章 LBP算法、PCA和LPP降維算法3.1 引言Ma和Manjunath對(duì)提取圖像紋理特征的不同小波變換方法進(jìn)行了比較分析 ,得到結(jié)論是Gabor小波變換方

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論