




已閱讀5頁,還剩43頁未讀, 繼續(xù)免費(fèi)閱讀
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
內(nèi) 容 摘 要生物特征識別是利用人類特有的生理或行為特征來識別個(gè)人身份的技術(shù),它提供了一種高可靠性、高穩(wěn)定性的身份鑒別途徑。人臉檢測和識別是目前生物特征識別中最受人們關(guān)注的一個(gè)分支,是當(dāng)前圖像處理、模式識別和計(jì)算機(jī)視覺領(lǐng)域內(nèi)的一個(gè)熱門研究課題,在公安部門罪犯搜索、安全部門動(dòng)態(tài)監(jiān)視識別、銀行密碼系統(tǒng)等許多領(lǐng)域有廣泛的研究,本文對此進(jìn)行了較為深入的研究。首先描述了人臉識別技術(shù)的研究內(nèi)容、方法、應(yīng)用前景,對人臉自動(dòng)檢測與識別技術(shù)進(jìn)行了綜述。并且詳細(xì)介紹了人臉識別很重要的一個(gè)步驟“人臉預(yù)處理”,文中提到的人臉預(yù)處理方法都是從圖像處理的角度著手的,主要目的是使人臉圖像標(biāo)準(zhǔn)化,并在一定程度上消除光照的影響。本文介紹了幾種主要的預(yù)處理方法,如幾何歸一化,灰度歸一化。其次,本文重點(diǎn)描述了人臉識別的經(jīng)典方法,PCA方法。主成分分析方法(Principal Component Analysis ,PCA),即離散K-L變換,是圖像壓縮中的一種最優(yōu)正交變換。它用一個(gè)低維子空間來描述人臉圖像,同時(shí)又能在一定程度上保存所需要的識別信息。其基本原理為:由高維圖像空間經(jīng)K-L變換后得到一組新的正交基,對這些正交基作一定的取舍,保留其中的一部分生成低維的人臉空間,即人臉的特征子空間,識別時(shí)將測試圖像投影到此空間,得到一組投影系數(shù),通過與各個(gè)人臉圖像比較進(jìn)行識別。這種方法使得壓縮前后的均方誤差最小,且變換后的低維空間有很好的分辨能力。但在這種人臉識別技術(shù)中,二維的人臉圖像矩陣必須先轉(zhuǎn)化為一維的圖像向量,才能進(jìn)行PCA分析,而在這種轉(zhuǎn)化后,造成圖像向量的維數(shù)一般較高,使整個(gè)特征抽取過程所耗費(fèi)的計(jì)算量相當(dāng)可觀。關(guān)鍵詞人臉識別;人臉預(yù)處理;主成分分析Research on Face Recognition Based on Principal Component AnalysisAbstract Biometrics is a kind of science and technology using individual physiological or behavioral characteristics to verify identity. It provides a highly reliable and robust approach to the identity recognition. Automatic face detection and recognition is one of the most attention branches of biometrics and it is also the one of the most active and challenging tasks for image processing, pattern recognition and computer vision. It is widely applied in commercial and law area, such as mug shots retrieval, real-tine video surveillance in security system and cryptography in bank and so on. The main research works and contributions are as the following. First, the research content, approach and development are emphasized. The research status is introduced. The technology of the face detection and recognition are summarized. And the paper describes face preprocessing in detail which is and important step in the face recognition. The face preprocessing methods we adopt are based on image processing techniques. The main purpose is to get the standardized facial images, and to eliminate the impact of illumination to some extent. In this paper, several key preprocessing methods are introduced, such as geometry normalization, gray-scale normalization and images binary-conversion. Principal Component Analysis (PCA) face recognition methods as the foundation of the K-L transformation is the most superior in the image compression .By using PCA, the dimension of the input is reduced while the main components are maintained. The major idea of PCA is to decompose a data space into a linear combination of a small collection of bases.In the face-recognition literature, the eigenvectors can be referred to as eigenfaces. The probe is identified by first projection to all gallery images. We denote a probe .A probe is comparing the projection to all gallery images, and it causes around the compression the mean error to be youngest. But in the PCA-based face recognition technique, the 2D face image matrices must be previously transformed into 1 D image vectors. The resulting image vectors of faces usually lead to a high dimensional image vector space, where it is difficult to evaluate the covariance matrix accurately due to its large size and the relatively small number of training samples. Key wordsFace recognition ;Face pretreatment;PCA目 錄第一章 緒 論11.1人臉識別研究的目的意義11.2人臉識別的定義及主要研究內(nèi)容31.3人臉識別方法綜述61.3.1人臉識別方法分類61.3.2常用的人臉識別方法61.3.3基于幾何特征的人臉識別方法71.3.4基于K-L變換的特征臉方法91.3.5神經(jīng)網(wǎng)絡(luò)方法101.3.6彈性匹配圖臉部識別方法121.3.7隱馬爾可夫模型的識別方法131.3.8基于FISHER線性判別式的方法131.3.9基于小波包的識別方法141.4人臉識別的應(yīng)用141.5人臉識別問題中的難點(diǎn)及發(fā)展方向151.5.1人臉識別問題中的難點(diǎn)151.5.2人臉識別的發(fā)展方向17第二章人臉圖像預(yù)處理182.1引言182.2人臉圖像庫簡介182.3人臉圖像的預(yù)處理算法192.3.1圖像的幾何歸一化192.3.2圖像的直方圖均衡化202.4本章小結(jié)23第三章 基于PCA的人臉識別方法233.1引言233.2 PCA人臉識別方法原理233.2.1特征提取的概念243.2.2離散K-L變換的原理243.2.3特征值的選擇263.2.4距離函數(shù)的選取與分類判別273.3經(jīng)典的PCA人臉識別283.3.1特征臉?biāo)惴?83.3.2經(jīng)典PCA人臉識別方法的實(shí)現(xiàn)過程293.3.3訓(xùn)練過程303.3.4識別過程32第四章 實(shí)驗(yàn)過程顯示及分析334.1 引言334.2 實(shí)驗(yàn)過程33致 謝37參考文獻(xiàn)38附錄3942第一章 緒 論1.1人臉識別研究的目的意義隨著信息技術(shù)及網(wǎng)絡(luò)的高速發(fā)展,人們的生活及身份日益數(shù)字化,信息的安全性和隱蔽性越來越受到人們的重視,身份識別與認(rèn)證技術(shù)也因此得到了較快的發(fā)展。而人臉識別作為圖像處理在這些領(lǐng)域最成功的應(yīng)用之一,最近幾年來成為廣大學(xué)者的研究熱點(diǎn),越來越受到關(guān)注。人類社會的發(fā)展進(jìn)入到21世紀(jì)的今天,社會的發(fā)展促進(jìn)了人的流動(dòng),進(jìn)而也增加了社會的不穩(wěn)定性,這就使得安全方面的需求成為當(dāng)今社會尤為重要的問題。不論是享受各項(xiàng)服務(wù)如網(wǎng)上沖浪、還是居家、辦公等都涉及到安全,以往這些行為基本上是通過符號密碼來進(jìn)行安全保護(hù),但是隨著服務(wù)數(shù)量的不斷增加,密碼越來越多以致無法全部記住,而且密碼有時(shí)也會被他人所竊取,各種密碼被破解的概率越來越高。可見在現(xiàn)代社會中,身份識別己經(jīng)成為人們?nèi)粘I钪薪?jīng)常遇到的一個(gè)基本問題。人們幾乎時(shí)時(shí)刻刻都需要鑒別別人的身份和證明自己的身份,以獲得對特定資源的使用權(quán)或者制權(quán),同時(shí)防止這些權(quán)限被他人隨意的取得。傳統(tǒng)的身份識別方法主要基于身份標(biāo)識物(如證件、卡片)和身份標(biāo)識知識(如用戶名、密碼)來識別身份,這在很長一段時(shí)期是非??煽亢头奖愕淖R別方法,得到了廣泛的應(yīng)用。但是,隨著網(wǎng)絡(luò)、通信、交通等技的飛速發(fā)展,人們活動(dòng)的現(xiàn)實(shí)空間和虛擬空間不斷擴(kuò)大,需要身份認(rèn)證的場合也變得無不在。密碼遺失、資料被盜的時(shí)間不斷發(fā)生,傳統(tǒng)的安全技術(shù)已暴露出重大的缺陷,就會給個(gè)人乃至整個(gè)社會帶來重大的甚至難以彌補(bǔ)的損失。面臨這樣的情況,人們對身份識別的安全性、可靠性、準(zhǔn)確和實(shí)用性提出了更高的要求,必須尋求身份識別的新途徑。于是,近年來人類生物特征越來越廣泛地應(yīng)用于身份識別,而且生物特征可以更好的進(jìn)行安全控制,世界各國政府都在大力推進(jìn)生物識別技術(shù)的發(fā)展及應(yīng)用。所謂生物特征認(rèn)證就是利用人的生理或行為特征對個(gè)人身份進(jìn)行識別或是認(rèn)證的技術(shù),與傳統(tǒng)的身份認(rèn)證技術(shù)不同,基于生物特征的身份認(rèn)證技術(shù),以人體本身所固有的生理特征或行為特征作為識別媒介,運(yùn)用圖像處理和模式識別等技術(shù),實(shí)現(xiàn)身份鑒別或驗(yàn)證。相對傳統(tǒng)的身份認(rèn)證方法而言,生物特征認(rèn)證技術(shù)具有不會因當(dāng)事人遺忘或他人竊取和偽造而進(jìn)行錯(cuò)誤判定,比傳統(tǒng)的身份認(rèn)證方法更加安全方便、特征唯一、不易偽造、不可竊取。生物特征可分為生理特征和行為特征兩大類,人臉、指紋、掌紋、虹膜、視網(wǎng)膜等屬于生理特征,語音、步態(tài)、筆跡等屬于行為特征,生理特征相對行為特征而言更為穩(wěn)定。人臉識別技術(shù)基于生理特征進(jìn)行識別,是最主要的生物特征身份認(rèn)證技術(shù)之一。在各種生物特征認(rèn)證技術(shù)中,人臉識別技術(shù)的市場份額僅次于指紋識別技術(shù)。人臉識別技術(shù)和其他的生物識別比起來有以下幾個(gè)優(yōu)點(diǎn): (1)人臉識別可以在隱蔽的條件下進(jìn)行,適用于安全監(jiān)控; (2)數(shù)據(jù)采集方便,采集設(shè)備成本低廉。目前,普通數(shù)碼相機(jī)、數(shù)碼攝像機(jī)和照掃描儀等攝像設(shè)備在普通家庭的日益普及進(jìn)一步增加了其可用性;(3)人臉識別具有快捷、非接觸的特點(diǎn),對用戶友好。人臉是人們在日常生活中辨認(rèn)他人的最常用的特征。利用人臉特征進(jìn)行身份驗(yàn)證最易被人們接受; (4)存在豐富的現(xiàn)有數(shù)據(jù)。社會上具有各種大型的人臉數(shù)據(jù)庫,如公安部門的身份證照片數(shù)據(jù)庫,學(xué)校里的學(xué)生學(xué)籍?dāng)?shù)據(jù)庫等等。在各種身份證明材料中,一般也會含有標(biāo)準(zhǔn)的正面人臉照片;(5)具有方便、快捷、強(qiáng)大的事后追蹤能力。普通人可以對人臉認(rèn)證系統(tǒng)的結(jié)果進(jìn)行判定,而上述其他生物特征一般只能通過專家認(rèn)定。人臉識別技術(shù)作為生物識別技術(shù)的一種,以其特有的穩(wěn)足性、方便性、唯一性等特點(diǎn)被愈來愈多地應(yīng)用于除安全問題外的各種身份識別領(lǐng)域。因?yàn)槠渚薮蟮纳虡I(yè)應(yīng)用前景,受到越來越多的重視。近幾十年以來人臉識別技術(shù)有了長足的發(fā)展,并且逐步走向?qū)嶋H應(yīng)用階段。可以預(yù)言,在今后的幾十年內(nèi),隨著人臉識別技術(shù)進(jìn)一步發(fā)展,人臉識別技術(shù)將應(yīng)用到更多的領(lǐng)域,例如視覺監(jiān)控、娛樂應(yīng)用、智能卡、自動(dòng)身份驗(yàn)證、銀行安全、公安系統(tǒng)刑偵破案的罪犯身份識別、身份證及駕駛執(zhí)照等證件驗(yàn)證、銀行及海關(guān)的監(jiān)控、自動(dòng)門衛(wèi)系統(tǒng)、視頻會議等。目前,各國都加大力度研究生物識別技術(shù),人臉識別這一最類似人類身份鑒別的方式得到了很多人的關(guān)注,很多重要的出入場合都在安裝人臉識別系統(tǒng)。這些己有的以及潛在的應(yīng)用領(lǐng)域?qū)⑼苿?dòng)人臉識別技術(shù)不斷發(fā)展。根據(jù)預(yù)計(jì),生物特征識別技術(shù)在2009-2012年的增長率將保持30%左右,在國內(nèi)這一數(shù)字會更高。整個(gè)生物識別技術(shù)市場的規(guī)模2010年將達(dá)到40億美元左右,國內(nèi)市場有可能達(dá)到40億人民幣。人臉識別作為一種新興的生物識別技術(shù)將占據(jù)整個(gè)生物特征識別技術(shù)15%-20%左右的份額。就算以15%計(jì)算,人臉識別的市場規(guī)模也將在2010年達(dá)到6億美元,國內(nèi)達(dá)到40億人民幣左右。作為一種最直接、最自然、最容易被人接受的生物特征識別技術(shù),人臉識別致力于探索如何使機(jī)器能夠自動(dòng)地根據(jù)用戶的人臉圖像來鑒別用戶的身份。 人臉識別的研究涉及模式識別、計(jì)算機(jī)視覺、人工智能、圖像處理、心理學(xué)、機(jī)器人的智能化研究、醫(yī)學(xué)、生理學(xué)和認(rèn)知科學(xué)等,與計(jì)算機(jī)人機(jī)交互領(lǐng)域和基于其它生物特征的身份識別方法都有密切聯(lián)系。雖然人們可以毫不費(fèi)力地通過臉部圖像來鑒別互相的身份,然而由于成像過程中各種影響因素的變化常常導(dǎo)致同一個(gè)人的人臉圖像發(fā)生非常大的變化,因此建立自動(dòng)系統(tǒng)完成識別任務(wù)是非常具有挑戰(zhàn)性的。雖然目前國內(nèi)外己經(jīng)有許多實(shí)用系統(tǒng)問世,但是只有在非常苛刻的成像條件下,才能得到比較令人滿意的識別效果。因此,人臉識別研究仍然遠(yuǎn)遠(yuǎn)沒有到達(dá)完善的境地,還有非常大的發(fā)展空間。1.2人臉識別的定義及主要研究內(nèi)容 人臉識別(Face Recognition)是指基于己知的人臉樣本庫,利用圖像處理和模式識別技術(shù)從靜態(tài)或動(dòng)態(tài)場景中,識別或驗(yàn)證一個(gè)或多個(gè)人臉。從廣義上來說,人臉識別主要包括人臉檢測、人臉表征、人臉鑒別、表情分析和物理分類五個(gè)方面。 (1)人臉檢測(Face Detection):即從各種不同的場景中檢測出人臉的存在并確定其位置、尺度和姿勢。這一任務(wù)主要受光照、噪聲、頭部傾斜度以及各種遮擋的影響;(2)人臉表征(Face Representation):即確定表示檢測出的人臉和數(shù)據(jù)庫中的已知人臉的描述方式。通常的表示方法有幾何特征(如歐氏距離、曲率、角度等)、代數(shù)特征(如矩陣特征矢量)、固定特征模板、特征臉等;(3)人臉鑒別(Face Identification):即通常所說的人臉識別,就是將待識別的人臉與數(shù)據(jù)庫中的己知人臉比較,得出相關(guān)信息。這一過程的核心是選擇適當(dāng)?shù)娜四槺硎痉绞脚c匹配策略;(4)表情分析(Facial Expression Analysis):即對待識別人臉的表情進(jìn)行分析,并對其分類;(5)物理分類(Physical Classification)即對待識別人臉的物理特征進(jìn)行分類,得出其年齡、性別、種族等相關(guān)信息。狹義的人臉識別就是根據(jù)系統(tǒng)新輸入的人臉,與己有的人臉數(shù)據(jù)庫進(jìn)行比對,來判斷該人臉是否在人臉庫中;如果在該人臉數(shù)據(jù)庫中,則給出所對應(yīng)的具體的個(gè)體信息。一般來說,我們所提的人臉識別指的是狹義的人臉識別。一個(gè)典型的自動(dòng)人臉識別系統(tǒng)如圖1.1所示,分為訓(xùn)練和識別兩個(gè)步驟,兩個(gè)步驟都需要檢測和定位人臉、人臉圖像的預(yù)處理和特征提取和選擇。其中訓(xùn)練一般是離線運(yùn)算的,而識別是在線操作的。 圖1.1人臉識別系統(tǒng)的基本框圖(1)人臉的檢測和定位,人臉檢測與人臉定位是相互聯(lián)系但又有所區(qū)別的兩個(gè)概念。人臉檢測的目的是檢測輸入的圖像中是否含有人臉,而人臉定位是確定輸入的圖像中人臉位置以及大小,并將人臉從背景中分割出來。檢測人臉對于簡單背景的同一人的人臉圖片是比較容易實(shí)現(xiàn)的,但當(dāng)人臉的背景變得復(fù)雜,或者圖片中的人臉屬于多個(gè)人時(shí),檢測就會變得相對困難。人臉檢測與定位是一項(xiàng)很復(fù)雜的工作,這是由于光線、視角、表情、墨鏡、遮擋物等各種因素,以及可能出現(xiàn)的圖像噪聲或干擾,即使是同一人的人臉圖像也可能會產(chǎn)生很大的差別,這使得人臉檢測與定位工作變得相當(dāng)困難。作為人臉識別的基礎(chǔ),人臉的檢測與定位是人臉識別研究的另一個(gè)重要方面。(2)人臉圖像的預(yù)處理,人臉檢測得到的人臉圖像,如有設(shè)備條件的差異,可能存在光照、噪聲、角度不好等缺陷,一般需要對圖像進(jìn)行幾何歸一化、灰度歸一化及邊緣檢測等處理。幾何歸一化主要是指將人臉圖像進(jìn)行一定的處理變?yōu)橄袼卮笮〗y(tǒng)一且人臉關(guān)鍵位置一致的圖片?;叶葰w一化則就是對人臉圖像進(jìn)行光照補(bǔ)償,消除光照對圖像的影響,進(jìn)而提高識別率。(3)特征提取和選擇,對人臉進(jìn)行識別主要依據(jù)人臉的特征,也就是說依據(jù)不同個(gè)體之間有較大差異而對同一個(gè)體則比較穩(wěn)定的度量。在實(shí)際操作中,我們主要是通過各種變換來達(dá)到對圖像進(jìn)行降維的效果,如特征臉方法中K-L變換就是特征提取,而主元選取就是特征選擇。除此之外還有DCT, Gabor變換、分?jǐn)?shù)階傅里葉變換等都是基于人臉的整體特征提取,還有基于人臉局部特征的提取方法,如利用顯著器官(眼鏡、眉毛、耳朵、嘴巴等)之間的距離關(guān)系,以及通過訓(xùn)練學(xué)習(xí)求得的局部特征。(4)人臉識別,在識別前對人臉圖像庫進(jìn)行處理,得到每個(gè)個(gè)體的特征信息,單獨(dú)建立一個(gè)新的人臉圖像數(shù)據(jù)庫,在識別過程中,采用同樣的方法得到測試人臉圖片的特征信息,并與庫中的每個(gè)個(gè)體信息進(jìn)行比較。在比較之前需確定相似性尺度,常用的是歐氏距離函數(shù)和基于貝葉斯準(zhǔn)則的概率尺度。一般情況下,識別可以分為兩種:一種是人臉辨認(rèn),即需要確認(rèn)被識別者的具體信息;另一種是身份證實(shí),只需要判斷識別對象是否是數(shù)據(jù)庫中個(gè)體的一員。整個(gè)人臉識別的研究工作主要是圍繞特征向量的提取和特征選擇展開的。因?yàn)橹暗念A(yù)處理步驟與圖像處理的工作是相通的,而之后的識別步驟與一般的模式識別問題是一致的。1.3人臉識別方法綜述1.3.1人臉識別方法分類根據(jù)研究角度的不同,我們對人臉識別方法可以進(jìn)行不同的分類方法。根據(jù)圖像來源途徑的不同,可以分為動(dòng)態(tài)和靜態(tài)的人臉識別;根據(jù)輸入人臉圖像的角度,可以分為基于正面、側(cè)面和傾斜人臉圖像識別;根據(jù)圖像的顏色特點(diǎn),可以分為彩色圖像和灰度圖像的人臉識別。本文的人臉識別研究是基于靜態(tài)、正面的灰度圖像的。根據(jù)對人臉圖像不同的特征提取方式,我們大致可以人臉識別方法分成兩種:一是基于局部特征分析的研究方法;二是基于整體的研究方法,它考慮到模式的整體屬性,主要有特征臉方法、彈性圖匹配方法、神經(jīng)網(wǎng)絡(luò)方法及隱馬爾可夫模型方法等等?;诰植刻卣鞣治龅姆椒ㄗR別結(jié)果取決于特征定位算法的準(zhǔn)確性,而且要求圖像的像素較高,因此要近距離拍攝圖片。基于整體的識別方法也各自有自己的缺陷,所以近年來的研究趨勢是將人臉的局部特征分析和整體識別結(jié)合起來。1.3.2常用的人臉識別方法對人臉識別方法的研究主要有兩大方向:一是基于人臉圖像局部特征的識別方法;二是基于人臉圖像整體特征的識別方法?;谌四槇D像局部特征的識別通常抽取人臉器官如眼睛、眉毛、鼻子和嘴等器官的位置,尺度以及彼此間的比率作為特征。進(jìn)一步地可以用幾何形狀擬合人臉器官,從而以幾何參數(shù)作為描述人臉的特征。由于此類方法通常要精確地抽取出位置、尺度、比率或幾何參數(shù)作為描述人臉的特征,因此對人臉圖像的表情變化比較敏感。同時(shí),人臉器官分割的精確度也對人臉特征的提取有一定的影響。另外,該類方法并沒有充分利用到人臉圖像本身具有的獲度信息,該方向已經(jīng)不是人臉識別技術(shù)發(fā)展的主流方向?;谌四槇D像整體特征的人臉識別方法由于不需要精確提取人臉圖像中部件的具體信息,而且可以充分利用到人臉圖像本身具有的灰度信息,因此可獲得更好的識別性能。目前,絕大部分關(guān)于人臉識別方法的文章都是基于人臉圖像整體特征的,主要有特征臉法、最佳鑒別向量集法,貝葉斯法,基于傅立葉不變特征法,彈性圖匹配法,其他相關(guān)方法有線性子空間法,可變形模型法和神經(jīng)網(wǎng)絡(luò)法。這些方法中有的側(cè)重于表述人臉圖像的特征提取,如彈性圖匹配法和傅立葉不變特征法;有的則側(cè)重于分類,如最佳鑒別向量集法、貝葉斯法和神經(jīng)網(wǎng)絡(luò)法;而有的則側(cè)重于人臉圖像重構(gòu),如特征臉法和線性子空間法。所有這些基于人臉圖像整體特征的人臉識別方法均取得了一定的識別性能。1.3.3基于幾何特征的人臉識別方法基于幾何特征的人臉識別方法主要源于人臉識別的初期研究階段。這種方法是以人臉各個(gè)器官和幾何關(guān)系為基礎(chǔ)進(jìn)行算法設(shè)計(jì)。對于不同人來說,臉上的各個(gè)器官,如眼睛、鼻子、嘴巴以及整個(gè)臉部的輪廓具有不同的形狀、大小、相對位置和分布情況。在基于幾何特征的人臉識別方法中,可以用一個(gè)矢量來表示提取出來的幾何參數(shù)。如果要獲得一個(gè)準(zhǔn)確、穩(wěn)定和可靠的識別結(jié)果,就要求這些被選出的幾何特征參數(shù)包含足夠豐富的辨識人臉的信息,且能反映不同人臉之間的差別。也就是說對這些矢量要求具有較高的模式分類能力,同時(shí)還要有一定的穩(wěn)健性,能夠消除由于時(shí)間變遷、光照變化等其他干擾因素所帶來的影響。具體來說,這些幾何參數(shù)一般包括人臉上兩個(gè)指定特征點(diǎn)之間的歐式距離、邊緣曲率、角度等等。在Brunelli和Poggio的文獻(xiàn)中給出了一組典型的人臉幾何特征參數(shù):(1)眉毛的厚度(2)眉毛與眼睛中心的垂直距離;(3)描述左眼眉毛弧度的12個(gè)數(shù)據(jù);(4)鼻子的寬度;(5)鼻子在面部上的位置;(6)嘴巴的垂直位置、嘴巴的寬度和上下嘴唇的亮度;(7)描述下顎形狀的11個(gè)半徑數(shù)據(jù);(8)以鼻子位置為準(zhǔn)的臉部寬度;(9)顴骨寬度(半臉寬)。當(dāng)這些幾何特征參數(shù)提取出來后,就可以采用最小距離(歐式距離)分類器,將待識別人臉特征向量與數(shù)據(jù)庫中人臉特征矢量進(jìn)行比較,取距離最近者作為識別結(jié)果。在實(shí)際應(yīng)用過程中,基于幾何特征的人臉識別方法存在著兩個(gè)方面的問題:(1)如何快速、準(zhǔn)確地檢測出人臉的重要標(biāo)志點(diǎn)依然是一個(gè)沒有很好解決的問題。(2)臉部幾何特征在人臉辨識中的有效性問題,即臉部幾何特征能夠提供多少可供識別的信息量。雖然各人臉的器官在形狀、大小及分布上各不相同,但是這種器官上的差異性更多是體現(xiàn)在某些細(xì)微的感覺意義上。例如眼睛顯得比較小、鼻子顯得比較寬,以及皮膚的紋理、顏色上的差異等等。顯然,這些特征中的一部分是難以精確測量出來或者是不能用幾何參數(shù)準(zhǔn)確描述的。所以僅靠增加臉上幾何參數(shù)的數(shù)目來提高人臉識別率是不太現(xiàn)實(shí)的。由于進(jìn)一步改善測量精度是十分困難的,因而通過增加臉部幾何參數(shù)的數(shù)量來改善識別率結(jié)果,其影響是極小的。因此,基于少量人臉幾何特征進(jìn)行大規(guī)模人臉辨識的可靠性是不容樂觀的。1.3.4基于K-L變換的特征臉方法基于特征臉的人臉識別方法的基礎(chǔ)是KL變換。KL變換是圖像壓縮中的一種最優(yōu) 正交變換。通過KL變換,可以把圖像在高維空間表示轉(zhuǎn)換到低維空間表示,而由低維空間恢復(fù)的圖像和原圖像具有最小的均方誤差,從而可以以圖像在低維空間的變換系數(shù)作為人臉圖像的描述特征。KL變換用于人臉識別的前提是人臉圖像處于低維空間,并且不同人臉是線性可分的。通常情況下,KL變換的變換矩陣由訓(xùn)練樣本類間散布矩陣的特征矢量生成。人臉圖像在前面的特征矢量上的投影有較大的能量,稱為主分量;在后面的特征矢量上的投影具有較小的能量。稱為次分量。當(dāng)舍棄部分次分量時(shí),KL變換也稱為主成分分析法(PCA)。由于人臉圖像具有相似的形狀和結(jié)構(gòu),人臉圖像在主分量上的投影過多地反映了光照變化,因此有人提出舍棄人臉圖像在前3個(gè)特征矢量上的投影,而用人臉圖像在其余特征矢量上的投影作為描述人臉圖像的特征。 KL變換是數(shù)字圖像壓縮領(lǐng)域里的一種最優(yōu)變換,它使從低維空間恢復(fù)的人臉圖像和原圖像的均方誤差最小。但KL變換只是從壓縮角度來看是最優(yōu)的,從分類角度來看卻不是最優(yōu)的。雖然它考慮了人臉圖像的所有差異(從壓縮角度),但沒有考慮這些差異是類內(nèi)差異(如光照變化,頭飾變化或幾何變化)還是類間差異(從分類角度)。K-L變換是圖像壓縮的一種最優(yōu)正交變換,人們將它應(yīng)用于特征提取,形成了子空間法模式識別的基礎(chǔ)。將K-L變換用于人臉識別,需要假設(shè)人臉處于低維的線性空間,不同人臉具有可分性。高維的圖像空間經(jīng)過K-L變換后得到一組新的正交基,保留其中重要的正交基從而形成了低維的人臉空間。若將所有子空間的正交基排列成圖像陣列,則正交基呈現(xiàn)人臉的形狀,因此這些正交基也被稱為特征臉。選擇那些正交基形成的子空間則有不同的考慮,與較大特征值對應(yīng)的一些正交基(也稱主分量)能夠表達(dá)人臉的大體形狀,而具體細(xì)節(jié)需要那些小特征值對應(yīng)的特征向量(也稱次分量)來加以補(bǔ)充描述,因此低頻成分用主分量表示,高頻分量用次分量表示。采用主分量作為新的正交空間的正交基的方法稱為主分量_(Principal Component Analysis,簡稱PCA)方法。 K-L變換在90年代初受到了很大的重視,實(shí)際用于人臉識別取得了很好的效果,一般庫德大小為100幅左右,識別率在70-100之間不等,這主要取決于人臉庫圖像的質(zhì)量。從壓縮能量的角度來看,K-L變換是最優(yōu)的,變換后的低維空間對于人臉有很好的表達(dá)能力,較好的判別能力。選擇訓(xùn)練樣本的散布矩陣作為K-L變換的生成矩陣,其最大特征向量反映了該樣本集合的最大分布的方向,但這是圖像統(tǒng)計(jì)方法,而不是人臉統(tǒng)計(jì)方法。它查找的是圖像之間所有的差異,并根據(jù)這些差異來確定不同人臉間的距離,而不管這些差異是由于光線、發(fā)型或背景的改變引起的,還是屬于人臉本身的內(nèi)在差異,因此特征臉的方法用于人臉識別存在理論的缺陷。研究表明,特征連的方法隨著光線、角度以及人臉的尺寸的引入而識別率急劇下降。主分量的方法使得變換后的表達(dá)能力最佳,次分量的方法考慮了高頻的人臉區(qū)分能力,但是由于外在因素帶來圖像差異和人臉本身帶來的差異對K-L變換而言是不加任何區(qū)分的,因此,如何選擇正交基并不根本解決問題。改進(jìn)的一個(gè)思路是針對干擾所在,對輸入圖像作規(guī)范化處理,包括輸入圖像的均值方差歸一化,人臉尺寸歸一化。另一種改進(jìn)是考慮到局部人臉圖像受到外在干擾相對較小的情況,除了計(jì)算特征臉之外,還利用K-L變換計(jì)算出特征眼、特征嘴等。將局部特征向量加權(quán)進(jìn)行匹配得到一些好的效果??傊?,特征臉方法是一種簡單、快速、使用的基于變換系數(shù)的算法,但由于它在本質(zhì)上依賴于訓(xùn)練集合測試集圖像的灰度相關(guān)性,而且要求測試圖像與訓(xùn)練集比較接近,所以存在著很大局限。1.3.5神經(jīng)網(wǎng)絡(luò)方法人工神經(jīng)網(wǎng)絡(luò)是一種以大量的處理單元(神經(jīng)元)為節(jié)點(diǎn),處理單元之間實(shí)現(xiàn)加權(quán)值互連的拓?fù)浣Y(jié)構(gòu)。人工神經(jīng)網(wǎng)絡(luò)中的處理單元是人類大腦神經(jīng)單元的簡化。處理單元之間的互連則是軸突、樹突這些信息傳遞路徑的簡化。根據(jù)不同的應(yīng)用場合,現(xiàn)已研究出較多的神經(jīng)元網(wǎng)絡(luò)模型及其動(dòng)態(tài)過程的算法。人工神經(jīng)元通常采用非線性的作用函數(shù),當(dāng)大量神經(jīng)元連接成一個(gè)網(wǎng)絡(luò)并動(dòng)態(tài)運(yùn)行時(shí),則構(gòu)成了一個(gè)非線性動(dòng)力學(xué)系統(tǒng)。人工神經(jīng)網(wǎng)絡(luò)具有自組織性、高維性、模糊性、分布性和冗余性等等特點(diǎn),較馮-諾依曼體系的計(jì)算機(jī)更適合模擬人類大腦的思維機(jī)理。但總的來說,由于人類對自身思維機(jī)理認(rèn)識的不足,所以對人工神經(jīng)元作了極度的簡化,這種模擬表現(xiàn)為極其膚淺和簡單。很多臉部識別系統(tǒng)都采用了多層感知機(jī)(MultiLayer Perceptor)作為人工神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu)。多層感知機(jī)由幾層全互連的非線性神經(jīng)組成。神經(jīng)元之間有權(quán)值連接,權(quán)值包含了訓(xùn)練模式空間的特征。訓(xùn)練過程就是調(diào)整權(quán)值的過程,最常用的算法就是BP法則。采用多層感知機(jī)進(jìn)行面部識別的目的就是建立一個(gè)關(guān)于臉部的緊湊表示,這相當(dāng)于面部特征的抽取。因?yàn)殡[層節(jié)點(diǎn)的數(shù)目L通常要遠(yuǎn)遠(yuǎn)小于輸入層和輸出層的節(jié)點(diǎn)數(shù)目,從而多層感知機(jī)將高維德輸入數(shù)據(jù)變換到一個(gè)低維子空間中,同時(shí)保留了原始數(shù)據(jù)中最重要的信息。如果隱層神經(jīng)元采用線性作用函數(shù),則多層感知機(jī)張成的降維子空間將與主元分析法張成的子空間一樣。主元分析法的方差是由大到小排列的,而多層感知機(jī)的方差是均勻分布到每個(gè)隱層神經(jīng)元上。多層感知機(jī)的輸入形式有很多種,最簡單的就是將整個(gè)人臉圖像作為輸入層,也可以對人臉圖像進(jìn)行采樣,然后用低分辨率圖像作為輸入層。還有的文獻(xiàn)采用了二進(jìn)制圖像的等密度區(qū)域或多個(gè)局部面部特征作為不同多層感知機(jī)的輸入層。直接使用BP神經(jīng)網(wǎng)絡(luò)進(jìn)行人臉識別的問題在于網(wǎng)絡(luò)過于龐大和復(fù)雜,例如對于一幅128128的人臉圖像,輸入層和輸出層的節(jié)點(diǎn)數(shù)目將達(dá)16438。顯然,訓(xùn)練這樣大的一個(gè)網(wǎng)絡(luò)將花費(fèi)很長時(shí)間,需要的存儲量也會很高。由此可以看出,人工神經(jīng)網(wǎng)絡(luò)有著與Eigenface方法非常相似的表達(dá)方法。一般來說,BP算法的收斂速度非常緩慢,學(xué)習(xí)過程可能需要對整個(gè)訓(xùn)練集進(jìn)行上千次反復(fù)迭代運(yùn)算,這是神經(jīng)網(wǎng)絡(luò)實(shí)際應(yīng)用的一個(gè)問題。此外,BP算法以誤差梯度下降的方式達(dá)到極小值,但在實(shí)際應(yīng)用中,容易陷入到局部極小中,無法得到全局最優(yōu)解,這也是有待解決的一個(gè)問題。1.3.6彈性匹配圖臉部識別方法在利用圖匹配進(jìn)行識別的方法中,一個(gè)目標(biāo)(如一個(gè)人臉圖像)可以采用一張圖(Graph)來表示。根據(jù)局部化空間頻率得到的一系列多分辨率秒數(shù)值可以用來表示圖中的節(jié)點(diǎn)數(shù)值。物體內(nèi)部的空間關(guān)系則可以用節(jié)點(diǎn)之間的幾何距離表示。Gabor變換是進(jìn)行時(shí)頻分析的有效工具,該函數(shù)在時(shí)間域和頻率域上都是局部化的,通常將Gabor特征用到針對臉部識別的彈性圖匹配中。Gabor特征在網(wǎng)格節(jié)點(diǎn)上提供了一個(gè)多尺度邊緣強(qiáng)度。一般來說,圖像中的關(guān)鍵部位會有較大的Gabor系數(shù)。同樣的,對于一個(gè)待識別的人臉圖像也可以定義一個(gè)網(wǎng)格G及網(wǎng)格上的特征矢量。在彈性圖匹配(Elastic Graph Matching)方法中,兩幅圖的距離是通過尋找G與M之間的最優(yōu)匹配來得到。在彈性圖匹配方法中,將人臉圖像庫中的圖像和待識別圖像都用特征矢量圖表示。通過對突遇圖之間的拓?fù)浣Y(jié)構(gòu)的匹配以及節(jié)點(diǎn)與節(jié)點(diǎn)之間的特征矢量值的比較,可以進(jìn)行人臉識別,這就將模板的圖像匹配轉(zhuǎn)化成了模板的圖匹配。在尋找最佳匹配方法時(shí),希望能夠同時(shí)維持特征數(shù)值接近和局部幾何關(guān)系。彈性圖匹配方法的最大優(yōu)點(diǎn)在于對光和表情變化的相對不敏感性。這主要?dú)w功于兩個(gè)原因:(1)用Gabor變換可提取圖像的局部多分辨率特征;(2)在計(jì)算距離或者能量函數(shù)時(shí),使用了變形匹配方法。彈性匹配圖方法的主要缺點(diǎn)在于計(jì)算量大。1.3.7隱馬爾可夫模型的識別方法隱馬爾可夫模型(Hidden Markov Model)一般應(yīng)用于非平穩(wěn)時(shí)間序列矢量的統(tǒng)計(jì)建模,在語音處理,特別是語音識別中得到廣泛的應(yīng)用。隱馬爾可夫模型為一個(gè)觀測序列提供了一個(gè)統(tǒng)計(jì)模型n引,該模型由兩個(gè)互相關(guān)聯(lián)的過程組成:(1)一個(gè)是底層不可觀測的馬爾可夫鏈,它由有限個(gè)狀態(tài)、一個(gè)概率轉(zhuǎn)移矩陣和一個(gè)初始狀態(tài)概率分布函數(shù)組成。(2)另外是一組聯(lián)系每一個(gè)狀態(tài)的概率密度函數(shù)。在使用隱馬爾可夫模型的面部識別方法中,首先將一個(gè)人臉圖像采集成一系列的條狀圖,將一幅二維圖像變成一個(gè)一維矢量序列,這個(gè)序列構(gòu)成了隱馬爾可夫模型的觀測矢量。由于人臉的特定構(gòu)造,在這種抽樣方式下,臉部特征帶的出現(xiàn)將服從于一定的順序,所以該模型可以用一個(gè)從左到右的隱馬爾可夫模型表示,其中狀態(tài)的轉(zhuǎn)移只能按照從左到右的方式進(jìn)行。接著是訓(xùn)練該隱馬爾夫模型,由以下幾個(gè)步驟組成:(1)建立一個(gè)隱馬爾可夫模型;(2)用訓(xùn)練數(shù)據(jù)迭代計(jì)算初始參數(shù)值;(3)用BaumWelch方法重新估計(jì)參數(shù)值。識別通過一個(gè)Viterbi識別器完成,用代表不同人的隱馬爾可夫模型與待識別圖像匹配,最高匹配者被選出來。1.3.8基于FISHER線性判別式的方法P.Belhumeur提出了一種基于Fisher線性判別式的人臉識別方法,與Eigenface方法相對應(yīng),Belhumeur稱其為Fisherface,這種方法對面部表情和光照方向不敏感。類似于Eigenface方法,F(xiàn)isherface方法也是采用線性投影技術(shù)將人臉圖像從高維圖像空間轉(zhuǎn)化到低維特征子空間。在這個(gè)低維子空間中,如果特征和投影方向選擇合適的話,人臉特征可以做到對光照方向和表情變化不敏感。與Eigenface方法不同的是,F(xiàn)isherface采用的投影方向幾乎與類內(nèi)散布方向垂直,而Eigenface方法采用的投影方向是使所有類散布最大化。Belhumeur認(rèn)為這種使所有類散布最大化的PCA方法會保留那些對分類不利的光照方向和表情信息。因此可認(rèn)為:對以均方誤差為準(zhǔn)則的臉部重建來說,PCA方法是一種最優(yōu)的方法:但從模式分類和辨識的觀點(diǎn)來看,PCA方法則不一定能夠取得最優(yōu)的結(jié)果。1.3.9基于小波包的識別方法基于小波包的面部識別方法首先對一幅人臉圖像進(jìn)行小波包分解。因?yàn)樾〔ò纸獾玫降牟煌l帶包含有不同的人臉信息,所以從每一個(gè)小波包中可以提取出不同的面部特征。對于小波包分解得到的離散逼近稀疏,Garcai進(jìn)一步將它分解成三個(gè)部分,分別是邊界區(qū)、上半部分和下半部分,然后就可以分別計(jì)算這三個(gè)區(qū)域的均值和方差,加上另外15個(gè)離散細(xì)節(jié)區(qū)域的方差,組成一個(gè)包含有21個(gè)分量的特征向量。小波包分解是一種多分辨率分析方法,能夠提供良好的面部紋理描述,所以有利于提取面部特征。1.4人臉識別的應(yīng)用任何一種技術(shù)的發(fā)展都是由于受到了實(shí)際應(yīng)用需要的激勵(lì),人臉識別技術(shù)也不例外,它最初就是公安部門要把它用于罪犯照片的存檔管理和刑偵破案。而現(xiàn)在逐步擴(kuò)大到社會生活的各個(gè)領(lǐng)域,例如在海關(guān)邊檢、物業(yè)管理、網(wǎng)絡(luò)安全、視頻會議、計(jì)算機(jī)訪問控制等方面都有著廣泛的應(yīng)用。我們從一下幾個(gè)方面具體介紹人臉識別技術(shù)的應(yīng)用:(1)在公安系統(tǒng)的罪犯識別方面,當(dāng)公安部門獲得案犯的照片后,可以利用人臉識別技術(shù),在存儲罪犯照片的數(shù)據(jù)庫里找出最相像的嫌疑犯。由于罪犯數(shù)據(jù)庫往往很大,如果這項(xiàng)搜索工作由人工完成,不僅效率低,而且容易出錯(cuò),因?yàn)槿嗽诳戳松习俜四槇D像后,記憶力會下降,而由計(jì)算機(jī)來完成則不會出現(xiàn)此問題;(2)身份證、駕駛證以及其他很多證件上都有照片,現(xiàn)在的證件驗(yàn)證一般都是由人進(jìn)行驗(yàn)證,如果利用人臉識別技術(shù),這項(xiàng)工作就可以交給機(jī)器完成,從而實(shí)現(xiàn)自動(dòng)化智能管理。當(dāng)前普遍使用的驗(yàn)證方法有符號或條形碼標(biāo)記,比如信用卡、自動(dòng)提款機(jī)等此類驗(yàn)證的安全性比較低。如果運(yùn)用人臉識別技術(shù),則安全性將大大改善;(3)可以進(jìn)行入口控制。入口控制的范圍很廣,它可以是樓宇、單位或私人住宅入口處的安全檢查,也可以是計(jì)算機(jī)系統(tǒng)或情報(bào)系統(tǒng)的入口控制。目前比較常用的手段是檢查證件。人員頻繁出入時(shí),保安人員再三檢查證件是比較麻煩的,而且安全系數(shù)也不高。在保密要求非常嚴(yán)格的部門除了證件,還可以加上另外一些生物識別手段,如指紋識別、手掌識別、語音識別等。人臉識別與之相比,具有直接、方便和界面友好的特點(diǎn)。當(dāng)前計(jì)算機(jī)系統(tǒng)的安全管理,通常使用字符和數(shù)字組成的密碼口令管理,此口令容易被遺忘或破解,如果使用人臉作為口令則既方便又安全;(4)在視頻監(jiān)控方面,目前,許多銀行、公司、公共場合等處都設(shè)有24小時(shí)的視頻監(jiān)控。另外偵察員在破案時(shí)也要用攝像機(jī)對人進(jìn)行跟蹤。在對圖像進(jìn)行分析時(shí),都要用到人臉的檢測,跟蹤和識別技術(shù)。對于以上提到的人臉識別技術(shù)的諸多應(yīng)用,我們可以把這些應(yīng)用分成兩類:一類是有限制條件照片的靜態(tài)匹配,譬如說護(hù)照、信用卡、駕駛證上的照片匹配。另一類是視頻圖像的實(shí)時(shí)匹配,如銀行、海關(guān)、公共場合的視頻監(jiān)控、公安系統(tǒng)中罪犯的跟蹤識別等。這些應(yīng)用在圖像的質(zhì)量、背景,還有是否存在定義好的匹配策略等等方面都存在著很大的不同。1.5人臉識別問題中的難點(diǎn)及發(fā)展方向1.5.1人臉識別問題中的難點(diǎn)人類具有很強(qiáng)的人臉識別能力,嬰兒可以很快學(xué)會辨認(rèn)其父母的臉。但對計(jì)算機(jī)來說,進(jìn)行人臉識別卻困難很多。這些困難一方面源于計(jì)算機(jī)本身學(xué)習(xí)能力的局限性,另一方面是源于人臉識別技術(shù)所具有的復(fù)雜性。人臉具有相對穩(wěn)定的特征和結(jié)構(gòu),這為人臉識別技術(shù)帶來了實(shí)現(xiàn)的可能。但人臉具體形態(tài)的多樣性和所處環(huán)境的復(fù)雜性又造成了識別的巨大困難。具體的說,它的困難表現(xiàn)在:(1)圖像獲取的不確定性目前對于人臉識別問題的研究大都基于已經(jīng)裁剪好的人臉區(qū)域圖像進(jìn)行的,在此基礎(chǔ)上再提出解決光照、姿態(tài)、遮擋等問題的識別算法。而就目前的研究現(xiàn)狀而言,光照、姿態(tài)、遮擋等干擾因素對檢測算法的影響要遠(yuǎn)大于對識別算法的影響。光照:光照的方向及強(qiáng)度變化會嚴(yán)重影響人臉圖像的灰度分布,因而影響大多數(shù)基于圖像灰度統(tǒng)計(jì)特性的識別方法的效果。即使是目前最好的人臉識別系統(tǒng)在室外光照條件下,其識別性能也會急劇下降。這就說明,復(fù)雜多變的光照問題仍是人臉識別中的難點(diǎn);姿態(tài):姿態(tài)的變化分為二維平面上的姿態(tài)變化和三維空間上的姿態(tài)變化。盡管采用3D人臉模型可以解決人臉識別問題中的姿態(tài)變化問題,但是由于3D人臉數(shù)據(jù)獲取有很多的局限性,所以當(dāng)前仍需依賴對姿態(tài)變化魯棒的 2D人臉識別算法。故如何提高2D人臉數(shù)據(jù)的識別算法對姿態(tài)的魯棒性是一項(xiàng)既有現(xiàn)實(shí)意義又有挑戰(zhàn)性的課題;表情:人臉識別相對于其他物體識別問題的一個(gè)困難就是人臉的非剛體性,主要體現(xiàn)為人臉豐富的表情變化,遮擋。對于人臉識別而言,造成遮擋的原因多種多樣,有可能的原因包括:外界景物的遮擋、眼鏡帽子等飾物的遮擋、人臉圖像部分缺失等。這些因素所導(dǎo)致的直接結(jié)果就是人臉區(qū)域部分的數(shù)據(jù)不完整,進(jìn)而影響后續(xù)處理的效果,甚至直接導(dǎo)致處于人臉識別系統(tǒng)第一階段的人臉檢測失效。(2)計(jì)算的復(fù)雜性很多經(jīng)典的識別問題譬如文字識別只需要處理相對較少的類,而且每個(gè)類有大量的訓(xùn)練樣本,但在人臉識別問題中,通常需處理相當(dāng)多的類,并且每個(gè)類存在很少的訓(xùn)練樣本,識別算法必須在很少的樣本中提取特征,通過訓(xùn)練進(jìn)行人臉圖像的匹配。盡管目前出現(xiàn)的一些商用的人臉識別系統(tǒng)在理想情況下已經(jīng)能夠可以接受的識別性能,但是整個(gè)人臉識別技術(shù)還遠(yuǎn)未成熟,還有大量的實(shí)際問題需要得到解決。(3)識別算法的普適性問題目前人臉識別中最成功的算法當(dāng)屬基于統(tǒng)計(jì)學(xué)習(xí)理論的算法。這類算法往往要求訓(xùn)練集合中的樣本能夠覆蓋所有情形下的人臉樣本,以便從中學(xué)習(xí)相關(guān)知識或規(guī)則,但這在實(shí)際中是無法滿足的,因?yàn)槟軌颢@得的訓(xùn)練樣本往往是有限的,因而便造成目前的識別算法普適性較差,即在由訓(xùn)練集中樣本擴(kuò)展到非訓(xùn)練集中樣本時(shí),識別性能會明顯下降。(4)人臉識別系統(tǒng)的長期適應(yīng)問題帶來這一問題的主要原因是隨著年齡的變化人臉會發(fā)生較大的變化,特別是對于青少年,年齡對容貌的影響更大。另外,不同年齡段樣本的收集也比較困難,因?yàn)檫@需要很長的時(shí)間跨度,目前所收集到的有年齡變化的人臉庫最長也只有1年左右的時(shí)間跨度,這給相關(guān)算法的研究帶來了一定困難。因此如何解決年齡變化對識別算法的影響并提出具有中長期適應(yīng)性的人臉識別算法是人臉識別系統(tǒng)必須解決的問題。除此之外,人臉識別還有低質(zhì)量照片問題,大規(guī)模人臉識別問題,海量數(shù)據(jù)的學(xué)習(xí)問題等等。1.5.2人臉識別的發(fā)展方向由于人臉識別領(lǐng)域仍存在上述很多問題未徹底解決,因此未來人臉識別必然圍繞著現(xiàn)有難點(diǎn)的解決而繼續(xù)發(fā)展。簡單概括一下,其發(fā)展方向大體包括:(1)準(zhǔn)確魯棒的人臉檢測與定位算法,保證后續(xù)識別算法具有穩(wěn)定可靠的樣本輸入;(2)高精度特殊圖像傳感器或快速三維掃描設(shè)備的研制,保證輸入原始人臉數(shù)據(jù)的質(zhì)量,克服圖像質(zhì)量低,光照和姿態(tài)等影響;(3)大規(guī)模全面公共人臉數(shù)據(jù)庫的建立,涵蓋所有人臉識別中所要面對的樣本,為全球研究者建立一個(gè)統(tǒng)一的研究和測試平臺;(4)多生物特征的融合,采用特征融合技術(shù),與目前其它生物特征識別技術(shù)進(jìn)行融合,克服遮擋、化妝和活體檢測等難點(diǎn);(5)普適特征提取技術(shù)和普適分類器的提出,解決現(xiàn)有算法無法同時(shí)解決普適性差,泛化能力低和中長期適應(yīng)性差等問題;(6)其它解決方案,包括大規(guī)模計(jì)算機(jī)的發(fā)展,數(shù)據(jù)庫管理及檢索技術(shù)的發(fā)展,適合生物特征存儲的數(shù)據(jù)結(jié)構(gòu)的發(fā)展等。第二章人臉圖像預(yù)處理2.1引言 圖像的預(yù)處理是模式識別過程的一個(gè)重要步驟。輸入圖像從實(shí)物轉(zhuǎn)換成數(shù)字圖像時(shí),由于設(shè)備條件的差異,往往存在噪聲、對比度太低等缺陷。另外,人臉在整幅圖像中的位置和大小又會因?yàn)榫嚯x遠(yuǎn)近、焦距大小等問題變得不確定。為了確保較高的識別率,我們必須在提取人臉特征之前對圖像作一定的預(yù)處理工作。 本節(jié)的預(yù)處理工作是在原始ORL人臉庫上進(jìn)行的。主要的預(yù)處理工作包括:圖像的幾何歸一化,圖像的灰度歸一化,直方圖均衡化幾個(gè)部分。2.2人臉圖像庫簡介建立一個(gè)包含人臉圖像的數(shù)據(jù)庫是做任何人臉識別系統(tǒng)的開發(fā)的前提。人臉數(shù)據(jù)庫的設(shè)計(jì)對系統(tǒng)的識別率有至關(guān)重要的影響,數(shù)據(jù)庫中不同光照、姿態(tài)和表情的變化甚至背景變化都會影響識別的結(jié)果,所以需要針對人臉識別問題建立適應(yīng)不同需要的人臉數(shù)據(jù)庫。下面介紹一些常用的標(biāo)準(zhǔn)數(shù)據(jù)庫。 目前使用最廣泛的人臉庫是英國ORL人臉數(shù)據(jù)庫。ORL人臉數(shù)據(jù)庫包含了英國劍橋大學(xué)從1992到1994年間在實(shí)驗(yàn)室采集到的人臉圖像數(shù)據(jù),由40人、每人10幅、共400幅圖像組成。每幅圖像的分辨率為92*112,灰度級為256。其中,35人為男性,5人為女性。這些圖像是在不同時(shí)間、不同光照、面部表情和面部遮掩物變化的情況下獲得的,如笑或不笑、眼睛或睜或閉、戴或不戴眼鏡;人臉姿態(tài)也有相當(dāng)程度的變化,深度旋轉(zhuǎn)和平面旋轉(zhuǎn)可達(dá)200,人臉的尺度也有多達(dá)10%的變化。 FERET人臉庫是目前最大的人臉數(shù)據(jù)庫,由美國國防部發(fā)起建立,其初衷是想開發(fā)一個(gè)自動(dòng)人臉識別系統(tǒng),以應(yīng)用于各種安全檢測目的。其最新的人臉庫包括14051幅灰度圖像,其中每人8張圖像,兩張正臉,3張從右到
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 現(xiàn)代漢語個(gè)人成長規(guī)劃試題及答案
- WPS表格計(jì)算功能解析試題及答案
- 2025年計(jì)算機(jī)一級試題及答案的復(fù)習(xí)攻略
- 想象與現(xiàn)實(shí)的文學(xué)界限試題及答案
- 圖片合成創(chuàng)意試題及答案
- 2025年計(jì)算機(jī)一級Photoshop案例教學(xué)試題及答案
- 普通邏輯考試難點(diǎn)分析與解答試題及答案
- 2025年工業(yè)互聯(lián)網(wǎng)平臺漏洞掃描技術(shù)發(fā)展趨勢預(yù)測報(bào)告
- 理解Photoshop顏色模式試題及答案
- 計(jì)算機(jī)一級WPS技能測試指南試題及答案
- 費(fèi)用組成-特殊施工增加費(fèi)課件講解
- 2024年湖南省長沙市雅禮實(shí)驗(yàn)中學(xué)中考二??荚囉⒄Z試題
- 2023年八年級歷史下冊競賽試卷
- 國民經(jīng)濟(jì)行業(yè)分類代碼表
- 小學(xué)六年級下冊數(shù)學(xué)期末考試卷完整版
- 人工智能設(shè)計(jì)倫理智慧樹知到期末考試答案章節(jié)答案2024年浙江大學(xué)
- MOOC 網(wǎng)絡(luò)技術(shù)與應(yīng)用-南京郵電大學(xué) 中國大學(xué)慕課答案
- 交付管理體系
- 國際市場開拓策略研究
- 小兒支氣管肺炎護(hù)理查房
- 新人教版數(shù)學(xué)五年級下冊全冊課本練習(xí)題精編可編輯可打印
評論
0/150
提交評論