人臉識(shí)別技術(shù)的主要研究方法_第1頁(yè)
人臉識(shí)別技術(shù)的主要研究方法_第2頁(yè)
人臉識(shí)別技術(shù)的主要研究方法_第3頁(yè)
人臉識(shí)別技術(shù)的主要研究方法_第4頁(yè)
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、1、緒論人臉識(shí)別是通過(guò)分析臉部器官的唯一形狀和位置來(lái)進(jìn)行身份鑒別。 人臉識(shí)別是一種重要的生物特 征識(shí)別技術(shù),應(yīng)用非常廣泛。與其它身份識(shí)別方法相比,人臉識(shí)別具有直接、友好和方便等特點(diǎn),因 而,人臉識(shí)別問(wèn)題的研究不僅有重要的應(yīng)用價(jià)值,而且在模式識(shí)別中具有重要的理論意義,目前人臉 識(shí)別已成為當(dāng)前模式識(shí)別和人工智能領(lǐng)域的研究熱點(diǎn)。本章將簡(jiǎn)單介紹幾種人臉識(shí)別技術(shù)的研究方 法。關(guān)鍵詞:人臉識(shí)別2、人臉識(shí)別技術(shù)的主要研究方法目前在國(guó)內(nèi)和國(guó)外研究人臉識(shí)別的方法有很多,常用的方法有:基于幾何特征的人臉識(shí)別方法、 基于代數(shù)特征的人臉識(shí)別方法、 基于連接機(jī)制的人臉識(shí)別方法以及基于三維數(shù)據(jù)的人臉識(shí)別方法。 人 臉識(shí)別

2、流程圖如圖 21 所示: 圖 21 人臉識(shí)別流程圖3、基于幾何特征的人臉識(shí)別方法基于特征的方法是一種自下而上的人臉檢測(cè)方法, 由于人眼可以將人臉在不此研究人員認(rèn)為有一 個(gè)潛在的假設(shè):人臉或人臉的部件可能具有在各種條件下都不會(huì)改變的特征或?qū)傩裕缧螤?、膚色、 紋理、邊緣信息等。 基于特征的方法的目標(biāo)就是尋找上述這些不變特征, 并利用這些特征來(lái)定位入臉。 這類方法在特定的環(huán)境下非常有效且檢測(cè)速度較高,對(duì)人臉姿態(tài)、表情、旋轉(zhuǎn)都不敏感。但是由于人 臉部件的提取通常都借助于邊緣算子,因此,這類方法對(duì)圖像質(zhì)量要求較高,對(duì)光照和背景等有較高 的要求,因?yàn)楣庹铡⒃胍?、陰影都極有可能破壞人臉部件的邊緣,從而影響

3、算法的有效性。模板匹配算法首先需要人 TN作標(biāo)準(zhǔn)模板(固定模板)或?qū)⒛0逑刃袇?shù)化(可變模板),然后在檢 測(cè)人臉時(shí),計(jì)算輸入圖像與模板之間的相關(guān)值,這個(gè)相關(guān)值通常都是獨(dú)立計(jì)算臉部輪廓、眼睛、鼻子 和嘴各自的匹配程度后得出的綜合描述, 最后再根據(jù)相關(guān)值和預(yù)先設(shè)定的閾值來(lái)確定圖像中是否存在 人臉。 基于可變模板的人臉檢測(cè)算法比固定模板算法檢測(cè)效果要好很多,但是它仍不能有效地處理人臉尺度、姿態(tài)和形狀等方面的變化?;谕庥^形狀的方法并不對(duì)輸入圖像進(jìn)行復(fù)雜的預(yù)處理, 也不需要人工的對(duì)人臉特征進(jìn)行分析或 是抽取模板,而是通過(guò)使用特定的方法(如主成分分析方法(PCA)、支持向量機(jī)(SVM)、神經(jīng)網(wǎng)絡(luò)方法(A

4、NN)等)對(duì)大量的人臉和非人臉樣本組成的訓(xùn)練集(一般為了保證訓(xùn)練得到的檢測(cè)器精度,非人臉樣本集的容量要為人臉樣本集的兩倍以上)進(jìn)行學(xué)習(xí), 再將學(xué)習(xí)而成的模板或者說(shuō)分類器用于人臉檢測(cè)。因此, 這也是 j 種自下而上的方法。 這種方法的優(yōu)點(diǎn)是利用強(qiáng)大的機(jī)器學(xué)習(xí)算法快速穩(wěn)定地實(shí)現(xiàn)了很 好的檢測(cè)結(jié)果,并且該方法在復(fù)雜背景下,多姿態(tài)的人臉圖像中也能得到有效的檢測(cè)結(jié)果。但是這種 方法通常需要遍歷整個(gè)圖片才能得到檢測(cè)結(jié)果, 并且在訓(xùn)練過(guò)程中需要大量的人臉與非人臉樣本, 以 及較長(zhǎng)的訓(xùn)練時(shí)間。近幾年來(lái),針對(duì)該方法的人臉檢測(cè)研究相對(duì)比較活躍。4、基于代數(shù)特征的人臉識(shí)別方法在基于代數(shù)特征的人臉識(shí)別中, 每一幅人臉

5、圖像被看成是以像素點(diǎn)灰度為元素的矩陣,用反映某些性質(zhì)的數(shù)據(jù)特征來(lái)表示人臉的特征。設(shè)人臉圖像),(y x I 為二維N MX灰度圖像,同樣可以看成是N M n X =維列向量,可視為 N MX維空間中的一個(gè)點(diǎn)。但這樣的一個(gè)空間中,并不是 空間中的每一部分都包含有價(jià)值的信息,故一般情況下,需要通過(guò)某種變換,將如此巨大的空間中的 這些點(diǎn)映射到一個(gè)維數(shù)較低的空間中去。然后利用對(duì)圖像投影間的某種度量來(lái)確定圖像間的相似度, 最常見(jiàn)的就是各種距離度量。在基于代數(shù)特征的人臉識(shí)別方法中,主成分分析法(PCA和Fisher線性判別分析(LDA是研究最多的方法。本章簡(jiǎn)要介紹介紹了PCA完整的 PCA(Princip

6、alComponentAnalysis) 人臉識(shí)別的應(yīng)用包括四個(gè)步驟:人臉圖像預(yù)處理;讀 入人臉庫(kù),訓(xùn)練形成特征子空間;把訓(xùn)練圖像和測(cè)試圖像投影的上一步驟中得到的子空間上;選擇一 定的距離函數(shù)進(jìn)行識(shí)別。詳細(xì)描述如下:讀入人臉庫(kù)一歸一化人臉庫(kù)后,將庫(kù)中的每個(gè)人選擇一定數(shù)量的圖像構(gòu)成訓(xùn)練集,設(shè)歸一化后的圖像是nXn,按列相連就構(gòu)成 n2維矢量,可視為n2維空間中的一個(gè)點(diǎn),可以通過(guò)K-L變換用一個(gè)低維子空間描述這個(gè)圖像。計(jì)算 KL 變換的生成矩陣訓(xùn)練樣本集的總體散布矩陣為產(chǎn)生矩陣,即或者寫成 :式中xi為第i個(gè)訓(xùn)練樣本的圖像向量,|1為訓(xùn)練樣本的均值向量,M為訓(xùn)練樣本的總數(shù)。為了求 n2Xn2維矩陣

7、刀的特征值和正交歸一化的特征向量,要直接計(jì)算的話,計(jì)算量太大,由此引入奇異值 分解定理來(lái)解決維數(shù)過(guò)高的問(wèn)題。利用奇異值分解(AVD)定理計(jì)算圖像的特征值和特征向量設(shè)A是一個(gè)秩為r的行nXr維矩陣,則存在兩個(gè)正交矩陣和對(duì)角陣:其中凡則這兩個(gè)正交矩陣和對(duì)角矩陣滿足下式:的非特征值把訓(xùn)練圖像和測(cè)試圖像投影到特征空間每一副人臉圖像向特征臉子空間投影,得到一組坐標(biāo)系數(shù), 就對(duì)應(yīng)于子空間中的一個(gè)點(diǎn)。同樣,子空間中的任一點(diǎn)也對(duì)應(yīng)于副圖像。這組系數(shù)便可作為人臉識(shí) 別的依據(jù), 也就是這張人臉圖像的特征臉特征。 也就是說(shuō)任何一幅人臉圖像都可以表示為這組特征臉 的線性組合,各個(gè)加權(quán)系數(shù)就是 KL 變換的展開(kāi)系數(shù),可

8、以作為圖像的識(shí)別特征,表明了該圖像在 子空間的位置,也就是向量 可用于人臉檢測(cè),如果它大于某個(gè)閾值,可以認(rèn)為 f 是人臉圖像,否則就認(rèn)為不是。這樣原來(lái)的人臉 圖象識(shí)別問(wèn)題就轉(zhuǎn)化為依據(jù)子空間的訓(xùn)練樣本點(diǎn)進(jìn)行分類的問(wèn)題。5、基于連接機(jī)制的人臉識(shí)別方法基于連接機(jī)制的識(shí)別方法的代表性有神經(jīng)網(wǎng)絡(luò)和彈性匹配法。神經(jīng)網(wǎng)絡(luò) (ANN) 在人工智能領(lǐng)域近年來(lái)是一個(gè)研究熱門,基于神經(jīng)網(wǎng)絡(luò)技術(shù)來(lái)進(jìn)行人臉特征提取 和特征識(shí)別是一個(gè)積極的研究方向。 神經(jīng)網(wǎng)絡(luò)通過(guò)大量簡(jiǎn)單神經(jīng)元互聯(lián)來(lái)構(gòu)成復(fù)雜系統(tǒng),在人臉識(shí)別中取得了較好的效果,特別是正面人臉圖像。常用的神經(jīng)網(wǎng)絡(luò)有:BP 網(wǎng)絡(luò)、卷積網(wǎng)絡(luò)、徑向基函數(shù)網(wǎng)絡(luò)、自組織網(wǎng)絡(luò)以及模糊神

9、經(jīng)網(wǎng)絡(luò)等n_。BP網(wǎng)絡(luò)的運(yùn)算量較小耗時(shí)也短,它的自適應(yīng)功能使系統(tǒng)的魯棒性增強(qiáng)。神經(jīng)網(wǎng)絡(luò)用于人臉識(shí)別,相比較其他方法,其可以獲得識(shí)別規(guī)則的隱性表達(dá),缺點(diǎn)是 訓(xùn)練時(shí)間長(zhǎng)、運(yùn)算量大、收斂速度慢且容易陷入局部極小點(diǎn)等。Gutta等人結(jié)合RBF與樹(shù)型分類器的混合分類器模型來(lái)進(jìn)行人臉識(shí)別乜螂1。 Lin 等人采用虛擬樣本進(jìn)行強(qiáng)化和反強(qiáng)化學(xué)習(xí),采用模塊化的網(wǎng)絡(luò)結(jié)構(gòu)網(wǎng)絡(luò)的學(xué)習(xí)加快,實(shí)現(xiàn)了基于概率決策的神經(jīng)網(wǎng)絡(luò)方法獲得了較理想結(jié)果,。此種方法能較好的應(yīng)用于人臉檢測(cè)和識(shí)別的各步驟中。 彈性匹配法采用屬性拓?fù)鋱D代表人臉, 拓?fù)鋱D的每個(gè)頂點(diǎn) 包含一個(gè)特征向量, 以此來(lái)記錄人臉在該頂點(diǎn)位置周圍的特征信息弓I。拓?fù)鋱D的頂

10、點(diǎn)是采用小波變換特征,對(duì)光線、角度和尺寸都具有一定的適應(yīng)性,且能適應(yīng)表情和視角的變化,其在理論上改進(jìn)了 特征臉?biāo)惴ǖ囊恍┤秉c(diǎn)。6、基于三維數(shù)據(jù)的人臉識(shí)別方法一個(gè)完整的人臉識(shí)別系統(tǒng)包括人臉面部數(shù)據(jù)的獲取、 數(shù)據(jù)分析處理和最終結(jié)果輸出三個(gè)部分。 圖 2-1 顯示了三維人臉識(shí)別的基本步驟: 1 、通過(guò)三維數(shù)據(jù)采集設(shè)備獲得人臉面部的三維形狀信息; 2 、 對(duì)獲取的三維數(shù)據(jù)進(jìn)行平滑去噪和提取面部區(qū)域等預(yù)處理; 3 、從三維數(shù)據(jù)中提取人臉面部特征,通 過(guò)與人臉庫(kù)中的數(shù)據(jù)進(jìn)行比對(duì); 4 、用分類器做分類判別,輸出最后決策結(jié)果?;谌S數(shù)據(jù)的方法的代表性是基于模型合成的方法和基于曲率的方法。 基于模型合成的方

11、法,它的基本思想為:輸入人臉圖像的二維的,用某種技術(shù)恢復(fù)(或部分恢復(fù) )人臉的三維信息,再重新合成指定條件下的人臉圖像。典型代表是3D 可變形模型和基于形狀恢復(fù)的3D增強(qiáng)人臉識(shí)別算法。3D可變形模型首先通過(guò) 200個(gè)高精度的3D人臉模型構(gòu)建一個(gè)可變形的 3D人 臉模型,用這個(gè)模型來(lái)對(duì)給定的人臉圖像擬合,獲得一組特定的參數(shù),再合成任何姿態(tài)和光照的人臉 圖像n卜捌?;谛螤罨謴?fù)的3D增強(qiáng)人臉識(shí)別算法是利用通用的 3D人臉模型合成新的人臉圖像, 合 成過(guò)程改變了一定的姿態(tài)與光源情況。3D 人臉識(shí)別問(wèn)題的是人臉曲面的曲率是最基本的表達(dá)曲面信息的局部特征,因而最早用來(lái)處理 曲率。 Lee 禾 lJ 用平

12、均曲率和高斯曲率值,將人臉深度圖中凸的區(qū)域分割出來(lái)。7、本章小結(jié)上面研究的各種識(shí)別方法都獲得了一定的成功,但各有優(yōu)缺點(diǎn):(1) 基于幾何特征的識(shí)別方法很簡(jiǎn)單,但目前還沒(méi)有形成特征提取的統(tǒng)一標(biāo)準(zhǔn),較難從圖像中抽 取穩(wěn)定的特征,尤其是特征受到遮擋或有較大表情變化時(shí),其對(duì)姿態(tài)變化的魯棒性也較差。(2) 基于代數(shù)特征的識(shí)別方法通過(guò)各種變換方法來(lái)提取主分量,代數(shù)特征向量是具有一定穩(wěn)定性 的,基于該方法的識(shí)別系統(tǒng)對(duì)不同的角度和表情都有一定的魯棒性。(3) 基于連接機(jī)制的識(shí)別方法其優(yōu)點(diǎn)是保存了圖像中的材質(zhì)信息,且特征提取不復(fù)雜。但受到原 始圖像數(shù)據(jù)量龐大的影響,識(shí)別時(shí)間長(zhǎng),特別是當(dāng)樣本數(shù)量大大增加時(shí),會(huì)嚴(yán)重影響其性能。(4) 基于三維數(shù)據(jù)的人臉識(shí)別方法使用三維數(shù)據(jù),是人臉識(shí)別的新思路,目前提取但信息還有一 定困難,且需要很大數(shù)據(jù)存儲(chǔ)和計(jì)算量。本章介紹了目前常用的一些人臉檢測(cè)與識(shí)別方法, 從識(shí)別率來(lái)看各種方法在指定數(shù)據(jù)庫(kù)上的

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論