版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
3d自動(dòng)人臉識(shí)別基本原理人臉識(shí)別經(jīng)過近40年的發(fā)展,取得了很大的發(fā)展,涌現(xiàn)出了大量的識(shí)別算法。這些算法的涉及面非常廣泛,包括模式識(shí)別、圖像處理、計(jì)算機(jī)視覺、人工智能、統(tǒng)計(jì)學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)、小波分析、子空間理論和流形學(xué)習(xí)等眾多學(xué)科。所以很難用一個(gè)統(tǒng)一的標(biāo)準(zhǔn)對(duì)這些算法進(jìn)行分類。根據(jù)輸入數(shù)據(jù)形式的不同可分為基于靜態(tài)圖像的人臉識(shí)別和基于視頻圖像的人臉識(shí)別。因?yàn)榛陟o態(tài)圖像的人臉識(shí)別算法同樣適用于基于視頻圖像的人臉識(shí)別,所以只有那些使用了時(shí)間信息的識(shí)別算法才屬于基于視頻圖像的人臉識(shí)別算法。接下來分別介紹兩類人臉識(shí)別算法中的一些重要的算法。特征臉特征臉方法利用主分量分析進(jìn)行降維和提取特征。主分量分析是一種應(yīng)用十分廣泛的數(shù)據(jù)降維技術(shù),該方法選擇與原數(shù)據(jù)協(xié)方差矩陣前幾個(gè)最大特征值對(duì)應(yīng)的特征向量構(gòu)成一組基,以達(dá)到最佳表征原數(shù)據(jù)的目的。因?yàn)橛芍鞣至糠治鎏崛〉奶卣飨蛄糠祷爻蓤D像時(shí),看上去仍像人臉,所以這些特征向量被稱為“特征臉”。在人臉識(shí)別中,由一組特征臉基圖象張成一個(gè)特征臉子空間,任何一幅人臉圖象(減去平均人臉后)都可投影到該子空間,得到一個(gè)權(quán)值向量。計(jì)算此向量和訓(xùn)練集中每個(gè)人的權(quán)值向量之間的歐式距離,取最小距離所對(duì)應(yīng)的人臉圖像的身份作為測(cè)試人臉圖像的身份。下圖給出了主分量分析的應(yīng)用例子。圖中最左邊的為平均臉,其他地為對(duì)應(yīng)7個(gè)最大特征值的特征向量。主分量分析是一種無(wú)監(jiān)督學(xué)習(xí)方法,主分量是指向數(shù)據(jù)能量分布最大的軸線方向,因此可以從最小均方誤差意義下對(duì)數(shù)據(jù)進(jìn)行最優(yōu)的表達(dá)。但是就分類任務(wù)而言,由主分量分析得到的特征卻不能保證可以將各個(gè)類別最好地區(qū)分開來。線性鑒別分析是一種著名的模式識(shí)別方法,通過將樣本線性變換到一個(gè)新的空間,使樣本的類內(nèi)散布程度達(dá)到最小,同時(shí)類間散布程度達(dá)到最大,即著名的Fisher準(zhǔn)則。標(biāo)準(zhǔn)特征臉同一個(gè)人不同圖像之間的的特征臉不同人的圖像之間的特征臉彈性圖匹配Lades等人針對(duì)畸變不變性的物體識(shí)別問題提出了一種基于動(dòng)態(tài)連接結(jié)構(gòu)的彈性圖匹配方法,并將其應(yīng)用于人臉識(shí)別。所有人臉圖像都有相似的拓?fù)浣Y(jié)構(gòu)。人臉都可表示成圖,圖中的節(jié)點(diǎn)是一些基準(zhǔn)點(diǎn)(如眼睛,鼻尖等),圖中的邊是這些基準(zhǔn)點(diǎn)之間的連線。每個(gè)節(jié)點(diǎn)包含40個(gè)Gabor小波(一種數(shù)字信號(hào)變換方法)系數(shù),包括相位和幅度,這些系數(shù)合起來稱為一個(gè)Jet,這些小波系數(shù)是原始圖像和一組具有5個(gè)頻率、8個(gè)方向的Gabor小波卷積(一種數(shù)字信號(hào)處理算子)得到的。這樣每幅圖就像被貼了標(biāo)簽一樣,其中的點(diǎn)被Jets標(biāo)定,邊被點(diǎn)之間的距離標(biāo)定。所以一張人臉的幾何形狀就被編碼為圖中的邊,而灰度值的分布被編碼為圖中的節(jié)點(diǎn)。如下圖所示:彈性圖匹配方法中人臉的彈性束圖表示為了識(shí)別一張新的人臉,需要從該人臉中找到基準(zhǔn)點(diǎn),提取出一個(gè)人臉圖,這可用彈性圖匹配得到。彈性圖匹配的目的是在新的人臉中找到基準(zhǔn)點(diǎn),并且提取出一幅圖,這幅圖和現(xiàn)有的人臉束圖之間的相似度最大。經(jīng)過彈性圖匹配后,新的人臉的圖就被提取出來了,此圖就表征了新的人臉,用它作為特征進(jìn)行識(shí)別。進(jìn)行識(shí)別時(shí),計(jì)算測(cè)試人臉和現(xiàn)有人臉束圖中的所有人臉之間的相似度,相似度最大的人臉的身份即為測(cè)試人臉的身份。由于該方法利用Gabor小波變換來描述面部特征點(diǎn)的局部信息,因此受光照影響較小。此外,在彈性匹配的過程中,網(wǎng)格的形狀隨著特征點(diǎn)的搜索而不斷變化,因此對(duì)姿態(tài)的變化也具有一定的自適應(yīng)性。該方法的主要缺點(diǎn)是搜索過程中代價(jià)函數(shù)優(yōu)化的計(jì)算量巨大,因而造成識(shí)別速度較慢,導(dǎo)致該方法的實(shí)用性不強(qiáng)。3D形態(tài)模型人臉本質(zhì)上是3D空間中的一個(gè)表面,所以原則上用3D模型能更好地表征人臉,特別是處理人臉的各種變化,如姿勢(shì)、光照等。Blanz等人提出了一種基于3D形態(tài)模型的方法,該方法將形狀和紋理用模型參數(shù)編碼,同時(shí)提出了一個(gè)能從單張人臉圖像還原模型參數(shù)的算法。形狀和紋理參數(shù)可用來進(jìn)行人臉的識(shí)別。為了處理由于這些參數(shù)導(dǎo)致的圖像之間差異的極端情形,通常是預(yù)先產(chǎn)生一個(gè)通用的模型。而進(jìn)行圖像分析時(shí),給定一張新的圖像,一般的做法是用通用模型去擬合新的圖像,從而根據(jù)模型來參數(shù)化新的圖像。基于視頻圖像的識(shí)別算法一個(gè)典型的基于視頻圖像的人臉識(shí)別系統(tǒng)一般都是自動(dòng)檢測(cè)人臉區(qū)域,從視頻中提取特征,最后如果人臉存在則識(shí)別出人臉的身份。在視頻監(jiān)控、信息安全和出入控制等應(yīng)用中,基于視頻的人臉識(shí)別是一個(gè)非常重要的問題,也是目前人臉識(shí)別的一個(gè)熱點(diǎn)和難點(diǎn)?;谝曨l比基于靜態(tài)圖像更具優(yōu)越性,因?yàn)锽ruce等人和Knight等人已證明,當(dāng)人臉被求反或倒轉(zhuǎn)時(shí),運(yùn)動(dòng)信息有助于(熟悉的)人臉的識(shí)別。雖然視頻人臉識(shí)別是基于靜態(tài)圖像的人臉識(shí)別的直接擴(kuò)展,但一般認(rèn)為視頻人臉識(shí)別算法需要同時(shí)用到空間和時(shí)間信息,這類方法直到近幾年才開始受到重視并需要進(jìn)一步的研究和發(fā)展。目前視頻人臉識(shí)別還有很多困難和挑戰(zhàn),具體來說有以下幾種:視頻圖像質(zhì)量比較差:視頻圖像一般是在戶外(或室內(nèi),但是采集條件比較差)獲取的,通常沒有用戶的配合,所以視頻人臉圖像經(jīng)常會(huì)有很大的光照和姿態(tài)變化。另外還可能會(huì)有遮擋和偽裝。人臉圖像比較?。和瑯?,由于采集條件比較差,視頻人臉圖像一般會(huì)比基于靜態(tài)圖像的人臉識(shí)別系統(tǒng)的預(yù)設(shè)尺寸小。小尺寸的圖像不但會(huì)影響識(shí)別算法的性能,而且還會(huì)影響人臉檢測(cè),分割和關(guān)鍵點(diǎn)定位的精度,這必然會(huì)導(dǎo)致整個(gè)人臉識(shí)別系統(tǒng)性能的下降。視頻人臉識(shí)別起源于基于靜態(tài)圖像的人臉識(shí)別,即識(shí)別系統(tǒng)自動(dòng)的檢測(cè)和分割出人臉,然后用基于靜態(tài)圖像的識(shí)別方法進(jìn)行識(shí)別。對(duì)這類方法的一個(gè)提高是加入了人臉跟蹤。在這類系統(tǒng)中,通過利用姿態(tài)和從視頻中估計(jì)到的深度信息合成一個(gè)虛擬的正面人臉。這個(gè)階段的另外一個(gè)能提高識(shí)別率的方法是利用視頻中充裕的幀圖像,基于每幀圖像的識(shí)別結(jié)果,使用”投票”機(jī)制。投票方法可以是確定的,但是概率投票方法一般來說更好。投票機(jī)制的一個(gè)缺點(diǎn)是計(jì)算結(jié)果的代價(jià)比較昂貴。視頻人臉識(shí)別的第二個(gè)發(fā)展階段是利用多模態(tài)信息。因?yàn)槿祟愐话銜?huì)利用多種信息識(shí)別人的身份,所以一個(gè)多模態(tài)系統(tǒng)將比只利用人臉的識(shí)別系統(tǒng)性能更好。更重要的是利用多模態(tài)信息提供了一種方法,它能全面解決那些只靠人臉無(wú)法識(shí)別的任務(wù)。例如,在一個(gè)完全沒有配合的環(huán)境(比如搶劫),歹徒的臉一般是蒙著的,這時(shí)唯一能進(jìn)行無(wú)人臉識(shí)別的方法就是分析歹徒軀體的運(yùn)動(dòng)特性。除了指紋,人臉和聲音是最常用于身份識(shí)別的信息。它們已經(jīng)被用于很多多模態(tài)身份識(shí)別系統(tǒng)。1997年以來,每?jī)赡?,就?huì)召開一個(gè)專門關(guān)于基于視頻和語(yǔ)音身份識(shí)別的國(guó)際會(huì)議。最近幾年,視頻人臉識(shí)別進(jìn)入第三個(gè)發(fā)展階段,這個(gè)階段方法的特點(diǎn)是同時(shí)采用空間信息(在每幀中)和時(shí)間信息(比如人臉特征的運(yùn)動(dòng)軌跡)。區(qū)別于概率投票方法的一個(gè)很大的不同之處在于,此類方法是在時(shí)間和空間的聯(lián)合空間中描述人臉和識(shí)別人臉的。視頻圖像的一個(gè)非常重要的特性是它的時(shí)間連續(xù)性,以及由此產(chǎn)生的人臉信息的不確定性。在人臉跟蹤和識(shí)別中利用時(shí)間信息是視頻人臉識(shí)別算法和基于靜態(tài)圖像的人臉識(shí)別算法的最大區(qū)別。目前這類算法大致可分為兩類:1、跟蹤-然后-識(shí)別,這類方法首先檢測(cè)出人臉,然后跟蹤人臉特征隨
溫馨提示
- 1. 本站所有資源如無(wú)特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 水電工程安全協(xié)議樣本
- 長(zhǎng)期汽車銷售購(gòu)銷合同
- 建設(shè)銀行個(gè)人貸款合同
- 墻體涂料工程分包合同
- 新版購(gòu)銷合同的條款列舉
- 茶葉物聯(lián)網(wǎng)應(yīng)用合同
- 廢料買賣合同協(xié)議
- 臨時(shí)兼職合同書
- 債權(quán)債務(wù)轉(zhuǎn)讓協(xié)議法律分析
- 程序員保密協(xié)議的案例解析
- 模具開發(fā)FMEA失效模式分析
- 年產(chǎn)40萬(wàn)噸灰底涂布白板紙?jiān)旒堒囬g備料及涂布工段初步設(shè)計(jì)
- 1-3-二氯丙烯安全技術(shù)說明書MSDS
- 學(xué)生思想政治工作工作證明材料
- 一方出資一方出力合作協(xié)議
- 污水處理藥劑采購(gòu)?fù)稑?biāo)方案(技術(shù)方案)
- 環(huán)保設(shè)施安全風(fēng)險(xiǎn)評(píng)估報(bào)告
- 數(shù)字邏輯與計(jì)算機(jī)組成 習(xí)題答案 袁春風(fēng) 第3章作業(yè)批改總結(jié)
- 要求降低物業(yè)費(fèi)的申請(qǐng)書范本
- 焊接機(jī)器人行業(yè)分析研究報(bào)告
- PI形式發(fā)票范文模板
評(píng)論
0/150
提交評(píng)論