版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、人臉識別特征臉方法賈東亞12346046一、實驗?zāi)康?、學(xué)會使用PCA主成分分析法。2、初步了解人臉識別的特征法。3、更熟練地掌握 matlab的使用。二、原理介紹1、PCA (主成分分析法介紹)引用一個網(wǎng)上的例子。假設(shè)有一份對遙控直升機操作員的調(diào)查,用x1(i)表示飛行員i的飛行技能,x2(i)表示飛行員i喜歡飛行的程度。通常遙控直升飛機是很難操作的,只有那些 非常堅持而且真正喜歡駕駛的人才能熟練操作。所以這兩個屬性x1(i)和x2(i)相關(guān)性是非常強的。我們可以假設(shè)兩者的關(guān)系是按正比關(guān)系變化的。如下圖里的任意找的向量u1所示,數(shù)據(jù)散布在u1兩側(cè),有少許噪聲?,F(xiàn)在我們有兩項數(shù)據(jù),是二維的。那
2、么如何將這兩項變量轉(zhuǎn)變?yōu)橐粋€來描述飛行員呢?由圖中的點的分布可知,如果我們找到一個方向的U,所有的數(shù)據(jù)點在 U的方向上的投影之和最大,那么該 U就能表示數(shù)據(jù)的大致走向。而在垂直于U的方向,各個數(shù)據(jù)點在該方向的投影相對于在 U上的投影如果足夠小,那么我們可以忽略掉各數(shù)據(jù)在該方向的投影,這 樣我們就把二維的數(shù)據(jù)轉(zhuǎn)化成了在U方向上的一維數(shù)據(jù)。為了將u選出來,我們先對數(shù)據(jù)進行預(yù)處理。先求出所有數(shù)據(jù)的平均值,然后用數(shù)據(jù)與 平均值的偏差代替數(shù)據(jù)本身。然后對數(shù)據(jù)歸一化以后,再代替數(shù)據(jù)本身。而我們求最大的投影和,其實就是求各個數(shù)據(jù)點在U上的投影距離的方差最大。而XTu就是投影的距離。故我們要求下式的最大值:1
3、mi=1m(x(i)Tu)2=uT(1mi=1mx(i)x(i)T)u按照u是單位向量來最大化上式,就是求1mi=1mx(i)x(i)T的特征向量。而此式是數(shù)據(jù)集的協(xié)方差矩陣。在實際應(yīng)用中,我們不止面臨二維的數(shù)據(jù)。因此不能使用幾何的形式呈現(xiàn),但原理也是一樣。就是找到一組相互正交的單位向量uk,然后根據(jù)貢獻率考慮選擇其中的部分作為考量的維數(shù),這也就實現(xiàn)了數(shù)據(jù)的降維。三、實驗步驟1、將庫里的400張照片分成兩組。一組作為訓(xùn)練,一組作為庫。每個人的前五張照片作為 訓(xùn)練,后五張作為庫。訓(xùn)練的照片按照順序的數(shù)字重命名。庫的照片名字不變。2、庫照片處理。 將每一張庫的照片轉(zhuǎn)化成 N維的向量。(庫里的照片是
4、112*92,故將轉(zhuǎn)化成的矩陣按列或行展開,就是個10304維的向量)我們稍后要對如此多維的向量用PCA進行降維。然后把這些向量存入一個矩陣?yán)铩6沂菍⑦@200個向量以列的形式存在了矩陣?yán)?。即z= ri23, r 4r 200 將這200個向量的每個元素相加起來求出平均值。再用Z里的每一個向量減去這個平均值得到每個的偏差。平均值r =1200k=1200 rk每個向量的偏差?k= rk- r即最后Z= ? 1 , ?2, ?3, ?4 ?200 接下來我們就要針對這些預(yù)處理后的數(shù)據(jù)進行降維。我們要求的N個相互正交的向量就是協(xié)方差矩陣ZZT的特征向量,而對應(yīng)的特征值就是各個向量所占的比重。但是Z
5、是個10304*200的矩陣,那么 ZZT就是個10304*10304的矩陣。使用 matlab直接求其特征值與 特征向量不太實際。所以我們考慮一個簡單的運算方法:協(xié)方差矩陣的秩受到訓(xùn)練圖像的限制:如果有N個訓(xùn)練樣本,則最多有N-1個對應(yīng)非零特 征值的特征向量,其他的特征向量對應(yīng)的特征值都是0。如果訓(xùn)練樣本的數(shù)目比圖像的維數(shù)低,則可以通過如下方法簡化主成份的計算。-設(shè)Z是預(yù)處理圖像的矩陣,每一列對應(yīng)一個減去均值圖像之后的圖像。則,協(xié)方差矩陣為S=TTT,并且對S的特征值分解為Sv i=TTT v i=入 i vi然而,TTT是一個非常大的矩陣。因此,如果轉(zhuǎn)而使用如下的特征值分解。TTTui二入
6、 iui此時,我們發(fā)現(xiàn)如果在等式兩邊乘以T,可得到TTTTui=入 iTui這就意味著,如果 Ui是TtT的一個特征向量,則 V i=Tui是S的一個特征向量。 我們的庫里 有200張112 * 92像素的圖像,則 TtT是一個200*200的矩陣,這就比原先的 10304 * 10304 的協(xié)方差矩陣要容易處理許多。需要注意的是,上面的特征向量V沒有進行歸一化,如果需要,應(yīng)該在后面在進行處理。 降維處理。上面的步驟已經(jīng)求到了所有的特征向量與特征值。而特征值就是各數(shù)據(jù)點在該特征向量上的方差。 跟據(jù)PCA,我們要選岀占主要比重的特征向量即可,而判定標(biāo)準(zhǔn)就是特征值。先把方差(特征值)降序排列,并把
7、對應(yīng)的特征向量也排列好。依次選擇方差,使選出的方 差和占所有方差和大約 95%左右。然后選擇對應(yīng)的特征向量。其余的特征向量與特征值可以拋 棄不用了。這就完成了降維。(中一共有200個不為零的方差(特征值) 歸一化處理。數(shù)據(jù)歸一化處理是數(shù)據(jù)挖掘的一項基礎(chǔ)工作,不同評價指標(biāo)往往具有不同的量綱和量綱單位,這樣的情況會影響到數(shù)據(jù)分析的結(jié)果, 為了消除指標(biāo)之間的量綱影響, 需要進行 數(shù)據(jù)標(biāo)準(zhǔn)化處理,以解決數(shù)據(jù)指標(biāo)之間的可比性。 原始數(shù)據(jù)經(jīng)過數(shù)據(jù)標(biāo)準(zhǔn)化處理后, 各指標(biāo)處于 同一數(shù)量級,適合進行綜合對比評價。我使用的是Z-score法。經(jīng)過處理得數(shù)據(jù)符合標(biāo)準(zhǔn)正態(tài)分布,即均值為0,標(biāo)準(zhǔn)差為1,轉(zhuǎn)化函數(shù)為x*=
8、x-其中卩為所有數(shù)據(jù)的均值,b為所有樣本數(shù)據(jù)的標(biāo)準(zhǔn)差。在里求得的特征值就是方差。所以我們要用1入k乘上每一個對應(yīng)的特征向量。本來這個歸一化處理應(yīng)該放在第一步的數(shù)據(jù)預(yù)處理那里。但由于那里的計算還沒有涉及到協(xié)方差矩陣,而我們需要的方差在后面才出現(xiàn),故把歸一化處理放在這里。即中,v i=1 入 iTui這些特征向量都是 10304*1的大小,跟我們一開始處理后的照片向量的大小一樣。這些就 是特征臉。特征臉可以線性組合成所有庫里的臉。 用特征臉對庫里的臉進行標(biāo)示,也就是將庫里的每張臉圖數(shù)據(jù)轉(zhuǎn)化成各個特征臉?biāo)嫉谋戎亍<? k= v kT?i,i=1,2,3200,k=1,2,3n 是最后n岀的方差數(shù)量
9、Q iT= 3 1, 3 2, 3 3, 3 43 n 人臉識別。先對訓(xùn)練的臉圖進行預(yù)處理。預(yù)處理即中所說的求偏差。求到訓(xùn)練圖的 偏差向量后,如那樣用特征臉對訓(xùn)練圖進行標(biāo)示。即求得Q *T= 3 1, 3 2, 3 3, 343然后求Q *T與Q iT的歐式距離,此距離表明兩圖的接近度。即& = Q *TQ iT2該距離越小,則這兩張圖越接近,則越有可能是同一個人。四、編程實現(xiàn)代碼:函數(shù):zz, y, tzl=circ(),對庫圖像的處理,并求出處理訓(xùn)練圖像需要的特征臉和數(shù)據(jù)平均值。function zz,y,till - circ*)航疋是經(jīng)過特征臉標(biāo)示的庫圖像胃y是庫圏像的教據(jù)平均
10、值y=zBros (92*112, 1);畔zeroH (畝*11盎 200):d=l;for i=l;40for j=6:10if i<10&ij<10t= J Q0J nu*2str (i) ' (T numiStr(j) bTnp1; a=uiLteadHt * ;a=dpuble*'a);y=y+a(:):2(:,(1)=3(:);歸旳;else if (i<10fc&j=10)t= r CO1 nu*2str (i) J 10. bmp':a=imread(t);3Fdouble (a):y=y+a(:):z (:; d)=a
11、"':);d=dH-l ;else if i>=lUAj<10t= O' num2 st r (i) j nun2st r (j ). bmp? J :aimreadQ'1 :a=double(a):y=y+a (:):z(:, d)=a(:) ;d=d+l;eLse if i>=lDtj=10t= ' j nunSstr (i J bmp'a=imread(t);a=doutil# (a):y=jrl-3(:); (ir 1) =u(;) ; d=d+l :?ndendendendend endy=y/200:軻是平均值hf
12、ar i= 1:210旳dEinz 3tz :rsiinvcc,'sin1 :殆盪用* simvcz是特征向重隼siAVal-ei£ (si*) ”(IE值辜sunval, lzid=SdtT siivalj ' des c end'),siJsvec'suvec' : ind' ;ETfc=O;for i=l:200 sunrs+simuaKi);-trtd脳u*蕪特證值的和d=0 r v*ig?Ll=0 ; smnl=0.while( weifht<0. 95)dd+1sum s lmval (d) +sum 1 ;TeiBl
13、=sujnl/sum:筈d為取的特征向1 weight為最終的比重endsimval=£iiLval (L : d, : i :sijnvaJ= sinvl. (0. 5);simvec=sinvec(:j l:dl ;til=;*sijii7ec*(kag (siAvali :*lzlzz=z:J ;函數(shù):ws=ld(zz,y,tzl)這三個自變量都是上面的函數(shù)的輸出變量。Ws是200張訓(xùn)練人臉識別的正確性。if yus hu= 0if zhengshu>8 g1=zhengshn.elseg l=-hengshu;endfttn亡tion itfs = Id ( Z2? y
14、j t zl J舄網(wǎng)藥HO張訓(xùn)練人臉識別的正確率if zhengshu>8ct=0 :irs-0.gl=zherLgshu+l ;for k=l;2QQelseks= niniZstr (k) ' . bnp :f lzhengshu+l ;ss-imreads):亡ndWijiishov(5S):end55=d.ouble * ssi :ky=mod(l£j 5):ss=ss(:)-y:(k-ky)/5;SS=3SJ *t zl :if ky=0SS=SSJ :覺特征臉標(biāo)示完畢£2=ki:硏皓識別elseOSJ=:g2=lE2+l :far 1=1:200e
15、ndosj= Io5jf non(HB-zz(;ti)>2):if gl=g2en.dct=ct+::xnujiij 耐 dd =min1 cs j1 :end5ni£h.u-mo d1 madd3 5).ws=ct/200;zhengsliu1 anadd-yushu) /5:end運行結(jié)果:» xjYj z>circ();» vldfxj y, z)vs =0. 9150200張訓(xùn)練圖片的識別率為91.5%加了顯示代碼后顯示的圖片結(jié)果:j r .口 I 回 £3 Q Figure 1Fil Ed Vie Ime Toe Dekl Wind Hel E M d%企注氏* M五、實驗總結(jié)收獲:這次實驗讓我更加熟練地應(yīng)用了matlab。對矩陣的運算也理解地更加的透徹。學(xué)習(xí)了PCA主成分分析法,這個方法在分析較多的數(shù)據(jù)時是非常有用的。在如今的大數(shù)據(jù)時代,PCA是個非常實用的分析手段。這次在做實驗的過程中, 上網(wǎng)查閱了許多關(guān)于人臉識別的資料, 發(fā)覺雖然自己完成了初 步的人臉識別的功能,但遠遠沒有達到現(xiàn)實生活的需求。我們做實驗的orl庫的像素不僅非常低,而且每張人臉的位置與大小也非常接近,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度新能源車輛贈予及充電設(shè)施安裝合同3篇
- 中國石化2024年度原料進口協(xié)議模板版
- 2025年智能工廠車間場地租賃及維護服務(wù)合同范本4篇
- 二零二五年院落出租與非物質(zhì)文化遺產(chǎn)保護合同3篇
- 2025版智能門面房租賃服務(wù)合作協(xié)議4篇
- 2025版海外院校代理傭金合同標(biāo)準(zhǔn)范本4篇
- 二零二五版高速公路監(jiān)控系統(tǒng)光纜安裝合同3篇
- 2025年項目經(jīng)理入職及項目團隊激勵方案合同3篇
- 現(xiàn)代醫(yī)療技術(shù)下的疾病預(yù)防策略
- 二零二五版美團騎手薪酬福利及晉升體系合同4篇
- 【采購管理優(yōu)化探究文獻綜述3000字】
- 《大學(xué)生職業(yè)發(fā)展與就業(yè)指導(dǎo)》課程標(biāo)準(zhǔn)
- 第23課《出師表》課件(共56張)
- GB/T 3953-2024電工圓銅線
- 發(fā)電機停電故障應(yīng)急預(yù)案
- 接電的施工方案
- 幼兒阿拉伯?dāng)?shù)字描紅(0-100)打印版
- 社會組織等級評估報告模板
- GB/T 12173-2008礦用一般型電氣設(shè)備
- 新媒體研究方法教學(xué)ppt課件(完整版)
- 2020新版?zhèn)€人征信報告模板
評論
0/150
提交評論