基于sif的人臉特征數(shù)據(jù)保護研究_第1頁
基于sif的人臉特征數(shù)據(jù)保護研究_第2頁
基于sif的人臉特征數(shù)據(jù)保護研究_第3頁
基于sif的人臉特征數(shù)據(jù)保護研究_第4頁
基于sif的人臉特征數(shù)據(jù)保護研究_第5頁
已閱讀5頁,還剩2頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

基于sif的人臉特征數(shù)據(jù)保護研究

0生物特征加密算法經(jīng)過幾十年的研究,生物特征識別技術(shù)已經(jīng)進入了實際階段,但生物特征數(shù)據(jù)的安全性和隱私度的研究相對較晚,出現(xiàn)了問題。由于生物特征具有唯一性,個人特征數(shù)據(jù)的丟失就意味著個人身份的丟失。特征數(shù)據(jù)一旦被破壞或竊取,無法像密碼和IC卡那樣取消或重新更新,個人生物特征的安全性顯得特別重要。特征模板數(shù)據(jù)庫是生物特征識別系統(tǒng)的重要組成部分,其中存儲著注冊用戶已提取的特征數(shù)據(jù)。研究表明,運用“HillClimbingAttacks”技術(shù),能夠通過特征模板數(shù)據(jù)庫中的數(shù)據(jù)重建原始的生物特征。因此,生物特征模板數(shù)據(jù)的安全性研究是一個重要而緊迫的研究課題,成為生物特征識別領(lǐng)域的研究熱點。目前,針對生物特征模板數(shù)據(jù)的安全性技術(shù)主要有兩大類算法。一類是Ratha等人提出的可重建生物特征(cancelablebiometric)算法,另一類是Uludag等人提出的生物特征加密系統(tǒng)(biometriccryptosystem)算法。Ratha等人根據(jù)生物特征具有的唯一性(invariable)、無法撤銷性(irrevocable)和隱私性(privacy)特點,對生物特征進行人為的、不可逆的變換,使得特征模板數(shù)據(jù)庫中保存的不再是原始的生物特征,而是生物特征的變換形式。由于變換的不可逆性,即使攻擊者獲取了特征模板數(shù)據(jù)庫中的數(shù)據(jù),也無法得到原始的生物特征??梢酝ㄟ^修改不可逆變換的參數(shù),得到新的特征模板數(shù)據(jù),使得模板數(shù)據(jù)庫中的數(shù)據(jù)具有可重建性(cancelable),進而克服生物特征的無法撤銷性所帶來的不足。Ratha等人提出3種不可逆變換函數(shù),用來生成可重建的指紋模板數(shù)據(jù)。生物特征加密系統(tǒng)算法將生物特征識別系統(tǒng)與密碼學(xué)結(jié)合起來。在這類算法中,特征模板數(shù)據(jù)庫中保存的不再是原始的生物特征,而是其在密碼學(xué)架構(gòu)下的一種變換形式,主要應(yīng)用糾錯碼(errorcorrectcode)來處理類內(nèi)差異問題。由于生物特征數(shù)據(jù)中噪聲的存在,引入糾錯碼對噪聲導(dǎo)致的誤差進行處理。Juels等人提出FuzzyCommitment算法,在此基礎(chǔ)上Juels等人進行改進提出FuzzyVault算法。目前,已有的關(guān)于生物特征模板數(shù)據(jù)安全性方面的研究大都是關(guān)于指紋和虹膜的,由于人臉特征容易受到光照、表情及姿勢變化等外在條件的影響,同一人的圖像表現(xiàn)差別很大,人臉特征之間具有較大的類內(nèi)差異,使得人臉數(shù)據(jù)方面的保護算法較少涉及。例如,Savvides等人利用隨機卷積核對人臉圖像進行加密。Teoh等人提出一種基于兩種因素的人臉特征識別Biohashing算法。人臉識別相對于虹膜和指紋識別,具有自然性和不容易被被測個體察覺等優(yōu)點,越來越多地應(yīng)用到身份識別中,本文主要考慮人臉特征數(shù)據(jù)的安全。糾錯碼一般是對二值的串進行糾錯編碼,人臉特征數(shù)據(jù)是實值的,將實值的特征轉(zhuǎn)化為二值的串,會丟失很多有用的信息;人臉特征的維數(shù)較大;人臉特征較易受到光照、表情或姿勢等外在因素的影響,具有較大的類內(nèi)差異,因此,人臉特征不適合應(yīng)用糾錯碼技術(shù)來處理,本文算法按照可重建生物特征的研究思路提出。已有的關(guān)于人臉特征數(shù)據(jù)的保護算法,人臉特征大都采用全局特征,而人臉的全局特征,較易受到光照、表情及姿勢等外部條件的影響。局部特征則可以很好地解決這些問題。局部特征主要是對以特征點為中心的局部區(qū)域的描述,綜合了特征點本身及其鄰域的信息。SIFT(scaleinvariantfeaturetransform)算法提取的特征就屬于這類局部特征,通過SIFT算法提取的特征對旋轉(zhuǎn)、尺度縮放、亮度變化等保持不變性,對仿射變化、噪聲也保持一定程度的穩(wěn)定性。因此,提出的人臉特征保護算法,采用人臉的SIFT特征。針對人臉識別,從保護生物特征模板數(shù)據(jù)的角度出發(fā),提出一種基于SIFT對人臉特征數(shù)據(jù)進行保護的安全算法。1sift法siftSIFT算法是Lowe在2004年提出的一種對尺度空間、圖像縮放、旋轉(zhuǎn)甚至仿射不變的圖像局部特征描述算子。SIFT算法利用不同尺度的高斯核函數(shù)對圖像連續(xù)濾波和下采樣,形成高斯金字塔圖像,根據(jù)相鄰尺度的高斯圖像得到DOG(differentofGaussian)金字塔多尺度空間。將DOG尺度空間的每個點與相鄰尺度和相鄰位置的點逐個進行比較,獲得局部極值點,再通過局部極值點確定關(guān)鍵點,最終得到SIFT特征。1.1高斯差分尺度空間由于高斯卷積核是實現(xiàn)尺度變化的唯一線性核,因此,采用尺度可變高斯函數(shù)G(x,y,σ)生成圖像I(x,y)的尺度空間L(x,y,σ),將不同尺度的高斯函數(shù)和人臉圖像I(x,y)進行卷積運算,即L(x,y,σ)=G(x,y,σ)*Ι(x,y)(1)式中,G(x,y,σ)=12πσ2e-x2+y22σ2,σ表示高斯函數(shù)的方差。為了能夠有效地在尺度空間中檢測到穩(wěn)定的關(guān)鍵點,利用不同尺度的高斯差分核與圖像卷積生成高斯差分尺度空間(DOGscale-space)(圖1)。D(x,y,σ)=[G(x,y,kσ)-G(x,y,σ)]*Ι(x,y)=L(x,y,kσ)-L(x,y,σ)(2)式中,k是常數(shù)因子。為了檢測D(x,y,σ)的局部極值點,采樣點不僅需要與它同一尺度的8個鄰域點進行比較,還要和上下相鄰尺度的9×2個鄰域像素共26個相鄰像素進行比較,得到局部極值點(見圖2),所有局部極值點構(gòu)成了SIFT候選關(guān)鍵點。1.2基于pet函數(shù)的de為了進一步增強匹配的穩(wěn)定性,提高抗噪聲能力,極值檢測得到的所有候選關(guān)鍵點必須排除低對比度的點和邊緣點,才能確定是關(guān)鍵點。通過擬合3維二次曲線找出低對比度的點,將D(x,y,σ)進行泰勒展開為二次項D(x)=D+?DΤ?xx+12xΤ?2D?x2x(3)式中,D是DOG計算的結(jié)果。由D和x可以找到一個偏移量?x=-?2D-1?x2?D?x(4)將式(4)代入式(3)中,如果|D(?x|<0.03,則該點是低對比度的點。由于DOG函數(shù)在跨越邊緣的地方存在大的主曲率,因此,通過主曲率查找邊緣點。Hessian矩陣的特征值正比于D的主曲率,設(shè)α是最大特征值,β是最小特征值,令α=rβ。Η=[DxxDxyDxyDyy](5)則tr(Η)=Dxx+Dxy=α+βDet(Η)=DxxDyy-(Dxy)2=αβtr(Η)2Det(Η)=(α+β)2αβ=(rβ+β)2rβ2=(r+1)2r(6)當(dāng)α=β時,式(6)取最小值。通過tr(Η)2Det(Η)<(r+1)2r檢測主曲率是否小于某一個閾值r。若不滿足該條件,則該點可能是邊緣點。1.3sift特征描述方法利用關(guān)鍵點鄰域像素的梯度方向的分布特性為每個關(guān)鍵點指定方向參數(shù),使算子具備旋轉(zhuǎn)不變性。點(x,y)處梯度的模值m(x,y)和方向θ(x,y)的計算公式分別為m(x,y)=√(L(x+1,y)-L(x-1,y))2+(L(x,y+1)-L(x,y-1))2θ(x,y)=arctan(L(x,y+1)-L(x,y-1)L(x+1,y)-L(x-1,y))(7)L(x,y+1),L(x,y-1),L(x-1,y),L(x+1,y)分別表示點(x,y)上下左右4個像素點的灰度值,此時的關(guān)鍵點具有位置、大小和方向3個參數(shù)。進一步將坐標(biāo)軸旋轉(zhuǎn)為關(guān)鍵點的方向,確保旋轉(zhuǎn)不變性。然后,對任意一個關(guān)鍵點,在其尺度空間,取以關(guān)鍵點為中心的16×16大小的區(qū)域。在每個4×4的小塊上計算8個方向的梯度向量直方圖,繪制每個梯度方向的累加值,形成一個種子點(見圖3)。一個關(guān)鍵點使用4×4共16個點來描述,最終形成128維的特征向量。該向量就是SIFT特征描述子,即SIFT特征向量。SIFT特征向量已經(jīng)去除了尺度變化、旋轉(zhuǎn)等幾何因素的影響。將特征向量的長度歸一化,則可以進一步去除光照變化的影響。當(dāng)兩幅圖像的SIFT特征向量生成后,采用關(guān)鍵點特征向量的歐氏距離作為關(guān)鍵點的相似性判定度量。取一幅圖像中的某個關(guān)鍵點,找出另一幅圖像中與該點歐氏距離最近的前兩個關(guān)鍵點。在這兩個關(guān)鍵點中,如果最近距離除以次近距離小于某個比例閾值,則認為這兩個關(guān)鍵點是匹配的。2基于sift特性的保護算法2.1算法的基本結(jié)構(gòu)本文提出的基于SIFT特征的人臉特征保護算法的基本結(jié)構(gòu)如圖4所示。算法主要由兩部分組成。1局部特征的提取在已有的關(guān)于生物特征數(shù)據(jù)的保護算法中,大都是采用PCA,LDA等全局的特征提取方法。這類方法容易受到光照、姿勢和表情等的影響,從而導(dǎo)致識別結(jié)果的偏差。SIFT算法提取圖像的局部特征,該特征對旋轉(zhuǎn)、尺度縮放和亮度變化等保持不變性,對噪聲也保持一定的穩(wěn)定性。因此,采用SIFT算法作為人臉特征提取方法,后面的實驗結(jié)果也進一步說明,采用這種特征,不僅對光照、遮擋及姿勢的變化等的影響具有較高的魯棒性,而且還能進一步提高識別率。2隨機投影生成Xn×M為對人臉圖像提取的M個n維的SIFT特征向量(其中n=128),將其投影到d維子空間中(d<n)。Xd×ΜRΡ=Rd×nXn×Μ(8)式中,Rd×n是d×n維隨機矩陣,Xd×ΜRΡ是投影后得到的d維子空間中的特征向量,其中RP(randomprojection)表示隨機投影。隨機矩陣Rd×n是由用戶擁有的密鑰K通過隨機數(shù)發(fā)生器產(chǎn)生的,每個用戶擁有各自不同的密鑰,只有合法的密鑰才能唯一決定隨機矩陣的生成。另外,匹配過程是在Xd×ΜRΡ之間進行的。在注冊和識別階段,隨機投影以相同的方式進行,只是用戶各自擁有的密鑰不同。經(jīng)過隨機投影后,特征模板數(shù)據(jù)庫中保存的是Xd×ΜRΡ,而不再是Xn×M。如果特征模板數(shù)據(jù)庫中的Xd×ΜRΡ被非法竊取,但是真正的人臉特征Xn×M仍然安全,使得特征數(shù)據(jù)的隱私性得到了保護。隨機投影與用戶的密鑰K密切相關(guān),通過修改用戶密鑰K可以生成不同的特征模板數(shù)據(jù)。如果特征模板數(shù)據(jù)被竊取或遭到了篡改,則修改用戶的密鑰可以重新生成新的特征模板數(shù)據(jù),從而保證了特征模板數(shù)據(jù)的可重建性。2.2u3000jb-lindestrauss引理的應(yīng)用隨機投影是一種有效而且精確的降維技術(shù),與其他降維方法相比,具有計算簡單等優(yōu)點,特別是通過隨機投影進行降維并不會導(dǎo)致數(shù)據(jù)有較大的變形。本文應(yīng)用隨機投影來保護人臉的SIFT特征,其理論基礎(chǔ)是Johnson-Lindenstrauss引理,這也是隨機投影得到廣泛應(yīng)用的主要原因。Johnson-Lindenstrauss引理對于任意0<ε<1與整數(shù)n,設(shè)d為正整數(shù),且使得d≥d0=O(ε-2lnN),則對于Rn中N個點的集合W,存在一個映射f:Rn→Rd,使得對所有的u,v∈W,有(1-ε)∥u-v∥2≤∥f(u)-f(v)∥2≤(1+ε)∥u-v∥2(9)Johnson-Lindenstrauss引理確保一個向量空間中的數(shù)據(jù)點被隨機投影到具有一定維數(shù)的子空間中,向量數(shù)據(jù)間的相似性近似保持不變。即同類數(shù)據(jù)投影后,仍為同一類數(shù)據(jù),不同類的數(shù)據(jù)也是如此,從而滿足生物特征識別的可辨識性要求。由于隨機投影中d?n,因此式(8)可以看成是一個欠定方程式,因此,這是一個“多到一”的投影,是不可逆的。也就是說,即使非法用戶竊取了Xd×ΜRΡ和Rd×n,也無法獲知原始的特征數(shù)據(jù)Xn×M,從而保證了原始特征數(shù)據(jù)的安全性。在進行識別時,只有特征數(shù)據(jù)和用戶的密鑰兩者都正確,才能通過識別。3實驗與結(jié)果分析3.1人臉庫模板wpo在人臉識別的應(yīng)用中,人臉圖像的采集容易受到姿勢、遮擋和表情變化等的影響。因此,本文提出的保護算法主要考慮帶有姿勢、遮擋和表情變化的人臉識別情況。算法實驗主要在CMU、AR和Feret人臉庫進行。CMU人臉庫中,人臉姿勢變化較大;AR人臉庫中的人臉帶有遮擋;Feret人臉庫中的人臉具有較大的表情變化。CMU人臉庫有68人,每人選取6幅具有姿勢變化的人臉圖像,圖像大小為92×112。本文算法以正面姿勢圖像(Pose27)為模板數(shù)據(jù),其他圖像用來測試(見圖5)。AR人臉庫選取119人,每人有26幅分兩個不同時間采集的,具有不同光照、不同表情和帶遮擋(圍巾和墨鏡)的人臉圖像,圖像大小為92×112。排除光照和表情的影響,本文算法只考慮帶遮擋的情況,則每人有4個測試圖像。取光照均勻、沒有遮擋的圖像作為模板數(shù)據(jù)(見圖6)。Feret人臉庫共有255人,每人有4幅圖像,同一人的圖像具有不同表情、光照、姿態(tài)、年齡和眼鏡等的變化。本文算法選取每個人的第一幅圖像作為模板圖像,對其他圖像進行測試,圖像大小為92×112(見圖7)。3.2算法的平均識別率人臉識別主要包含兩個方面的應(yīng)用,即認證和識別。認證是指驗證用戶是否是他所聲明的身份,通過把待認證用戶的特征數(shù)據(jù)和特征模板數(shù)據(jù)庫中所聲明的模板數(shù)據(jù)進行“一對一”的比較,來確定身份;識別則是一個“一對多”的過程,通過將待識別用戶的特征數(shù)據(jù)與特征模板數(shù)據(jù)庫中的模板逐一比較,從而找到一個最匹配的模板,來確認身份。本文的實驗是針對識別來進行的,如果測試圖像與某個模板數(shù)據(jù)的SIFT特征匹配點數(shù)最多,則判定測試圖像為該模板數(shù)據(jù)所屬的那一類。為了減少隨機性的影響,實驗反復(fù)循環(huán)10次,從而得到平均識別率。圖8—10分別是當(dāng)用戶持有合法密鑰時,在CMU、AR和Feret人臉庫上得到的識別率。維數(shù)為128的識別率為原始SIFT算法的識別率。從圖中可以看到,本文的安全算法(圖中“SIFT”表示本文算法)的平均識別率與原始SIFT算法識別率相比,均有一定的提高,特別是AR庫和Feret庫。實驗結(jié)果表明,本文算法對姿勢、遮擋和表情的變化具有較好的魯棒性。另外,在進行隨機投影時,特征空間的維數(shù)會改變,從圖8—10中可以看到,本文算法的識別率不會隨著維數(shù)的變小有較大的降低。因此,本文算法對特征空間維數(shù)的改變有較好的魯棒性。進一步考慮不同人臉特征對本文算法的影響,在本文算法中采用FDA特征,特征的匹配采用歐氏距離。在圖8—10中,“FDA”表示這類情況的實驗結(jié)果。CMU庫的FDA特征向量的維數(shù)為67,AR庫的FDA特征向量維數(shù)為118,Feret庫的FDA特征向量維數(shù)為254。因此,圖8中采用FDA特征只有維數(shù)為60、50和40的實驗結(jié)果。圖9中則沒有維數(shù)為120的識別率。從圖8—10可以看到,在CMU和Feret人臉庫上,采用SIFT特征的識別率均高于采用FDA特征的識別率。在AR人臉庫,本文算法的識別率稍差于采用FDA特征的結(jié)果。但是圖8—10中,采用FDA特征,算法的識別率隨著子空間維數(shù)的減少有明顯的降低。因此,本文的保護算法采用SIFT特征比采用FDA特征的識別效果要好,并且對特征空間維數(shù)的改變具有更好的魯棒性。3.3實驗結(jié)果及分析Biohashing算法是Teoh等人提出的一種基于兩因素的生物特征識別算法,Biohashing算法是將提取的特征向量與Token(或智能卡)中存儲的隨機序列進行迭代內(nèi)積運算,從而得到基于用戶的編碼BioHashCode,BioHashCode之間通過漢明距離(Hammingdistance)來度量相似性。Biohashing算法針對人臉識別取得較好的識別效果,并且該算法也引入了與特征數(shù)據(jù)無關(guān)的隨機因素Key。因此,本文與Bi

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論