




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
面部識(shí)別的算法分析與設(shè)計(jì)案例目錄TOC\o"1-3"\h\u26758面部識(shí)別的算法分析與設(shè)計(jì)案例 1213711.1基于MTCNN的檢測(cè)算法 1108811.1.1卷積神經(jīng)網(wǎng)絡(luò) 1214241.1.2多種任務(wù)的學(xué)習(xí) 3111491.2算法的選取 5202631.3人臉識(shí)別的算法 51.1基于MTCNN的檢測(cè)算法近年來(lái),在計(jì)算機(jī)視覺(jué)領(lǐng)域卷積的神經(jīng)網(wǎng)絡(luò)取得了劃時(shí)代的進(jìn)步,基于卷積神經(jīng)網(wǎng)絡(luò)的臉部計(jì)算算法不斷登場(chǎng)。最有名的是KaippengZhang團(tuán)隊(duì)提出的基于卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的多任務(wù)學(xué)習(xí)水平的面部檢測(cè)算法。該算法主要設(shè)計(jì)了一種輕量卷積的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),能夠充分保證實(shí)時(shí)性能,并提出了一種解決困難在線樣本的方法。該算法目前基于與算法相同的算法,具有最高的識(shí)別精度。1.1.1卷積神經(jīng)網(wǎng)絡(luò)CNN是一種將二維的數(shù)據(jù)作為輸入處理的不完整連接的N層神經(jīng)網(wǎng)絡(luò)的算法。網(wǎng)絡(luò)各層有N個(gè)二維的平臺(tái)面,各平臺(tái)面有N個(gè)獨(dú)立的神經(jīng)元。神經(jīng)元之間的連接只存在于相鄰之間。CNN的底層主要用于提取圖像的紋理和邊框。然后將最下層得到的信息通過(guò)神經(jīng)元連接傳遞到下一層,圖像最重要的結(jié)構(gòu)信息被分階段提取出來(lái)。簡(jiǎn)單來(lái)說(shuō),層越多,性能越好。CNN使用的算法和普通的神經(jīng)網(wǎng)絡(luò)算法的區(qū)別在于CNN是由本地連接和共享。這樣一來(lái),需要訓(xùn)練的重量就會(huì)減少,網(wǎng)絡(luò)模型的學(xué)習(xí)復(fù)雜性也會(huì)減輕。卷積神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu)。圖3-1主要包括卷積層、環(huán)層和完全連接的層。圖1.-1卷積神經(jīng)網(wǎng)絡(luò)的基本架構(gòu)圖卷積層上圖所示的C1和C2是卷積層。卷積層通過(guò)如上圖的conv1和conv2所示的可學(xué)習(xí)卷積內(nèi)核。首先,從上一層矩陣中提取大小相同的卷積內(nèi)核區(qū)域,然后按順序?qū)⒕矸e內(nèi)核的相應(yīng)位置值與該區(qū)域值相乘,最后添加偏移量。最后,其他區(qū)域的結(jié)果按照卷積內(nèi)核的移動(dòng)步長(zhǎng)順序計(jì)算。所有折疊完成后,這些結(jié)果是為了生成新的矩陣而結(jié)合的。L-1第一個(gè)單層卷積神經(jīng)網(wǎng)絡(luò)的第無(wú)數(shù)個(gè)特征圖為的意思是從L的第一層的第M層到第L層的第n層的圖表的卷積內(nèi)核。所以第n個(gè)特征圖的公式為1.1.1:(3-1)*對(duì)于符號(hào),這是離散卷積算法的運(yùn)算符號(hào)。f(*)是算法的激活函數(shù),通常是信令函數(shù),表示為圖1.1.2(3-2)這里面的X是輸入,f(x)是輸出池化層上圖的S1和S2是池化層。池化層對(duì)主要的視覺(jué)特征進(jìn)行過(guò)濾,通過(guò)采樣將其整合抽象和視覺(jué)功能。環(huán)層采用最大值的采樣方法,采樣大小為4X4。首先,由上一層提取的特征矩陣被分割成4X4矩陣,然后獲得各矩陣的最大值,進(jìn)行最終輸出。尺寸是原來(lái)的1/2。減少采樣后的計(jì)算量,可以避免圖像轉(zhuǎn)換的影響。儀式如下公式1.1.3:(3-3)其中L-1層網(wǎng)絡(luò)表示輸出的無(wú)數(shù)個(gè)特征的圖表,這是L層網(wǎng)絡(luò)優(yōu)化后的無(wú)數(shù)個(gè)圖表,down表示最大函數(shù)。全部連接層圖3-1的F1由于連接層和完全連接層主要可以提高網(wǎng)絡(luò)映射,所以網(wǎng)絡(luò)上的上一層的所有神經(jīng)元都會(huì)連接到當(dāng)前網(wǎng)絡(luò)的所有神經(jīng)元,而同一層的神經(jīng)元不會(huì)連接。其公式為1.1.4(3-4)這里面的L所表示的當(dāng)前的網(wǎng)絡(luò)的層數(shù),N表示的是第L-1層網(wǎng)絡(luò)的神經(jīng)元的個(gè)數(shù),這個(gè)表示是第L-1層的網(wǎng)絡(luò)的第i個(gè)神經(jīng)元輸入的值。表示的是第L層網(wǎng)絡(luò)神經(jīng)元J和第L-1層網(wǎng)絡(luò)神經(jīng)元i之間的連接的權(quán)值,表示的是第L層網(wǎng)絡(luò)神經(jīng)元J的偏置。表示的是激活函數(shù)。1.1.2多種任務(wù)的學(xué)習(xí)所提出的MTCNN算法記述了多任務(wù)學(xué)習(xí)面部檢測(cè)框架【13】【8】。所以可以同時(shí)執(zhí)行下面的三個(gè)功能:(1)人臉檢測(cè):面部檢測(cè)可以被視為二進(jìn)制分類問(wèn)題,使用交叉熵的損失函數(shù)用公式1.1.5來(lái)描述:(3-5)里面的用來(lái)表示第i個(gè)訓(xùn)練樣本的真實(shí),這個(gè)表示的是人臉,如果沒(méi)有等于1就說(shuō)明不是人臉。用來(lái)表示第i個(gè)的訓(xùn)練樣本為人臉的改了吧。(2)檢測(cè)框的回歸:通過(guò)用歐式距離公式1.1.6用來(lái)表示候選窗口的損失【13】:(3-6)這個(gè)表示的是第無(wú)數(shù)個(gè)的樣本的真實(shí)向量。矢量由決定了邊界線的四個(gè)元素(水平坐標(biāo)、垂直坐標(biāo)、h和寬度)此表示第i個(gè)訓(xùn)練樣本的預(yù)繪制包圍盒矢量。人臉的特征點(diǎn)的檢測(cè):面部特征點(diǎn)的構(gòu)成基本上與檢測(cè)幀回歸相同,由二維排列構(gòu)成。用歐幾里德距離表示的特征點(diǎn)損失的說(shuō)明如公式1.1.7:(3-7)這表示為第i個(gè)訓(xùn)練樣本的實(shí)際面部坐標(biāo)。共有5個(gè)點(diǎn),各點(diǎn)有4個(gè)坐標(biāo)。由此就知道為20元組。如圖3-2這主要表示第N個(gè)樣本的坐標(biāo)【13】。圖3-2MTCNN的主要架構(gòu)解析MTCNN的算法講述:操作1:首先,初始化訓(xùn)練樣本和網(wǎng)絡(luò)權(quán)重。樣品集主要由部分臉部和部分非面部樣品構(gòu)成。假設(shè)樣本總數(shù)為N,則訓(xùn)練樣本集可以輸入金字塔。在網(wǎng)絡(luò)中裝入各種大小的圖像。操作2:把目標(biāo)全部綜合在一起,然后再使用廣撒網(wǎng)法來(lái)調(diào)整網(wǎng)絡(luò)。操作3:將一樣的圖像放置在不同大小的結(jié)構(gòu)中,并且一起傳送到訓(xùn)練的網(wǎng)絡(luò)里面。操作4:使用P-Net生成候選窗口和邊界。再用Bounding盒子進(jìn)行校正,最后使用NMS的算法進(jìn)行疊加重組。操作5:把P-Net輸出和改善后的候選窗口及Bounding盒得到矢量傳輸?shù)絅-Net。用這種方法的優(yōu)點(diǎn)就是淘汰了消極樣本。操作6:將N-Net得到改善后的結(jié)果輸入O-Net,再重復(fù)操作4,最后的得到臉部的具體位置。1.2算法的選取根據(jù)本論文算法和結(jié)果的要求,需要選擇合適的算法。需要結(jié)果的精度,實(shí)現(xiàn)高速化。翻閱很多優(yōu)秀的論文以及期刊,最后決定MTCNN算法。它主要是利用卷積神經(jīng)網(wǎng)絡(luò)的構(gòu)造,并且它在最近幾年的呼聲是相對(duì)很多其他算法中最好的。檢測(cè)率是指實(shí)際檢測(cè)出的面部數(shù)量與正確檢測(cè)出的面部數(shù)量的比率,錯(cuò)誤檢測(cè)率是指實(shí)際檢測(cè)出的面部錯(cuò)誤的比率。MTCNN這個(gè)算法的成功率是最高的,并且很少存在失誤的,至于檢測(cè)的速度這個(gè)由于人臉太多以及人臉也不一樣,所以對(duì)于速度我們可以進(jìn)行忽略不計(jì)。所以綜上所述我們選擇的是MTCNN這個(gè)人臉識(shí)別算法作為本文的算法。1.3人臉識(shí)別的算法面部識(shí)別主要是將收集的圖像輸入保存在面部數(shù)據(jù)庫(kù)中,然后在數(shù)據(jù)庫(kù)中找到一致的面部的過(guò)程,進(jìn)而達(dá)到最初的目的——身份的認(rèn)證。直接對(duì)照臉部圖像時(shí),因?yàn)橛?jì)算量變多,所以為了用低次元的特征向量來(lái)表達(dá)臉部,需要使用特征提取方法。這個(gè)階段有兩個(gè)主要問(wèn)題需要解決。一個(gè)是確認(rèn)輸入是誰(shuí),另一個(gè)是確認(rèn)輸入是否在數(shù)據(jù)庫(kù)中有保存。隨著時(shí)代的進(jìn)步,科技的飛速發(fā)展,技術(shù)的不斷成熟,近幾年提出的面部識(shí)別算法的識(shí)別率非常優(yōu)秀,主要分為:第一類這是一種傳統(tǒng)的機(jī)器學(xué)習(xí)方法,主要使用比較流暢的表現(xiàn)論,將臉部圖像映射到部分空間以進(jìn)行識(shí)別。第二類就是我們現(xiàn)在說(shuō)的使用深度卷積神經(jīng)網(wǎng)絡(luò)理論應(yīng)用到網(wǎng)絡(luò)讓網(wǎng)絡(luò)學(xué)習(xí)到人臉最本質(zhì)的特征然后再進(jìn)行識(shí)別。1.1.1FACENET的識(shí)別算法深層學(xué)習(xí)主要是基于深層神經(jīng)網(wǎng)絡(luò)的包括多電平非線性轉(zhuǎn)換的機(jī)器學(xué)習(xí)方法。實(shí)際上,深層學(xué)習(xí)的概念是在2006年之前提出的,但是受到當(dāng)時(shí)條件的影響,受到了限制。只能識(shí)別早期深層學(xué)習(xí)手寫數(shù)字等小樣本。這個(gè)適用于面部樣品的話是非常沒(méi)有效果的。隨著技術(shù)的進(jìn)步,計(jì)算機(jī)的硬件已經(jīng)不再是限制條件,深度學(xué)習(xí)再次受到關(guān)注。FACENET是谷歌提出的基于卷積神經(jīng)網(wǎng)絡(luò)的最新算法。FACENET直接學(xué)習(xí)從圖像到空間的映射。以下3-3是FACENET的圖像:圖3-3FACENET的主要圖像1)FACENET的基本構(gòu)架提高深層神經(jīng)網(wǎng)性能的最直接的方法是增加大小。當(dāng)然尺寸包括深度和寬度。深度主要是網(wǎng)絡(luò)的層數(shù),寬度是網(wǎng)絡(luò)各層的神經(jīng)元。但是這個(gè)制度也有很多缺點(diǎn)。因?yàn)楫吘鼓艿玫綌?shù)據(jù)是有限的,網(wǎng)絡(luò)的大小越大就會(huì)發(fā)生釣魚的現(xiàn)象。這主要是因?yàn)樯顚由窠?jīng)網(wǎng)由串聯(lián)的多種神經(jīng)網(wǎng)絡(luò)層組成,大小越大,參數(shù)越大,訓(xùn)練參數(shù)隨x的增大而增大,導(dǎo)致計(jì)算越發(fā)的復(fù)雜。在有限的計(jì)算資源設(shè)備中,如果大小的增加導(dǎo)致性能的提高沒(méi)有太大變化,則會(huì)浪費(fèi)很多資源。但是為了解決上面的這些問(wèn)題,F(xiàn)ACENET的深層神經(jīng)網(wǎng)使用了Inception的網(wǎng)絡(luò)結(jié)構(gòu),Inception對(duì)完全連接層應(yīng)用完全連接層,通過(guò)應(yīng)用卷積層來(lái)對(duì)網(wǎng)絡(luò)進(jìn)行深度的優(yōu)化進(jìn)而提高性能。Inception這個(gè)是使用了解析網(wǎng)絡(luò)結(jié)構(gòu)。核心想法是在網(wǎng)絡(luò)上尋找最佳Locapos結(jié)構(gòu),取代原來(lái)的非稀缺結(jié)構(gòu)。Arra的團(tuán)隊(duì)提出了一種具有相互連接層的網(wǎng)絡(luò)結(jié)構(gòu)。在這個(gè)結(jié)構(gòu)中,每個(gè)層的輸入必須計(jì)算網(wǎng)絡(luò)最后一層的結(jié)構(gòu)特性和最后一層的輸出集中在該層的輸入上。因此,網(wǎng)絡(luò)最底層的每個(gè)節(jié)點(diǎn)都對(duì)應(yīng)于輸入特征圖的特定區(qū)域,這個(gè)節(jié)點(diǎn)也被用來(lái)輸入網(wǎng)絡(luò)的下一層。在最下級(jí)網(wǎng)絡(luò)中,相關(guān)關(guān)系強(qiáng)的節(jié)點(diǎn)集中在相對(duì)空間。根據(jù)各層連接,Inception具有更多的系數(shù),減少了必要的訓(xùn)練參數(shù)。使用1*1、3*3、5*5的維護(hù)并列構(gòu)建Inception。使用3*3帶環(huán)層進(jìn)行帶環(huán),在基礎(chǔ)網(wǎng)絡(luò)輸入通過(guò)各種卷積過(guò)濾器分支后,輸出向量將堆疊在網(wǎng)絡(luò)的下一層輸入中??紤]到成本問(wèn)題,輸出后添加3*3帶環(huán)層1*1卷積濾波器。圖3-4是Inception的結(jié)構(gòu)展示:圖3-4Inception架構(gòu)圖2)三元損失函數(shù)對(duì)于深神經(jīng)網(wǎng)絡(luò)提取的180個(gè)微特征向量,F(xiàn)ACENET將使用損失函數(shù)作為解決函數(shù),減少距離來(lái)減少錯(cuò)誤。圖3-5是三元損失函數(shù)的過(guò)程:圖3-5損失函數(shù)三元函數(shù)的約束公式為1.1.1:(3-8)α表示間隔的差τ表示樣品的全部集合,變換以后得到下面的1.1.2公式:(3-9)丟失的L函數(shù),優(yōu)化不滿足條件的元組,忽略已經(jīng)滿足條件的。步驟詳解步驟1:用標(biāo)簽訓(xùn)練臉部樣本后,重置FACENET網(wǎng)絡(luò)的加權(quán)值,將面部樣品批輸入網(wǎng)絡(luò)。步驟2:通過(guò)卷積和采樣的操作得到一個(gè)網(wǎng)絡(luò)輸出為128的向量。步驟3:結(jié)合上面的公式,計(jì)算輸出和預(yù)測(cè)之間的誤差。步驟4:采用降維法反向更新FACENET的值,直到誤差收斂完成。步驟5:將測(cè)試圖像輸入到步驟4的網(wǎng)絡(luò)中,輸出表示當(dāng)前矢
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 石大學(xué)前兒童保育學(xué)課件1-7眼睛耳神經(jīng)
- 云安全與邊緣計(jì)算的協(xié)同防護(hù)-洞察闡釋
- 遺傳學(xué)課程內(nèi)容更新與跨學(xué)科融合的創(chuàng)新模式
- 激勵(lì)社會(huì)力量參與老年助餐服務(wù)的可行路徑
- 心理健康課思維導(dǎo)圖
- 2025至2030年中國(guó)波導(dǎo)合分路器行業(yè)投資前景及策略咨詢報(bào)告
- 2025至2030年中國(guó)水瓶座圖案拼圖行業(yè)投資前景及策略咨詢報(bào)告
- 2025至2030年中國(guó)氣密測(cè)試機(jī)行業(yè)投資前景及策略咨詢報(bào)告
- 2025至2030年中國(guó)橙柑桔清洗打蠟機(jī)行業(yè)投資前景及策略咨詢報(bào)告
- 2025至2030年中國(guó)木炭烘干機(jī)行業(yè)投資前景及策略咨詢報(bào)告
- 企業(yè)家刑事法律風(fēng)險(xiǎn)及其防范(課件)
- 手工皂制作教程(課堂)課件
- 國(guó)民經(jīng)濟(jì)核算課程期末復(fù)習(xí)(按題型)(含答案)
- 立式圓筒形儲(chǔ)罐罐底真空試驗(yàn)記錄
- 小學(xué)生勞動(dòng)教育評(píng)價(jià)細(xì)則
- 籃球比賽計(jì)分表word版
- 手衛(wèi)生依從性差魚骨分析
- 第4章 頜位(雙語(yǔ))
- 課程綜述(數(shù)電)
- 塔吊負(fù)荷試驗(yàn)方案
- 傷口和傷口敷料基礎(chǔ)知識(shí).ppt
評(píng)論
0/150
提交評(píng)論