版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
人臉檢測(cè)人臉檢測(cè)概述01任務(wù)人臉檢測(cè)方法02任務(wù)人臉檢測(cè)評(píng)價(jià)指標(biāo)03任務(wù)學(xué)習(xí)目標(biāo)掌握人臉檢測(cè)的基本概念掌握人臉檢測(cè)的方法掌握人臉檢測(cè)的評(píng)價(jià)指標(biāo)1人臉檢測(cè)概述1人臉檢測(cè)概述從問題的領(lǐng)域來看,人臉檢測(cè)屬于目標(biāo)檢測(cè)領(lǐng)域,目標(biāo)檢測(cè)通常有兩大類:通用目標(biāo)檢測(cè):檢測(cè)圖像中多個(gè)類別的目標(biāo),比如ILSVRC2017的VID任務(wù)檢測(cè)200類目標(biāo),VOC2012檢測(cè)20類目標(biāo),通用目標(biāo)檢測(cè)核心是n(目標(biāo))+1(背景)=n+1分類問題。這類檢測(cè)通常模型比較大,速度較慢。特定類別目標(biāo)檢測(cè):僅檢測(cè)圖像中某一類特定目標(biāo),如人臉檢測(cè),行人檢測(cè),車輛檢測(cè)等等,特定類別目標(biāo)檢測(cè)核心是1(目標(biāo))+1(背景)=2分類問題。這類檢測(cè)通常模型比較小,速度要求非常高。從發(fā)展歷史來看,深度學(xué)習(xí)在其中的作用非常明顯:非深度學(xué)習(xí)階段:此階段的人臉檢測(cè)主要有兩個(gè)應(yīng)用于人臉的特征,Haar特征和Hog特征,提取特征后在由分類器分類。深度學(xué)習(xí)階段:和目標(biāo)檢測(cè)相同,應(yīng)用于目標(biāo)檢測(cè)的算法也適用于人臉檢測(cè)。2人臉檢測(cè)方法人臉檢測(cè)方法機(jī)器學(xué)習(xí)中基于Haar特征和Hog特征實(shí)現(xiàn)人臉檢測(cè)任務(wù)2Haar特征:也稱Haar-like特征,分為四類:邊緣特征、線性特征、中心特征和對(duì)角線特征,組合為特征模板。特征模板內(nèi)有白色和黑色兩種矩形,并定義該模板的特征值為白色矩形像素和減去黑色矩形像素和。但矩形特征只對(duì)一些簡(jiǎn)單的圖形結(jié)構(gòu),如邊緣、線段較敏感,所以只能描述特定走向(水平、垂直、對(duì)角)的結(jié)構(gòu)。通過改變特征模板的大小和位置,可在圖像子窗口中窮舉出大量的特征。矩形特征可位于圖像任意位置,大小也可以任意改變,所以矩形特征值是受矩形模版類別、矩形位置和矩形大小這三個(gè)因素的影響。故類別、大小和位置的變化,使得很小的檢測(cè)窗口含有非常多的矩形特征。人臉檢測(cè)方法2但矩形特征只對(duì)一些簡(jiǎn)單的圖形結(jié)構(gòu),如邊緣、線段較敏感,所以只能描述特定走向(水平、垂直、對(duì)角)的結(jié)構(gòu)。對(duì)于圖中的A,B和D這類特征,特征數(shù)值計(jì)算公式為:
。而對(duì)于C來說,計(jì)算公式如下:
,之所以將黑色區(qū)域像素和乘以2,是為了使兩種矩形區(qū)域中像素?cái)?shù)目一致。通常希望矩形放到人臉區(qū)域計(jì)算出來的特征值和放到非人臉區(qū)域計(jì)算出來的特征值差別越大越好,這樣就可以用來區(qū)分人臉和非人臉。人臉檢測(cè)方法2通過改變特征模板的大小和位置,可在圖像子窗口中窮舉出大量的特征。上圖的特征模板稱為“特征原型”,特征原型在圖像子窗口中擴(kuò)展(平移伸縮)得到的特征稱為“矩形特征”,矩形特征的值稱為“特征值”。圖中即使用兩個(gè)Haar矩形特征,表示出人臉的某些特征。比如中間一幅表示眼睛區(qū)域的顏色比臉頰區(qū)域的顏色深,右邊一幅表示鼻梁兩側(cè)比鼻梁的顏色要深。同樣,其他目標(biāo),如眼睛等,也可以用一些矩形特征來表示。使用特征比單純地使用像素點(diǎn)具有很大的優(yōu)越性,并且速度更快。人臉檢測(cè)方法2Hog特征:Hog特征又叫方向梯度直方圖特征(HistogramofOrientedGradient,HOG)。Hog特征是一種在計(jì)算機(jī)視覺和圖像處理中用來進(jìn)行物體檢測(cè)的特征描述子。它通過計(jì)算和統(tǒng)計(jì)圖像局部區(qū)域的梯度方向直方圖來構(gòu)成特征。優(yōu)點(diǎn):(1)由于HOG是在圖像的局部方格單元上操作,所以它對(duì)圖像幾何和光學(xué)的形變都能保持很好的不變性,這兩種形變只會(huì)出現(xiàn)在更大的空間領(lǐng)域上。(2)在粗的空域抽樣、精細(xì)的方向抽樣以及較強(qiáng)的局部光學(xué)歸一化等條件下,只要行人大體上能夠保持直立的姿勢(shì),可以容許行人有一些細(xì)微的肢體動(dòng)作,這些細(xì)微的動(dòng)作可以被忽略而不影響檢測(cè)效果。因此HOG特征是特別適合于做圖像中的人體檢測(cè)的。人臉檢測(cè)方法2HOG特征提取方法就是將一個(gè)image(你要檢測(cè)的目標(biāo)或者掃描窗口):(1)灰度化(將圖像看作一個(gè)x,y,z(灰度)的三維圖像);(2)采用Gamma校正法對(duì)輸入圖像進(jìn)行顏色空間的標(biāo)準(zhǔn)化(歸一化),目的是調(diào)節(jié)圖像的對(duì)比度,降低圖像局部的陰影和光照變化所造成的影響,同時(shí)可以抑制噪音的干擾;(3)計(jì)算圖像每個(gè)像素的梯度(包括大小和方向),主要是為了捕獲輪廓信息,同時(shí)進(jìn)一步弱化光照的干擾;(4)將圖像劃分成小cells(例如6×6像素/cell);(5)統(tǒng)計(jì)每個(gè)cell的梯度直方圖(不同梯度的個(gè)數(shù)),即可形成每個(gè)cell的descriptor;(6)將每幾個(gè)cell組成一個(gè)block(例如3×3個(gè)cell/block),一個(gè)block內(nèi)所有cell的特征descriptor串聯(lián)起來便得到該block的HOG特征descriptor;(7)將圖像image內(nèi)的所有block的HOG特征descriptor串聯(lián)起來就可以得到該image(要檢測(cè)的目標(biāo))的HOG特征descriptor了。這個(gè)就是最終的可供分類使用的特征向量了。3人臉檢測(cè)的評(píng)價(jià)指標(biāo)人臉檢測(cè)的評(píng)價(jià)指標(biāo)3評(píng)價(jià)人臉檢測(cè)效果的好壞,常用三個(gè)指標(biāo):召回率,誤檢數(shù)和檢測(cè)速度。召回率(recall):檢測(cè)器能檢測(cè)出來的人臉數(shù)量的比例就是召回率recall。檢測(cè)器檢測(cè)出來的矩形框越接近人工標(biāo)注的矩形框,說明檢測(cè)結(jié)果越好,通常交并比IoU大于0.5就認(rèn)為是檢測(cè)出來了,所以recall=檢測(cè)出來的人臉數(shù)量/圖像中總?cè)四様?shù)量,其中交并比IoU=框與框的交集區(qū)域/框與框的并集區(qū)域。誤檢數(shù)(falsepositives):通常用檢測(cè)錯(cuò)誤的絕對(duì)數(shù)量作為誤檢數(shù)falsepositives指標(biāo)。與recall相對(duì),檢測(cè)器檢測(cè)出來的矩形框與任何人工標(biāo)注框的IoU都小于0.5,則認(rèn)為這個(gè)檢
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度合作建房項(xiàng)目竣工驗(yàn)收合同范本
- 2025年度建筑涂料工程招投標(biāo)代理與咨詢服務(wù)合同
- 2025年度智能家電研發(fā)生產(chǎn)合同協(xié)議書標(biāo)準(zhǔn)格式
- 貴州2025年貴州省市場(chǎng)監(jiān)管局所屬事業(yè)單位招聘39人筆試歷年參考題庫附帶答案詳解
- 蚌埠2025年安徽馬鞍山和縣中學(xué)招聘勞務(wù)派遣制教師筆試歷年參考題庫附帶答案詳解
- 牡丹江2024年黑龍江牡丹江市直事業(yè)單位集中選調(diào)15人筆試歷年參考題庫附帶答案詳解
- 淮安2024年江蘇淮安市公安局經(jīng)濟(jì)技術(shù)開發(fā)區(qū)分局招聘警務(wù)輔助人員15人筆試歷年參考題庫附帶答案詳解
- 沈陽2025年遼寧沈陽市渾南區(qū)事業(yè)單位博士招聘36人筆試歷年參考題庫附帶答案詳解
- 柳州2025年廣西柳州市事業(yè)單位招聘2077人筆試歷年參考題庫附帶答案詳解
- 昆明2025年云南昆明市晉寧區(qū)人民政府辦公室招聘編外工作人員筆試歷年參考題庫附帶答案詳解
- GB/T 26189.2-2024工作場(chǎng)所照明第2部分:室外作業(yè)場(chǎng)所的安全保障照明要求
- 新教科版一年級(jí)科學(xué)下冊(cè)第一單元《身邊的物體》全部課件(共7課時(shí))
- 2025年中國(guó)水解聚馬來酸酐市場(chǎng)調(diào)查研究報(bào)告
- 高考百日誓師動(dòng)員大會(huì)
- 2025江蘇常州西太湖科技產(chǎn)業(yè)園管委會(huì)事業(yè)單位招聘8人歷年高頻重點(diǎn)提升(共500題)附帶答案詳解
- 2025年北京控股集團(tuán)有限公司招聘筆試參考題庫含答案解析
- 2024年北京東城社區(qū)工作者招聘筆試真題
- 2024新人教版初中英語單詞表默寫版(七~九年級(jí))
- 體育科學(xué)急救知識(shí)
- 復(fù)工復(fù)產(chǎn)質(zhì)量管理工作
- 2025年東方電氣集團(tuán)東方鍋爐股份限公司校園招聘高頻重點(diǎn)提升(共500題)附帶答案詳解
評(píng)論
0/150
提交評(píng)論