版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、隨機森林在人體識別中的應用陳楠 12J0030摘要人體識別是計算機視覺領域的一大類熱點問題,其研究內容涵蓋了人體的監(jiān)測與跟蹤、手勢識 別、動作識別、人臉識別、性別識別和行為與事件識別等,有著非常廣泛的應用價值。隨機森林以它自 身固有的特點和優(yōu)良的分類效果在眾多的機器學習算法中脫穎而出。隨機森林算法的實質是一種樹預測 器的組合,其中每一棵樹都依賴于一個隨機向量,森林中的所有的向量都是獨立同分布的。本文簡單介 紹了隨機森林的原理,并對近幾年來隨機森林在姿勢識別和人臉識別中的應用進行討論。關鍵詞隨機森林;姿勢識別;人臉識別:人體識別概述人體識別是計算機視覺領域的一大類熱點問題,其研究內容涵蓋了人體的
2、監(jiān)測與跟蹤、手勢識別、 動作識別、人臉識別、性別識別和行為與事件識別等。其研究方法幾乎囊括了所有的模式識別問題的理 論與技術,例如統(tǒng)計理論,變換理論,上下文相關性,分類與聚類,機器學習,模板匹配,濾波等。人 體識別有著非常廣泛的應用價值。絕大多數(shù)人臉識別算法和人臉表情分析算法在提取人臉特征之前,需要根據(jù)人臉關鍵點的位置(如眼 角,嘴角)進行人臉的幾何歸一化處理。即使在巳知人臉粗略位置的情況下,人臉關鍵點精確定位仍然是一 個很困難的問題,這主要由外界干擾和人臉本身的形變造成。當前比較流行的算法有:基于啟發(fā)式規(guī)則的方法、主成分分析(PCA)、獨立元分析(ICA)、基于K-L變 換、彈性圖匹配等。隨
3、機森林綜述隨機森林顧名思義,使用隨機的方式建立一個森林,森林里面有很多的決策樹組成,隨機森林的每 一棵決策樹之間是沒有關聯(lián)的。在得到森林之后,當有一個新的輸入樣本進入的死后,就讓森林的每一 棵決策樹分別進行一下判斷,看看這個樣本應該屬于哪一類(對于分類算法),然后看看哪一類能被選擇 最多,就預測這個樣本為那一類。隨機森林是一種統(tǒng)計學習理論,其隨機有兩個方面:首先是在訓練的每一輪中,都是對原始樣本集 有放回的抽取固定數(shù)目的樣本點,形成k個互不相同的樣本集。第二點是:對于每一個決策樹的建立是 從總的屬性中隨機抽取一定量的屬性作分裂屬性集,這樣對于k個樹分類器均是不相同的。由隨機生成的k個決策樹組成
4、了隨機森林。對于每一個決策樹來講,其分裂屬性是不斷的選取具有最大信息增益的屬性進行排列。整個隨機森 林建立后,最終的分類標準采用投票機制得到可能性最高的結果。卜圖是隨機森林構建的過程:圖1隨機森林構建過程隨機森林在人體識別中的應用3 1隨機森林應用于姿勢識別以1一文來討論,論文中所涉及到的人體識別過程主要分為兩步,首先是,身體部位標記:對于從 單張景深圖像中對人體進行分段,并標記出關鍵節(jié)點。之后進行身體關節(jié)定位,將標記的各個人體部分 重新映射到三維空間中,對關鍵節(jié)點形成高可靠的空間定位。depth image body pa rts3D joint proposals圖2深度圖像-身體部位標記
5、-關節(jié)投影本文的最主要貢獻在于將姿勢識別的問題轉化成了物體識別的問題,通過對身體不同部位的空間位 置的確定來實現(xiàn),做到了低計算消耗和高精確度。在身體部位標記的過程中,將問題轉化成了對每個像 素的分類問題,對于每個像素點,從景深的角度來確定該點的局域梯度特征。該特征是點特征與梯度特征的良好結合。舉個例子,對于不同點的相同屬性值的判別,如下圖,圖a中的兩個測量點的像素偏移間均具有較 大的景深差,而圖b中的景深差則明顯很小。由此看出,不同位置像素點的特征值是有明顯差別的,這 就是分類的基礎。圖3景深圖像特質示例feQ,*) = dt(x + Ku) di (x + Kv)式 i文中對于決策樹的分裂屬
6、性的選擇來說。由于某兩個像素點、某些圖像特征選取的隨意性,將形成 大量的備選劃分形式,選擇對于所有抽樣像素對于不同的分裂屬性劃分前后的信息炳增益進行比較,選 取最大的一組i|)=(e,T)作為當前分裂節(jié)點。(信息增益與該圖像塊最終是否正確地分類相關,即圖像塊歸 屬于正確的關鍵特征點區(qū)域的概率。)0 a)(L X)圖4決策時分類說明argmax決策樹的建立后,某個葉子節(jié)點歸屬于特定關鍵特征點區(qū)域的概率可以根據(jù)訓練圖像最終分類的情況統(tǒng)計得到,這就是隨機森林在實際檢測特征點時的最重要依據(jù)。在人體關節(jié)分類中,我們由形成的決策森林,來對每一個像素點的具體關節(jié)屬性進行判斷,并進行 顏色分類。隨機森林這種基
7、于大量樣本統(tǒng)計的方法能夠對由于光照、變性等造成的影響,實時地解決關 鍵特征點定位的問題。如圖所示,是對于景深圖像處理后的結果展示。圖5姿勢識別處理結果應該這樣說,這篇文章在算法的層面對隨機森林沒有太大的貢獻。在劃分函數(shù)的形式上很簡單。這 個團隊值得稱道的地方是通過計算機圖形學造出了大量的不同體型不同姿勢的各種人體圖像,用作訓練 數(shù)據(jù),這也是成為2011年CVPR BestPaper的重要原因。正是因為論文的成果運用于Kinect,在工業(yè)界有 著巨大的作用,落實到了商用的硬件平臺上,推動了隨機森林在計算機視覺、多媒體處理上的熱潮。3.2隨機森林應用于人臉識別基于回歸森林的臉部特征檢測通過分析臉部
8、圖像塊來定位人臉的關鍵特征點,在此基礎上條件回歸 森林方法考慮了全局的臉部性質。對于進行分析,這篇論文是2012年CVPR上的論文,本文考慮的是 臉部朝向作為全局性質。其主要描述的問題是如何利用條件隨機森林,來確定面部10個關鍵特征點的位 置。與之前不同的是,在隨機森林的基礎上,加入了面部朝向的條件約束。對于面部特征標記的問題轉化成了對大量圖像塊的分類問題。類似于人體識別中的局域梯度特征識 別。本文中,對于每一個圖像塊來說,從灰度值、光照補償、相位變換等圖像特征,以及該圖像塊中心 與各個特征點的距離來判斷圖像塊的位置特征。在決策樹的分裂屬性確定過程,依然使用“最大信息炳 增益”原則。Condi
9、tional Regression Forest Regression ForestTrainingAA圖7條件隨機森林算法說明文中提出了更進一步基于條件隨機森林的分類方法,即通過設定臉部朝向的約束對決策樹分類,在 特征檢測階段能夠根據(jù)臉部朝向選擇與之相關的決策樹進行回歸,提高準確率和降低消耗。此論文還對 條件隨機森林,即如何通過臉部朝向對決策進行分類進行了說明,但這與隨機森林算法沒有太大關系, 這里就不再繼續(xù)討論了。隨機森林這種基于大量樣本統(tǒng)計的方法能夠對由于光照、變性等造成的影響, 實時地解決關鍵特征點定位的問題。另一篇文章3對于臉部特征標記,提出了精確度更高、成本更低的方法。艮股基于結構
10、化輸出的隨 機森林的特征標記方式。文中將面部劃分為20個特征點,對于各個特征點來說,不僅有獨立的圖像塊分 類標記,還加入了例如,點4,對于其他嘴唇特征點3,18,19的依賴關系的判斷。這樣的方法使特征點標 記準確率大大增加。該方法依然是使用隨機森林的方法,有所不同的是引入了如式中所示的與依賴節(jié)點之間的關系。對 于決策樹的建立依然是依賴信息炳增益原則來決定,葉子節(jié)點不僅能得到特征的獨立劃分還會得到該特 征對依賴特征的貢獻,最終特征節(jié)點的判斷會綜合原始投票及空間約束。圖8臉部特征標記圖9決策樹依賴關系例如當對下圖中人臉特征點進行分類時,使用簡單的隨機森林方法,經(jīng)過判斷會將各個點進行標注, 可以看到
11、紅色的點,標注出的鼻子特征。如果利用依賴節(jié)點進行判斷,鼻子的點會被局限在其他鼻子特 征點的周圍,進行疊加后,得到了這個結果。顯然,對于此節(jié)點的判斷,利用結構輸出的方式,準確度 更高了。隨機森林總結大量的理論和實證研究都證明了 RF具有很高的預測準確率,對異常值和噪聲具有很好的容忍度,旦 不容易出現(xiàn)過擬合。可以說,RF是一種自然的非線性建模工具,是目前數(shù)據(jù)挖掘算法最熱門的前沿研究 領域之一。具體來說,它有以下優(yōu)點:通過對許多分類器進行組合,它可以產(chǎn)生高準確度的分類器;它可以處理大量的輸入變量;它可以在決定類別時,評估變量的重要性;在建造森林時,它可以在內部對于一般化后的誤差產(chǎn)生不偏差的估計;它包
12、含一個好方法可以估計遺失的資料,并且,如果有很大一部分的資料遺失,仍可以維持準確 度。它提供一個實驗方法,可以去偵測變量之間的相互作用;學習過程是很快速的:對異常值和噪聲具有很好的容忍度,且不容易出現(xiàn)過擬合;隨機森林的缺點:對于有不同級別的屬性的數(shù)據(jù),級別劃分較多的屬性會對隨機森林產(chǎn)生更大的影響,所以隨機森 林在這種數(shù)據(jù)上產(chǎn)出的屬性權值是不可信的;單棵決策樹的預測效果很差:由于隨機選擇屬性,使得單棵決策樹的預測效果很差。參考文獻:Shotton, J., Fitzgibbon, A., Cook, M.; Shaip, T, Finocchio, Moore, R., Kipman, A.,
13、Blake, A., 11 Real-time human pose recognition in parts from single depth images,Computer Vision and Pattern Recognition (CVPR), 2011 IEEE Conference on , vol., no , pp. 1297,1304, 20-25 June 2011Dantone M, Gall J, Fanelli G, et al. Real-time facial feature detection using conditional regression forestsC/Comput
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年湖北客運從業(yè)資格證能開什么車
- 2024年度智能制造LED指示燈采購合同
- 2024年建筑外墻亮化工程勞務合同
- 人教部編版六年級語文上冊《語文園地三》精美課件
- 習作我和-過一天說課稿
- 道路信號燈維護服務方案
- 六年級勞動教育《做蛋糕》備課說課稿
- 2024年式精裝倉庫租賃合同范本
- 2024年建筑項目維護保養(yǎng)合同
- 2024年度八寶山殯儀館鮮花制品采購合同的簽署與生效合同
- 消防安全培訓內容
- 2024-2030年辣椒種植行業(yè)市場深度分析及發(fā)展策略研究報告
- 變電站綠化維護施工方案
- 校園展美 課件 2024-2025學年人美版(2024)初中美術七年級上冊
- 2024版《糖尿病健康宣教》課件
- ktv保安管理制度及崗位職責(共5篇)
- 腦出血試題完整版本
- 義務教育信息科技課程標準(2022年版)考試題庫及答案
- 建筑施工安全生產(chǎn)責任書
- 新員工三級安全教育考試試題參考答案
- 公司年會策劃及執(zhí)行服務合同
評論
0/150
提交評論