

免費(fèi)預(yù)覽已結(jié)束,剩余66頁可下載查看
下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
畢業(yè)設(shè)計(jì)(論文)題目:基于膚色分割和匹配的人臉識別算法研究 系 別 信息工程系專業(yè)名稱 通信工程班級學(xué)號 098204233學(xué)生姓名 張翀指導(dǎo)教師 李忠民二O一三年五月 南昌航空大學(xué)科技學(xué)院學(xué)士學(xué)位論文 畢業(yè)設(shè)計(jì)(論文)任務(wù)書I、畢業(yè)設(shè)計(jì)(論文)題目:基于膚色分割和匹配的人臉識別算法研究II、畢 業(yè)設(shè)計(jì)(論文)使用的原始資料(數(shù)據(jù))及設(shè)計(jì)技術(shù)要求:為了把人臉區(qū)域從非人臉區(qū)域分割出來,需要使用適合不同膚色和不同光照條件的可靠膚色模型?;谀w色分割和匹配的人臉識別算法研究主要運(yùn)用Matlab軟件編程實(shí)現(xiàn)對人臉圖像進(jìn)行圖像轉(zhuǎn)換、消除噪聲、填孔處理、圖像重構(gòu)和邊緣檢測,從而實(shí)現(xiàn)基于膚色分割和匹配的人臉識別算法。具體要求如下:1、基于膚色分割和匹配的人臉識別的一般過程;2、采用Matlab實(shí)現(xiàn)圖像轉(zhuǎn)換、消除噪聲、填孔處理、圖像重構(gòu)和邊緣檢測等相關(guān)算法;3、比較各種算法的處理效果; 4、采用Matlab實(shí)現(xiàn)基于膚色分割和匹配的人臉識別算法;5、翻譯一篇相關(guān)的英文資料。III、畢 業(yè)設(shè)計(jì)(論文)工作內(nèi)容及完成時間: 第0103周:資料查找、方案論證、英文資料翻譯、開題報(bào)告撰寫; 第0411周:基于膚色分割和匹配的人臉識別算法設(shè)計(jì);編寫程序、仿真測試; 第1215周:對比測試; 第1618周:畢業(yè)論文撰寫,答辯。 、主 要參考資料:1. 美恩格爾 W K. Digital Signal Processing Using MATLAB M. 西安:西安交通大學(xué)出版社,20022. 美 Nakamura S. Numerical Analysis and Graphic Visualization with MATLAB(Second Edition) M.北京:電子工業(yè)出版社,20023. 美岡薩雷斯. 數(shù)字圖像處理(MATLAB版)M. 北京:電子工業(yè)出版社,20054. 美岡薩雷斯. 數(shù)字圖像處理(第二版)M. 北京:電子工業(yè)出版社,200720075. 張化光,劉鑫蕊,孫秋野.MATLAB/SIMULINK實(shí)用教程M.北京:人民郵電出版社,20116. 劉文達(dá),胡榮強(qiáng). 基于膚色和模板匹配模型的人臉識別新方法研究J. 信息科技,2008:144-1457. 謝毓湘,王衛(wèi)威,欒悉道等. 基于膚色與模板匹配的人臉識別J. 計(jì)算機(jī)工程與科學(xué),2008,30(6): 54-56,69 信息工程 系 電子信息工程 專業(yè)類 0982042 班學(xué)生(簽名): 填寫日期: 2013 年 1 月 10 日指導(dǎo)教師(簽名): 助理指導(dǎo)教師(并指出所負(fù)責(zé)的部分):電子信息工程 系主任(簽名): 學(xué)士學(xué)位論文原創(chuàng)性聲明本人聲明,所呈交的論文是本人在導(dǎo)師的指導(dǎo)下獨(dú)立完成的研究成果。除了文中特別加以標(biāo)注引用的內(nèi)容外,本論文不包含法律意義上已屬于他人的任何形式的研究成果,也不包含本人已用于其他學(xué)位申請的論文或成果。對本文的研究作出重要貢獻(xiàn)的個人和集體,均已在文中以明確方式表明。本人完全意識到本聲明的法律后果由本人承擔(dān)。作者簽名: 日期:學(xué)位論文版權(quán)使用授權(quán)書本學(xué)位論文作者完全了解學(xué)校有關(guān)保留、使用學(xué)位論文的規(guī)定,同意學(xué)校保留并向國家有關(guān)部門或機(jī)構(gòu)送交論文的復(fù)印件和電子版,允許論文被查閱和借閱。本人授權(quán)南昌航空大學(xué)科技學(xué)院可以將本論文的全部或部分內(nèi)容編入有關(guān)數(shù)據(jù)庫進(jìn)行檢索,可以采用影印、縮印或掃描等復(fù)制手段保存和匯編本學(xué)位論文。 作者簽名: 日期:導(dǎo)師簽名: 日期:基于膚色分割和匹配的人臉識別算法研究 學(xué)生姓名:張翀 班級:0982042 指導(dǎo)老師:李忠民摘要:人臉識別技術(shù)是生物特征識別技術(shù)中應(yīng)用最廣的一項(xiàng)技術(shù),也是計(jì)算機(jī)視覺和模式識別領(lǐng)域研究得最多的一個課題。隨著科技的發(fā)展,傳統(tǒng)的身份驗(yàn)證已很難適應(yīng)人們的需求。基于虹膜和指紋的生物特征驗(yàn)證對采集條件要求高,很難大范圍推廣。同其他生物特征識別技術(shù)相比(比如虹膜、指紋),人臉識別技術(shù)具有操作簡單、結(jié)果直觀、隱蔽性好的優(yōu)越性。因此,人臉識別技術(shù)在信息安全、刑事偵破、公共事業(yè)等領(lǐng)域具有廣泛的應(yīng)用前景。人臉識別技術(shù)就是通過計(jì)算機(jī)提取人臉的特征,并根據(jù)這些特征進(jìn)行身份驗(yàn)證的一種技術(shù)。它涉及模式識別、圖像處理、計(jì)算機(jī)視覺、生理學(xué)、心理學(xué)等諸多學(xué)科的知識,是當(dāng)前研究的熱點(diǎn)之一。本文提出了一種基于膚色與模板匹配的人臉識別算法。 本文首先利用顏色空間特性,對人臉膚色的聚類特性進(jìn)行了研究,基于不同的顏色空間膚色聚類結(jié)果的對比,本文選擇 YCbCr 顏色模型來進(jìn)行膚色分割。依據(jù)人的膚色信息,在 YCbCr 空間進(jìn)行膚色映射生成二值圖像,然后根據(jù)人臉的形狀特征確定人臉?biāo)谖恢?。并對灰度圖象進(jìn)行剪切提取,為后續(xù)識別做好準(zhǔn)備。 其次,文章研究了濾波器,填空處理,圖像重構(gòu)和邊緣檢測從而實(shí)現(xiàn)基于膚色分割和匹配的人臉識別算法。關(guān)鍵詞:人臉識別,膚色分割,模板匹配 指導(dǎo)老師簽名:IResearch on face recognition algorithm based on skin color segmentation and matching Student name : Zhang Chong Class: 0982042 Supervisor : Li ZhongminAbstract:Face recognition is one of the most widely used Technologies in the field of biometrics recognition, and it is The famous topic in computer vision and pattern recognition. The biologic characteristic based identity recognition such as iris and dactylogram needs very strict information collection conditions, which makes it difficult to be used practically. Compared to other biometrics(such as iris, fingerprint), face recognition technique is simpler, more intuitive, and having more hidden capability. Therefore, face recognition have great potential in a wide range of applications in information security, criminal investigation, public utilities and other fields. The face recognition is a technique that extracts visual features, and distinguishes one face from another based on these features. It is a research area spanning several disciplines such as image processing, pattern recognition, computer vision, physiology and psychology. Now it is one of the key issues. This paper presents an algorithm for face recognition using skin color and template matching. First, we studied the clustering characteristics of face skin color under some color spaces, and then we choose one of them namely YCbCr among the models for skin segmentation. By the study, get a face based on the skin color and the shape feature. Then pick-up the face areas from the gray image, prepare for face recognition. This paper also researches the filter, fill in the blank processing, image reconstruction and edge detection so as to realize the face recognition algorithm based on skin color segmentation and matching. Keywords:face recognition skin color segmentation template matching Signature of Supervisor: II 目 錄 1 緒論1.1研究背景與意義.11.2國內(nèi)外研究現(xiàn)狀.21.2.1人臉識別的發(fā)展過程.21.2.2目前的主流識別方法.21.2.3尚待解決的問題.41.3本文的研究重點(diǎn)及內(nèi)容安排.4 2 算法理論與實(shí)現(xiàn)原理2.1常見色彩空間比較.62.1.1 RGB空間.7 2.1.2 HSI空間.82.1.3 CMY/CMYK彩色空間.10 2.1.4 YIQ色彩空間.12 2.1.5 YUV彩色空間.122.1.6 YCbCr色彩空間.13 2.2膚色分割理論.13 2.3常見膚色模型比較.142.3.1 區(qū)域模型.142.3.2 簡單高斯模型.142.3.3 混合高斯模型.142.3.4 直方圖模型.152.3.5 YCbCr 空間膚色模型.15 3 系統(tǒng)設(shè)計(jì) 3.1系統(tǒng)流程.173.2基于膚色的人臉檢測算法.173.2.1膚色建模.183.2.2膚色模型在人臉檢測的后期驗(yàn)證中的應(yīng)用.193.3數(shù)學(xué)形態(tài)學(xué)操作.193.4系統(tǒng)的概要設(shè)計(jì).213.5具體算法設(shè)計(jì).233.5.1相似度計(jì)算.233.5.2二值化算法.243.5.3灰度均衡.243.6建立YCbCr膚色模型.253.7膚色分割步驟.263.8圖象的邊緣檢測和銳化處理.273.9人臉檢測.29 4 基于MATLAB的實(shí)現(xiàn)步驟及分析4.1將RGB空間轉(zhuǎn)換為YCbCr空間.314.2將彩色圖像轉(zhuǎn)換為灰度圖像.314.3消除噪聲.324.4對圖像做填孔處理.334.5圖像重構(gòu).344.6相關(guān)匹配.354.7斷開連接處理.364.8設(shè)計(jì)模板.374.9邊緣檢測.394.10系統(tǒng)GUI設(shè)計(jì).414.10.1導(dǎo)入圖像文件及處理.41 5 總結(jié)與展望5.1總結(jié).435.2展望.43參考文獻(xiàn).44致 謝.46附 錄.47 1 緒論1.1研究背景與意義 人臉識別技術(shù)是一種生物識別技術(shù)。生物識別技術(shù),就是指通過獲取和分析人的身體或行為特征來實(shí)現(xiàn)身份的自動鑒別或驗(yàn)證,這些特征包括先天遺傳的生理特征,如指紋、虹膜等,也包括后天習(xí)慣形成的行為特征,如手寫簽名、步態(tài)等。人臉識別技術(shù),就是通過計(jì)算機(jī)獲取人臉的特征,然后根據(jù)這些特征進(jìn)行身份識別或驗(yàn)證的一種技術(shù)。人臉識別技術(shù)涉及到圖像處理技術(shù)、計(jì)算機(jī)視覺技術(shù)、模式識別技術(shù)等眾多領(lǐng)域。 相較與其它基于生物特征的識別方法,它具有它特有的優(yōu)勢。首先,人臉識別采用的是非接觸性采集,方法友好而方便,使用者不會有任何心理障礙,亦不會造成任何侵犯性,容易被人們所接受。其次,人臉識別的結(jié)果可以提供許多其它識別方法不能提供的信息,如性別、表情、年齡等,這一特點(diǎn)也大大地?cái)U(kuò)展了人臉識別的應(yīng)用前景。隨著計(jì)算機(jī)技術(shù)的飛速發(fā)展,人臉識別技術(shù)飛速發(fā)展也擴(kuò)散到了各個領(lǐng)域。如計(jì)算機(jī)安全、機(jī)器視覺、門禁系統(tǒng)、醫(yī)學(xué)診斷系統(tǒng)、智能監(jiān)控系統(tǒng)以及三維動畫等。其中最為常見的應(yīng)用有:(l)視頻監(jiān)控。在銀行、公園、停車場等許多公共場到處都裝有視頻監(jiān)控,當(dāng)有異常情況或有陌生人闖入時,需要實(shí)時跟蹤、監(jiān)控、識別和報(bào)警等。(2)證件驗(yàn)證。在海關(guān)、機(jī)場等場所,都需要檢驗(yàn)人的身份。一般身份證和護(hù)照上都會有持有人的照片,使用人臉識別,就可以由機(jī)器代替人來完成驗(yàn)證識別的工作,實(shí)現(xiàn)自動化的智能管理。(3)刑偵破案。通常情況下公安部門的系統(tǒng)里存儲有嫌疑犯的照片,當(dāng)通過作案現(xiàn)場或其他途徑獲得嫌疑犯的照片或其面部特征描述之后,可以從數(shù)據(jù)庫中迅速查找確認(rèn),大大提高刑偵破案的準(zhǔn)確性的效率。(4)入口控制。入口控制的范圍比較廣,包括樓宇、住宅等入口處的安全檢查,也包括了進(jìn)入計(jì)算機(jī)系統(tǒng)或情況系統(tǒng)前的身份驗(yàn)證等。(5)表情分析。人臉識別可以判斷出人臉圖像中的面部變化特征,識別和分析人的情感狀態(tài),如高興、生氣等。此外,人臉識別技術(shù)還在醫(yī)學(xué)、檔案管理、人臉動畫、人臉建模、視頻會議等方面有著巨大的應(yīng)用前景。 由此看出,計(jì)算機(jī)人臉識別技術(shù)的應(yīng)用將帶來顯著的社會效益和經(jīng)濟(jì)效益。因此,進(jìn)行計(jì)算機(jī)人臉識別方法和技術(shù)的研究對社會生活具有重大意義。1.2國內(nèi)外研究現(xiàn)狀1.2.1人臉識別的發(fā)展過程 人臉識別的研究已經(jīng)有很長的歷史,最早可以追溯到上個世紀(jì)法國人Galton的工作,但真正有發(fā)展還是近40年的事。1973年Kanade的工作起至今,大多數(shù)人臉識別研究工作的對象為正面或接近正面的人臉圖像。國內(nèi)外對于人臉識別的研究發(fā)展,技術(shù)趨勢分別經(jīng)歷了三個階段:傳統(tǒng)的人機(jī)交互式階段、機(jī)器自動識別初級階段、機(jī)器自動識別高級階段。第一階段是以Bertlioin為代表的傳統(tǒng)人機(jī)交互式階段,,主要研究人臉識別所需要的面部特征,該階段的識別依賴于人的操作。這些人臉識別方法都需要利用操作員的某些先驗(yàn)知識,仍然擺脫不了人的干預(yù)。第二階段主要是自動識別初級階段,其采用機(jī)器自動識別的手段進(jìn)行識別,20世紀(jì)90年代以來,隨著高速度高性能計(jì)算機(jī)的出現(xiàn),人臉識別方法有了重大突破,進(jìn)入了真正的機(jī)器自動識別階段,人臉識別研究也得到了前所未有的重視。國外有很多大學(xué)在此方面取得了很大進(jìn)展,他們研究涉及的領(lǐng)域很廣,其中有從感知和心理學(xué)角度探索人類識別人臉機(jī)理的,如美國TxeasDallas大學(xué)的Abdi和Toole小組,主要研究人類感知人臉的規(guī)律,如漫畫效應(yīng)、性別識別與人臉識別的關(guān)系、種族效應(yīng)等;由Srtilnig大學(xué)的Bruce教授和Glasgow大學(xué)的Burton教授合作領(lǐng)導(dǎo)的小組,主要是研究人類大腦在人臉認(rèn)知中的作用,并在此基礎(chǔ)上建立了人臉認(rèn)知的兩大功能模型,他們對熟悉和陌生人臉的識別規(guī)律以及圖像序列的人臉識別規(guī)律也進(jìn)行了研究。也有從視覺機(jī)理角度進(jìn)行研究的,如英國Aberdeen大學(xué)的Carw小組,主要研究人臉視覺表征方法,他們對空間頻率在人臉識別中的作用也進(jìn)行了分析;荷蘭Groningne大學(xué)的Pektov小組,主要研究人類視覺系統(tǒng)的神經(jīng)生理學(xué)機(jī)理并在此基礎(chǔ)上發(fā)展了并行模式識別方法。更多的學(xué)者則從事利用輸入圖像進(jìn)行計(jì)算機(jī)人臉識別的研究工作。國內(nèi)關(guān)于人臉識別的研究始于20世紀(jì)80年代,主要是在國際上流行方法基礎(chǔ)上作了發(fā)展性工作。中國科技大學(xué)楊光正等提出一種基于鑲嵌圖的人臉自動識別方法,清華大學(xué)張長水等對特征臉的方法做了進(jìn)一步發(fā)展,南京理工大學(xué)楊靜宇等主要是采用奇異值分解方法進(jìn)行人臉識別研究,上海交通大學(xué)李介谷等則專門研究了人臉斜視圖像的集合特征提取與恢復(fù),東南大學(xué)何振亞等,采用對稱主元分析神經(jīng)網(wǎng)絡(luò),用去冗余和權(quán)值正交相結(jié)合的方法對人臉進(jìn)行特征提取和識別,與此同時還有許多科研院校及科研機(jī)構(gòu)也進(jìn)行人臉識別的研究,并取得了一些成果。但相比之下,國內(nèi)對人臉識別的研究和重視程度很不夠,研究成果與國際還有一定的差距。第三階段是機(jī)器自動識別高級階段,真正利用機(jī)器進(jìn)行對人臉的自動識別。根據(jù)輸入圖像的性質(zhì),人臉識別方法分為靜止圖像的識別方法和圖像序列的識別方法兩大類。由于圖像序列的計(jì)算遠(yuǎn)比靜止圖像的計(jì)算復(fù)雜和耗時,靜止圖像的識別方法是人臉識別領(lǐng)域中主要的研究方向,研究成果也更為成熟,而基于圖像序列的人臉識別還處于起步階段。早期研究較多的兩種靜態(tài)人臉識別方法為:基于幾何特征的人臉識別方法和基于相關(guān)匹配的人臉識別方法。目前,靜止圖像的人臉識別方法主要有三個研究方向:一是基于統(tǒng)計(jì)的識別方法,包括特征臉(Eigenfaces)方法和隱馬爾可夫模型(Hidden Markov Mode)方法;二是基于連接機(jī)制的識別方法,包括一般的神經(jīng)網(wǎng)絡(luò)方法和彈性圖匹配(Elastic Graph Matching)方法;三是其他一些綜合方法或處理非二維灰度圖像的方法。圖像序列中的人臉識別是人臉識別領(lǐng)域中最富有挑戰(zhàn)性的課題,己經(jīng)吸引了越來越多的研究人員。圖像序列中利用整個跟蹤序列來識別人臉的關(guān)鍵是進(jìn)行運(yùn)動估計(jì)和人臉跟蹤。由于人臉跟蹤的重要性,目前它己經(jīng)逐漸發(fā)展成為一個獨(dú)立于人臉識別的研究領(lǐng)域,除了應(yīng)用于人臉識別外,它在視頻通信、人機(jī)交互以及唇讀等方面都有著廣泛的應(yīng)用。1.2.2目前的主流識別方法 在過去近40年的時間里,出現(xiàn)了許多人臉識別的方法。由于人臉識別的應(yīng)用領(lǐng)域廣而且實(shí)用性非常強(qiáng),許多知識背景不同的研究者都對這項(xiàng)技術(shù)做過相應(yīng)的工作,這些研究者來自諸如生物學(xué)、模式識別、神經(jīng)網(wǎng)絡(luò)、計(jì)算機(jī)視覺、計(jì)算機(jī)圖形學(xué)等領(lǐng)域,這種知識背景的差異也導(dǎo)致了不同類型的人臉識別方法。在眾多識別方法中,大部分可以歸納成三大類別:基于統(tǒng)計(jì)的方法,基于特征結(jié)構(gòu)的方法以及混合方法。 (l)基于統(tǒng)計(jì)的方法。這一類別方法的特點(diǎn)是使用整個面部圖像作為識別系統(tǒng)的輸入。其中,基于主成分分析的方法占絕大多數(shù),如Craw和Cammeron、Kirby和Sirovich、Turk和Pentland提出的基于特征臉的工作,Moghaddam和Pentland基于概率特征臉的工作,Belhumeur、Swets和weng、zhao基于Fisher臉和LDA子空間的工作,Phillips基于支撐向量機(jī)(SVM)的工作,Liu和Wechsler基于演化跟蹤的工作,Li和Lu基于特征線方法的工作,Bartllett基于ICA的工作等。除了這些基于主成分分析理論的工作外,還有部分基于LDA/FLD和PDBNN(Probabilistic decision based NN)的識別方法。 (2)基于特征的方法。也叫基于結(jié)構(gòu)的方法,在這類方法中,輸入的數(shù)據(jù)不是整張臉部,而是一些局部特征,如眼睛、鼻子、嘴等局部的位置或其它統(tǒng)計(jì)量。其中比較有代表性的工作有Kanade和Kelly等基于幾何的方法,Okada和Wiskott等基于動態(tài)鏈接體系的方法,Nefian等基于隱式馬爾科夫的方法,Lawrence基于神經(jīng)網(wǎng)絡(luò)的方法等。 (3)混合方法?;旌戏椒ㄊ且环N將基于統(tǒng)計(jì)和基于特征的方法同時使用的方法,這一特點(diǎn)和人類的識別過程非常相似,有時我們可能通過人臉圖像的某個部分來辨識對象,有時又通過整體圖像來識別。具有代表性的工作有Pentland等提出的模態(tài)特征臉方法,Penev等提出的混合局部特征方法(HLFA),Lanitis等基于形狀正則化的方法,Huang等基于臉部成分的方法等。 目前,這些方法都在各種人臉識別場合發(fā)揮著非常重要的作用,并且還不斷的有新的方法出現(xiàn)。1.2.3尚待解決的問題雖然人臉識別擁有著其他生物特征識別技術(shù)無法比擬的優(yōu)點(diǎn),但人臉識別技術(shù)中還存在以下諸多需要完善的地方:人臉識別的復(fù)雜性使得單獨(dú)使用一種現(xiàn)有的方法不可能取得很好的識別效果,利用先驗(yàn)知識,多種方法綜合使用是今后研究的必然趨勢;不同人臉描述方式有不同特點(diǎn),多特征融合方法也是改善識別性能的一個手段;在一些高級信息安全的應(yīng)用中,需要研究人臉與指紋、虹膜、語音等識別技術(shù)的融合方法,如何與基于其他生物特征的鑒別系統(tǒng)結(jié)合也是一個有意義的研究方向;三維圖像比二維圖像更能提供完整而真實(shí)的內(nèi)容,如何對三維人臉參數(shù)進(jìn)行建模和有效利用三維信息進(jìn)行識別,將是今后一個具有挑戰(zhàn)性的研究課題。1.3本文的研究重點(diǎn)及內(nèi)容安排本文主要探討了基于matlab的在彩色圖像皮膚區(qū)域中,采用分割算法以膚色作為人臉檢測核心的一種新方法和新思路。人臉檢測系統(tǒng)要求實(shí)現(xiàn)對輸入的可能包含人臉的圖像進(jìn)行處理,并輸出圖像中是否存在人臉以及人臉的數(shù)目、位置、尺度、位姿等參數(shù)信息。傳統(tǒng)的人臉檢測方法大多是在亮度空間內(nèi)進(jìn)行,利用灰度的變化做多尺度空間的全搜索,計(jì)算量非常大、效率極低,而在人臉區(qū)域中,膚色一定是占主導(dǎo)地位的像素色彩值,雖然膚色因人而異,但經(jīng)過研究可以發(fā)現(xiàn)膚色在色彩空間中的一定范圍內(nèi)是呈聚類特性的,特別是在排除了光照亮度和在經(jīng)過變換的色彩空間中,利用膚色這一特征可以排除掉在灰度圖像中的非皮膚區(qū)域,這對人臉檢測起到了積極的作用。 本文共分為五章,其內(nèi)容如下: 第一章是緒論,闡述了本文的研究背景和意義、國內(nèi)外人臉研究概況及發(fā)展趨勢。介紹了常用的人臉識別方法以及本文的主要工作和章節(jié)安排。 第二章是算法理論與實(shí)現(xiàn)原理,介紹了膚色分割和分類識別的各種算法及其原理。 第三章是系統(tǒng)設(shè)計(jì),對基于Matlab的膚色分割和匹配的人臉識別方法的算法原理和分析過程進(jìn)行了詳細(xì)的描述以及系統(tǒng)設(shè)計(jì)。 第四章根據(jù)第二章中描述的膚色分割原理和第三章中詳細(xì)分析的人臉識別方法,構(gòu)建了本文的人臉識別系統(tǒng),對系統(tǒng)的框架用基于Matlab的實(shí)現(xiàn)步驟進(jìn)行了描述。 第五章是本文工作的總結(jié)及對未來工作的展望。 2 算法理論與實(shí)現(xiàn)原理2.1常見色彩空間比較 談到使用顏色檢測,就不得不從色彩空間說起,不同的色彩空間對于人臉檢測的結(jié)果有直接的影響,這是因?yàn)椴煌膽?yīng)用場合和不同的物體需要使用不同的色彩空間進(jìn)行檢測。色彩空間,通俗一點(diǎn)講,就是各種色彩的集合,色彩的種類越多,色彩空間越大,能夠表現(xiàn)的色彩范圍即色域越廣。色彩空間也稱為色彩系統(tǒng)或色彩模式,建立色彩空間的主要目的是提供一個可接受的指定色彩標(biāo)準(zhǔn)。對于有關(guān)彩色視覺系統(tǒng)的設(shè)計(jì)開發(fā)而言,研究顏色是相當(dāng)重要的。圖像中的顏色不僅給我們的感覺更愉悅,而且能獲得更多的視覺信息。人的視覺對彩色相當(dāng)敏感。人眼一般能區(qū)分的灰度等級只有二十多個,但是能區(qū)分有不同亮度、色度和飽和度的幾千種顏色??梢圆煊X的顏色屬性包括亮度、色度和飽和度。亮度反映了能察覺的明視度(luminance);色度指紅色、綠色等顏色,對單色光源而言,色度的不同以波長的不同顯示;飽和度是可以察覺的白色光加入單色光的比。在數(shù)字圖像中利用彩色信息可以提高圖像的可鑒別性,使圖像細(xì)節(jié)更容易辨認(rèn),目標(biāo)更容易識別。在進(jìn)行數(shù)字圖像處理時,人們并不是對所有顏色一一處理,而是根據(jù)色度學(xué)理論建立顏色模型,基于顏色模型進(jìn)行處理。色度學(xué)理論認(rèn)為,任何顏色都可以由紅(R)、綠(G)、藍(lán)(B)三種基本顏色按不同比例混合得到。根據(jù)計(jì)算機(jī)色彩理論,對每一種顏色而言,在計(jì)算機(jī)中有不同的表達(dá)方式,這樣就形成了各種不同的色彩系統(tǒng),即色彩空間。當(dāng)然,各種色彩空間只不過是顏色在計(jì)算機(jī)內(nèi)不同的表達(dá)而已,每一種色彩空間都有各自的產(chǎn)生背景、應(yīng)用領(lǐng)域等。主要的色彩空間有 RGB、HSI、CMY/CMYK、YIQ、YUV、YCbCr 等。其中,RGB 色彩空間是最基本的色彩空間,其他的色彩空間都是基于該色彩空間的,只是用途各異。它們與 RGB 色彩空間可以按一定的關(guān)系進(jìn)行轉(zhuǎn)換。下面介紹這幾種色彩空間。2.1.1 RGB空間 當(dāng)人們想到彩色時,通常是指紅、綠和藍(lán)即三基色,按適當(dāng)比例將這三類基色混合起來就可以獲得任何其它彩色。待電腦中顯示的圖像色彩通常需要轉(zhuǎn)化成 RGB 模式。其中三種顏色,有的顏色含有紅色多一點(diǎn),其它成分少一點(diǎn)。針對含有紅色成分的多少,可以人為地分成 0 到 255 共 256 個等級,0 級表示不含紅色成分,255 表示含有 100%的紅色,同樣綠色和藍(lán)色也可以被劃分成 256 級。這樣紅、綠、藍(lán)各種不同的組合就可以表示出 256 256256(約 1600 萬)種顏色。這是最常用的顏色空間。 RGB 顏色模型基于笛卡兒坐標(biāo)系統(tǒng),三個坐標(biāo)軸分別為 R、G、B,模型通常采用如圖 2.1 所示的單位立方體表示。紅、綠、藍(lán)三基色的坐標(biāo)分別為(1,0,0)、(0,1,0)、(0,0,1),原點(diǎn)(0,0,0)對應(yīng)黑色,離原點(diǎn)最遠(yuǎn)的點(diǎn)(1,1,1)對應(yīng)白色。在這個模型中,從黑到白的灰度值分布在從原點(diǎn)到離原點(diǎn)最遠(yuǎn)的頂點(diǎn)間的連線上,而立方體內(nèi)其余各點(diǎn)對應(yīng)不同的顏色,可用從原點(diǎn)到該點(diǎn)的矢量(r,g,b)表示。其中 (2.1) 圖 2.1 RGB 彩色立方體 RGB 彩色空間是對人眼的光譜量化性質(zhì)的近似,因此利用 R、G、B 三分量表征顏色是很自然的一種格式,而且現(xiàn)有彩色圖像采集設(shè)備都是以 CCD 技術(shù)為核心,直接感知 RGB 三分量,這使得 RGB 彩色空間成為各種圖像采集和處理的基礎(chǔ)。其它彩色空間一般都以 RGB 彩色空間為基礎(chǔ),是 RGB 彩色空間的線性或非線性函數(shù)。但是 RGB 色彩空間不直觀,而且是人眼感知上非常不均勻的色彩空間,周圍環(huán)境的光照變化很容易引起 RGB 值的變化。2.1.2 HSI空間 HSI 色度空間是孟塞爾彩色空間的簡化形式,是以彩色的色調(diào)(hue)、飽和度(saturation)、亮度(intensity)為三要素來表示的。它同人對色彩的感知相一致,是適合人的視覺特性的色彩空間。線形色彩表示系統(tǒng)如 RGB 色彩空間,其三個色彩分量沒有很好的和人對色彩判斷的因素相聯(lián)系,冗余信息多,對三個分量分別處理將會帶來顏色信息的丟失和錯亂,將 RGB 空間轉(zhuǎn)換為 HIS 空間后,它將亮度(I)與反映色彩本質(zhì)特性的兩個參數(shù)色調(diào)(H)和飽和度(S)分開。在提取一類物體在色彩方面的特性時,經(jīng)常需要了解其在某一色彩空間的聚類特性,而這一聚類特性往往體現(xiàn)在色彩的本質(zhì)特性上,而又經(jīng)常受到光照明暗等條件的干擾影響。光照明暗給物體顏色帶來的直接影響就是亮度分量(I),所以若能將亮度分量從色彩中提取出去,而只用反映色彩本質(zhì)特性的色度、飽和度來警醒聚類分析,會獲得比較好的效果。這也正是 HIS 格式在彩色圖像處理和計(jì)算機(jī)視覺的研究中經(jīng)常被使用的原因。 HSI 顏色模型和理想雙錐體模型(圖 2.2)吻合。I 軸和亮度軸線重合,以亮度值最低的黑點(diǎn)表示原點(diǎn),若 I 經(jīng)過歸一化處理后(I)的值域?yàn)?0-1,0 表示亮度最低的黑點(diǎn),1 表示亮度最高的白點(diǎn);一個顏色樣本的特征矢量在垂直于 I 的平面上的投影線的長度,表示顏色樣本的飽和度 S,取值為0-1;投影與水平方向的夾角為樣本的色調(diào) H,H 的取值范圍為 0-360。 圖 2.2 HSI 顏色模型 HSI 顏色模型中的 I 分量與圖像的彩色信息無關(guān),與顏色信息相關(guān)的 H、S 分量不隨光照條件的變化而變化,因此非常適合視覺系統(tǒng)感知彩色特性的圖像處理算法。RGB 空間向 HIS 空間映射的關(guān)系如下: (2.2)其中 或者 (2.3) (2.4) (2.5) (2.6)2.1.3 CMY/CMYK 彩色空間彩色印刷或彩色打印的紙張是不能發(fā)射光線的,因而印刷機(jī)或彩色打印機(jī)就只能使用一些能夠吸收特定的光波而反射其它光波的油墨或顏料。油墨或顏料的三基色是青(Cyan)、品紅(Magenta)和黃(Yellow),簡稱 CMY。青色對應(yīng)藍(lán)綠色,品紅對應(yīng)紫紅色。理論上說,任何一種由顏料表現(xiàn)的色彩都可以用這三種基色按不同的比例混合而成,這種顏色表示方法稱 CMY 色彩空間表示法。顏色打印機(jī)和彩色印刷系統(tǒng)都采用 CMY 色彩空間。 由 CMY 混合的色彩又稱為相減混色,因?yàn)?CMY 空間正好與 RGB 空間互補(bǔ),即用白色減去 RGB空間中的某一色彩值就等于 i 同樣色彩在 CMY 空間中的值。RGB 到 CMY 的變換如下: (2.7)根據(jù)這個原理,很容易把 RGB 空間轉(zhuǎn)換成 CMY 空間。由于彩色墨水和顏料的化學(xué)特性,用等量的 CMY 三基色得到的黑色不是真正的黑色,因此在印刷術(shù)中 常加一種真正的黑色(black ink),所以CMY 又寫成 CMYK,即 (2.8) (2.9)實(shí)際應(yīng)用中,一幅圖像在計(jì)算機(jī)中用 RGB 空間顯示;用 RGB 或 HSI 空間編輯處理;打印輸出時要轉(zhuǎn)換成 CMY 空間;如果要印刷,則要轉(zhuǎn)換成 CMYK 四幅印刷分色圖,用于套印彩色印刷品。2.1.4 YIQ色彩空間YIQ 色彩空間通常被北美的電視系統(tǒng)所采用,屬于 NTSC(National Television Standards Committee)系統(tǒng)。這里 Y 不是指黃色,而是指顏色的明視度( Luminance),即亮度(Brightness)。其實(shí) Y 就是圖像的灰度值(Gray value),而 I 和 Q 則是指色調(diào)(Chrominance),即描述圖像色彩及飽和度的屬性。在YIQ 系統(tǒng)中,Y 分量代表圖像的亮度信息,I、Q 兩個分量則攜帶顏色信息,I 分量代表從橙色到青色的顏色變化,而 Q 分量則代表從紫色到黃綠色的顏色變化。將彩色圖像從 RGB 轉(zhuǎn)換到 YIQ 色彩空間,可以把彩色圖像中的亮度信息與色度信息分開,分別獨(dú)立進(jìn)行處理。YIQ 與 RGB 之間的對應(yīng)關(guān)系如式2.10,式 2.11 所示。 (2.10) (2.11)2.1.5 YUV 彩色空間該彩色空間是數(shù)字視頻和壓縮編碼中最常用的格式,直接對 U、V 分量進(jìn)行處理,可以節(jié)省彩色空間轉(zhuǎn)換的計(jì)算。RGB到Y(jié)UV的變化如下: (2.12)在現(xiàn)代彩色電視系統(tǒng)中,通常采用三管彩色攝像機(jī)或彩色 CCD(點(diǎn)耦合器件)攝像機(jī),它把攝得的彩色圖像信號,經(jīng)分色,分別放大校正得到 RGB,再經(jīng)過矩陣變換電路得到亮度信號 Y 和兩個色差信號 R-Y、B-Y,最后發(fā)送端將亮度和色差三個信號分別進(jìn)行編碼,用同一信道發(fā)送出去,這就是我們常用的 YUV 色彩空間。采用 YUV 色彩空間的重要性是它的亮度信號 Y 和色度信號 U、V 是分離的。如果只有 Y 信號分量而沒有 U、V 分量,那么這樣表示的圖像就是黑白灰度圖。彩色電視采用 YUV 空間正式為了用亮度信號 Y 解決彩色電視機(jī)與黑白電視機(jī)的兼容問題,使黑白電視機(jī)也能接收彩色信號。2.1.6 YCbCr 色彩空間YCbCr 由 YUV 色彩系統(tǒng)衍生而來,在這種格式中,亮度信息用單個分量 Y 來表示,彩色信息用兩個色差分量 Cb 和 Cr 來存儲。分量 Cb 是藍(lán)色分量和一個參考值的差,分量 Cr 是紅色分量和一個參考值的差。該空間常用于彩色圖像的壓縮和傳輸,JPEG 格式的圖片采用的色彩系統(tǒng)就是該系統(tǒng)。RGB 空間和 YCbCr 空間的轉(zhuǎn)換關(guān)系如下式: (2.13)YCbCr 色彩空間具有以下一些優(yōu)點(diǎn):(1)具有與人類視覺感知過程相類似的構(gòu)成原理。(2)YCbCr 色彩空間格式廣泛地應(yīng)用在電視顯示等領(lǐng)域中,也是許多視頻編碼,如 MPEG、JPEG等標(biāo)準(zhǔn)中普遍采用的顏色表示格式。(3)YCbCr 色彩空間格式具有與 HIS 等其它一些色彩空間格式相類似的將色彩重的亮度分量分離出來的優(yōu)點(diǎn)(4)YCbCr 色彩空間格式的計(jì)算過程和空間坐標(biāo)表示形式相比 HIS 等簡單。2.2膚色分割理論膚色特征主要由膚色模型進(jìn)行描述,而膚色模型的選取與色度空間(chrominance space)的選擇密切相關(guān)。人臉檢測常用的色度空間主要RGB(紅、綠、藍(lán)三基色)、rgb(亮度歸一化的三基色)、HSI(色調(diào)、飽和度、亮度)、YIQ(NTSC制的光亮度和色度模型)、YUV(PAL制的光亮度和色度模型)、YCbCr(CCIR601)編碼方式的色度模型、CIEL(國際照明委員會提出的基于色度學(xué)的彩色模型)等。另外,用膚色模型對膚色進(jìn)行分割分為兩個階段:模型建立與模型運(yùn)用。模型的建立主要是通過對大量膚色像素集進(jìn)行統(tǒng)計(jì)分析,然后確定模型中的參數(shù);對于模型的運(yùn)用,主要是通過已建立的膚色模型來判別所輸入的像素或區(qū)域是否為膚色,或者給出其與膚色的相似程度。不論在什么樣的色彩空間中,膚色模型大體上分為四種:區(qū)域模型或IF-THEN模型、簡單高斯模型、混合高斯模型和直方圖模型。2.3常見膚色模型比較2.3.1 區(qū)域模型該模型又稱IF-THEN模型、簡單門限模型,它主要是利用了膚色在色彩空間的聚類性(即取值范圍),將一塊滿足一定條件的區(qū)域標(biāo)定為膚色區(qū)域。采用這個模型來判別膚色需要分兩步走:首先通過統(tǒng)計(jì)的方法確定模型(即歸屬于膚色的具體范圍);其次利用這個模型來判別新的像素或區(qū)域是否為膚色。因此,對于一幅新的圖像,如果某個像素或區(qū)域滿足給定的條件就為膚色,否則就是非膚色。從上面的判斷過程來看,它是一種較簡單的膚色模型。該模型的困難之處在于如何確定閾值。閾值選擇不當(dāng)可能會使膚色檢測率下降,誤檢率上升。此方法計(jì)算簡單,使用方便,速度快,但是效果不是很好,只適用于特定條件下的膚色檢測。2.3.2 簡單高斯模型這種方法是假設(shè)膚色分布服從單峰高斯分布。它主要通過統(tǒng)計(jì)分析,預(yù)測高斯分布的參數(shù),其中參數(shù)確定常用的方法有EM算法,Maximum-Likelihood或
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 中國建筑裝飾設(shè)計(jì)項(xiàng)目創(chuàng)業(yè)計(jì)劃書
- 中國肌肉刺激器項(xiàng)目創(chuàng)業(yè)計(jì)劃書
- 中國BOSS系統(tǒng)項(xiàng)目創(chuàng)業(yè)計(jì)劃書
- 中國掛面制造項(xiàng)目創(chuàng)業(yè)計(jì)劃書
- 2025版簡易服務(wù)合同范本
- 中國AFC自動售票檢票系統(tǒng)項(xiàng)目創(chuàng)業(yè)計(jì)劃書
- 高壓力縮比進(jìn)氣道優(yōu)化設(shè)計(jì)方法-洞察闡釋
- 安全教考試試題及答案
- 社區(qū)農(nóng)田建設(shè)合作合同書
- 知識產(chǎn)權(quán)保護(hù)意識-洞察闡釋
- 北京市海淀清華附中2024屆高二數(shù)學(xué)第二學(xué)期期末達(dá)標(biāo)檢測試題含解析
- 《城市道路與交通》課件
- 高處作業(yè)吊籃危險(xiǎn)源辨識及風(fēng)險(xiǎn)評價(jià)表
- 反對本本主義的背景內(nèi)容及其意義課件
- 火電廠危險(xiǎn)化學(xué)品安全管理課件
- 《中國近現(xiàn)代史綱要(2023版)》課后習(xí)題答案合集匯編
- 常用應(yīng)用文寫作格式
- (國衛(wèi)版)老年人能力評估
- 國開2023秋《人文英語3》第1-4單元作文練習(xí)參考答案
- (完整版)雨水收集系統(tǒng)施工方案
- 電磁場與電磁波智慧樹知到課后章節(jié)答案2023年下同濟(jì)大學(xué)
評論
0/150
提交評論