




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領
文檔簡介
基于膚色相似度的人臉檢測與定位摘要本課題致力于完成VisualC++6.0平臺下的人臉檢測與定位系統(tǒng),人臉檢測定位的算法限制于基于膚色相似度算法。要完成的工作包括相似度的計算,圖像的二值化,垂直直方圖和水平直方圖的獲取,人臉特征〔眼睛、嘴和鼻子〕的提取。本課題著重于膚色模型相似度在人臉檢測與定位中的應用,對增加人臉檢測與定位的準確率的研究有一定的指導意義。提出一種基于膚色的人臉檢測定位算法,設計了基于膚色的人臉檢測和定位系統(tǒng)。采用了臉部皮膚之間相似度的方法以及二值化方法,使用了基于邊界方法和基于區(qū)域方法相結(jié)合的算法,提取了眼睛、嘴和鼻子等關鍵特征,最終較好地實現(xiàn)了人臉定位。在MicrosoftWindows平臺上,利用VisualC++6.0開發(fā)了軟件。本課題的成果具有一定的應用價值。實驗結(jié)果說明,該軟件對于一定尺寸范圍內(nèi)清晰的正面人臉圖能夠正確檢測定位并提取特征,并且在速度和準確性方面具有良好的性能。關鍵詞:圖像分割;人臉定位;膚色;人臉檢測;特征提取DetectionandLocalizationofPersonFaceBasedonSkinColorSimilarityAbstractThistopicdevotestocompletingthedetectionandlocalizationsystemofthepersonfaceundertheVisualC++6.0platforms,andthedetectionlocalizationalgorithmofthepersonfacelimittobasingontheskincolorsimilarityalgorithm.Thetopicmustcompletesimilaritycomputation,binaryimageprocessing,verticalhistogram,horizontalhistogramandextractingpersonfacecharacteristic(eye,mouthandnose).Thistopicemphasizeapplicationofskincolormodelsimilarityinthedetectionandthelocalizationofpersonface,andhasasignificantinstructionforresearchofincreasingaccuracyindetectionandthelocalizationofpersonface.Inthispaper,theauthorshavepresentedanalgorithmanddesignedasystemforfacedetectionandlocationbasedoncomplexion.Bystrengtheningthecontrastbetweenfacefeaturesandbyadoptingbinaryimageprocessingmethod,thesystemhasimprovedthepreprocessingeffect;andbyusingboundary-basedalgorithmplusregion-basedalgorithm,thesystemhasrealizedfacelocationthroughtheextractionofthefeaturesofeyes,noseandmouth.TakingadvantagesofVisualC++6.0,theauthorshavealsodevelopedcorrespondingsoftwarebasedonMicrosoftWindows.Productionofthispaperhavedefiniteapplicationvalue.Experimentresultsprovethatthesystemisvalidindetecting,locatingandextractingfrontalviewfacefeaturesinacertainrange.Anditpossessfavorableperformanceinrapidityandaccuracy.Keywords:imagesegmentation;facelocalization;complexion;facedetection;featureex-traction目錄引言1第1章人臉檢測與定位概述21.1人臉檢測的定義、應用及難點21.2人臉檢測的研究背景及現(xiàn)狀21.3本文研究的主要內(nèi)容3第2章基于膚色模型的人臉檢測42.1人臉檢測方法42.2基于膚色的人臉檢測42.2.1色彩空間的選擇42.2.2膚色模型52.3人臉膚色相似度的計算6第3章相似度根底上的人臉特征定位103.1人臉檢測與定位算法103.1.1人臉區(qū)域分割算法103.1.2人臉區(qū)域標記算法123.1.3人臉檢測流程123.2人眼的檢測算法及標定133.2.1有背景灰度人臉圖像中的人眼檢測與定位143.2.2眼睛的標定153.3鼻子的標定173.4嘴的標定183.5設計結(jié)果及分析19結(jié)論與展望21致謝22參考文獻23附錄A引用的外文文獻及翻譯24附錄B參考文獻題錄及摘要27附錄C主要源程序29插圖清單圖2-1訓練流程圖……………6圖2-2二值化流程圖………………………...7圖2-3原圖…………………...7圖2-4相似度圖……………...8圖2-5二值化圖……………...8圖2-6垂直直方圖…………...8圖2-7水平直方圖…………...9圖3-1人臉檢測與定位的總體流程……….10圖3-2人臉區(qū)域分割系統(tǒng)………………….10圖3-3區(qū)域分割算法流程………………….11圖3-4標記人臉區(qū)域……………………….12圖3-5人臉檢測流程圖……………………..13圖3-6LOG算子…………….15圖3-7邊緣提取流程……………………….15圖3-8邊緣提取圖………….16圖3-9眼睛的定位………….16圖3-10眼睛標記流程圖……………………17圖3-11眼睛標記……………17圖3-12鼻子的標記流程圖…………………18圖3-13鼻子標記……………18圖3-14嘴巴標記……………19圖3-15系統(tǒng)主界面…………19引言人臉檢測和定位是人臉識別中一個重要的組成局部,其檢測問題卻是一個極賦挑戰(zhàn)性的課題。人臉是一個包含五官、毛發(fā)等的極不規(guī)那么的復雜待測目標,不同的人臉在形狀、大小、顏色、質(zhì)地等方面都有很大的變化;所考慮的檢測對象大多是由圖像捕捉設備所采集的數(shù)字圖。所以采集條件特別是光照條件包括光源的方向、明暗、色彩等都會對圖的效果產(chǎn)生很大的影響,進而影響對人臉的檢測;另外,人臉上還可能長有胡須、戴有眼鏡等,這些也同樣是人臉檢測不可無視的因素。人臉檢測具有一定的難度和復雜性,對這一問題的深入研究必將推動模式識別等計算機科學的開展。人臉的檢測問題在近10年中得到了廣泛的關注,國內(nèi)外很多研究人士提出了很多方法,在不同領域取得了一定進展。但是對于一種能夠普遍適用于各種復雜情況的,準確率很高的檢測算法,還有很大的探索空間。本文利用VisualC++6.0開發(fā)了人臉定位和特征提取的軟件,該軟件對于一定尺寸范圍內(nèi)清晰的正面人臉圖能夠正確檢測定位并提取特征。第1章人臉檢測與定位概述1.1人臉檢測的定義、應用及難點人臉檢測(facedetection)是指在輸入圖中確定所有人臉(如果存在)的位置與大小。人臉檢測系統(tǒng)的輸入是可能包含人臉的圖,輸出是關于圖中是否存在人臉以及人臉的數(shù)目、位置、尺度、位姿等信息的參數(shù)化描述。人臉檢測問題最初來源于人臉識別(facerecogznition)。人臉識別的研究可以追溯到20世紀60—70年代,經(jīng)過幾十年的曲折開展已日趨成熟。人臉檢測是自動人臉識別系統(tǒng)中的一個關鍵環(huán)節(jié),但是早期的人臉識別研究主要針對具有較強約束條件的人臉圖(如無背景的圖),往往假設人臉位置或很容易獲得,因此人臉檢測問題并未受到重視。近幾年隨著電子商務等應用的開展,人臉識別成為最有潛力的生物身份驗證手段,這種應用背景要求自動人臉識別系統(tǒng)能夠?qū)σ话悱h(huán)境下的圖像具有一定的適應能力,由此所面臨的一系列問題使得人臉檢測開始作為一個獨立的課題受到研究者的重視。人臉檢測研究的就是如何從靜態(tài)圖或者視頻序列中找出人臉,如果存在人臉,那么輸出人臉數(shù)目、每個人臉的位置及大小。人臉檢測是人臉身份識別的前期工作,同時人臉檢測作為完整的單獨功能模塊,在智能視頻監(jiān)控、視頻檢索和視頻內(nèi)容組織等方面都有直接的應用。人臉檢測的一個最重要的應用是人臉識別技術(shù)。人臉識別技術(shù)的研究是本世紀計算機視覺領域最具挑戰(zhàn)性的研究課題之一,其應用領域十分廣泛:可用于公安系統(tǒng)的罪犯身份識別、平安驗證系統(tǒng)、信用卡驗證、醫(yī)學、檔案管理、視頻會議、人機交互系統(tǒng)、駕駛執(zhí)照及護照等與實際持證人的核對、銀行及海關的監(jiān)控系統(tǒng)及自動門衛(wèi)系統(tǒng)等。今天,人臉檢測的應用背景已經(jīng)遠遠超出了人臉識別系統(tǒng)的范疇,在基于內(nèi)容的檢索、數(shù)字視頻處理、視覺監(jiān)測等方面有著重要的應用價值。人臉檢測研究具有重要的學術(shù)價值,受到學者越來越多的關注。人臉檢測雖然有誘人的應用前景,但是在現(xiàn)實中卻還沒有開始大規(guī)模的使用。其主要原因之一就是用計算機自動進行人臉的檢測和識別十分困難,目前的檢測效果〔正確率、速度〕不如其他的生物識別技術(shù),如指紋識別,視網(wǎng)膜識別等等。人們在日常生活中就進行了大量的人臉檢測和識別工作,對人臉檢測與特征的定位取得了一定的成績,但人臉檢測仍然存在著許多難點。人臉是一類具有相當復雜的細節(jié)變化的自然結(jié)構(gòu)目標,此類目標的檢測問題的挑戰(zhàn)性在于:臉由于外貌、表情、膚色等不同,具有模式的可變性;一般意義上的人臉,可能存在眼鏡、胡須等附屬物;作為三維物體的人臉的影不可防止地受由光照產(chǎn)生的陰影的影響。因此,如果能夠找到解決這些問題的方法,成功構(gòu)造出人臉檢測,將為解決其它類似的復雜模式檢測問題提供重要的啟示。1.2人臉檢測的研究背景及現(xiàn)狀人臉檢測的研究歷史比擬悠久。高爾頓(Galton)早在1888年和1910年就分別在《Nature》雜志發(fā)表了兩篇關于利用人臉進行身份識別的文章,對人類自身的人臉識別能力進行了分析。最早的研究論文見于1965年陳〔Chan〕和布萊索〔Bledsoe〕在PanoramicResearchInc.發(fā)表的技術(shù)報告,至今已有四十多年的歷史。近年來,人臉檢測研究得到了諸多研究人員的青睞,涌現(xiàn)出了諸多技術(shù)方法。尤其是1990年以來,人臉檢測更得到了長足的開展。幾乎所有知名的理工科大學和主要IT產(chǎn)業(yè)公司都有研究組在從事相關研究。人臉檢測研究的開展主要分為以下幾個階段:第一階段〔1964年~1990年〕這一階段人臉檢測通常只是作為一個一般性的模式識別問題來研究,所采用的主要技術(shù)方案是基于人臉幾何結(jié)構(gòu)特征〔Geometricfeaturebased〕的方法。人工神經(jīng)網(wǎng)絡也一度曾經(jīng)被研究人員用于人臉識別問題中。這一階段是人臉檢測識別研究的初級階段,非常重要的成果不是很多,也根本沒有獲得實際應用。第二階段〔1991年~1997年〕這一階段盡管時間相對短暫,但卻是人臉識別研究的高潮期,可謂碩果累累:不但誕生了假設干代表性的人臉識別算法,而且美國軍方還組織了著名的FERET人臉識別算法測試,并出現(xiàn)了假設干商業(yè)化運作的人臉識別系統(tǒng),比方最為著名的Visionics〔現(xiàn)為Identix〕的FaceIt系統(tǒng)。這一階段的人臉識別技術(shù)開展非常迅速,所提出的算法在較理想圖采集條件、對象配合、中小規(guī)模正面人臉數(shù)據(jù)庫上到達了非常好的性能,也因此出現(xiàn)了假設干知名的人臉識別商業(yè)公司。第三階段〔1998年~現(xiàn)在〕FERET’96人臉檢測識別算法評估說明:主流的人臉識別技術(shù)對光照、姿態(tài)等由于非理想采集條件或者對象不配合造成的變化魯棒性比擬差。因此,光照、姿態(tài)問題逐漸成為研究熱點。與此同時,人臉識別的商業(yè)系統(tǒng)進一步開展。為此,美國軍方在FERET測試的根底上分別于2000年和2002年組織了兩次商業(yè)系統(tǒng)評測。目前非理想條件下〔尤其是光照和姿態(tài)〕、對象不配合、大規(guī)模人臉數(shù)據(jù)庫上的人臉識別問題逐漸成為研究的熱點問題。而非線性建模方法、統(tǒng)計學習理論、基于Boosting的學習技術(shù)、基于3D模型的人臉建模與識別方法等逐漸成為備受重視的技術(shù)開展趨勢。目前國內(nèi)的,國外的對人臉檢測問題的研究很多,比擬著名的有MIT,CMU等;清華大學、北京工業(yè)大學、中科院計算所和自動化所等都有人員從事人臉檢測相關的研究。而且,MPEG7標準組織已經(jīng)建立了人臉識別草案小組,人臉檢測算法也是一項征集的內(nèi)容。隨著人臉檢測研究的深入,國際上發(fā)表的有關論文數(shù)量也大幅度增長,如IEEE的FG(IEEEInternationalConferenceonAutomaticFaceandGestureRecognition)、ICIP(InternationalConferenceonImageProcessing)、CVPR(ConferenceonComputerVisionandPatternRecognition)等重要國際會議上每年都有大量關于人臉檢測的論文,占有關人臉研究論文的近1/3之多。1.3本文研究的主要內(nèi)容本課題致力于完成VisualC++6.0平臺下的人臉檢測與定位系統(tǒng),人臉檢測定位的算法限制于基于膚色相似度算法。要完成的工作包括相似度的計算,圖像的二值化,垂直直方圖和水平直方圖的獲取,人臉特征〔眼睛、嘴和鼻子〕的提取。本課題著重于膚色模型相似度在人臉檢測與定位中的應用,對增加人臉檢測與定位的準確率的研究有一定的指導意義。第2章基于膚色模型的人臉檢測2.1人臉檢測方法人臉檢測傳統(tǒng)的方法多是在亮度空間進行,僅有灰度信息的變化,沒有任何區(qū)域或比例的限制,所以必須做多尺度空間的全搜索,計算量非常大,而利用色度信息那么可大大降低搜索區(qū)域,其中膚色信息是最為直接有效的。而且在人臉區(qū)域中,膚色一定是占主導地位的像素色彩值。膚色雖然因人而異,但很多研究說明膚色在色彩空間中的一定范圍內(nèi)還是呈聚類特性的,特別是在排除了光照亮度和在經(jīng)過變換的色彩空間中。所以利用膚色這一線索可以排除掉在灰度圖像中很像人臉而對應到彩色圖像中根本不是膚色的區(qū)域,這在人臉檢測中會起到積極的作用。目前人臉檢測方法主要可以分為以下4類:基于知識的方法:利用人臉的幾何形狀以及臉部器官的比例對稱關系來定位人臉;基于特征的方法:直接利用人臉信息如膚色特征、輪廓特征、紋理特征等;基于模板的方法:使用模板在待測圖像中逐點掃描計算匹配度,根據(jù)匹配度來判斷有無人臉;基于外觀的方法:如神經(jīng)網(wǎng)絡法、支持向量機法、特征臉法等。上述的各種方法都存在自身的優(yōu)缺點和適用領域,很多學者在各自所面臨的問題范圍內(nèi)不斷探索,也創(chuàng)造了許多卓有成效的檢測算法。但各種檢測算法都存在效率與性能上的矛盾,也即在正確率、魯棒性能方面更好的算法往往會花費更多的時間及系統(tǒng)消耗。在本文的設計中提出了一種基于膚色相似度的人臉檢測與定位的方法,采用了臉部皮膚之間相似度的方法以及二值化方法,使用了基于邊界方法和基于區(qū)域方法相結(jié)合的算法,提取了眼睛、嘴和鼻子等關鍵特征,最終較好地實現(xiàn)了人臉的檢測與定位。下面就介紹這種方法。2.2基于膚色的人臉檢測色彩空間的選擇根據(jù)計算機色彩理論,對一種顏色而言,在計算機中有不同的表達式,這樣就形成了各種不同的色彩空間,當然各種色彩空間只不過是顏色在計算機內(nèi)的不同的表達形式而已,在具體的色彩空間中通過實踐找到膚色區(qū)間,建立起可操作性的膚色模型,這樣就讓膚色信息成為了人臉檢測的核心方法。不同膚色模型的建立基于不同的顏色空間,且為顏色空間的一個子空間。主要的彩色空間有以下幾種:RGB格式〔紅、綠、藍三基色模型〕、HIS格式〔色度、飽和度、亮度模型〕和YCbCr(YUV)格式。對于彩色空間來說,RGB是最常用的顏色表示系統(tǒng),但是人臉膚色在這一系統(tǒng)中的分布非常廣泛,因此不適合表示人臉區(qū)域,往往需要轉(zhuǎn)換到其他的彩色空間。在該文的設計中采用了YCbCr(YUV)格式。這種色彩空間是以演播室質(zhì)量標準為目標的CCIR601編碼方案中采用的彩色表示模型,被廣泛地應用在電視的色彩顯示等領域中。其優(yōu)點將在下一節(jié)介紹。通過下面的轉(zhuǎn)換公式,可以將像素由RGB空間轉(zhuǎn)換到Y(jié)CbCr空間。Y=0.299R+0.587G+0.114BCb=-0.1687R-0.3313G+0.5B+128〔2-1〕Cr=0.5R-0.4187G-0.0813B+128我們將統(tǒng)計采集到的多幅圖像人臉區(qū)域像素RGB值,按上式進行轉(zhuǎn)換,統(tǒng)計在CbCr空間的分布概率,保存概率大于0.1的像素點,得到膚色分布區(qū)域。最終,我們得到的膚色范圍是:Cb∈[90,125],Cr∈[135,165]。將膚色范圍內(nèi)的像素置1,其余置0,得到分割后的二值圖像,實現(xiàn)人臉的初步定位。膚色模型膚色是人臉一個重要而明顯的特征,利用膚色模型可以快速排除非膚色區(qū)域,大大減小搜索空間,提高人臉檢測的效率。1.光線補償處理考慮到膚色等色彩信息經(jīng)常受到光源顏色、圖像采集設備的色彩的偏差等因素的影響,而在整體上偏離本質(zhì)色彩而向某一方向移動,即我們通常所說的色彩偏冷、偏暖,照片偏黃、偏藍等等,這種現(xiàn)象在藝術(shù)照片中更為常見。為了抵消這種整個圖像中存在著的色彩偏差,我們將整個圖像中所有像素的亮度(是經(jīng)過了非線性Y--校正后的亮度)從高到低進行排列,取前5%的像素,如果這些像素的數(shù)目足夠多(例如,大于100),我們就將它們的亮度作為“參考白〞(ReferenceWhite),也即將它們的色彩的R、G、B分量值都調(diào)整為最大的255。整幅圖像的其他像素點的色彩值也都按這一調(diào)整尺度進行變換。2.非線性分段色彩變換這是構(gòu)成我們實際利用膚色模型的主要局部。這一非線性分段色彩變換得到的膚色模型屬于色彩空間中的聚類模型,這一類膚色模型的建立首先要選取一種適宜的色彩空間,我們注意到Y(jié)CbCr色彩空間具有如下優(yōu)點:YCbCr色彩格式具有人類視覺感知過程相類似的構(gòu)成原理;CbCr色彩格式被廣泛的應用在電視顯示等領域中,也是許多視頻壓縮解碼,如MPEG,JPEG等標準中普遍采用的顏色表示格式;YCbCr色彩格式具有與HIS等其他一些顏色格式相類似的將色彩中的亮度分量別離出來的優(yōu)點;相比HIS等其他一些色彩格式,YCbCr色彩格式的計算過程和空間坐標表示形式比擬簡單;實驗結(jié)果說明在YCbCr色彩空間中膚色的聚類特性比擬好。在YCbCr色彩空間中,膚色聚類事兩頭尖的紡錘形狀,也就是在Y值較大和較小的局部,膚色聚類區(qū)域也隨之縮減。由此可見,在值較大和較小的局部,膚色聚類區(qū)域也隨之縮減。由此可見,在Y值不同的地方,我們對Cb-Cr子平面進行投影,得到的結(jié)果是不同的,由此得到結(jié)論,簡單地排除Y分類,按照傳統(tǒng)地做法在三維的Cb-Cr子平面中尋求膚色的聚類區(qū)域是不可行的,我們必須考慮Y值不同造成的影響,從而對YCbCr色彩格式進行非線性分段色彩變換。首先應用膚色模型進行人臉的初定位,接著提出了一種基于膚色區(qū)域分割方法得到包含人臉區(qū)域在內(nèi)的一系列矩形區(qū)域,從而進行了定位。2.3人臉膚色相似度的計算該文設計的是基于人臉膚色模型,利用相似度方法,對人臉區(qū)域進行了檢測和定位。我們定義r=R/(R+G+B),b=B/(R+G+B),這樣把三維的RGB降為二維。而在這個二維平面上,膚色區(qū)域服從高斯分布。我們可以采用訓練的方法來計算得到一個分布中心,此過程主要生成可用于識別的參數(shù)。通常,在已有的樣本訓練集根底上確定某個判定規(guī)那么,使得按此規(guī)那么對被識別對象進行分類所造成的錯誤識別率最小或者結(jié)果期望最大。開始訓練命令,翻開bmp格式的圖像后計算每幅圖像的像素數(shù)CrList和CbList,然后查詢總的圖像數(shù)count用于將當前數(shù)據(jù)庫內(nèi)的所有用戶圖片進行訓練,最后對每幅圖像求訓練平均,得到可供識別比對的訓練基。訓練的過程如下圖:訓練開始訓練開始讀取用戶數(shù)量以及對應的圖像數(shù)讀取用戶數(shù)量以及對應的圖像數(shù)讀取下一個用戶的信息讀取下一個用戶的信息讀取下一幅圖像讀取下一幅圖像轉(zhuǎn)成灰階形式轉(zhuǎn)成灰階形式全部圖全部圖NY全部用戶N全部用戶Y保存訓練基對每個人求保存訓練基對每個人求訓練平均圖2-1訓練流程圖這樣訓練以后,得到了Cb和Cr的均值為117.4361和156.5599,落在膚色范圍內(nèi),驗證了理論的正確性。同樣也得到了膚色信息的均值M和方差C,為下一步計算相似度做了準備。然后根據(jù)所考察的像素離中心遠近得到膚色的相似度,得到與原圖相似的分布圖,均值M和方差C如下:M=E(x),C=E((x-M)(x-M)T),其中x=[r,b]T相似度計算公式為:P(r,b)=exp[-0.5(x-m)TC-1(x-m)]〔2-2〕關于相似度軟件的實現(xiàn)純粹是公式的實現(xiàn),在這就不做說明了。再按照一定的規(guī)那么對該圖二值化,通過設置適宜的閾值〔關于最正確閾值的設置將在下一章中介紹〕,可將圖像變成只有0和1的二值圖像,這樣做的目的是為了減小計算量,加快處理速度,同時,還可將目標從背景中別離出來,有效的突出了目標。二值化流程如下:NNNY找到第一個像素的位置其灰度值>閾值灰度值=0灰度值=1查找下個像素結(jié)束圖2-2二值化流程圖按這種方法就可以對輸入的bmp圖像2-3進行處理,圖2-3原圖其相似度計算結(jié)果如圖2-4示:圖2-4相似度圖可以給出二值化圖2-5示:圖2-5二值化圖以及垂直直方圖2-6示:圖2-6垂直直方圖水平直方圖2-7示:圖2-7水平直方圖至此完成了相似度的計算和圖像的二值化,以及兩種直方圖的提取,那么下一章節(jié)將在此根底之上進行人臉區(qū)域的標記和人臉特征〔眼睛、鼻子、嘴巴〕的提取。第3章相似度根底上的人臉特征定位在上一章得到的人臉區(qū)域根底上,對原圖像進行灰度計算,將可能的眼睛區(qū)域分割成小圖像塊標定人眼中心,從而在眼睛確定的情況下把鼻子和嘴巴提取出來。總體流程如下:眼睛定位眼睛定位圖像灰度化圖像灰度化翻開位圖翻開位圖計算相似度標記人臉圖像二值化計算相似度標記人臉圖像二值化圖3-1人臉檢測與定位的總體流程下面將介紹人臉標記和眼睛、鼻子、嘴巴定位的算法及其流程。3.1人臉檢測與定位算法人臉區(qū)域分割算法人臉區(qū)域分割的系統(tǒng)結(jié)構(gòu)如圖3-2所示:包含人臉區(qū)域在內(nèi)的一系列矩形區(qū)圖像中的膚色和非膚色象素點包含人臉區(qū)域在內(nèi)的一系列矩形區(qū)圖像中的膚色和非膚色象素點人臉區(qū)域分割算法人臉區(qū)域分割算法圖3-2人臉區(qū)域分割系統(tǒng)在圖3-2中,輸出的一系列矩形將取代原來的整幅圖像作為人臉檢測算法的輸入。這些矩形應該滿足以下條件:矩形系列中應該盡可能地包含待檢測圖像中的全部人臉對于距離較近或者是有接觸的多個人臉,分割后得到的膚色區(qū)域自然距離較近或者是連在一起,這時可以用一個矩形區(qū)域覆蓋它們。不漏檢、不降低正確率是膚色分割處理的前提,也是人臉區(qū)域分割算法的首要前提。據(jù)前面對膚色模型的分析,無論什么樣的膚色模型都存在判斷失誤,所以算法輸出的一系列矩形應該盡量包含所有的人臉區(qū)域。矩形系列應該少包含非膚色區(qū)域相對整幅圖像,經(jīng)過膚色分割預處理后的這一系列矩形的大小要明顯小于原來的整幅圖像,這是膚色分割預處理能夠提高人臉檢測算法時間效率的主要原因,也是膚色分割預處理能夠降低誤報率的關鍵。對于可能的人臉區(qū)域來說,其相對于水平方向的旋轉(zhuǎn)角度在45°到135°之間,因此旋轉(zhuǎn)角度小于45°或大于135°的區(qū)域為非人臉區(qū)域。圖像分割的目的是把人臉的器官與臉的其他局部別離開來,并保證每個器官的完整性。在包含人臉的圖像中,臉部比擬明顯而易區(qū)分的特征主要是面部器官:眼睛、嘴、鼻子和眉毛。鼻子往往與臉的反差不大,因此通常用鼻孔代替。這幾個面部特征在灰度圖像中一般比周圍區(qū)域暗。尤其是眼睛和嘴在絕大局部情況下都清晰可見。因此圖像分割可以利用的特征是:灰度比周圍區(qū)域暗的區(qū)域。在設計中,為了減少圖像分割這一步的運算量,對圖像做了二值化處理。分割的對象是黑白圖像,分割簡化為找出所有黑色的連通區(qū)域,它們都成為人臉器官的候選者。從一幅圖中,按一定規(guī)那么劃分出感興趣的局部或區(qū)域稱為分割。對于利用人臉各器官之間幾何關系的人臉定位方法來說,分割算法是十分重要的。在這里,感興趣的局部是人臉的器官(眼睛、嘴、眉毛、鼻子等等)。成功的分割算法能夠有效地把人臉器官和臉的其他局部別離開來,并且保持器官的完整性。設計采用了基于邊界的方法和基于區(qū)域的方法相結(jié)合的算法?;谶吔绶椒ㄊ翘崛∵吘?,利用邊緣進行分割,該方法處理的像素數(shù)量比擬少,各像素點間的相鄰關系比擬簡單,處理速度比擬快,但是,基于邊界的方法是從局部特性來求圖像整體的分割,因此在全局宏觀性質(zhì)上不如基于區(qū)域的方法?;趨^(qū)域的方法那么是尋找互相連接在一起、并有相同特征的像素所形成的區(qū)域,它是實現(xiàn)圖像分割的一種重要方法。在本系統(tǒng)中,基于邊界的方法主要用于前期矩形序列的產(chǎn)生,快速地得到包含人臉區(qū)域的外接矩形;然后用基于區(qū)域的方法,,全局考慮,對初始矩形序列進行區(qū)域歸并,得到最終的輸出矩形。算法的整體流程圖如圖3-4所示:輸入的經(jīng)過膚色分割的圖像輸入的經(jīng)過膚色分割的圖像去噪聲處理去噪聲處理提取邊界提取邊界對邊界的連通關系作處理對邊界的連通關系作處理由邊界的連通性和閉合性得到初始的一系列矩形由邊界的連通性和閉合性得到初始的一系列矩形將初始的矩形序列進行歸并處理將初始的矩形序列進行歸并處理輸出最終的矩形輸出最終的矩形圖3-3區(qū)域分割算法流程人臉區(qū)域標記算法在標記人臉之前,首先要對相似度圖像進行二值化操作,這一局部已經(jīng)在前面一章中介紹了。接下來就要對人臉區(qū)域進行檢測,標記人臉的過程實際上是對得到的二值化圖像進行人臉邊界估計的過程。估計人邊界臉算法利用了人臉的結(jié)構(gòu)特征:人臉左右邊界膚色點個數(shù)約為人臉垂直方向最多膚色點個數(shù)的0.2~0.3倍;人臉上邊界膚色點個數(shù)應該約為人臉區(qū)域?qū)挾鹊?.5倍;人臉區(qū)域高度約為人臉區(qū)域?qū)挾鹊?.5倍。首先估計人臉的左右邊界,具體算法如下:搜索垂直方向具有最多灰度值為0的點(白點,即可能的人臉)的x坐標pos,并將白點數(shù)目計為count;從pos開始往左邊搜索得到垂直方向第一次具有小于0.2count個白點的x坐標作為人臉區(qū)域的左邊界left;pos開始往右邊搜索,得到垂直方向第一次具有小于0.3count個白點的x坐標作為人臉區(qū)域的右邊界right。接著估計人臉的上下邊界,具體算法如下:從上往下搜索水平方向的白點數(shù),得到第一次具有大于0.5(right-left)個白點的y坐標作為人臉區(qū)域的上邊界top;根據(jù)人臉結(jié)構(gòu)特征,將top+1.5(right-left)作為人臉區(qū)域的下邊界bottom。從而,可以確定人臉區(qū)域為rect(left,top,right,bottom)。標定的人臉區(qū)域如圖3-5所示。從圖可以看出,經(jīng)過相似度計算和二值化操作,然后對人臉進行邊界估計,最后進行標定,根本上做到了。圖3-4標記人臉區(qū)域人臉檢測流程整個基于膚色模型的人臉檢測的流程如下:原始圖像原始圖像膚色檢測皮膚圖像皮膚圖像濾波和填充修正后的皮膚圖像修正后的皮膚圖像檢查每個皮膚區(qū)域皮膚像素與整個矩形面積的比找到該區(qū)域的外接矩形皮膚像素與整個矩形面積的比非人臉小于固定值非人臉矩形面積小于固定值矩形面積非人臉非人臉大于固定值標準候選人臉標準候選人臉在原始圖像相同位置得到矩形,進行放縮、直方圖均衡化等處理候選人臉候選人臉圖3-5人臉檢測流程圖3.2人眼的檢測算法及標定因為人臉的五官位于臉部頂點與下巴點之間,將搜索范圍設為一矩形區(qū)域,矩形的長為臉部頂點與下巴點的距離,矩形的寬即是臉寬。標記人臉區(qū)域以后,就可以進行邊緣提取,接著標記眼睛,由人臉各特征的位置關系,就可以從上到下區(qū)分出眼睛、鼻子、嘴等特征。假設人臉的姿勢比擬正,那么人臉上的特征是水平邊緣集中的區(qū)域。我們可以在低分辨率下提取水平邊緣,然后找到人臉區(qū)域內(nèi)富含這些邊緣的連通區(qū),作為人臉特征的候選區(qū)域。這些區(qū)域的位置和大小并不準確,因為邊緣檢測本身容易出現(xiàn)位置偏移,連通區(qū)的大小也隨著閾值而變化。所以還要進一步修正上面的結(jié)果。對正面的人臉來說,眼睛、鼻子等特征和整個人臉的尺寸大小之間存在先驗的約束關系,這就是人臉結(jié)構(gòu)的恒常性,因此我們利用這些約束關系來確定特征區(qū)域的大小?!惨驗橄日已劬?,我們就以眼睛的大小為準,最后在調(diào)整嘴巴的大小〕。人臉是一種特殊的模式,而人的雙眼與眉毛、鼻、口按一定的結(jié)構(gòu)分布在灰度根本均勻的人臉平面上,人臉這種特殊模式與圖像背景模式大相徑庭,從而為判別人的雙眼位置提供了依據(jù)。尋找最正確分割閾值使人眼從復雜圖像背景和人臉中別離出來是人眼定位的第一步。所謂最正確分割閾值指的是能將眼睛虹膜、瞳孔、上眼框與眉毛以及其它人臉部位、背景物明顯別離的灰度分割閾值。由于眼睛虹膜、瞳孔部位的灰度值明顯比其鄰近區(qū)域(眼部周圍皮膚、眼白)灰度值要低,因此能夠從適當光照條件下拍照的圖像中分割眼睛虹膜、瞳孔部位的灰度值總是存在的,并且不是唯一的,而是有一定的小范圍。然而尋找這樣的最正確分割閾值并不是一件容易的事,眼睛虹膜、瞳孔部位及其鄰近區(qū)域的灰度值會因人而異,并隨光照條件、帶眼鏡時鏡片的反光而變化,加上復雜背景的變化,使得最正確分割閾值的估計十分困難,但通過圖像灰度直方圖分析和統(tǒng)計的方法,對最正確分割閾值可能所在的灰度區(qū)間進行粗估計還是可以做到的。經(jīng)對多幅在復雜背景及不同光照條件下人臉圖像的直方圖分析與統(tǒng)計發(fā)現(xiàn),只要臉部光照適中,雙眼部位較清晰,絕大多數(shù)情況下最正確分割閾值位于歸一化灰度值0.1與0.6之間。假設選擇固定的背景和光照條件,由統(tǒng)計的方法可估計出更小的最正確分割閾值可能所在的區(qū)間。另外,利用直方圖均衡方法也可使輸入圖像的最正確分割閾值可能所在的區(qū)間縮小。有背景灰度人臉圖像中的人眼檢測與定位首先用某一分割閾值Threshold將包含人臉的灰度圖像二值化,去除二值化圖像中小的黑斑點,再對二值化圖像中黑色塊進行標記、計算每塊面積(像素數(shù))、確定每塊的外接矩形位置及寬高。人眼位置的判定是根據(jù)眼睛在二值化人臉圖像中的幾何位置確定的,主要有以下幾條準那么:雙眼中心距應在某個范圍內(nèi):考慮到人臉在圖像中大小的變化,雙眼中心距變化大約在一定像素距離范圍內(nèi);雙眼下方一定距離內(nèi)不能有其它黑塊:雙眼下方一定距離內(nèi)沒有其它器官,因此在二值化圖像中不能有其它黑塊,這一特點也是區(qū)分眉毛與眼睛的重要判據(jù);雙眼中心位置上下相差不超過一定距離:由于人臉在圖像中可能向兩側(cè)傾斜,雙眼中心位置常常不在水平線上。作為判據(jù),允許人臉在一定程度上向兩側(cè)傾斜,雙眼中心位置在垂直方向相差不超過一定距離(如15個像素距離);眼睛黑塊所包含的像素數(shù)應在某個范圍內(nèi):二值化圖像中眼塊所包含的像素數(shù)應在某個范圍內(nèi)(如5~50個像素),太大的黑塊不太可能是眼塊;眼睛黑塊的外接矩形應是一寬大于高的矩形或接近于正方形:由于眼睛的結(jié)構(gòu)特點,二值化圖像中眼塊的外接矩形常常是一寬大于高的矩形或接近于正方形,眼塊的幾何中心位于圓形的眼睛虹膜(含瞳孔)位置,高遠大于寬的外接矩形對應的黑塊不可能是眼塊;與圖像四邊接壤或非常接近的黑塊不是眼塊:由于拍攝人臉圖像時,要求人臉在照片中應完整,且較靠近圖像中心,因此在二值化圖像中與圖像四邊接壤或非常接近的黑塊不是眼塊。為了能從粗估計的分割閾值區(qū)間中找到最正確分割閾值,我們提出了結(jié)合找人眼位置過程的自動調(diào)整法。選擇一適當?shù)拈撝?,從初始閾值T0=0.1遞增(在T0到Tmax=0.6區(qū)間搜索),以每一新的閾值Threshold二值化人臉灰度圖像,并按上述人眼位置判定準那么檢測人眼黑塊是否出現(xiàn)。隨著閾值的不斷增加,可以看到二值化人臉圖像中新黑塊在不斷地出現(xiàn),已有的黑塊面積在擴展并不斷地與別的黑塊相重合。一旦在某個閾值下檢測到雙眼黑塊出現(xiàn),此時的閾值即為最優(yōu)分割閾值,檢測到的人眼黑塊的幾何中心也應接近于虹膜(瞳孔)中心(這是因為分割閾值越大,眼塊可能由無到有,由小到大,此時最先出現(xiàn)的應是具有較低灰度值的瞳孔和虹膜所對應的黑塊)。眼睛的標定由于眼睛和膚色的差異較大,在上一章人臉區(qū)域二值化的根底上,再進行邊緣檢測。所謂的邊緣就是圖像的最根本特征,是指圖像周圍象素灰度有階躍變化和屋頂變化的像素的集合;是由灰度的不連續(xù)性反映的。邊緣廣泛存在于物體與背景之間、物體與物體之間、圖像基元與基元之間。它是圖像分割所依賴的重要特征。經(jīng)典的邊緣提取方法是考慮圖像的每個像素在某個領域灰度的變化,利用邊緣臨近的一階或二階方向?qū)?shù)變化規(guī)律,進行局部梯度運算。求梯度根據(jù)濾波算子的不同可以分為好多種。通過對處理后的圖像進行研究比照發(fā)現(xiàn):拉普拉斯高斯算子既具備了高斯算子的優(yōu)點又具備了拉普拉斯算子的優(yōu)點在邊緣檢測中不但對灰度漸變和噪聲較多的圖像處理最好,而且是各向同性的,得到的處理后的圖像具有連貫性和高清晰度。常用的5X5LOG算子如下列圖:-2-4-4-4-2-4080-4-48248-4-4080-4-2-4-4-4-2圖3-6LOG算子LOG算子首先用高斯函數(shù)對圖像進行低通濾波消除空間尺度遠小于高斯空間常數(shù)的圖像強度變化即去除噪聲,然后用拉普拉斯算子進行高通濾波提取線特征在一個灰度均勻區(qū)域的邊緣處LOG算子有以下表現(xiàn):邊緣以外灰度均勻處取零,邊緣較暗一側(cè)取正,邊緣較亮一側(cè)取負,邊緣中某些點處取零。用LOG算子提取邊緣流程為:膚色區(qū)域用LOG用LOG算子進行邊緣提取是否為邊緣?NY是否為邊緣?處理為白色處理為黑色處理為白色處理為黑色圖3-7邊緣提取流程這樣就可以將人臉的整個邊界的輪廓大致地提取出來了。其邊緣提取結(jié)果如下:圖3-8邊緣提取圖然后對邊緣檢測的結(jié)果進行水平方向的投影,根本能確定眼睛的兩個范圍I和II。這里雖然有眉毛的影響,但是由于眉毛正好位于眼睛的上方,因此不影響水平區(qū)域確實定,如圖示:ABIIIABIII右眼眉毛左眼眉毛右眼眉毛左眼眉毛左眼右眼左眼右眼圖3-9眼睛的定位然后在I和II的上方區(qū)域的豎直方向投影,得到的第一個峰值附近的區(qū)域A、B。然后在A與I以及B與II確定的兩個矩形區(qū)域內(nèi),對黑點進行區(qū)域膨脹,可以得到的眼睛的大致輪廓和左右眼角,然后黑點的坐標的平均值作為瞳孔的位置。具體算法是:在確定的人臉區(qū)域,把人臉局部劃分為左右、上下四等份,再把人臉寬度12等份,每一份為nSlidWinWidth和人臉高度30等份,每一份為nSlidWinHeight。由經(jīng)驗可知:人眼只可能位于人臉上半局部的下9/15區(qū)域內(nèi),在這個區(qū)域內(nèi)找白色像素的個數(shù)當它大于nSlidWinWidth*nSlidWinHeight/3時,可把參考位圖的像素變?yōu)榧t色。這樣就把眼睛區(qū)域劃分為很多的小區(qū)域,在把這些區(qū)域中寬度小于人臉寬度的1/20刪除掉,然后在合并相鄰的閉合區(qū)域〔小于人臉寬度的1/40〕,這樣就可確定人眼的水平區(qū)域。以同樣的方法:去除掉小于人臉高度的1/100的區(qū)域,然后在合并區(qū)域〔小于人臉高度的1/100〕,這樣就可以確定人眼的垂直區(qū)域。在確定的人眼范圍內(nèi),標定出左右眼角和眼睛的位置。眼睛標定的流程為:確定人臉區(qū)域確定人臉區(qū)域邊緣檢測邊緣檢測確定人眼的水平區(qū)域確定人眼的水平區(qū)域確定人眼的垂直區(qū)域確定人眼的垂直區(qū)域標記左右眼角和眼睛的位置標記左右眼角和眼睛的位置圖3-10眼睛標記流程圖標記效果如圖:圖3-11眼睛標記3.3鼻子的標定在確定了眼睛的位置以后,鼻子的位置也就相應地定位下來了。以兩眼的瞳距為1來計算,鼻子到兩眼中心的距離為0.7到1,在附近尋找顏色較深的區(qū)域,根本得到鼻孔的位置。然后在鼻孔上方一定范圍內(nèi)〔鼻孔距離的1/2左右〕找到亮度最高的點作為鼻尖。其算法流程為:確定眼睛區(qū)域確定眼睛區(qū)域可能的鼻子區(qū)域可能的鼻子區(qū)域找出鼻尖找出鼻尖確定鼻孔的位置確定鼻孔的位置標記鼻孔標記鼻孔圖3-12鼻子標記流程圖標記的結(jié)果如圖示:圖3-13鼻子標記3.4嘴的標定嘴確實認考慮到唇色和位置兩重信息。對于唇色,滿足如下限制條件的位于臉的下部區(qū)域可能是嘴:〔3-1〕嘴到兩眼中心的距離可能為1.0到1.3左右,在滿足條件的區(qū)域采用類似找眼睛的方法,區(qū)域膨脹,確定左右嘴角和嘴的中心。其結(jié)果如圖3-14示:圖3-14嘴巴標記3.5設計結(jié)果及分析設計程序的主界面如下:圖3-15系統(tǒng)主界面單擊翻開圖像翻開一幅人臉圖像,然后用上述界面進行相似度計算,圖像二值化、垂直直方圖、水平直方圖、標記人臉區(qū)域,接著可以依次標記眼睛的位置和鼻子的位置的特征標注。在MicrosoftWindows平臺上,利用VisualC++6.0實現(xiàn)了以上算法。使用此算法對多幅人臉圖像進行了處理,所采用的圖像都是在正常光照以及室內(nèi)條件下所攝取的正面人臉圖片(其相對于水平方向的旋轉(zhuǎn)角度在45°到135°之間),并具有各種背景,上面的算法能成功地檢測定位多張人臉圖,本設計結(jié)果的正確檢測率到達90%以上。然而由于人臉拍攝的環(huán)境不同,也給系統(tǒng)帶來了一些問題。該軟件與人臉的外界光照條件、人臉的拍攝角度以及是否帶眼鏡有關,易受人臉模式的多樣性(如胡須、眼鏡等)、圖像獲取過程中的不確定性(如光照的強度、光源方向等)等因素的影響?;谀w色的人臉檢測和定位算法分析:統(tǒng)計出一般的人臉區(qū)域中膚色像素所應占的百分比,然后具有較高的檢測成功率;利用這一百分比作為閾值對檢測算法得到的候選臉區(qū)域進行驗證,從而排除了膚色像素數(shù)不滿足這一閾值的候選臉;采用了增強人臉特征與臉部皮膚之間比照度的方法,以及改良的對人臉圖像進行二值化處理,減少了運算量。結(jié)論與展望通過基于膚色的人臉檢測、定位等操作,可以較好地定位人臉的識別區(qū)域。文中給出了人臉分割、檢測算法、關鍵器官定位等主要算法。經(jīng)過改良二值化處理,對于全局閾值占有很大比重的情形,可以較好地解決圖像的二值化,為進一步的人臉識別奠定了根底。本設計耗時數(shù)月,最后完成了所要求的功能。總結(jié)下來,主要優(yōu)點如下:界面人性化,容易操作;對用戶的添加、錄入、刪除十分方便;在光照適當、人臉位姿恰當時,識別率可以到達100%;模塊化編程,可擴充性好,以后可以添加進一步的功能。當然,系統(tǒng)也有它的缺點,主要是下面的兩點:訓練時間過長,不能動態(tài)的添加用戶;魯棒性較差,環(huán)境光照的改變會影響識別率?;谶@些優(yōu)缺點,今后如果要進行改良,首先解決的問題必然是魯棒性的問題。如何將光照對識別的影響減小到最少,是一個很有難度的問題。目前的去光照處理的效果并不令人滿意,白平衡處理那么只能對總體進行小幅度的修正,不能解決光照造成的左右不平衡的問題。當然也可以從其它角度解決這個問題,例如將攝像頭和燈光結(jié)合,使得每次識別的主光源都位于正前方。其次是增加對側(cè)面臉進行識別的功能。我們知道人類對人臉的識別能力遠遠超過正面,而是可以從正面到側(cè)面的各種角度進行區(qū)分。如何使得計算機也能對側(cè)面臉進行檢測識別也是目前研究的一個熱點??尚械姆椒ㄖ皇鞘褂萌S的人臉模型,當模型足夠細膩的時候,就可以模擬出人臉各個角度的圖像。致謝大學四年的光陰如白駒過隙,轉(zhuǎn)瞬即逝。想想自己即將踏出寧靜而優(yōu)美的校園,也許這一生的學生生活就這樣結(jié)束了。不禁生起一絲悲涼之意。在這四年中我根本完成當時還是在遙遠的大一時定下的目標,可以這么說我能有今天的一切,跟母校-老師們是別離不開的!在這里我深深說一句:親愛的老師們謝謝你!尤其是在最后的半學期里,得到了老師的熱情指導,對本文的算法、編撰和定稿不吝賜教,使我看到了一個搞科學研究的學者應有的作風,為以后的我真正的走上工作崗位—搞研發(fā)時應怎樣處理類似的工作奠定了根底。在這還要感謝那些曾做過和我一樣課題的前輩們,正是看了關于你們?nèi)四槞z測與定位的專著和論文后才啟發(fā)了我怎樣進行人臉檢測、怎么樣的算法才是最合理的??梢哉f在拿到這個課題時,我可是一臉的朦朧,正是你們的著作在我做畢業(yè)設計的過程中敲打著我,時刻啟迪我。謝謝你們!致謝人:2007年6月17日參考文獻[1]王天學,刑桂芬,江波.基于區(qū)域分割的復雜背景中的人臉檢測與定位[J].計算機工程與設計,2004,11(25):1-3[2]王學武,石躍祥.基于眼睛特征的人臉檢測方法[J].計算機應用研究,2006年,1(1):1-3[3]王春紅,楊伯原,張洛平,張波.B超圖像邊緣檢測算法分析及C++實現(xiàn)[J].河南科技大學學報〔自然科學版〕,2006,2(27):1-3[4]王鄭耀.數(shù)字圖像的邊緣檢測,西安交通大學本科畢業(yè)論文[D],2003年6月[5]朱文佳,戚飛虎.快速人臉檢測與特征定位[J].中國圖像圖形學報,2005,11(10):1-4[6]吳為.人臉識別的軟件系統(tǒng)開發(fā),復旦大學工學學士學位論文[D],2005年6月[7]張宏林.VisualC++數(shù)字圖像模式識別技術(shù)及工程實踐[C].北京:人民郵電出版社,2003[8]張永梅,韓焱,商細云.一種人臉的檢測與定位方法[J].中北大學學報〔自然科學版〕,2006,3(27):1-5[9]張敏,陶亮.人臉圖像中人眼的檢測與定位[J].光電工程,2006,8(33):1-6[10]郭瑞,張淑玲,汪小芬.人臉識別特征提取方法和相似度匹配方法研究[J].計算機工程,2006,11(32):1-2[11]黃翠榮,嚴佩敏,時鹿鳴.基于方差相似度計算的人臉識別技術(shù)[J].上海大學學報(自然科學版),2003,12(4):1-4[12]梁路宏,艾海舟,徐光佑,張鈸.人臉檢測研究綜述[J].電子學報,2001,29〔6〕:744-747[13]謝建新.數(shù)字視頻采集與目標跟蹤,華僑大學本科畢業(yè)論文[D],2004年6月[14]蔡照.利用delphi6實現(xiàn)拉普拉斯高斯邊緣檢測算法[J].圖形圖像處理與游戲編程,2006,7(11):1-2[15]裘偉.一種基于相似度及復雜度人眼定位算法[J].蘇州大學學報〔工科版〕,2006,6(26):1-4[16]S.Phimoltares,C.Lursinsap,K.ChamnongthaiFacedetectionandfacialfeaturelocalizationwithoutconsideringtheappearanceofimagecontext[J].ImageandVisionComputing25(2007)741–753附錄A引用的外文文獻及翻譯Facedetectionandfacialfeaturelocalizationwithoutconsideringtheappearanceofimagecontext2.OurmethodologyInthisSection,weintroduceourmethodtoprocessthefrontal-viewfaceimagesfortheextractionofheadboundary,faceboundary,andfacialfeaturesincludingeyeswitheyebrows,nostrils,andmouth.Headboundaryistheouterprofileofheadincluding,shouldersFaceboundaryisthefacecontourthatexcludeshair,shoulders,andneck.Weuserectangularboxestolocatefacialfeatures.2.1.SmoothingandthresholdingTheschemediagramofthedouble-thresholdmethodisshowninFig.1.Thefirststepistoreducenoisebyusinga3?3medianfilter.Afterthat,anedgeoperatorisapplied.WetestedtheedgedetectiontechniquebyWechslerandKidode[13]andtheresultisshowninFig.2.Theedgeoutputappearstoothinandthetop-faceboundaryistooweaktobedetectedinthelatershareholdingprocedure.Inordertoobtainfatboundary,JianmingHuetal.[14]proposedfourmasks(horizontal(size3?7),vertical(7?3),45_(9?3),and135_(9?3))todetectimageedgesandselectthemaximumastheedgestrength.Insteadofusinglargesizes,wedevelopsmallersizesofmasksasshowninFig.3foredgedetection.Experimentalresultsshowthatourmethodisasgoodastheirmethod.Thresholdingisperformedtotransformthegray-leveledgeimagesintobinary.Thehighthresholdvalueisdeterminedbychoosingallthehighintensitypixelsthatoccupy5%oftheentirepixels.Thelowthresholdvalueisdecidedbychoosingallthehighintensitypixelsthatoccupy25%oftheentirepixels.Thehighthresholdedimageisusedtoobtaintheheadboundaryandthelowthresholdedimageisusedtoproducethefaceboundary.Thesethresholdingpercentagesaredeterminedbasedonourempiricaldatainordertoachievethebestresults.2.2.TracingheadandfaceboundariesInordertotracetheheadboundary,wedividethehigh-thresholdimageintoleftandrighthalves.Whenwescantheedgeimagefromtoptobottom,thefirstlayerofthecontouroccurredistheheadboundaryandthesecondlayerofthecontouroccurredisthefaceboundary.Fortracingtheheadboundary,astartingpointislocatedasthefirstwhitepixelonthefirstlayerofthelefthalf.Fromthestartingpoint,wetracetheleftandrightprofilesofhead.Becausetheouterboarderofthefirstlayerisshiftedoutwardsfromtheactualboundaryforafewpixels(say,p),weadjusttheedgeofthelefthalftotherightandtheedgeoftherighthalftotheleftbyppixelsrespectively.Becausesomefaceprofilesdisappearinthehighthresholdedimage,thelowthresholdedimageisusedtotracefaceboundary.Theheadbordersareremovedandamorphologicalopeningisusedtoeliminateunnecessarynoises.Afterthat,theimageisscannedfromfourdirections(righttoleft,lefttoright,toptobottom,andbottomtotop)toproducethefaceboundary.2.3.LocatefacialfeaturesInordertoidentifyfacialfeatures,wefirstextracttheircandidates.Thecandidatesareextractedbyoverlayingthefaceboundaryobtainedfromtheprevioussectiononthebinaryedgeimage,andconvertingallthewhitepixelsinthebinaryedgeimagethatareonoroutsidethefaceboundarytoblack.Afterthat,weapplyx-andy-projectionstolocatefacialfeatures.Inthecandidateimage,weusex-projectiontoobtainthefacialfeatures’horizontallocationsandy-projectiontoobtaintheirverticallocations.Bycombiningthehorizontalandverticallocations,wecanobtainfourrectangularboxes:twoforeyes,onefornostrils,andoneformouth.譯文不用考慮面部內(nèi)容的人臉檢測與定位2我們的方法在這個局部,我們介紹我們的方法處理前面對人臉圖像的看法,從而來提取頭頂區(qū)域、面孔區(qū)域,并且面部特征包括眼睛以及眼眉、鼻孔,和嘴.頭頂區(qū)域是頭外面外形,包括肩膀。面孔區(qū)域是排除頭發(fā)、肩膀和脖子的面孔等高。我們使用直方圖定位面部特征。2.1平滑和閾值使用雙重閾值法如下圖。第一步將使用3x3的中值濾波器來減少噪聲,在這以后進行邊緣操作。我們使用Wechsler和Kidode的方法來測試邊緣檢測技術(shù)的可靠性,結(jié)果在圖2中顯示。邊緣檢測結(jié)果看上去太稀薄而且人臉頂部區(qū)域太微弱以至于不能夠被閾值程序所檢測。為了獲得圓潤的界限,JianmingHu等[14]提出了四個面具(水平(大小3.7),垂直(7.3),45_(9.3),和135_(9.3))用來檢測圖像邊緣和選擇最大值作為邊緣分量。而不是使用大些的作為邊緣分量。我們設計出一些面具模板用來邊緣檢測,實驗結(jié)果說明我們的方法像他們的一樣好。閾值法是把灰度級邊緣圖像轉(zhuǎn)化為二值圖像,高閾值點是由占整個圖像的前5%灰度級高的灰度決定的,而低閾值點是由占整個圖像的前25%灰度級高的灰度決定的。高閾值是用來獲取頭頂區(qū),而低閾值是用來獲得面部區(qū)域的。這些閾值百分比的選定是由經(jīng)驗性數(shù)據(jù)決定的,為了獲取最好的實驗結(jié)果。2.2檢測頭型和面部區(qū)域為了確定頭部邊界區(qū)域,我們把高閾值圖分割成左右兩半局部。當我們從頂部到低部掃描圖邊緣時,第一層周線產(chǎn)生的是頭部邊界和第二層周線產(chǎn)生的是面部邊界區(qū)域。為了追蹤頭部邊界,起始點設置在第一層左半部的第一個白象素的位置。從這個起始點開始,我們來追蹤左右局部頂部輪廓。因為第一層的外部邊界從實際的邊界向外移動數(shù)個象素數(shù)〔稱為P〕,我們分別各自調(diào)整左半部到右半部和右半部到左半部個P象素點。因為一些面部輪廓在高閾值圖中很模糊,所以我們用低閾值來檢測面部區(qū)域。頭部區(qū)域被隔離,我們用形態(tài)學的方法來消除不必要的噪聲。這樣做以后,圖像被從四個方向〔從左到右,從右向左,從頂?shù)降?,從底向頂〕進行檢測來確定臉部特征。2.3定位臉部特征為了識別臉部特征,我們首先提取他們的候選區(qū)域。候選區(qū)域通過覆蓋臉部邊界獲得原圖的二進制圖邊緣局部和把在或不在二進制圖內(nèi)的白象素轉(zhuǎn)化成黑象素。這樣之后我們應用x和y坐標來定位臉部特征,在圖的候選區(qū)域中用x坐標來獲得臉部特征的水平定位和用y坐標來獲得臉部特征的垂直定位。通過合并水平和垂直方向上的定位,我們可以得到四個直方圖:兩眼的、鼻孔的和嘴巴的。附錄B參考文獻題錄及摘要[1]黃翠榮,嚴佩敏,時鹿鳴.基于方差相似度計算的人臉識別技術(shù)[J].上海大學學報(自然科學版),2003.12(4):1-4摘要:針對人臉識別過程中所需的圖像匹配,采用計算特征矢量方差的方法,經(jīng)過一定的對應關系變化,得到了相似度計算的權(quán)值。這些權(quán)值具有很好的穩(wěn)定性和準確性,有利于識別率的提高。實驗采用自制人臉庫進行識別測試,取得了較滿意的結(jié)果,驗證了此方法的有效性。[2]王天學,刑桂芬,江波.基于區(qū)域分割的復雜背景中的人臉檢測與定位[J].計算機工程與設計,2004,11(25):1-3摘要:基于區(qū)域分割和特征驗證,提出了一種復雜背景下的人臉檢測與定位的方法。在粗略定位人臉的根底上,提出了一種新穎簡單的區(qū)域分割方法,有效地定位出了人臉的候選區(qū)域,通過檢測眼睛和嘴唇完成對人臉確實認。實驗說明該方法檢測速度快、準確率高、魯棒性好。[3]朱文佳,戚飛虎.快速人臉檢測與特征定位[J].中國圖像圖形學報,2005,11(10):1-4摘要:人臉檢測與特征定位是人臉分析技術(shù)的一個重要組成局部,其目標是在圖像中搜索人臉特征(如眼、鼻、嘴、耳等)的位置。雖然人們可以毫不費力地完成這些工作,但對于機器來說,這依然是一件極其困難的任務。近幾年來該項技術(shù)已有了長足的開展,已成功地應用于諸如人臉識別、姿態(tài)識別、表情識別、臉部動畫等諸多領域。本文利用DavidCristinace和TimCootes提出的一個多階段人臉特征檢測方法實現(xiàn)了一個實時人臉特征定位系統(tǒng)。同時也對原算法本身作了一些改良,在對精度影響極小的情況下,大大提高了原算法的速度。[4]郭瑞,張淑玲,汪小芬.人臉識別特征提取方法和相似度匹配方法研究[J].計算機工程,2006,11(32):1-2摘要:橫向比擬特征提取方法,綜合考慮認證率和特征提取時間兩方面因素,該文認為特征臉結(jié)合線性判別分析方法是研究的4種特征提取方法中最優(yōu)的方法。通過對投影空間維數(shù)的研究,最正確投影空間維數(shù)同數(shù)據(jù)庫本身類內(nèi)圖像的相似程度和每一類的樣本數(shù)目同方向增長,它們之間存在定性關系而非定量關系。相似度匹配方法的研究結(jié)果說明余弦距離分類器分類效果最正確。[5]張敏,陶亮.人臉圖像中人眼的檢測與定位[J].光電工程,2006,8(33):1-6摘要:利用人臉幾何特征和圖像分割原理,提出了一種在有背景的灰度和彩色人臉圖像中自動檢測與定位人眼的新算法。首先,基于人臉器官幾何分布先驗知識建立人眼位置判定準那么;其次對人眼的分割閾值范圍進行粗估計;然后采用分割閾值遞增法,并結(jié)合人眼位置判定準那么判定分割圖像中雙眼黑塊是否出現(xiàn);最后利用二維相關系數(shù)作為對稱相似性測度,檢驗檢測到的雙眼的真實性。為了防止圖像背景對人眼檢測的干擾,還運用了膚色分割原理來縮小檢測人眼的搜索區(qū)域,從而進一步提高人眼定位的準確性。實驗驗證說明,所提出的人眼檢測與定位方法在速度和準確性方面具有良好的性能。[6]張永梅,韓焱,商細云.一種人臉的檢測與定位方法[J].中北大學學報〔自然科學版〕2006,3(27):1-5摘要:出一種基于膚色的人臉檢測定位算法,設計了基于膚色的人臉檢測和定位系統(tǒng).采用了增強人臉特征與臉部皮膚之間比照度的方法以及二值化方法,改良了預處理的效果.使用了基于邊界方法和基于區(qū)域方法相結(jié)合的算法,提取了眼睛、嘴和鼻子等關鍵特征,最終較好地實現(xiàn)了人臉定位。在MicrosoftWindowsME平臺上,利用VisualC++6.0開發(fā)了軟件。實驗結(jié)果說明,該軟件對于一定尺寸范圍內(nèi)清晰的正面人臉圖像能夠正確檢測定位并提取特征。[7]裘偉.一種基于相似度及復雜度人眼定位算法[J].蘇州大學學報〔工科版〕2006,6(26):1-4摘要:出一種在檢測到人臉區(qū)域的前提下,對人眼進行準確定位的算法。該算法首先計算人臉圖像的相似度信息,并對得到的相似度圖像進行二值化,從而標定人臉區(qū)域。然后對得到的人臉區(qū)域進行圖像塊分割,通過復雜度計算得到三個復雜度最大的區(qū)域塊,計算其居中度,從而實現(xiàn)對人眼的準確定位。[8]吳為.人臉識別的軟件系統(tǒng)開發(fā),復旦大學工學學士學位論文,2005年6月摘要:人臉識別技術(shù)有著廣闊的應用前景和迫切的現(xiàn)實需求,是當前模式識別、計算機視覺等領域里最熱門的研究方向之一。而人臉識別的軟件系統(tǒng)開發(fā),那么是聯(lián)系理論和實踐的最重要的環(huán)節(jié)。本文著重介紹了人臉識別軟件系統(tǒng)開發(fā)的背景,原理以及最后的設計結(jié)果。[9]謝建新.數(shù)字視頻采集與目標跟蹤,華僑大學本科畢業(yè)論文,2004年6月摘要:在室內(nèi)環(huán)境條件下,使攝像機具有智能檢測的視頻采集功能,實現(xiàn)攝像機對移動人體的臉部區(qū)域的檢測,并對人體的臉部區(qū)域進行實時跟蹤。在目標跟蹤模塊中,通過對所采集圖像進行灰度變換、二值化、垂直直方圖、水平直方圖的變換,結(jié)合膚色和人臉橢圓形狀來檢測彩色圖像、背景中的人臉區(qū)域。首先利用人類膚色在色度空間分布的穩(wěn)定性,檢測出圖像中的皮膚區(qū)域,通過先驗知識進行甄別,選出候選人臉區(qū)域。利用人臉的寬高比、顏色、結(jié)構(gòu)等特征進行人臉逐級判別,從而確定人臉位置;通過對臉部的各器官建立相應的數(shù)學模型,檢測出人臉的特征,對其鼻子,眼睛,嘴巴進行的定位,來驗證人臉區(qū)域定位的準確性。最后根據(jù)后續(xù)幀中人臉區(qū)域重心的位移來控制云臺實現(xiàn)跟蹤。[10]王學武,石躍祥.基于眼睛特征的人臉檢測方法[J].計算機應用研究.2006年,1(1):1-3摘要:于眼球的灰度級較低,而眼球周圍白色區(qū)域的灰度級較高,因此在其交界處灰度級產(chǎn)生強烈突變。利用這一特征先從圖像中找出可能的眼睛對,定位可能的人臉區(qū)域,通過計算其對稱性來確定各種人臉特征的存在,更進一步驗證可能的人臉區(qū)域。實驗證明,此方法能迅速準確地從復雜背景圖像中檢測出人臉,而且對多人臉圖像同樣有效。附錄C主要源程序////////////////////////////////////////////////////////////////////////////計算相似度//////////////////////////////////////////////////////////////////////////voidCLikelyHood::CalLikeHood(){inti,j;for(i=0;i<m_nHeight;i++) {for(j=0;j<m_nWidth;j++) {doublex1,x2; TCbCrtemp=CalCbCr(m_pSourceData[i][j].rgbRed,m_pSourceData[i][j].rgbGreen,m_pSourceData[i][j].rgbBlue); x1=temp.Cb-bmean; x2=temp.Cr-rmean; doublet; t=x1*(x1*brcov[1][1]-x2*brcov[1][0])+x2*(-x1*brcov[0][1]+x2*brcov[0][0]); t/=(brcov[0][0]*brcov[1][1]-brcov[0][1]*brcov[1][0]); t/=(-2); m_pLikeliHoodArray[i][j]=exp(t); } } filter(m_pLikeliHoodArray,m_nWidth,m_nHeight);doublemax=0.0; for(i=0;i<m_nHeight;i++) for(j=0;j<m_nWidth;j++) if(m_pLikeliHoodArray[i][j]>max) max=m_pLikeliHoodArray[i][j]; for(i=0;i<m_nHeight;i++) {for(j=0;j<m_nWidth;j++) {m_pLikeliHoodArray[i][j]/=max; } }m_bLikeliHoodReady=true;}/////////////////////////////////////////////////////////////////////////////////計算Cb,Cr///////////////////////////////////////////////////////////////////////////////TCbCrCLikelyHood::CalCbCr(intR,intG,intB){ TCbCrres;
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 電子測量技術(shù)在建筑智能化中的應用考核試卷
- 搬運設備智能調(diào)度與路徑規(guī)劃考核試卷
- 電力儀表的數(shù)字技術(shù)創(chuàng)新與應用考核試卷
- 石棉在水利工程和港口建設中的應用考核試卷
- 皮革服裝行業(yè)法律法規(guī)與標準解讀考核試卷
- 電子元器件在移動醫(yī)療設備中的應用考核試卷
- 照明項目實踐指導考核試卷
- 環(huán)境污染治理與區(qū)域環(huán)境質(zhì)量改善考核試卷
- 購物中心運營現(xiàn)場管理
- 2025知識產(chǎn)權(quán)許可協(xié)議樣本:技術(shù)秘密轉(zhuǎn)讓合同
- 白塞病診斷和治療課件
- 基準地價技術(shù)報告
- 靜安區(qū)實驗室施工方案模板
- 《上海奉賢區(qū)S村非機動車停放管理的調(diào)查報告》4200字
- 口腔門診診所過敏性休克搶救流程
- 2022橋梁承載能力快速測試與評估技術(shù)規(guī)程
- 風電機組吊裝作業(yè)安全管理
- 南陽市基礎教育教學研究項目立項申報書
- 提升員工質(zhì)量意識培訓課件
- GIS軟件工程的總體設計-
- 萬邦特種材料股份有限公司年產(chǎn)18000噸特種紙遷建項目環(huán)境影響報告書
評論
0/150
提交評論