人臉識(shí)別中圖像預(yù)處理的研究_第1頁(yè)
人臉識(shí)別中圖像預(yù)處理的研究_第2頁(yè)
人臉識(shí)別中圖像預(yù)處理的研究_第3頁(yè)
人臉識(shí)別中圖像預(yù)處理的研究_第4頁(yè)
人臉識(shí)別中圖像預(yù)處理的研究_第5頁(yè)
已閱讀5頁(yè),還剩16頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、 學(xué)號(hào):1110012130人臉識(shí)別中圖像預(yù)處理的研究Face Recognition In the Image Of Pretreatment課 程 名 稱:數(shù)字圖像處理學(xué) 院:專 業(yè) 名 稱:電 話:郵 箱:日 期:簽 名:人臉識(shí)別中圖像預(yù)處理的研究 學(xué)號(hào):1110012130摘要 本設(shè)計(jì)是一個(gè)關(guān)于人臉識(shí)別中圖像預(yù)處理的研究,人臉識(shí)別技術(shù)是計(jì)算機(jī)模式識(shí)別研究領(lǐng)域中一項(xiàng)熱門的研究課題。本文主要對(duì)人臉圖像進(jìn)行預(yù)處理,以便為進(jìn)行下一步的圖像識(shí)別做前提準(zhǔn)備。文中首先是對(duì)人臉識(shí)別的背景及國(guó)內(nèi)外相關(guān)研究工作的介紹。其次,是對(duì)各種預(yù)處理法及其在

2、人臉識(shí)別中的應(yīng)用作了詳細(xì)的介紹,并對(duì)各種方法從理論分析和實(shí)驗(yàn)結(jié)果兩方面進(jìn)行比較,從而讓人們對(duì)人臉識(shí)別圖像預(yù)處理有更深一層的了解。最后,利用垂直積分投影和水平積分投影法對(duì)人臉進(jìn)行定位。關(guān)鍵詞: 銳化,二值化,邊緣檢測(cè),人臉定位Abstract The design is an image on the pretreatment of face recognition,face recognition technology is the computer pattern recognition research in the field of a hot research topic. This

3、paper mainly preprocessing of face image , the next step in order to carry out the image recognition premise prepared to do. In the fist, this paper is to introduce the background and related research work of the face recognition. And then, text of the law and its various pretreatment in the applica

4、tion of face recognition in detail, and various methods from the theoretical analysis and experimental results to compare the two areas so that people on the face recognition have a better i

5、mage of a pretreatment of understanding. The last but not least, this paper uses the vertical integral projection and horizontal integral projection method to locate human faces. Key words:  Sharpening, Binarization , Edge detection, Face location 1. 引言隨著

6、信息技術(shù)的發(fā)展,以及計(jì)算機(jī)的軟硬件性能的飛速提升,更加高效并且更加友好的人機(jī)交互技術(shù)被不斷地提出并應(yīng)用于我們周圍。這些技術(shù)的應(yīng)用不再依賴于傳統(tǒng)的鍵盤、鼠標(biāo)、顯示器等設(shè)備,開(kāi)始向著多模態(tài)人機(jī)交互的方向發(fā)展。多模態(tài)人機(jī)交互模擬人類自然交流的方法,包括視覺(jué)、聽(tīng)覺(jué)、觸覺(jué)和嗅覺(jué),試圖綜合圖像,聲音,文字等手段,達(dá)到與計(jì)算機(jī)進(jìn)行交流的目的,其中以視覺(jué)交流最為方便和易于接受。同時(shí),圖像處理設(shè)備的性價(jià)比也不斷地提高,從而使得基于圖像處理的人機(jī)交互技術(shù)成為當(dāng)前研究領(lǐng)域的熱點(diǎn)。視頻監(jiān)控便是其中一個(gè)重要的研究方向,簡(jiǎn)單而言,不僅用攝像機(jī)代替人眼,而且用計(jì)算機(jī)替代人、協(xié)助人,來(lái)完成監(jiān)視或控制任務(wù),從而減輕人的負(fù)擔(dān)。智

7、能視覺(jué)監(jiān)控系統(tǒng)能在不需要人干預(yù)的情況下,通過(guò)攝像機(jī)拍錄的圖像序列進(jìn)行自動(dòng)分析來(lái)對(duì)場(chǎng)景中的變化進(jìn)行定位、跟蹤。早期的人臉信息方面的研究主要集中在人臉識(shí)別領(lǐng)域,這一時(shí)期的人臉識(shí)別算法都是在默認(rèn)已經(jīng)得到了一個(gè)正面人臉或者人臉很容易獲得的前提下進(jìn)行的。但是隨著人臉信息利用的研究范圍不斷擴(kuò)大和開(kāi)發(fā)實(shí)際系統(tǒng)需求的不斷提高,研究者們發(fā)現(xiàn),這種假設(shè)下的研究并不能滿足實(shí)際需求。于是,人臉檢測(cè)算法開(kāi)始作為獨(dú)立的研究?jī)?nèi)容發(fā)展起來(lái),并且發(fā)展出了人臉特征定位,人臉跟蹤等相關(guān)研究。2. 相關(guān)工作 1893年,Bertillon采用語(yǔ)句描述方法對(duì)人臉?lè)诸悺?#160; 20世紀(jì)60年代,Bledsoe提出了人臉識(shí)別的半自動(dòng)

8、系統(tǒng)模型與特征提取方法。  70年代,美、英等發(fā)達(dá)國(guó)家開(kāi)始重視人臉識(shí)別的研究工作并取得進(jìn)展。 1972年,Harmon用交互式人臉識(shí)別方法在理論上與實(shí)踐上進(jìn)行了詳細(xì)的論述。就在這一年,Sakai設(shè)計(jì)了人臉圖像自動(dòng)識(shí)別系統(tǒng)。  80年代初T. Minami研究出了優(yōu)于Sakai的人臉圖像自動(dòng)識(shí)別系統(tǒng)。  90年代,由于計(jì)算機(jī)技術(shù)、數(shù)字圖像處理、模式識(shí)別技術(shù)的發(fā)展,加上人們對(duì)人臉圖像自動(dòng)識(shí)別的迫切需求,各國(guó)軍、警方及有關(guān)部門高度重視,大公司鼎力相助,對(duì)它的研究變得非常熱門。  1996年美國(guó)軍方組織了人臉自動(dòng)識(shí)別系統(tǒng)大賽,勒克菲勒大學(xué)的Facelt

9、系統(tǒng)獲得冠軍。美國(guó)的LAU公司研制的人臉圖像自動(dòng)識(shí)別系統(tǒng),是以人眼辨別人的原理,基于生物測(cè)量學(xué)、人像復(fù)原技術(shù)開(kāi)發(fā)的裝置。用人臉12-42個(gè)特征點(diǎn),對(duì)人群中尋找的人進(jìn)行定量定性識(shí)別,已經(jīng)用在機(jī)場(chǎng)、火車站、公共場(chǎng)所、重點(diǎn)控制地區(qū)。 作為一種最直接、最自然、最容易被人接受的生物特征識(shí)別技術(shù),人臉識(shí)別致力于探索如何使機(jī)器能夠自動(dòng)地根據(jù)用戶的人臉圖像來(lái)鑒別用戶的身份。人臉識(shí)別發(fā)展到現(xiàn)在,已有40多年的歷史,是模式識(shí)別和計(jì)算機(jī)視覺(jué)的一個(gè)非常活躍的研究熱點(diǎn)。人臉識(shí)別的研究涉及模式識(shí)別、計(jì)算機(jī)視覺(jué)、人工智能、圖像處理、心理學(xué)、生理學(xué)和認(rèn)知科學(xué)等,與計(jì)算機(jī)人機(jī)交互領(lǐng)域和基于其它生物特征的身份識(shí)別方法都

10、有密切聯(lián)系。雖然人們可以毫不費(fèi)力地通過(guò)臉部圖像來(lái)鑒別互相的身份,然而由于成像過(guò)程中各種影響因素的變化常常導(dǎo)致同一個(gè)人的人臉圖像發(fā)生非常大的變化,因此建立自動(dòng)系統(tǒng)完成識(shí)別任務(wù)是非常具有挑戰(zhàn)性的。雖然目前國(guó)內(nèi)外已經(jīng)有許多實(shí)用系統(tǒng)問(wèn)世,但是只有在非常苛刻的成像條件下,才能得到比較令人滿意的識(shí)別效果。因此,人臉識(shí)別研究仍然遠(yuǎn)遠(yuǎn)沒(méi)有到達(dá)完善的境地,還有非常大的發(fā)展空間。  我國(guó)在這方面也取得了較好的成就,國(guó)家863項(xiàng)目“面像檢測(cè)與識(shí)別核心技術(shù)”通過(guò)成果鑒定并初步應(yīng)用,就標(biāo)志著我國(guó)在人臉識(shí)別這一當(dāng)今熱點(diǎn)科研領(lǐng)域掌握了一定的核心技術(shù)。北京科瑞奇技術(shù)開(kāi)發(fā)股份有限公司在2002年開(kāi)發(fā)了一種人臉鑒別系統(tǒng)

11、,對(duì)人臉圖像進(jìn)行處理,消除了照相機(jī)的影響,再對(duì)圖像進(jìn)行特征提取和識(shí)別。這對(duì)于人臉鑒別特別有價(jià)值,因?yàn)槿四樿b別通常使用正面照,要鑒別的人臉圖像是不同時(shí)期拍攝的,使用的照相機(jī)不一樣。系統(tǒng)可以接受時(shí)間間隔較長(zhǎng)的照片,并能達(dá)到較高的識(shí)別率,在計(jì)算機(jī)中庫(kù)藏2300人的正面照片,每人一張照片,使用相距1-7年、差別比較大的照片去查詢,首選率可以達(dá)到50%,前20張輸出照片中包含有與輸入照片為同一人的照片的概率可達(dá)70%。2005年1月18日,由清華大學(xué)電子系人臉識(shí)別課題組負(fù)責(zé)人蘇光大教授主持承擔(dān)的國(guó)家"十五"攻關(guān)項(xiàng)目人臉識(shí)別系統(tǒng)通過(guò)了由公安部主持的專家鑒定。鑒定委員會(huì)認(rèn)為,該項(xiàng)技術(shù)處于

12、國(guó)內(nèi)領(lǐng)先水平和國(guó)際先進(jìn)水平。3. 你的工作本論文主要對(duì)人臉識(shí)別圖像預(yù)處理模塊的研究。本系統(tǒng)應(yīng)用MATLAB對(duì)樣本圖像做直方圖均衡化處理,噪聲去除、平滑、銳化處理,二值化和邊緣檢測(cè)等預(yù)處理,進(jìn)而應(yīng)用到人臉識(shí)別系統(tǒng)。根據(jù)人臉的結(jié)構(gòu)特征點(diǎn)和數(shù)學(xué)形態(tài)學(xué)的理論對(duì)人臉進(jìn)行定位。圖像預(yù)處理模塊在整個(gè)系統(tǒng)中起著極其關(guān)鍵的作用,圖像處理的好壞直接影響著后面的定位和識(shí)別工作。3.1 人臉識(shí)別的過(guò)程3.1.1人臉識(shí)別的整體過(guò)程 一個(gè)典型的人臉識(shí)別系統(tǒng)處理過(guò)程如圖所示。一般包括三個(gè)步驟:人臉檢測(cè)、人臉特征提取、人臉識(shí)別與驗(yàn)證。具體實(shí)現(xiàn)過(guò)程中,首先獲取圖像集,然后用人臉檢測(cè)模塊進(jìn)行人臉檢測(cè)。如果檢測(cè)到人臉圖像

13、,則進(jìn)行特征點(diǎn)定位,一般以兩眼中心為基準(zhǔn),根據(jù)兩眼根據(jù)兩眼距離d,對(duì)人臉圖像進(jìn)行歸一化處理,歸一化處理包含了圖像預(yù)處理,圖像縮放以及有效人臉區(qū)域選取等操作。最后對(duì)歸一化的人臉圖像進(jìn)行特征提取,送入分類器進(jìn)行識(shí)別,最終獲得識(shí)別結(jié)果1。 圖1 人臉識(shí)別技術(shù)處理流程圖 3.1.2預(yù)處理過(guò)程 預(yù)處理(前處理)是人臉識(shí)別過(guò)程中的一個(gè)重要環(huán)節(jié)。預(yù)處理就是在圖像分析中,對(duì)輸入圖像進(jìn)行特征抽取、分割和匹配前所進(jìn)行的處理。輸入圖像由于圖像采集環(huán)境的不同,如光照明暗程度以及設(shè)備性能的優(yōu)劣等,往往存在有噪聲,對(duì)比度不夠等缺點(diǎn)。另外,距離遠(yuǎn)近,焦距大小等又使得人臉在整幅圖像中間

14、的大小和位置不確定。為了保證人臉圖像中人臉大小,位置以及人臉圖像質(zhì)量的一致性,必須對(duì)圖像進(jìn)行預(yù)處理。圖像預(yù)處理的主要目的是消除圖像中無(wú)關(guān)的信息,濾除干擾、噪聲,恢復(fù)有用的真實(shí)信息,增強(qiáng)有關(guān)信息的可檢測(cè)性和最大限度地簡(jiǎn)化數(shù)據(jù),從而改進(jìn)特征抽取、圖像分割、匹配和識(shí)別的可靠性。 在預(yù)處理階段,對(duì)圖像進(jìn)行優(yōu)化,盡可能去除或者減小光照、成像系統(tǒng)、外部環(huán)境等對(duì)待處理圖像的干擾,為后續(xù)處理提高質(zhì)量。以便使不同的人臉圖像盡可能在同一條件下完成特征提取、訓(xùn)練和識(shí)別。人臉圖像的預(yù)處理主要包括人臉?lè)稣?,人臉圖像的增強(qiáng),以及歸一化等工作。人臉?lè)稣菫榱说玫饺四樜恢枚苏娜四槇D像;圖像增強(qiáng)是為了改善人臉圖像的

15、質(zhì)量,不僅在視覺(jué)上更加清晰圖像,而且使圖像更利于計(jì)算機(jī)的處理與識(shí)別。歸一化工作的目標(biāo)是取得尺寸一致,灰度取值范圍相同的標(biāo)準(zhǔn)化人臉圖像2。3.2 人臉圖像預(yù)處理過(guò)程3.2.1 圖像采集通常人臉信息的來(lái)源有以下幾種方式:(1)通過(guò)掃描儀對(duì)照片的掃描 (2)通過(guò)數(shù)碼相機(jī)對(duì)人臉的拍攝(3)Internet上各種免費(fèi)提供的數(shù)據(jù)庫(kù)。 人臉圖像的采集需要在弱光源環(huán)境并且人臉部無(wú)明顯遮蓋物,人臉部表情不能太夸張。3.2.2 灰度圖像直方圖均衡化圖像的灰度變換有多種方法可以實(shí)現(xiàn),其中最常用的就是直方圖均衡化的方法。直方圖均衡化又稱直方圖平坦化,是將一已知灰度概率密度分布的圖像,經(jīng)過(guò)某種變換,

16、變成一幅具有均勻灰度概率分布的新圖像,其結(jié)果是擴(kuò)展了像元取值的動(dòng)態(tài)范圍,從而達(dá)到了增強(qiáng)圖像整體對(duì)比度的效果。 直方圖是一種點(diǎn)操作,它逐點(diǎn)改變圖像的灰度值,盡量使各個(gè)灰度級(jí)別都具有相同的數(shù)量的像素點(diǎn),使直方圖趨于平衡。直方圖均衡可以使輸入圖像轉(zhuǎn)換為在每一個(gè)灰度級(jí)上都有相同像素點(diǎn)數(shù)的輸出圖像(即輸出的直方圖是平的)。這對(duì)于圖像比較或分割是十分有用的3。 均衡化處理的步驟如下: (1)對(duì)給定的待處理圖像統(tǒng)計(jì)其直方圖,求出Pr(r) (2)根據(jù)統(tǒng)計(jì)出的直方圖采用累積分布函數(shù)做變換,,求變換后的新灰度; (3) 用新灰度代替就灰度,求出Ps(s),這一步

17、是近似過(guò)程,應(yīng)根據(jù)處理的目的盡量做到合理,同時(shí)把灰度值相等或近似的合并到一起。處理后效果圖如下: 圖2 直方圖均衡化 由兩幅圖像對(duì)比可以看出,原圖像的灰度值非常集中,導(dǎo)致其對(duì)比度效果差,進(jìn)行直方圖均衡化處理之后,灰度值重新分配,直方圖的范圍加大了,原來(lái)分布較密的部分被拉伸,分布稀疏的部分被壓縮,從而使一幅圖像的對(duì)比度在總體上得到很大的增強(qiáng),處理之后的圖像變的更加的清楚,圖像中的一些細(xì)節(jié)也突出了。3.2.3 灰度圖像平滑與銳化處理圖像平滑就是針對(duì)圖像噪聲的操作,其主要作用是為了消除噪聲,圖像平滑的常用方法是采用均值濾波或中值濾波,均值濾波是一種線性空間濾波,它用一個(gè)有奇數(shù)點(diǎn)的掩模在圖像上滑動(dòng),將

18、掩模中心對(duì)應(yīng)像素點(diǎn)的灰度值用掩模內(nèi)所有像素點(diǎn)灰度的平均值代替,如果規(guī)定了在取均值過(guò)程中掩模內(nèi)各像素點(diǎn)所占的權(quán)重,即各像素點(diǎn)所乘系數(shù),這時(shí)就稱為加權(quán)均值濾波;中值濾波是一種非線性空間濾波,其與均值濾波的區(qū)別是掩模中心對(duì)應(yīng)像素點(diǎn)的灰度值用掩模內(nèi)所有像素點(diǎn)灰度值的中間值代替。以下是對(duì)多種濾波的比較效果圖:圖3多種濾波處理后的對(duì)比圖從中可以看出高斯濾波和均值濾波對(duì)圖像處理后的效果較好,而motion濾波對(duì)圖像處理后,圖像變得較模糊。 圖像銳化的目是使灰度反差增強(qiáng),從而使圖像的邊緣或線條變得清晰,有利于輪廓抽取。該系統(tǒng)中主要對(duì)圖像進(jìn)行sobel算子和Laplacian算子銳化處理。Sobel算子是典型的

19、基于一階導(dǎo)數(shù)的邊緣檢測(cè)算子,由于該算子中引入了類似局部平均的運(yùn)算,因此對(duì)噪聲具有平滑作用,能很好的消除噪聲的影響。Sobel算子包含兩組3x3的矩陣,分別為橫向及縱向模板,將之與圖像作平面卷積,即可分別得出橫向及縱向的亮度差分近似值。拉普拉斯算子是最簡(jiǎn)單的各向同性微分算子,一個(gè)二元圖像函數(shù)f(x,y)的拉普拉斯變換定義為 因?yàn)槿我怆A微分都是線性操作,所以拉普拉搜變換也是一個(gè)線性操作。為了更適于數(shù)字圖像處理,這一方程需要表示為離散形式。通過(guò)鄰域處理有多種方法定義離散變換,考慮到有兩個(gè)變量,在x方向上對(duì)二階偏微分采用下列定義:類似地,在y方向上為 二維拉普拉斯數(shù)字實(shí)現(xiàn)可由這兩個(gè)

20、分量相加得到:   由于拉普拉斯是一種微分算子,它的應(yīng)用強(qiáng)調(diào)圖像中灰度的突變和降低灰度慢變化的區(qū)域。這將產(chǎn)生一幅把圖像中的淺灰色邊線和突變點(diǎn)疊加到暗背景中的圖像。將原始圖像和拉普拉斯圖像疊加在一起的簡(jiǎn)單方法可以保護(hù)拉普拉斯銳化處理的經(jīng)過(guò),同時(shí)又能復(fù)原背景信息。如果實(shí)用的定義具有負(fù)的中心系數(shù),那么必須將原始圖像減去經(jīng)拉普拉斯變換后的圖像而不是加上它,從而得到銳化的結(jié)果。所以我們使用拉普拉斯變換對(duì)圖像增強(qiáng)的基本方法可表示為下式: 對(duì)圖像進(jìn)行處理后的效果圖如下:圖4 平滑與銳化后的效果圖 從圖中對(duì)比可以看出經(jīng)平滑處理的圖像有些細(xì)節(jié)會(huì)變得模糊,但圖像經(jīng)銳化后使灰

21、度反差增強(qiáng),從而使圖像的邊緣或線條變得清晰。而從從Laplacian銳化后的圖像1和2的對(duì)比中可看出將原始圖像和拉普拉斯圖像疊加在一起的簡(jiǎn)單方法可以保護(hù)拉普拉斯銳化處理的經(jīng)過(guò),同時(shí)又能復(fù)原背景信息。3.2.4 圖像二值化處理 人臉圖像通過(guò)二值化處理把灰度圖轉(zhuǎn)化為單色(黑,白)圖像,二值化的關(guān)鍵是找出一個(gè)合理的閡值,在人臉識(shí)別中二值化用來(lái)把人的頭發(fā)、眼睛、臉的輪廓及背景以及人臉的亮域分開(kāi)。 (1) 二值化的數(shù)學(xué)表示 圖像的二值化一般按下述公式進(jìn)行:公式中g(shù)(x,y)是原圖像中位于(x ,y)處像素的灰度,gb(x,y)是二值化后該處的像素值,它只能取1(白)或0(黑),在人臉

22、圖像二值化過(guò)程中,圖像數(shù)值為0的部分為背景,數(shù)值為1的部分表示人臉,T是二值化處理過(guò)程的閩值。二值化的關(guān)鍵在于閾值的選擇,通常用一個(gè)三元函數(shù)的閾值算子來(lái)表示閩值式中(x,y)是圖像象素坐標(biāo),Gb(x,y)是(x,y)的灰度電平,Nb(x,y)是(x,y)周圍局部灰度特性。(2)二值化閾值的確定 二值化閾值將人臉圖像的像素分為兩組集合,一組的灰度低于該閾值,另一組的灰度高于該閾值,二值化問(wèn)題的關(guān)鍵就在于如何精確的找出閾值,也就是兩組灰度集合的最佳分離值。 我們采用的是類間方差分析法對(duì)圖像進(jìn)行二值化處理的。類間方差分析法是基于對(duì)邊緣處理后的圖像邊緣灰度值較高,可通過(guò)閾值前后的類

23、間方差和類內(nèi)方差的比較,最大值處就是可選的閾值。 算法假設(shè)圖像有1,2,3.L級(jí)灰度,設(shè)閾值為k,把給定區(qū)域的像素分為具有k以上灰度值的像素和小于k的像素兩類。分別計(jì)算像素?cái)?shù)目、平均灰度值、方差,然后用類間方差與類內(nèi)方差之比,求出類間方差最大時(shí)對(duì)應(yīng)的K值,作為圖像的閾值。 實(shí)驗(yàn)效果圖如下:圖5 圖像二值化從結(jié)果圖中可看出,灰度圖像經(jīng)過(guò)二值化處理后轉(zhuǎn)化為單色(黑,白)圖像把人的頭發(fā)、眼睛、嘴巴、臉的輪廓及背景以及人臉的亮域分開(kāi),效果清楚明顯。 3.2.5圖像邊緣檢測(cè)圖像邊緣是圖像最基本的特征之一,往往攜帶著一幅圖像的大部分信息。而邊緣存在于圖像的不規(guī)則結(jié)構(gòu)和不平穩(wěn)現(xiàn)

24、象中,也即存在于信號(hào)的突變點(diǎn)處,這些點(diǎn)給出了圖像輪廓的位置,這些輪廓常常是在圖像處理時(shí)所需要的非常重要的一些特征條件,這就需要對(duì)一幅圖像檢測(cè)并提取出它的邊緣。本文主要運(yùn)用canny算子對(duì)圖像進(jìn)行處理。Canny檢測(cè)階躍邊緣的基本思想是在圖像中找出具有局部最大梯度幅值的像素點(diǎn)。Canny根據(jù)檢測(cè)的要求,定義了下面三個(gè)最優(yōu)準(zhǔn)則:(1) 最優(yōu)檢測(cè)。對(duì)真實(shí)邊緣不漏檢,非邊緣點(diǎn)不錯(cuò)檢,即要求輸出信噪比最大。 (2) 最優(yōu)檢測(cè)精度。檢測(cè)的邊緣點(diǎn)的位置距實(shí)際的邊緣點(diǎn)的位置最近。(3) 檢測(cè)點(diǎn)與邊緣點(diǎn)一一對(duì)應(yīng)。每一個(gè)實(shí)際存在的邊緣點(diǎn)和檢測(cè)的邊緣點(diǎn)是一一對(duì)應(yīng)的關(guān)系。 Canny首次將上述判據(jù)

25、用是數(shù)學(xué)的形式表示出來(lái),然后采用最優(yōu)化數(shù)值方法,得到最佳邊緣檢測(cè)模板。對(duì)于二維圖像,需要使用若干方向的模板分別對(duì)圖像進(jìn)行卷積處理,再取最可能的邊緣方向。現(xiàn)在對(duì)Canny邊緣檢測(cè)器作一概括說(shuō)明。用fi,j表示圖像。使用可分離濾波方法求圖像與高斯平滑濾波器卷積,得到的結(jié)果是一個(gè)已平滑數(shù)據(jù)陣列。 其中Gi,j;代表一個(gè)高斯濾波的過(guò)程,而是高斯函數(shù)的標(biāo)準(zhǔn)差,它控制著平滑程度。 已平滑數(shù)據(jù)陣列Si,j的梯度可以使用2×2一階有限差分近似式來(lái)計(jì)算x與y偏導(dǎo)數(shù)的兩個(gè)陣列Pi,j與Qi,j:在這個(gè)2×2正方形內(nèi)求有限差分的均值,以便在圖像中的同一點(diǎn)計(jì)算x和y的偏導(dǎo)數(shù)梯度

26、。幅值和方位角可用直角坐標(biāo)到極坐標(biāo)的坐標(biāo)轉(zhuǎn)化公式來(lái)計(jì)算:在上式中,Mi,j反映了圖像上的點(diǎn)i,j處的邊緣強(qiáng)度,i,j是圖像點(diǎn)i,j的法向矢量,正交于邊緣方向。根據(jù)Canny的定義,中心邊緣點(diǎn)為算子Gi,j;與圖像fi,j的卷積在邊緣梯度方向上的最大值,這樣就可以在每一個(gè)點(diǎn)的梯度方向上判斷此點(diǎn)強(qiáng)度是否為其鄰域的最大值來(lái)確定該點(diǎn)是否為邊緣點(diǎn)。當(dāng)一個(gè)像素滿足下面三個(gè)條件時(shí),則被認(rèn)為是圖像的邊緣點(diǎn): (1) 該點(diǎn)的邊緣強(qiáng)度大于沿該點(diǎn)梯度方向的兩個(gè)相鄰像素點(diǎn)的邊緣強(qiáng)度 (2)與該點(diǎn)梯度方向上相鄰兩點(diǎn)的方向差小于4(3)以該點(diǎn)為中心的3×3鄰域中的邊緣強(qiáng)度極大值小于某個(gè)閾值&

27、#160;Canny給出的這三個(gè)判據(jù)具有廣泛的代表意義12。實(shí)驗(yàn)結(jié)果圖:圖6 canny算子邊緣檢測(cè) Canny算子采用高斯函數(shù)對(duì)圖像進(jìn)行平滑處理,因此具有較強(qiáng)的噪聲抑制能力;同樣該算子也將一些高頻邊緣平滑掉,造成邊緣丟失,采用了雙閾值算法檢測(cè)和連接邊緣,邊緣的連續(xù)性較好。3.3 人臉檢測(cè)定位算法 設(shè)所處理的圖像為I(x,y),其大小為M*N,則該圖像的垂直積分投影函數(shù)為:PV(x)稱為垂直積分投影函數(shù),觀察不同單人圖像的垂直積分投影曲線,可以發(fā)現(xiàn)人臉?biāo)趨^(qū)域使垂直積分投影曲線形成一個(gè)具有一定寬度的凸峰。這個(gè)凸峰的左右邊界大致代表了人臉的左右邊界,這是因?yàn)榕c背景相比,人臉區(qū)域往往具有

28、較高的亮度,在經(jīng)過(guò)二值化后的圖像中,人臉區(qū)域(灰度值為1)與背景(灰度值為0)分離開(kāi)來(lái)。在人臉左右邊界處,垂直方向上亮度值的總和迅速減小,形成一個(gè)明顯的凸峰。因此只要確定垂直積分投影曲線中主要凸峰的左右邊界,就能得到人臉的左右邊界。人臉的眉、眼、鼻孔、嘴區(qū),從灰度分布上來(lái)看,比周圍區(qū)域暗,因此如對(duì)人臉作水一平積分投影:則在眉、眼、鼻孔、嘴區(qū)的水平位置分別會(huì)出現(xiàn)一個(gè)極小值,這是因?yàn)槿四槇D像中眉毛,眼睛,鼻子,嘴巴這些主要特征點(diǎn)的像素灰度值比較小,二值化以后有明顯的黑區(qū),因此在水平投影圖上的峰谷變化中便可以確定各主要特征點(diǎn)的大致分布位置。一旦眼、嘴水平位置確定后,便可獲得這兩者之間的垂直距離h,令

29、w=0.8*h,便可確定臉區(qū)(h和w分別對(duì)應(yīng)臉區(qū)的高和寬),其中臉區(qū)的上,下邊分別落在眼之上,嘴之下。人臉定位圖如下:圖7 人臉定位4結(jié)語(yǔ)文中介紹了臉識(shí)別的前景展望,人臉識(shí)別的整體過(guò)程,及預(yù)處理的方法。本文主要針對(duì)人臉識(shí)別中圖像預(yù)處理進(jìn)行研究,通過(guò)圖像預(yù)處理的一些方法,像直方圖均衡化、平滑、銳化、二值化、邊緣檢測(cè)等,對(duì)讀入的人臉圖像進(jìn)行處理消除圖像中無(wú)關(guān)的信息,從而使圖像增強(qiáng),圖像細(xì)節(jié)突出,然后利用人臉的垂直積分投影和水平積分投影法進(jìn)行人臉的定位。由于時(shí)間和條件的限制,還存在著相當(dāng)?shù)牟蛔阒帲海?)預(yù)處理的方法還有很多,但由于實(shí)際情況有限不能一一展現(xiàn)。 (2)對(duì)于較難識(shí)別的圖像不能做到很好的處理,影

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論