基于PCA的人臉識別算法實現(xiàn)_第1頁
基于PCA的人臉識別算法實現(xiàn)_第2頁
基于PCA的人臉識別算法實現(xiàn)_第3頁
基于PCA的人臉識別算法實現(xiàn)_第4頁
基于PCA的人臉識別算法實現(xiàn)_第5頁
已閱讀5頁,還剩69頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

畢業(yè)設(shè)計(論文)設(shè)計(論文)題目:基于PCA的人臉識別算法實現(xiàn)摘要隨著科技的進(jìn)展,人類社會的進(jìn)步,傳統(tǒng)身份識別由于容易遺失,容易被破解已不能起到身份識別作用。人們需要加倍平安靠得住的身份識別技術(shù)。而生物特點的并世無雙,不易丟失和被復(fù)制的特性專門好知足了身份識別的需要。同時隨著運算機(jī)科學(xué)技術(shù)和生物醫(yī)學(xué)的進(jìn)展使得利用生物特點識別成了可能。在生物特點識別領(lǐng)域,由于人臉識別的操作快速簡單,結(jié)果直觀,準(zhǔn)確靠得住,不需要人的配合等優(yōu)勢已成為人們關(guān)注的核心。主成份分析(PCA)通過提取高維度的人臉圖像的主元,使得圖像在低維度空間中被處置來降低了圖像處置的難度。由于其有效的解決了圖像空間維數(shù)太高的問題,已經(jīng)成為人臉識別領(lǐng)域超級重要的理論。本文研究的確實是基于PCA的人臉識別算法的實現(xiàn)。本文依照完整人臉識別流程來分析基于PCA的人臉識別算法實現(xiàn)的性能。第一利用經(jīng)常使用的人臉圖像的獲取方式獲取人臉圖像。本文為了更好的分析基于PCA人臉識別系統(tǒng)的性能選用了Essex人臉數(shù)據(jù)庫。接下來是人臉圖像預(yù)處置方式。由于Essex人臉圖像質(zhì)量較好,而且已經(jīng)做過相應(yīng)的預(yù)處置,因此本文實驗中只利用灰度處置。接著利用PCA提取人臉特點,利用奇異值分解定理計算協(xié)方差矩陣的特點值和特點向量和利用最近鄰法分類器歐幾里得距離來進(jìn)行人臉判別分類。在實驗中咱們發(fā)覺基于PCA的人臉識別系統(tǒng)的識別率很高,而且具有必然魯棒性,因此基于PCA的人臉識別算法的實現(xiàn)的研究仍是成心義?!娟P(guān)鍵詞】人臉識別PCA算法奇異值分解定理歐幾里得距離

ABSTRACTWiththedevelopmentofscienceandtechnology,theprogressofhumansociety,thetraditionalidentificationiseasytolose,easytobecrackedandithasnotplayanidentifiablerole.Peopleneedamoresecureandreliableidentificationtechnology.Biometricisunique,easytoloseandreplicationcharacteristicsofgoodmeettheneedsoftheidentification.Withthedevelopmentofcomputerscienceandtechnologyandbiomedicalmakesuseofbiometricidentificationhasbecomepossible.Inthefieldofbiometricidentification,facerecognitionwiththeadvantagesofoperationisfastandsimple,theresultsareintuitive,accurateandreliable,donotneedco-ordination,hasbecomethefocusofattention.Theprincipalcomponentanalysis(PCA)toextracthighdimensionalfaceimageofthemainelement,makingtheimagesareprocessedinlow-dimensionalspaceanditreducesthedifficultyofimageprocessing.PCAsolveseffectivelytheproblemofhighdimensionimagespaceandithasbecomeaveryimportanttheoryinfacerecognitionfield.Thispaperisinthiscontextofwritingfrom.

InaccordancewiththefullrecognitionprocesstoanalyzetheperformanceofPCA-basedfacerecognitionalgorithm.Thefirsttousethemethodofaccesstocommonlyusedfaceimagesforfaceimages.InordertobetteranalysisisbasedontheperformanceofthePCAfacerecognitionsystemselectedEssexfacedatabase.Nextisthefaceimagepreprocessingmethods.Essexfaceimagequalityisbetter,andhavedonetheappropriatepretreatment,usingonlygray-scaleprocessingofthistrial.ThenusethePCAforfacefeatureextractionusingsingularvaluedecompositiontheoremtocalculatethecovariancematrixoftheeigenvaluesandeigenvectors,andusetheEuclideandistanceofthenearestneighborclassifiertotheclassificationofhumanfacediscrimination.Intheexperiment,wefoundthatahighrecognitionrateofthePCA-basedfacerecognitionsystem,butwithacertainrobustness,thePCA-basedfacerecognitionalgorithmtoachievemeaningful.【Keywords】facerecognitionPCAalgorithmSVDEuclideandistance

目錄前言 1第一章人臉識別系統(tǒng)概述 2第一節(jié)人臉識別的研究概況 2第二節(jié)人臉識別的進(jìn)展趨勢 3一、多數(shù)據(jù)融合與方式綜合 4二、動態(tài)跟蹤人臉識別系統(tǒng) 4三、基于小波神經(jīng)網(wǎng)絡(luò)的人臉識別 4四、三維人臉識別 4五、適應(yīng)各類復(fù)雜背景的人臉分割技術(shù) 4六、全自動人臉識別技術(shù) 4第三節(jié)人臉識別技術(shù)的要緊難點 4一、復(fù)雜條件下人臉的檢測和關(guān)鍵點定位 5二、光照問題 5三、資態(tài)問題 5四、表情問題 5五、遮擋問題 5第四節(jié)人臉識別流程 5一、人臉圖像搜集 6二、預(yù)處置 6三、特點提取 6第五節(jié)本章小結(jié) 7第二章人臉圖像的獲取 9第一節(jié)人臉圖像獲取 9第二節(jié)人臉分割 9第三節(jié)人臉數(shù)據(jù)庫 10第四節(jié)本章小結(jié) 11第三章人臉圖像的預(yù)處置 12第一節(jié)人臉圖像格式 12一、JPEG格式 12二、JPEG2000格式 12三、BMP格式 13四、GIF格式 13五、PNG格式 13第二節(jié)人臉圖像經(jīng)常使用預(yù)處置方式 14一、灰度轉(zhuǎn)變 14二、二值化 15三、直方圖均衡 15四、圖像濾波 15五、圖像銳化 17六、圖像歸一化 18第三節(jié)本章小結(jié) 19第四章人臉識別 20第一節(jié)主成份分析大體理論 20一、什么是主成份分析? 20二、例子 20三、基變換 21四、方差 23五、PCA求解:特點根分解 27六、PCA的假設(shè) 28七、總結(jié): 28八、在運算機(jī)視覺領(lǐng)域的應(yīng)用 30第二節(jié)基于PCA人臉識別算法的實現(xiàn) 31一、創(chuàng)建數(shù)據(jù)庫 32二、計算特點臉 32三、人臉識別 34第三節(jié)本章小結(jié) 36結(jié)論 37致謝 38參考文獻(xiàn) 39附錄 40一、英文原文 40二、英文翻譯 53三、源程序 64前言隨著社會和科技的進(jìn)展,社會步伐的加速,人們對高效靠得住的身份識別需求日趨強(qiáng)烈。各類技術(shù)在科研和實際中都受到了專門大的重視和進(jìn)展。由于生物特點內(nèi)在的穩(wěn)固性和唯一性使其成了作為身份識別的理想依據(jù)。人臉特點作為典型的生物特點外,還有隱蔽性好,易于被用戶同意,不需要人的配合等優(yōu)勢?,F(xiàn)已成了身份識別領(lǐng)域研究的熱點。PCA算法通過降低維度,提取主元素,減少了數(shù)據(jù)冗余,解決了圖像緯度太高無法處置或處置很慢的特點,同時維持了原始圖像的絕大部份信息。在人臉識別領(lǐng)域,很多先進(jìn)的識別算法都是在其基礎(chǔ)上的改良。因此研究基于PCA的人臉識別算法實現(xiàn)具有重要的理論和利用價值。本文要緊介紹基于PCA的人臉識別算法的實現(xiàn),除第一章外,其余內(nèi)容依照人臉識別的流程可分為人臉圖像獲取,人臉圖像預(yù)處置,人臉特點提取和特點匹配四個部份。具體安排如下:第一章要緊介紹人臉識別的研究現(xiàn)狀,人臉識別技術(shù)的要緊難點及人臉識別流程。第二章要緊介紹經(jīng)常使用的人臉圖像獲取方式和人臉圖像數(shù)據(jù)庫。第三章要緊介紹經(jīng)常使用的人臉圖像預(yù)處置方式。第四章要緊介紹PCA算法,SVD定理,如何通過PCA和SVD提取人臉特點及如何利用最近鄰法分類器歐幾里得距離來進(jìn)行判別分類。

第一章人臉識別系統(tǒng)概述第一節(jié)人臉識別的研究概況人臉識別的研究起源比較早,Galton在1888年和1910年就已在Nature雜志發(fā)表兩篇關(guān)于如何利用人臉進(jìn)行身份識別的論文。在他的文章,他使用一組數(shù)字表示相異的人臉側(cè)面特點,同時還對人類本身的人臉識別能進(jìn)行了研究分析。自動人臉的研究歷史相對照較短,到此刻只是五十連年的時刻。只是1990年以來,才取得了長足的進(jìn)步。此刻,已變成運算機(jī)視覺領(lǐng)域的一個核心,很多聞名的大學(xué)和IT公司都有研究組在從事這發(fā)面的研究。關(guān)于人臉識別的研究歷史可分為三個時期:第一時期(1964-1990)那個時期要緊采取的技術(shù)是基于人臉幾何結(jié)構(gòu)的。研究的重點要緊在剪影上。研究人員做了大量關(guān)于如何提取臉部剪影曲線的結(jié)構(gòu)特點的研究。那個時期屬于人臉識別的低級時期,突出的研究功效不多,也沒有取得的實際應(yīng)用。第二時期(1991-1997)那個時期盡管時刻相對較短,可是碩果累累,顯現(xiàn)了假設(shè)干具有代表性的算法和幾個商業(yè)化的人臉識別系統(tǒng),如Identix(原為Visionics)公司的FaceIt系統(tǒng)。那個時期最具盛名的人臉識別方式是MIT媒體實驗室的Turk和Pentland提出的的“特點臉”方式。后來很多人臉識別技術(shù)都與特點臉有關(guān),此刻特點臉已與歸一化的協(xié)相關(guān)量方式一路成了人臉識別性能測試的基準(zhǔn)算法。那個時期的要緊功效有:1992年左右,Brunelli和Poggio做了一個基于結(jié)構(gòu)特點的方式和基于模板匹配的方式性能對照的實驗,并得出了模塊匹配的方式優(yōu)于基于特點的方式的結(jié)論。那個結(jié)論和特點臉的一起作用,大體上停止了純粹基于結(jié)構(gòu)特點人臉識別的研究,而且專門大的增進(jìn)了基于表觀的線性子空間建模和基于統(tǒng)計模式識別技術(shù)的進(jìn)展,使其慢慢成為主流技術(shù)。Belhumeur等人的Fisherface方式也是現(xiàn)在期一個重要的功效。該方式目前仍然是主流人臉識別方式中的一種,產(chǎn)生了很多變種,比如子空間判別模型等。其先利用PCA即特點臉對人臉圖像表現(xiàn)特點進(jìn)行降維,并利用線性判別分析方式對降維后的主成份進(jìn)行變換以取得“盡可能大的類間散度和盡可能小的類內(nèi)散度”。彈性匹配技術(shù)[1]為另一個重要方式。它用一個屬性圖來描述人臉:屬性的極點代表臉部關(guān)鍵特點點,它的屬性為相應(yīng)特點點處的多分辨率,多方向局部特點—Gabor變換[2],稱為Jet;邊的屬性為不同特點點間的幾何關(guān)系。關(guān)于輸入的圖像,其通過一種優(yōu)化搜索策略來定位預(yù)先定位的假設(shè)干臉部關(guān)鍵特點點,同時提取它們的Jet特點,取得輸入人臉圖像的屬性圖。最后通過計算其與已知人臉屬性圖的相似度來完成識別進(jìn)程。彈性匹配方式的優(yōu)勢是既保留了臉部的全局結(jié)構(gòu)特點,也對人臉關(guān)鍵局部特點進(jìn)行了建模。局部特點分析由Atick等提出。其在本質(zhì)上是基于統(tǒng)計的低維對象描述方式,與PCA相較,局部特點分析在全局主成份分析的基礎(chǔ)上提取的是局部特點。它既保留了全局拓?fù)湫畔?,有提取了局部特點,使其具有了更好的描述和識別能力。局部特點分析技術(shù)已商業(yè)化為聞名FaceIt系統(tǒng)。柔性模型,包括主動形狀模型和主動外觀模型。它是人臉建模方面的一個新的進(jìn)步。其要緊將人臉描述為2D形狀和紋理兩個分離的部份,別離用PCA建模,然后再通過PCA[3,4,5]將二者合成來對人臉建模。柔性模型具有良好的人臉合成能力,能夠利用基于合成的圖像分析技術(shù)對人臉圖像進(jìn)行特點提取和建模。那個時期所提出的算法在理想圖像搜集條件,人員配合,中小規(guī)模正面人臉數(shù)據(jù)庫上達(dá)到了超級好的性能。,也誕生幾個聞名的人臉識別系統(tǒng)。第三時期(1998年—此刻)那個時期關(guān)于人臉識別的研究超級熱點。有大量的研究人員從事這方面的研究。要緊針對的是主流的人臉識別技術(shù)在搜集條件不睬想和用戶不配合下魯棒性差的問題。光照和姿態(tài)問題成了研究核心。那個時期要緊功效有:Georghiades等人基于光照錘模型的多姿態(tài),多光照條件人臉識別方式。Blanz和Vetter等人基于3D變形模型的多姿態(tài),多光照的人臉識別方式。Shashua等人基于上圖像的人臉圖像識別與繪制技術(shù)[6,7]。整體而言,目前非理想成像條件下(尤其是光照和姿態(tài)),對象不配合,大規(guī)模人臉數(shù)據(jù)庫上的人臉識別已慢慢成為研究的重點。而非線性建模方式,統(tǒng)計學(xué)習(xí)理論,基于Boosting的學(xué)習(xí)技術(shù),基于3D模型的人臉建模與識別方式等慢慢成為備受重視的技術(shù)進(jìn)展趨勢。從整個人臉識別的研究歷史來看,基于PCA的特點臉[8,9]識別方式占據(jù)了超級重要的地位,也對后來的人臉識別技術(shù)產(chǎn)生甚遠(yuǎn)的阻礙。在后來很多的人臉識別技術(shù),咱們或多或少都會發(fā)覺它的影子。人臉圖像維數(shù)都很高,PCA方式不但專門好表征人臉而且通過去除相關(guān)性,減少冗余,解決了在人臉識別進(jìn)程中圖像為數(shù)太高的問題。并且隨著現(xiàn)代社會的進(jìn)展,快速人臉識別的需求愈來愈大。因此研究基于PCA的人臉識別算法的實現(xiàn)仍是有實際意義,本文也就在如此的背景下寫作而成。第二節(jié)人臉識別的進(jìn)展趨勢人臉識別至今盡管取得了豐碩的研究功效,可是還有很多問題需要解決。人臉識別的難度在于:人臉是非剛性物體,而且會隨著年齡的增加而改變,特點難以完全描述;人臉常常有許多遮擋物,如:眼鏡,帽子等;環(huán)境的光照和人臉的姿態(tài)等。人臉識別的以后要緊的進(jìn)展趨勢如下:一、多數(shù)據(jù)融合與方式綜合人臉識別技術(shù)通過這幾十年的進(jìn)展,已取得超級不錯的功效??墒歉黝惣夹g(shù)和方式都有自己不同的適應(yīng)環(huán)境和各自的特點。如何利用數(shù)據(jù)融合理論,將不同的方式綜合起來,彼此補(bǔ)充,來取得較好的人臉識別成效,便成為人們的研究熱點之一。二、動態(tài)跟蹤人臉識別系統(tǒng)目前的靜態(tài)人臉識別技術(shù)只能知足一樣身份識別場合如門禁系統(tǒng),考勤系統(tǒng)等,無法進(jìn)行人臉的動態(tài)跟蹤與識別。隨著此刻社會的進(jìn)展,目前對動態(tài)人臉的跟蹤與識別的需求愈來愈大,尤其是在一些平安領(lǐng)域。三、基于小波神經(jīng)網(wǎng)絡(luò)的人臉識別小波自提出以來,其理論和應(yīng)用取得了長足的進(jìn)展。它被以為是傅里葉分析的沖破性的進(jìn)展。隨著神經(jīng)網(wǎng)絡(luò)的理論研究的深切,與小波,混沌,模糊集等非線性理論相結(jié)合已成為一個超級重要的進(jìn)展方向。小波變換具有時頻特性和變焦特性,神經(jīng)網(wǎng)絡(luò)具有自學(xué)習(xí),自適應(yīng),魯棒性,容錯性和推行能力。若是能結(jié)合二者的優(yōu)勢,將會取得人臉識別不錯的成效。四、三維人臉識別目前許多人臉識別功效是成立在二維人臉基礎(chǔ)上的,而實際的人臉是三維的。三維人臉相較較于二維圖像提供了加倍完整的人臉信息。隨著此刻三維人臉?biāo)鸭夹g(shù)的慢慢進(jìn)展,如何利用三維人臉進(jìn)行人臉識別已成為一個新的研究熱點。五、適應(yīng)各類復(fù)雜背景的人臉分割技術(shù)此刻在復(fù)雜背景下的人臉分割已經(jīng)取得了必然的功效,如彈性匹配,但檢測速度和成效還無法令人中意。在復(fù)雜背景下快速有效檢測和分割人臉技術(shù)還需進(jìn)一步的研究。六、全自動人臉識別技術(shù)全自動人臉識別技術(shù)目前還處于低級研究時期,識別成效和速度離實際的要求還相差甚遠(yuǎn)。具體緣故是人臉是非剛體,無法取得準(zhǔn)確完整的描述人臉特點。如何有效的表達(dá)人臉特點將是其研究的重點。第三節(jié)人臉識別技術(shù)的要緊難點目前的人臉識別技術(shù)在人員配合,較理想搜集條件下能夠取得比較中意的結(jié)果。但在人員不配合,搜集條件不睬想下,系統(tǒng)的性能陡然下降。目前的要緊的難點為:一、復(fù)雜條件下人臉的檢測和關(guān)鍵點定位人臉檢測和關(guān)鍵點定位為實際人臉識別系統(tǒng)的前端處置模塊,此模塊直接阻礙著人臉識別系統(tǒng)的性能。目前大多數(shù)特點定位算法的精度都會隨著光照,姿態(tài)等轉(zhuǎn)變而快速下降。復(fù)雜條件下的人臉檢測與關(guān)鍵點定位是目前人臉識別急需解決的問題之一。二、光照問題關(guān)照問題是運算機(jī)視覺存在已久的問題,尤其在人臉識別中表現(xiàn)得加倍明顯。但目前為止光照處置技術(shù)遠(yuǎn)未達(dá)到有效的程度,還需要深切的研究。三、資態(tài)問題關(guān)于姿態(tài)的研究相對不多,此刻人臉識別算法要緊以正面或準(zhǔn)正面姿態(tài)。當(dāng)人臉姿態(tài)俯仰或左右比較大時,人臉識別的識別率驟降。如何提高人臉識別系統(tǒng)對姿態(tài)的魯棒性是人臉識別中一個具有挑戰(zhàn)性的任務(wù)。四、表情問題表情識別是生物特點識別的中的一種,是人機(jī)交互不可或缺的部份。表情是復(fù)雜的臉部肌肉運動,每一個表情都是幾十塊臉部肌肉一起運動的結(jié)果,很難用精準(zhǔn)的數(shù)學(xué)模型來表示這些肌肉的運動。臉部表情的轉(zhuǎn)變?yōu)槟槻刻攸c點的運動。由于目前的運算機(jī)技術(shù)的限制,運算機(jī)還不能準(zhǔn)確的定位這些臉部特點點,也無法分辨臉部肌肉的運動。而且,同一種表情在不同的人上也會有不同的表現(xiàn)形式。而且同一個人的不同表情之間也沒有明確的界限。以上這些決定運算機(jī)很難用統(tǒng)一的標(biāo)準(zhǔn)來識他人的臉部表情。五、遮擋問題關(guān)于非配合情形下,搜集到的人臉圖像一樣都不是完整的,這會阻礙人臉特點提取與識別,可能還會致使人臉檢測算法的失效。如何有效地排除遮擋物的阻礙有著超級重要的意義,如在監(jiān)控環(huán)境下。以上列舉了部份要緊的技術(shù)難點,其他難點由于本文的討論可不能涉及,因此可不能再一一列舉。本文的實驗是在人臉圖像正面姿態(tài),光照正常,表情正常,部份臉部圖像有小范圍遮擋的情形下進(jìn)行的。如此做的目的只是讓咱們的工作重心集中在分析PCA人臉識別算法性能上。第四節(jié)人臉識別流程圖人臉識別系統(tǒng)處置流程一、人臉圖像搜集搜集人臉圖像是通過傳感器搜集人臉圖像,并將其轉(zhuǎn)換為運算性能夠處置的數(shù)字信號。這是人臉識別的第一步。在搜集人臉圖像時,要注意用戶人臉姿態(tài),臉部有無遮擋,周圍光照是不是知足要求及設(shè)備搜集圖像的質(zhì)量是不是能知足要求。二、預(yù)處置預(yù)處置是為了除去噪聲和對測量儀器或其他因素對人臉圖像造成退化現(xiàn)象進(jìn)行恢復(fù)。從傳感器搜集到圖像除包括人臉特點信息,還包括背景信息,因此必需從原始人臉圖像分割出咱們要處置的部份。如何分割就需要定位和分割算法。他們一樣以人臉圖像在圖像結(jié)構(gòu)和人臉信號散布的先驗知識為依據(jù)。經(jīng)常使用的人臉預(yù)處置有人臉圖像灰度化,人臉圖像二值化,人臉圖像歸一化,直方圖修正,圖像濾波和圖像銳化。3人臉檢測在實驗進(jìn)程中第一要選好自己想要處置的圖片,圖片的要求是正面或側(cè)面,在實驗進(jìn)程中第一要讀入自己想要處置的彩色圖像,然后利用矩陣分割原理、二值化圖像處置技術(shù)聯(lián)通域勾畫最小矩形等數(shù)字圖像處置方式判定出人臉的所在的可能范圍,再進(jìn)一步確信人臉的區(qū)域,在原圖頂用紅色的矩形框標(biāo)注并顯示結(jié)果。三、特點提取特點提取確實是運算機(jī)通過提取人臉圖像中能夠凸顯個性化不同的的本質(zhì)特點,進(jìn)而來實現(xiàn)身份識別。本文講解如何利用PCA算法提取人臉特點,進(jìn)而實現(xiàn)人臉識別。特點要緊包括三種類型:物理特點,結(jié)構(gòu)特點和數(shù)學(xué)特點。由于物理特點和結(jié)構(gòu)特點容易被發(fā)覺,觸覺和其他感覺器官所感知,因這人類常常是利用這些特點來對對象進(jìn)行識別。關(guān)于運算機(jī)而言,模擬人類的感覺器官是很難實現(xiàn)的,但運算機(jī)在處置數(shù)學(xué)特點的能力上要比人類強(qiáng)得多,因此咱們通過諸如協(xié)方差矩陣,統(tǒng)計平均值和相關(guān)系數(shù)等數(shù)學(xué)特點來構(gòu)建人臉識別系統(tǒng)。特點提取和選擇的全然任務(wù)確實是從許多特點中找出那些最有效的特點。在樣本數(shù)不是很多的情形下,能夠利用這些特點進(jìn)行分類器的設(shè)計,可是在大多數(shù)情形下,由于測量空間的維數(shù)很高,不能直接進(jìn)行分類器的設(shè)計。因此,如何把高維測量空間緊縮到低維特點空間,以便有效的設(shè)計分類器,便成了一個值得試探的問題。為了取得有效的特點,一樣需要通過特點形成,特點提取和特點選擇等步驟。特點形成特點形成是依照被識別對象產(chǎn)生出一組大體特點的進(jìn)程,當(dāng)被識別的對象是波形或數(shù)字圖像時,這些特點能夠通過計算得來;當(dāng)被識別對象是實物或某種進(jìn)程時,這些特點能夠用儀表或傳感器測量來取得。通過上面方式取得特點被稱為原始特點。特點提取原始數(shù)據(jù)組成的空間被稱為測量空間。由于測量空間的維數(shù)一樣都很高,不易設(shè)計分類器,因此在分類器設(shè)計之前,需要從測量空間變換到維數(shù)很少的特點空間,由特點向量表示。通過映射或變換方式用低緯空間來表示樣本的進(jìn)程被稱為特點提取。映射后的特點稱為二次特點,它們是原始特點的某種組合,一般是線性組合。特點選擇從一組特點中挑出一些最有效的特點從而達(dá)到降低特點空間維數(shù)量的的進(jìn)程稱為特點選擇。由于在許多實際問題中常常不容易找到那些最重要的特點,或由于條件限制而不能對這些重要特點進(jìn)行測量。從而使得特點選擇和特點提取的任務(wù)復(fù)雜化。特點提取和特點選擇在有些情形下并非是截然分開的,因為從必然意義上來講,二者都是要達(dá)到對數(shù)據(jù)進(jìn)行降維的目的,只是實現(xiàn)的途徑不同。特點提取是通過某種變換的方式組合原有的高維特點,從而取得一組低維的特點。而特點選擇是依照專家的查驗知識或評判準(zhǔn)那么來挑選對分類最有阻礙的特點。比如能夠先將原始特點空間映射到維數(shù)較低的空間,在那個空間中在進(jìn)一步選擇特點來進(jìn)一步降低維度;也能夠先去除那些明顯不含有分類信息的特點,而后再進(jìn)行映射以降低維度。四、特點匹配特點匹配是計算兩個人臉圖像特點樣本的特點模塊間的相似度即將搜集到的人臉圖像的特點模版與系統(tǒng)中已存儲的特點模版進(jìn)行比對,并輸出最正確匹配對象。在本文要緊講解利用最近鄰法分類器歐幾里得距離來判他人臉圖像,在實際普遍利用的還有基于SVM即支持向量機(jī),基于神經(jīng)網(wǎng)絡(luò)和圖匹配的方式。第五節(jié)本章小結(jié)本章由人臉識別的研究背景,人臉識別技術(shù)的要緊難點,人臉識別的進(jìn)展趨勢和人臉識別流程四個末節(jié)組成。在人臉識別的研究概況末節(jié)要緊講解人臉識別的研究概況及基于PCA人臉識別算法實現(xiàn)的研究意義。在人臉識別的進(jìn)展趨勢末節(jié)要緊講解人臉識別技術(shù)以后的走向。在人臉識別技術(shù)的要緊難點末節(jié)主要講解人臉識別的要緊技術(shù)難點及本文是在什么樣的條件進(jìn)行實驗的。人臉識別末節(jié)講解本文人臉識別的流程。

第二章人臉圖像的獲取第一節(jié)人臉圖像獲取隨著運算機(jī)科技和微電子的進(jìn)展,此刻人臉圖像搜集設(shè)備也愈來愈多。經(jīng)常使用的搜集設(shè)備有數(shù)碼相機(jī),數(shù)碼攝影機(jī)等??墒撬鸭O(shè)備成像原理各異,有些設(shè)備對某類人臉圖像的搜集成效比較好,進(jìn)而人臉識別率高,對不同類的人臉圖像搜集成效差,進(jìn)而人臉識別率低。只是隨著此刻科技的進(jìn)展,那個問題已大體上被解決。另外,人臉圖像搜集的形式不同也會阻礙識別率。人臉圖像的搜集形式要緊有兩種:一為靜態(tài)人臉圖像,二位動態(tài)人臉圖像。靜態(tài)人臉圖像的搜集相對照較簡單,用數(shù)碼相機(jī)即可獲取。動態(tài)人臉圖像相較靜態(tài)人臉圖像獲取難度較大,但其加倍切近實際需求,應(yīng)用處合加倍廣漠。動態(tài)人臉圖像相較于靜態(tài)人臉圖提供了加倍客觀的信息量。但同時也帶了問題,動態(tài)人臉圖像序列里的某一幅圖像可能會產(chǎn)生剎時模糊,這將會阻礙其識別率。上述問題是由人臉的多變性產(chǎn)生的。關(guān)于動態(tài)人臉圖像要考慮如安在序列中提取清楚的圖像又不丟失局部信息。同時成立人臉圖像間的相關(guān)性是有必要的,能夠有效的提高識別率。在實際中,要采納何種人臉?biāo)鸭问揭Q于應(yīng)用的需求和場合。一樣而言,動態(tài)人臉圖像搜集應(yīng)用于特殊場合,如犯法識別進(jìn)程,而靜態(tài)人臉圖像搜集應(yīng)用于一般的平安場合。關(guān)于靜態(tài)人臉圖像搜集要注意要確保人臉表情正常,姿態(tài)無傾斜,光線盡可能均勻,而且要對周圍的光源做必要的處置,幸免受到周圍強(qiáng)光和不均勻異色光的干擾。搜集完成后要對每一個對象的圖像做必要的審核,剔除掉不符合要求的人臉圖像。第二節(jié)人臉分割人臉識別是通過對人臉進(jìn)行精準(zhǔn)定位,并從圖像中提取人臉區(qū)域。人臉分割屬于圖像分割,是人臉識別系統(tǒng)中不可缺少的一環(huán)。要對人臉進(jìn)行識別一樣需要將人臉區(qū)域從搜集到的圖像中分離出來。人臉分割比較經(jīng)典的方式有數(shù)據(jù)驅(qū)動和模型驅(qū)動。數(shù)據(jù)驅(qū)動方式直接對圖像進(jìn)行處置,不依托于先驗知識。其包括有基于邊緣檢測的方式,基于閥值的方式和基于區(qū)域增加的方式。基于模型的方式需要先驗知識。其包括有活動輪廓模型等。搜集到圖像中人臉區(qū)域顏色和紋理轉(zhuǎn)變較大,因此若是要實現(xiàn)精準(zhǔn)分割,只利用圖像的數(shù)據(jù)信息是不夠的,因此實際中基于模型的方式利用的比較多?;谶吘壍姆指罘绞叫枰獌蓚€步驟,別離為邊緣檢測和邊緣連接。該方式先提取邊緣后再進(jìn)行邊界連接,取得分割輪廓??墒悄莻€方式也存在問題,實際中由于噪聲的圖像的阻礙,常常會檢測到假的邊緣,從而致使錯誤的分割。基于閥值的方式是利用搜集到圖像的灰度直方圖計算出分割閥值,又能夠分為全局閥值方式和局部閥值方式。全局閥值方式是利用整個圖像的灰度信息,來取得用于分割的閥值。局部閥值方式是圖像不同區(qū)域取得對應(yīng)不同區(qū)域的閥值即一個閥值對應(yīng)圖像的一個子區(qū)域。在實際中,由于噪聲等因素的阻礙,直方圖常常不能有明顯的峰值顯現(xiàn),這是選擇閥值并非合理,它是由閥值分割的特點決定的。此方式只考慮了圖像的灰度信息,拋棄了圖像的其他信息。關(guān)于灰度差不明顯的圖像,得不到令人中意的結(jié)果。基于區(qū)域增加的方式是將含有相似性質(zhì)的像素集合起來形成一個新的區(qū)域。第一把圖像分割成較小的區(qū)域,有可能超級小,乃至可能是一個像素。在每一個子區(qū)域中,對通過適當(dāng)概念能反映一個物體內(nèi)成員隸屬度的性質(zhì)進(jìn)行計算,每一個子區(qū)域會用一組參數(shù)來表示該區(qū)域。然后對相鄰區(qū)域所有邊界進(jìn)行分析,假設(shè)便利信息強(qiáng),那么邊界不變,假設(shè)邊界信息弱,那么排除個邊界并歸并相應(yīng)的鄰域。它是一個迭代進(jìn)程,每一步從頭計算邊界信息,假設(shè)沒有區(qū)域歸并,迭代完成,圖像分割完成。該方式開銷較大,但能夠利用圖像的相關(guān)性質(zhì)進(jìn)行邊界定位。該方式當(dāng)前研究的區(qū)別在于區(qū)域性質(zhì)不同上?;谀P偷姆绞?,都是通過引入統(tǒng)計信息來取得高魯棒性。其中活動輪廓模型是利用在圖像上的一條動態(tài)曲線,在內(nèi)力曲線本身新的表現(xiàn)和外力圖像信息的表現(xiàn)一起作用下趨于對象的輪廓。模型方式具有豐碩的先驗知識,在實際中具有專門好的適應(yīng)性和魯棒性。目標(biāo)分割與識別通過將目標(biāo)集合和統(tǒng)計信息表示為模型,是其成為目標(biāo)的搜索匹配或監(jiān)督分類。第三節(jié)人臉數(shù)據(jù)庫人臉數(shù)據(jù)庫是人臉識別研究,開發(fā)和評測不可缺少的。每一個人臉識別系統(tǒng)都需要一個人臉數(shù)據(jù)庫。人臉圖像數(shù)據(jù)庫的設(shè)計對人臉識別系統(tǒng)的識別率有著超級大阻礙。設(shè)計一個在所有轉(zhuǎn)變情形下都能正確識別的系統(tǒng)是超級困難的,而且也沒有必要。所有人臉識別系統(tǒng)都是在必然的約束條件進(jìn)行的。因此有必要成立知足不同需要的人臉數(shù)據(jù)庫。經(jīng)常使用人臉數(shù)據(jù)庫如下:國外人臉數(shù)據(jù)庫的有FERET人臉數(shù)據(jù)庫,MIT人臉數(shù)據(jù)庫,YALE人臉數(shù)據(jù)庫,PIE人臉數(shù)據(jù)庫,ORL人臉數(shù)據(jù)庫,AR人臉數(shù)據(jù)庫和Essex人臉數(shù)據(jù)庫。FERET人臉數(shù)據(jù)庫是人臉識別中最經(jīng)常使用的數(shù)據(jù)庫,包括多姿態(tài)和多光照的人臉灰度圖像,但其多為西方人臉圖像,每一個人的人臉圖像轉(zhuǎn)變較少。MIT人臉數(shù)據(jù)庫有麻省理工大學(xué)媒體實驗室成立,由16位志愿者的2592副多姿態(tài),多光照和不同大小的圖像組成。PIE人臉數(shù)據(jù)庫有卡內(nèi)基梅隆大學(xué)成立,由68位志愿者的41368副不同姿態(tài),多光照和不同表情的圖像組成。ORL人臉數(shù)據(jù)庫由劍橋大學(xué)AT&T實驗室成立由40位志愿者的400幅圖像組成,其中部份志愿者的圖像還有姿態(tài),表情和光照的轉(zhuǎn)變。由于其人臉轉(zhuǎn)變模式較少,現(xiàn)已很少利用。AR人臉數(shù)據(jù)庫為西班牙巴塞羅那運算機(jī)視覺中心成立,由116人的3228幅圖像組成。搜集是在嚴(yán)格操縱攝像機(jī)參數(shù),光照轉(zhuǎn)變,攝像機(jī)距離等條件下進(jìn)行的。Essex人臉數(shù)據(jù)庫是英國埃塞克斯大學(xué)的人臉數(shù)據(jù)庫。任何人都能夠下載它的人臉數(shù)據(jù)庫,可是你不能發(fā)布,打印,銷售或發(fā)行這些圖像。那個人臉數(shù)據(jù)庫由LiborSpeacek博士主持的運算機(jī)視覺研究項目在保護(hù)。那個數(shù)據(jù)庫由faces94,faces95,faces96,grimace四個庫組成。如此做的目的是為了增加難度。Faces96和grimace是那個數(shù)據(jù)庫最難識別的。它們的背景和比例是轉(zhuǎn)變的,人臉表情是極度轉(zhuǎn)變的。英國埃塞克斯大學(xué)運算機(jī)視覺研究項目鼓舞研究者發(fā)布利用那個數(shù)據(jù)庫取得人臉識別結(jié)果。咱們在本文采納的是它的face94數(shù)據(jù)庫。faces94數(shù)據(jù)庫中人臉圖像是在受試者坐在距離相機(jī)固定位置,并要求發(fā)言的情形下搜集而成。發(fā)言的目的是為了搜集臉部表情的轉(zhuǎn)變。每一個圖像的大小為180*200,圖像的背景是藍(lán)色的。有輕微的姿態(tài)變換,無光照變換。國內(nèi)人臉數(shù)據(jù)庫有中科院計算技術(shù)研究所銀晨科技面向識別聯(lián)合實驗室成立的CAS—PEAL人臉數(shù)據(jù)庫。該數(shù)據(jù)庫是基于目前的人臉數(shù)據(jù)庫大多都較小或圖像轉(zhuǎn)變因素單一,人臉圖像的多為西方人,其臉部特點與東方人存在必然的不同,需要成立一個大規(guī)模,多因素的東方人臉數(shù)據(jù)庫的需求成立的,共搜集了1040位志愿者(595名男性,445名女性)的99450幅圖像。該數(shù)據(jù)庫依照不同的轉(zhuǎn)變因素又分為7種模式子庫。這7種轉(zhuǎn)變因素為姿態(tài),表情,飾物,光照,背景,距離和時刻跨度,其中以姿態(tài),表情,飾物和光照為主,故稱為PEAL(pose,expression,accessory和lighting的簡寫)。CASE—PEAL—R1為CASE—PEAL的共享版,能夠提供給研究人員用以研究利用。其中研究人員指的是研究生導(dǎo)師或其他固定職位的研究員,不包括學(xué)生。第四節(jié)本章小結(jié)本章要緊介紹人臉圖像獲取,人臉分割和人臉數(shù)據(jù)庫。在人臉圖像獲取和人臉分割兩個末節(jié)中要緊介紹經(jīng)常使用的人臉獲取方式及獲取人臉原始圖像后如何分割出咱們需要部份的方式,也為后面人臉圖像數(shù)據(jù)庫打下了基礎(chǔ)。在人臉數(shù)據(jù)庫一節(jié)中,要緊介紹了經(jīng)常使用的人臉數(shù)據(jù)庫及本文的實驗是在Essex人臉數(shù)據(jù)庫中咱們選擇出來的子庫中進(jìn)行的。如此做的目的是咱們的工作中心集中在核心人臉識別算法的性能研究上。

第三章人臉圖像的預(yù)處置第一節(jié)人臉圖像格式在運算機(jī)中任何信息都是以文件的形式存儲,圖像信息也不例外,它通過采樣,量化和編碼后以圖像文件進(jìn)行存儲,因此在人臉識別之前有必要介紹圖像文件格式。圖像的文件格式很多,本節(jié)只介紹本文經(jīng)常使用的幾種圖像格式。一、JPEG格式JPEG文件格式是經(jīng)常使用的圖像文件格式。它是由聯(lián)合照片專家組(JointPhotographicExpertsGroup)開發(fā)的,而且命名為“ISO10918-1”,JPEG僅僅是一種俗稱罷了。JPEG文件以.jpg或.jpeg為擴(kuò)展名,其緊縮技術(shù)超級先進(jìn)。JPEG利用有損緊縮方式去除冗余圖像和彩色數(shù)據(jù),取得了較高的緊縮率,同時還能夠給人豐碩生動的視覺感受,即能夠利用最小的磁盤存儲較好的圖像質(zhì)量。它是一種靈活的格式,能夠調(diào)劑圖像質(zhì)量,許諾利用不同緊縮比例緊縮文件。由于JPEG優(yōu)良的品質(zhì)和杰出的表現(xiàn),它的應(yīng)用也超級普遍,專門是在網(wǎng)絡(luò)和光盤讀物上,確信都能找到它的影子。目前各類閱讀器均支持JPEG這種圖像格式,因為JPEG格式的文件尺寸較小,下載速度快,使得Web頁有可能以較短的下載時刻提供大量美觀的圖像,JPEG同時也就順理成章地成為網(wǎng)絡(luò)上最受歡迎的圖像格式二、JPEG2000格式JPEG2000是基于小波變換的圖像緊縮標(biāo)準(zhǔn),一樣由聯(lián)合照片專家組(JointPhotographicExpertsGroup)開發(fā)和保護(hù)。JPEG2000通常被以為是以后取代JPEG(基于離散余弦變換)的下一代圖像緊縮標(biāo)準(zhǔn)。JPEG2000文件的擴(kuò)展名為jp2。JPEG2000緊縮率比JPEG高約30%左右,同時支持有損和無損緊縮,而且可不能產(chǎn)生原先的基于離散余弦變換的JPEG標(biāo)準(zhǔn)的塊狀模糊瑕疵。JPEG2000格式有一個極為重要的特點在于它能實現(xiàn)漸進(jìn)傳輸,即先傳輸圖像的輪廓,然后慢慢傳輸數(shù)據(jù),不斷提高圖像質(zhì)量,讓圖像由朦朧到清楚顯示。另外,JPEG2000還支持所謂的"感愛好區(qū)域"特性,能夠任意指定影像上感愛好區(qū)域的緊縮質(zhì)量,還能夠選擇指定的部份先解緊縮。在有些情形下,圖像中只有一小塊區(qū)域?qū)τ脩羰怯行У模瑢@些區(qū)域,采納低緊縮比,而感愛好區(qū)域之外采納高緊縮比,在保證不丟失重要信息的同時,又能有效地緊縮數(shù)據(jù)量,這確實是基于感愛好區(qū)域的編碼方案所采取的緊縮策略。其優(yōu)勢在于它結(jié)合了接收方對緊縮的主觀需求,實現(xiàn)了交互式緊縮。而接收方隨著觀看,常常會有新的要求,可能對新的區(qū)域感愛好,也可能希望某一區(qū)域更清楚些。三、BMP格式BMP(Bitmap-File)圖形文件是Windows采納的圖形文件格式,在Windows環(huán)境下運行的所有圖象處置軟件都支持BMP圖象文件格式。Windows系統(tǒng)內(nèi)部各圖像繪制操作都是以BMP為基礎(chǔ)的。Windows以前的BMP圖文件格式與顯示設(shè)備有關(guān),因此把這種BMP圖象文件格式稱為設(shè)備相關(guān)位圖DDB(device-dependentbitmap)文件格式。Windows以后的BMP圖象文件與顯示設(shè)備無關(guān),因此把這種BMP圖象文件格式稱為設(shè)備無關(guān)位圖DIB(device-independentbitmap)格式。Windows以后,在系統(tǒng)中仍然存在DDB位圖,只只是若是你想將圖像以BMP格式保留到磁盤文件中時,微軟極力推薦你以DIB格式保留。目的是為了讓W(xué)indows能夠在任何類型的顯示設(shè)備上顯示所存儲的圖象。BMP位圖文件默許的文件擴(kuò)展名是BMP或bmp,有時它也會以.DIB或.RLE作擴(kuò)展名。BMP格式的特點是包括的圖像信息較豐碩,幾乎不進(jìn)行緊縮,由此致使了它的缺點—占用磁盤空間過大。四、GIF格式GIF圖像互換格式(GraphicsInterchangeFormat)是CompuServe公司在1987年開發(fā)的圖像文件格式。GIF文件的數(shù)據(jù),是一種基于LZW算法的持續(xù)色調(diào)的無損緊縮格式。其緊縮率一樣在50%左右,它不屬于任何應(yīng)用程序。目前幾乎所有相關(guān)軟件都支持它,公共領(lǐng)域有大量的軟件在利用GIF圖像文件。GIF圖像文件的數(shù)據(jù)是通過緊縮的,而且是采納了可變長度等緊縮算法。GIF格式的另一個特點是其在一個GIF文件中能夠存多幅彩色圖像,若是把存于一個文件中的多幅圖像數(shù)據(jù)逐幅讀出并顯示到屏幕上,就可組成一種最簡單的動畫。在初期,GIF所用的LZW緊縮算法是Compuserv所開發(fā)的一種免費算法。但是令很多軟件開發(fā)商感到意外的是,GIF文件所采納的緊縮算法突然成了Unisys公司的專利。據(jù)Unisys公司稱,他們已注冊了LZW算法中的W部份。若是要開發(fā)生成(或顯示)GIF文件的程序,那么需向該公司支付版稅。由此,人們開始尋求一種新技術(shù),以減少開發(fā)本錢。PNG(PortableNetworkGraphics,便攜網(wǎng)絡(luò)圖形)標(biāo)準(zhǔn)就在那個背景下應(yīng)運而生了。它一方面知足了市場對更少的法規(guī)限制的需要,另一方面也帶來了更少的技術(shù)上的限制,如顏色的數(shù)量等。在2003年6月20日,LZW算法在美國的專利權(quán)已到期而失效。在歐洲、日本及加拿大的專利權(quán)亦已別離在2004年的6月18日、6月GIF格式的特點是緊縮比高,磁盤空間占用少。目前互聯(lián)網(wǎng)上大量彩色動畫多為這種格式。五、PNG格式PNG,圖像文件存儲格式,其目的是替代GIF和TIFF文件格式,同時增加一些GIF文件格式所不具有的特性。流式網(wǎng)絡(luò)圖形格式(PortableNetworkGraphicFormat,PNG)名稱來源于非官方的“PNG'sNotGIF”,是一種位圖文件(bitmapfile)存儲格式,讀成“ping”。PNG用來存儲灰度圖像時,灰度圖像的深度可多到16位,存儲彩色圖像時,彩色圖像的深度可多到48位,。PNG利用從LZ77派生的無損數(shù)據(jù)緊縮算法。PNG是目前保證最不失真的格式,它綜合GIF和JPG二者的優(yōu)勢,存儲形式豐碩,兼有GIF和JPG的色彩模式。它能將圖像文件緊縮到極限以利于網(wǎng)絡(luò)傳輸,又能保留所有與圖像品質(zhì)相關(guān)的信息。它的顯示速度快,只需下載1/64的圖像信息就能夠夠顯示出低分辨率的預(yù)覽圖像。PNG一樣支持透明圖像的制作。PNG的缺點是不支持動畫應(yīng)用成效。第二節(jié)人臉圖像經(jīng)常使用預(yù)處置方式一樣,系統(tǒng)搜集到的原始圖像都會受到各類各樣的噪聲的阻礙而失真。而且由于各類條件的限制,搜集到的原始圖像不能直接進(jìn)行利用,必需做預(yù)處置,即排除噪聲,校正失真,將圖像轉(zhuǎn)變?yōu)闃?biāo)準(zhǔn)形式。如此才有利于穩(wěn)固的進(jìn)行特點提取。經(jīng)常使用的人臉預(yù)處置有:灰度轉(zhuǎn)變,二值化,直方圖均衡,圖像濾波,圖像銳化和歸一化處置。一、灰度轉(zhuǎn)變?nèi)四樧R別的研究常以灰度圖像為處置對象。因為彩色圖像的顏色信息常常受到復(fù)雜背景的阻礙。利用彩色圖像進(jìn)行人臉識別存在較多缺點,而灰度圖像為一種最簡單有效的對照增強(qiáng)方式。彩色圖像有紅綠藍(lán)三原色組合而成,灰度圖像只含有亮度信息,而且灰度圖像的亮度為持續(xù)轉(zhuǎn)變的,因此灰度圖像要對亮度值進(jìn)行量化,為0-255,共256個品級。0為全黑,255為全亮。經(jīng)常使用的體會公式為gray=*R+*G+*B.經(jīng)常使用變換的方式如下:線性變換:假設(shè)圖像為灰度轉(zhuǎn)變范圍為,變換后的圖像為灰度轉(zhuǎn)變范圍為,那么它們之間關(guān)系為 ()分段線性變換:假設(shè)圖像為灰度轉(zhuǎn)變范圍為,變換后的圖像為,目標(biāo)的灰度轉(zhuǎn)變范圍為,想使灰度轉(zhuǎn)變到,那么對應(yīng)關(guān)系為 ()非線性變換:利用非線性函數(shù)作為映射函數(shù)如對數(shù)函數(shù),進(jìn)行灰度變換。對數(shù)變換和指數(shù)變換別離為 () ()其中a,b,c用來調(diào)整曲線的位置和形狀。指數(shù)變換能對圖像的高灰度區(qū)以較大的拉伸。對數(shù)變換能夠使圖像低灰度區(qū)有較大拉伸而高灰度區(qū)進(jìn)行緊縮。對數(shù)變換能夠使圖像灰度散布相匹配于人的視覺特性。二、二值化二值化是通過選取適當(dāng)?shù)拈y值將灰度圖像的灰度值從0到255變換為只有0和255的黑白圖像。在人臉識別中二值化用來把人的頭發(fā),眼睛,臉的輪廓及背影與人臉的亮域分開。在圖像二值化進(jìn)程當(dāng)選擇適合的閥值超級重要。經(jīng)常使用的圖像二值化選擇方式如下:整體閥值法:在二值化時候只利用一個全局閥值t。假設(shè)圖像為,灰度范圍為,t為和之間選擇的一個適合的灰度值,轉(zhuǎn)換后的圖像為,那么轉(zhuǎn)換關(guān)系為 ()局部閥值法:它是依照當(dāng)前像素的灰度值和此像素周圍點局部灰度特點值來一起決定閥值。動態(tài)閥值法:它的閥值不僅和該像素和周圍像素有關(guān),還和該像素的坐標(biāo)位置有關(guān)。整體閥值法適合圖像質(zhì)量比較好的情形,現(xiàn)在圖像在直方圖一樣有兩個峰值。局部閥值法能夠處置比較復(fù)雜的情形,但有些情形會發(fā)生失真。動態(tài)閥值法適應(yīng)性和性能都比較好,實際中關(guān)于人臉識別常采納此法進(jìn)行二值化。三、直方圖均衡直方圖均衡是將將各灰度級分量盡可能均勻散布,從而來增強(qiáng)人臉圖像的對照度。另外它還能減少光照對人臉圖像的阻礙,令人臉特點提取變得容易,同時還提高了人臉圖像的主觀質(zhì)量。其要緊在于依照圖像灰度散布和實際的需求選擇適合的映射函數(shù)。選擇函數(shù)能夠持續(xù)滑膩函數(shù),也能夠是分段函數(shù)。映射函數(shù)為分段函數(shù)時一樣是基于想要突出人臉圖像中某些灰度值物體的細(xì)節(jié),又不想捐軀其他灰度值上的細(xì)節(jié)的考慮。如此能夠是需要的細(xì)節(jié)灰度值區(qū)間得以拉伸,不需要的細(xì)節(jié)得以緊縮。四、圖像濾波此刻排除噪聲的方式有全局處置和局部算子兩類。全局處置類的方式需要了解信號和噪聲的統(tǒng)計模型。人臉圖像預(yù)處置常常利用后一類方式。經(jīng)常使用的有均值濾波器,高斯滑膩濾波器,中值濾波器和邊緣維持濾波器。均值濾波器均值濾波是對信號進(jìn)行局部平均,以平均值來代表該像素點來代表該像素點的灰度值,即每一個像素值用其局部鄰域內(nèi)所有值的均值置換: ()其中,M是鄰域內(nèi)像素點總數(shù)。領(lǐng)域N的大小操縱著濾波程度,對應(yīng)大卷積模板的大尺度鄰域會加大濾波程度。作為去除噪聲的代價,大尺度濾波器會致使圖像細(xì)節(jié)的損失。在設(shè)計線性滑膩濾波器時,選擇濾波權(quán)值使得濾波器只有一個峰值,稱之為主瓣,而且在水平和垂直方向上是對稱的。線性滑膩濾波器去除高頻成份和圖像中的銳化細(xì)節(jié)。高斯滑膩濾波器由于高斯函數(shù)的傅里葉變換仍是高斯變換,因此高斯函數(shù)能組成一個在頻域具有滑膩性能的低通濾波器,它對去除服從正態(tài)散布的噪音超級有效。一維零均值高斯函數(shù)為: ()其中高斯散布參數(shù)決定了高斯濾波器的寬度。對圖像處置而言,常利用二維零均值離散高斯函數(shù)作滑膩濾波器。二維零均值離散高斯函數(shù)為: ()一樣而言,一幅圖像的邊緣方向是事前無法明白的,因此,在濾波前是無法確信一個方向是不是比另一個方向需要更多的滑膩。二維高斯函數(shù)具有旋轉(zhuǎn)對稱性,即濾波器各個方向上的滑膩程度是相同的,這就意味著高斯滑膩濾波器在后續(xù)邊緣檢測中可不能偏向任一方向。高斯函數(shù)是單值函數(shù)。這說明,高斯濾波器是用像素鄰域的加權(quán)均值來代替該點的像素值,而每一鄰域像素點權(quán)值是隨該點與中心點間距離單調(diào)遞減。高斯函數(shù)的傅里葉變換的頻譜是單瓣的。這就意味著滑膩圖像可不能被不需要的高頻信號所污染,同時保留了大部份所需信號。高斯濾波器寬度決定著滑膩程度,是由表征的。越大,高斯濾波器的頻帶就越寬,滑膩度就越好。通過調(diào)劑,可在圖像特點過度模糊(過滑膩)與滑膩圖像中過量突變量(欠滑膩)間取得折中。高斯函數(shù)的可分理性,使得高斯濾波器能夠有效地實現(xiàn)。二維高斯函數(shù)卷積能夠分兩步進(jìn)行,第一將圖像與一維高斯函數(shù)進(jìn)行卷積,然后將卷積結(jié)果與方向垂直的相同一維高斯函數(shù)進(jìn)行卷積。因此,二維高斯濾波器的計算量隨著濾波模板寬度線性增加而不是平方增加。中值濾波器中值濾波是一種非線性濾波方式。它在滑膩脈沖噪聲方面超級有效,同時它能夠愛惜像素尖銳的邊緣。它用像素點鄰域灰度值的中值來代替該像素點的灰度值。該方式在去除脈沖噪聲,椒鹽噪聲的同時又能保留圖像邊緣細(xì)節(jié),這是因為它不依托于鄰域內(nèi)那些與典型值不同專門大的值。中值濾波器在處置持續(xù)圖像窗函數(shù)時與線性濾波器的工作方式類似,但濾波進(jìn)程再也不是加權(quán)運算。例如,取4*4窗函數(shù),計算以點[i,j]為中心的窗函數(shù)的像素中值時,第一按強(qiáng)度值大小排列像素點,然后選擇排序像素集的中間值作為點[i,j]的新值。中值濾波在必然條件下,能夠克服線性濾波器帶來的圖像細(xì)節(jié)模糊的缺點,而且對濾除脈沖干擾是最有效的。但對一些細(xì)節(jié)多,專門是線,尖點等細(xì)節(jié)多的圖像不宜采納中值濾波。邊緣維持濾波器均值濾波的滑膩功能會使圖像邊緣模糊,而中值濾波在去除脈沖噪聲的同時也將圖像中的細(xì)條細(xì)節(jié)濾除掉。邊緣維持濾波器結(jié)合二者的優(yōu)勢,在濾除噪聲脈沖的同時,也可不能使圖像的邊緣十分模糊。邊緣維持算法的大體進(jìn)程為:對灰度圖像的每一個像素點[i,j]取適當(dāng)大小的一個鄰域,別離計算[i,j]的左上角子鄰域,左下角子鄰域,右上角子鄰域和右下角子鄰域的灰度散布均勻度V,然后取最小均勻度對應(yīng)區(qū)域的均值作為該像素的新灰度值。計算灰度均勻度V可通過下式: ()或 ()線性滑膩濾波器去除高斯噪聲的成效專門好,且在大多數(shù)情形下,對其他類型的噪聲也有專門好的去除成效?;谙袼丶訖?quán)運算的濾波器屬于線性濾波器,均值濾波器和高斯濾波器都屬于線性濾波器,而中值濾波器為非線性濾波器。五、圖像銳化圖像銳化用于解決圖像提取,圖像傳輸及相關(guān)處置進(jìn)程受到某些因素阻礙而變得模糊。圖像模糊是圖像蒙受了平均或積分運算造成,能夠通過對圖像進(jìn)行逆運算來使圖像變得清楚??墒菆D像銳化存在一個前提條件,圖像必需要有較高的信噪比,不然會造成信噪比更低,圖像噪聲增加比圖像信號更多。在實際中,一樣先濾除噪聲后在進(jìn)行圖像銳化處置。經(jīng)常使用的圖像銳化方式為拉普拉斯銳化。假設(shè)拉普拉斯算子為即離散數(shù)字圖像為,其一階偏導(dǎo)數(shù)為 (),那么其二階偏導(dǎo)數(shù)為 ()因此 ()關(guān)于擴(kuò)算現(xiàn)象引發(fā)的人臉圖像模糊,可通過進(jìn)行圖像銳化,其中k為擴(kuò)算效應(yīng)的相關(guān)系數(shù)。k值要選擇合理,假設(shè)k過大,圖像輪廓邊緣會過沖。假設(shè)k過小會致使銳化成效不明顯。六、圖像歸一化圖像歸一化包括灰度歸一化和幾何歸一化?;叶葰w一化是為了使不同灰度值的圖像具有統(tǒng)一灰度。如此做的目的是減弱光照轉(zhuǎn)變對灰度轉(zhuǎn)變而致使人臉識別率降低。具體操作為: ()其中和別離為理想的均值和方差,一樣,,M和VAR為輸入人臉圖像實際的均值和方差。幾何歸一化要緊的內(nèi)容有大小矯正,平移,旋轉(zhuǎn)和翻轉(zhuǎn)。大小矯正是為了把原始圖像的人臉校正到統(tǒng)一的大小,常常依據(jù)人臉的坐標(biāo)。平移是為了排除人臉左右偏移對人臉識別的阻礙。旋轉(zhuǎn)是為了使兩眼維持在水平位置。翻轉(zhuǎn)是為了使目標(biāo)圖像中的人臉維持在正面位置。經(jīng)常使用校正法有直接幾何校正法和間接結(jié)合校正法。直接幾何校正從畸變圖像數(shù)組開始,依照行列的順序,通過 ()進(jìn)行轉(zhuǎn)換,其中為直接校正變換函數(shù)。但還需要將原先像素的灰度值賦值給轉(zhuǎn)換后相應(yīng)的像素點,而且還需要重采樣,使不規(guī)那么排列的離散灰度數(shù)組變成規(guī)那么排列的灰度數(shù)組。間接幾何校正從空白的校正圖像數(shù)組開始,按行列順依次對每一個校正像素點反求其在畸變圖像坐標(biāo)系中的位置。變換式為 ()其中為間接變換函數(shù)。把通過上式取得畸變圖像位置上的灰度值去除添回到空白校正圖像點陣中相應(yīng)的位置上,而且還需要通過灰度內(nèi)插來確信(x,y)的位置的灰度值。第三節(jié)本章小結(jié)本章要緊介紹了JPEG文件格式和人臉圖像經(jīng)常使用預(yù)處置方式。在人臉圖像經(jīng)常使用預(yù)處置方式一節(jié)中要緊介紹了圖像歸一化處置,經(jīng)常使用的排除噪音的方式等,別離為灰度轉(zhuǎn)變,二值化,直方圖修正,圖像濾波,圖像銳化和歸一化處置。第四章人臉識別第一節(jié)主成份分析大體理論一、什么是主成份分析?主成份分析為Principlecomponentanalysis[10,11,12]的中文翻譯,其英文簡寫為PCA。它是一種超級流行和有效的數(shù)據(jù)分析技術(shù),最重要的應(yīng)用是對原有數(shù)據(jù)進(jìn)行簡化。主成份分析可以有效的找出數(shù)據(jù)中最“要緊”的元素和結(jié)構(gòu),去除噪聲和冗余,將原有的復(fù)雜數(shù)據(jù)降維處置,揭露出隱藏在復(fù)雜數(shù)據(jù)背后的簡單結(jié)構(gòu)。它的優(yōu)點是簡單,而且無參數(shù)限制,能夠方便的應(yīng)用與各個場合。因此應(yīng)用極為普遍,從神經(jīng)科學(xué)到運算機(jī)圖形學(xué)都有它的身影。PCA被稱為應(yīng)用線形代數(shù)最有價值的結(jié)果之一。本節(jié)下面的內(nèi)容將開始講解PCA的具體內(nèi)容。具體安排為:第一將從一個簡單的例子開始說明PCA應(yīng)用的場合和方式的由來,進(jìn)行一個比較直觀的說明;然后加入數(shù)學(xué)的嚴(yán)格推導(dǎo),引入線形代數(shù),進(jìn)行問題的求解。隨后將揭露PCA與SVD(SingularValueDecomposition)之間的聯(lián)系和如何將之應(yīng)用于真實世界。最后將分析PCA理論模型的假設(shè)條件和針對這些條件可能進(jìn)行的改良。二、例子在實驗科學(xué)中常常碰到的情形是,利用大量的變量代表可能轉(zhuǎn)變的因素,例如光譜、電壓、速度等等。在實際中,由于實驗環(huán)境和觀測手腕的限制,實驗數(shù)據(jù)往往變得極為的復(fù)雜,混亂,而且數(shù)據(jù)存在專門大的冗余。如何對數(shù)據(jù)進(jìn)行分析,取得隱藏在數(shù)據(jù)背后變量間的本質(zhì)關(guān)系,是一個很困難的問題。在神經(jīng)科學(xué)、氣象學(xué)、海洋學(xué)等等學(xué)科實驗中,假設(shè)的變量個數(shù)往往超級之多,可是真正的阻礙因素和它們之間的關(guān)系可能又是超級之簡單的。下面的例子取自一個咱們都超級熟悉的物理學(xué)中的實驗。那個實驗看上去似乎過于簡單,但足以說明問題。如圖表所示,這是一個理想彈簧運動規(guī)律的測定實驗。假設(shè)球是連接在一個無質(zhì)量無摩擦的彈簧之上,從平穩(wěn)位置沿x軸拉開必然的距離然后釋放。圖理想彈簧運動規(guī)律模型關(guān)于一個具有先驗知識的實驗者來講,那個實驗是超級容易的。球的運動只是在x軸向上發(fā)生,只需要記錄下x軸上的運動序列并加以分析即可??墒?,在實際中,關(guān)于第一次做那個實驗的實驗者來講(這也是實驗科學(xué)中最常碰到的一種情形),是無法進(jìn)行如此的假設(shè)的。那么,一樣來講,必需記錄下球的三維位置(x0,y0,z0)。這一點能夠通過在不同角度放置三個攝像機(jī)實現(xiàn)(如下圖),假設(shè)以200Hz的頻率拍照畫面就能夠夠取得球在空間中的運動序列??墒牵捎趯嶒灥南拗?,這三臺攝像機(jī)的角度可能比較任意,并非是正交的。事實上,在真實世界中也并無所謂的x,y,z軸,每一個攝像機(jī)記錄下的都是一幅二維的圖像,有其自己的空間坐標(biāo)系,球的空間位置是由一組二維坐標(biāo)記錄的:[(xA,yA)(xB,yB)(xC,yC)]。通過實驗,系統(tǒng)的攝像機(jī)記錄了幾分鐘球的位置序列。如何從這些數(shù)據(jù)中取得球是沿著某個x軸運動的規(guī)律呢?如何將實驗數(shù)據(jù)中的冗余變量剔除,化歸到那個潛在的x軸上呢?在真實的實驗場景中,數(shù)據(jù)的噪音是必需面對的因素。在那個實驗中噪音可能來自空氣、摩擦、攝像機(jī)的誤差和非理想化的彈簧等等。噪音使數(shù)據(jù)變得混亂,掩蓋了變量間的真實關(guān)系。如何去除噪音是實驗者天天都要試探和解決的問題。上面提出的兩個問題確實是PCA方式要解決的目標(biāo)。PCA主成份分析方式是解決此類問題的一個超級有效的工具。下文將結(jié)合以上的例子提出解決方式,慢慢表達(dá)PCA方式的思想和求解進(jìn)程。三、基變換從線形代數(shù)的角度來看,PCA的目標(biāo)確實是利用另一組基去從頭描述取得的數(shù)據(jù)空間。而新的基要能盡可能揭露原有的數(shù)據(jù)間的關(guān)系。在那個例子中,沿著某x軸上的運動是最重要的。那個維度即最重要的“主元”。PCA的目標(biāo)確實是找到如此的“主元”,最大程度的去除冗余和噪音的干擾。標(biāo)準(zhǔn)正交基為了更有利于推導(dǎo),將對上述例子的數(shù)據(jù)作出概念為:在實驗進(jìn)程中,在每一個采樣時刻點上,每一個攝像機(jī)記錄一組二維坐標(biāo)為(x,y),綜合三臺攝像機(jī)數(shù)據(jù),在每一個時刻點上取得的位置數(shù)據(jù)對應(yīng)于一個六維列向量。 ()若是以200Hz的頻率拍照10分鐘,將取得10*60*200=120000個如此的向量數(shù)據(jù)。抽象一點來講,每一個采樣點數(shù)據(jù)都是在m維向量空間(此例m=6)內(nèi)的一個向量,那個地址的m是涉及到的變量個數(shù)。由線形代數(shù)知識能夠明白,在m維向量空間中的每一個向量都是一組正交基的線形組合。最一般的一組正交基是標(biāo)準(zhǔn)正交基,實驗采樣的結(jié)果通常能夠看做是在標(biāo)準(zhǔn)正交基下表示的。舉例來講,上例中每一個攝像機(jī)記錄的數(shù)據(jù)坐標(biāo)為(x,y),如此的基即是[(1,0),(0,1)]。那什么緣故不取或是其他任意的基呢?緣故是,如此的標(biāo)準(zhǔn)正交基反映了數(shù)據(jù)的搜集方式。假設(shè)搜集數(shù)據(jù)點是(2,2),一樣并非會記錄。(在基下),因為一樣的觀測者都是適應(yīng)于取攝像機(jī)的屏幕坐標(biāo),即向上和向右的方向作為觀測的基準(zhǔn)。也確實是說,標(biāo)準(zhǔn)正交基表現(xiàn)了數(shù)據(jù)觀測的一樣方式。在線形代數(shù)中,這組基表示為行列向量線形無關(guān)的單位矩陣。 ()基變換從更嚴(yán)格的數(shù)學(xué)概念上來講,PCA回答的問題是:如何尋覓到另一組正交基,它們是標(biāo)準(zhǔn)正交基的線性組合,而且能夠最好的表示數(shù)據(jù)集?在PCA方式中有一個很關(guān)鍵的假設(shè):線性。這是一個超級好的假設(shè),它使問題取得了專門大程度的簡化,具體表現(xiàn)為數(shù)據(jù)被限制在一個向量空間中,能被一組基表示,而且還隱含的假設(shè)了數(shù)據(jù)間的持續(xù)性關(guān)系。如此一來數(shù)據(jù)就能夠夠被表示為各類基的線性組合。令X表示原數(shù)據(jù)集。X是一個m*n的矩陣,它的每一個列向量都表示一個時刻采樣點上的數(shù)據(jù),在上面的例子中,m=6,n=120000。Y表示轉(zhuǎn)換以后的新的數(shù)據(jù)集表示。P是他們之間的線性轉(zhuǎn)換。它們間的轉(zhuǎn)換關(guān)系為 ()有如下概念:pi表示P的行向量。xi表示X的列向量。yi表示Y的列向量。上式(3)在線性代數(shù)中,它有如下的含義:P是從X到Y(jié)的轉(zhuǎn)換矩陣。幾何上來講,P對X進(jìn)行旋轉(zhuǎn)和拉伸取得Y。P的行向量, (p1,p2,…,pm)是一組新的基,而Y是原數(shù)據(jù)X在這組新的基表示下取得的從頭表示。下面是對最后一個含義的說明: () ()注意到Y(jié)的列向量: ()可見yi表示的是xi與P中對應(yīng)列的點積,也確實是相當(dāng)于是在對應(yīng)向量上的投影。因此,P的行向量事實上確實是一組新的基。它對原數(shù)據(jù)X進(jìn)行從頭表示。問題在線性的假設(shè)條件下,問題轉(zhuǎn)化為尋覓一組變換后的基,也確實是P的行向量(p1,p2,…,pm),這些向量確實是PCA中所謂的“主元”。問題轉(zhuǎn)化為如下的形式:如何才能最好的表示原數(shù)據(jù)X?P的基如何選擇才是最好的?解決問題的關(guān)鍵是如何表現(xiàn)數(shù)據(jù)的特點。那么,什么是數(shù)據(jù)的特點,如何表現(xiàn)呢?四、方差“最好的表示”是什么意思呢?下面將給出一個較為直觀的說明,但同時會增加一些額外的假設(shè)條件。在線性系統(tǒng)中,所謂的“混亂數(shù)據(jù)”通常包括以下三種成份:噪音,旋轉(zhuǎn)和冗余。噪音和旋轉(zhuǎn)噪音對數(shù)據(jù)的阻礙是龐大的,如果不能對噪音進(jìn)行區(qū)分,就不可能抽取到數(shù)據(jù)中有效的信息。噪音的衡量有多種方式,最常見的概念是信噪比SNR(signal-to-noiseratio),或是方差比: () ()比較大的信噪比表示數(shù)據(jù)的準(zhǔn)確度高,而信噪比低那么說明數(shù)據(jù)中的噪音成份比較多。那么如何區(qū)分什么是信號,什么是噪音呢?那個地址假設(shè),變換較大的信息被以為是信號,變換較小的那么是噪音。事實上,那個假設(shè)等價于一個低通的濾波器,是一種標(biāo)準(zhǔn)的除噪準(zhǔn)那么。而變換的大小那么是由方差來描述的。它表示了采樣點在平均值雙側(cè)的散布,對應(yīng)于圖表(a)確實是采樣點云的“胖瘦”。顯然的,方差較大,也確實是較“寬”較“胖”的散布,表示了采樣點的要緊散布趨勢,是主信號或要緊分量;而方差較小的散布那么被認(rèn)為是噪音或次要分量。(a)(b)圖(a)攝像機(jī)A的搜集數(shù)據(jù)。圖中黑色垂直直線表示一組正交基的方向。是采樣點云在長線方向上散布的的方差,而是數(shù)據(jù)點在短線方向上散布的方差。(b)對P的基向量進(jìn)行旋轉(zhuǎn)使SNR和方差最大。假設(shè)攝像機(jī)A拍照到的數(shù)據(jù)如表(a)所示,圓圈代表采樣點,因為運動理論上是只存在于一條直線上,因此偏離直線的散布都屬于噪音。現(xiàn)在SNR描述的確實是采樣點云在某對垂直方向上的概率散布的比值。那么,最大限度的揭露原數(shù)據(jù)的結(jié)構(gòu)和關(guān)系,找出潛在的最優(yōu)的x軸,事實上等價尋覓一對空間內(nèi)的垂直直線(圖中黑線表示,也對應(yīng)于此空間的一組基),使得信噪比盡可能大的方向。容易看出,本例中潛在的x軸確實是圖上的較長黑線方向。那么如何尋覓如此一組方向呢?直接的方式是對基向量進(jìn)行旋轉(zhuǎn)。如圖表(b)所示,隨著這對直線的轉(zhuǎn)動SNR和方差的轉(zhuǎn)變情形。對應(yīng)于SNR最大值的一組基p,確實是最優(yōu)的“主元”方向。冗余在實驗中,常常會顯現(xiàn)由于咱們先驗知識的不足而引入了一些沒必要要的變量。如此可能會是兩種情形:1)該變量對結(jié)果沒有阻礙;2)該變量能夠用其它變量表示,從而造成數(shù)據(jù)冗余。(a)(b)(c)圖可能冗余數(shù)據(jù)的頻譜圖表示。r1和r2別離表示兩個不同的觀測變量。(比如例子中的xA,yB)。最正確擬合曲線r2=kr1用虛線表示。如圖表3所示,它揭露了兩個觀測變量之間的關(guān)系。(a)圖所示的情形是低冗余的,從統(tǒng)計學(xué)上說,這兩個觀測變量是彼此獨立的,它們之間的信息沒有冗余。而相反的極端情形如(c),r1和r2高度相關(guān),r2完全能夠用r1表示。一樣來講,這種情形發(fā)生可能是因為攝像機(jī)A和攝像機(jī)B放置的位置太近或是數(shù)據(jù)被重復(fù)記錄了,也可能是由于實驗設(shè)計的不合理所造成的。那么關(guān)于觀測者而言,那個變量的觀測數(shù)據(jù)確實是完全冗余的,應(yīng)當(dāng)去除,只用一個變量就能夠表示。這也確實是PCA中“降維”思想的本源。協(xié)方差矩陣關(guān)于上面的簡單情形,能夠通過簡單的線性擬合的方式來判定各觀測變量之間是不是顯現(xiàn)冗余的情形,而關(guān)于復(fù)雜的情形,需要借助協(xié)方差[13]來進(jìn)行衡量和判定: ()A,B別離表示不同的觀測變量所記錄的一組值,在統(tǒng)計學(xué)中,由協(xié)方差的性質(zhì)能夠取得:,且當(dāng)且僅當(dāng)觀測變量A,B彼此獨立。,當(dāng)A=B等價的,將A,B寫成行向量的形式:,協(xié)方差能夠表示為 ()那么,關(guān)于一組具有m個觀測變量,n個采樣時刻點的采樣數(shù)據(jù)X,將每一個觀測變量的值寫為行向量,能夠取得一個m*n的矩陣: ()接下來概念協(xié)方差矩陣如下: () ()容易發(fā)覺協(xié)方差矩陣具有如下性質(zhì):eq\o\ac(○,1)CX是一個m*m的平方對稱矩陣。eq\o\ac(○,2)Cx對角線上的元素是對應(yīng)的觀測變量的方差。eq\o\ac(○,3)非對角線上的元素是對應(yīng)的觀測變量之間的協(xié)方差。協(xié)方差矩陣CX包括了所有觀測變量之間的相關(guān)性氣宇。更重要的是,依照前兩部份的說明,這些相關(guān)性氣宇反映了數(shù)據(jù)的噪音和冗余的程度。在對角線上的元素越大,說明信號越強(qiáng),變量的重要性越高;元素越小那么說明可能是存在的噪音或是次要變量。在非對角線上的元素大小那么對應(yīng)于相關(guān)觀測變量對之間冗余程度的大小。一樣情形下,初始數(shù)據(jù)的協(xié)方差矩陣?yán)鲜遣惶玫模憩F(xiàn)為信噪比不高且變量間相關(guān)度大。PCA的目標(biāo)確實是通過基變換對協(xié)方差矩陣進(jìn)行優(yōu)化,找到相關(guān)“主元”。那么,如何進(jìn)行優(yōu)化?矩陣的那些性質(zhì)是需要注意的呢?協(xié)防差矩陣的對角化總結(jié)上面的部份能夠發(fā)覺主元分析和協(xié)方差矩陣優(yōu)化的原那么是:1)最小化變量冗余即對應(yīng)于協(xié)方差矩陣的非對角元素要盡可能??;2)最大化信號即對應(yīng)于要使協(xié)方差矩陣的對角線上的元素盡可能的大。因為協(xié)方差矩陣的每一項都是正值,最小值

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論