關(guān)于Gabor小波和人工神經(jīng)網(wǎng)絡(luò)的人臉識別_第1頁
關(guān)于Gabor小波和人工神經(jīng)網(wǎng)絡(luò)的人臉識別_第2頁
關(guān)于Gabor小波和人工神經(jīng)網(wǎng)絡(luò)的人臉識別_第3頁
關(guān)于Gabor小波和人工神經(jīng)網(wǎng)絡(luò)的人臉識別_第4頁
關(guān)于Gabor小波和人工神經(jīng)網(wǎng)絡(luò)的人臉識別_第5頁
已閱讀5頁,還剩8頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

依據(jù)Gabor小波和人工神經(jīng)網(wǎng)絡(luò)的人臉辨認摘要人臉辨認是核算機視覺范疇中十分活潑的一個研討方向,在圖畫、生物、工業(yè)等民用范疇及軍事范疇中有著廣泛的運用,其間以方針特征的獲取為難點與要點。這篇文章研討的意圖是前進Gabor方針辨認算法的魯棒性,降低負面要素對辨認作用的影響。首要介紹了常用的分類規(guī)矩,剖析了人工神經(jīng)網(wǎng)絡(luò)以及BP算法的優(yōu)缺陷。給出了一種變步長學(xué)習(xí)速率的改善辦法,優(yōu)化了BP神經(jīng)網(wǎng)絡(luò),為后文的辨認研討供給了較好的分類器撐持。要害字:神經(jīng)網(wǎng)絡(luò),Gabor濾波器,特征獲取,人臉辨認AbstractTheautomatictargetrecognitionisapopissueinthecomputervisionarea,thathasbeenusedabundantlyinmanyfieldssuchasimage,biology,industryandSOon,especiallyinmilitarycircles.DuringATR’Staches,extractingfeatureoftargetimageshouldbethemostdifficultandimportantone.TheaimofthispaperistoenhancetherobustnessofcorrespondingGaboralgorithmandtoweakentheeffectofnegativefactors.Firstly,somemainclassifiersarepresented,andsomeadvantageanddisadvantageofBPnetworkwhichbelongtotheANNareanalysed.AnimprovedmethodwhosestepextentshiftisgiventooptimizetheBPnet,whichsuppliesabetterclassifierforthenextwork.Keywords:Neuralnetwork,GaborJets,F(xiàn)eatureextracting,F(xiàn)acerecognition1序言1.1研討布景及含義人臉辨認是生物特性區(qū)分技能的一個首要方向,它觸及圖畫處置,形式辨認,核算機視覺等多個研究范疇,具有十分廣泛的運用遠景,多年來一直是一個研討熱門。關(guān)聯(lián)于其它人體生物特征辨認技能,如指紋辨認、虹膜辨認、掌紋辨認,人臉辨認技能是最直接、最天然、最簡略被人承受的。與其它技能比擬,它具有侵略性小、較少需求或不需求用戶的自動協(xié)作、樣本收集便利、運用場合廣泛、潛在的數(shù)據(jù)資源豐富、設(shè)備本錢低一級長處[1]。人臉辨認體系具有操作及流程簡略、適用面廣、撐持一對一或一對多比對、撐持多點一起收集比對、帶有數(shù)據(jù)庫撐持記載及查詢功用,對收集現(xiàn)場環(huán)境需求較低,可在極短的時間里區(qū)分出進出者的身份是不是合法,根絕運用別人鑰匙、暗碼、磁卡等不合法進入。人臉辨認技能的安全性、可靠性較高,且具有廣泛的市場需求,它能夠運用于公安部門的監(jiān)犯檔案管理、監(jiān)犯辨認查找、刑偵破案、安全驗證體系、信用卡驗證、醫(yī)學(xué)、檔案管理、視頻會議、人機交互體系、證件核對、保安監(jiān)督、門禁操控及至自動柜員機(ATM)等多種場合[2]。人臉辨認對人類來說是件天但是然的工作,但對核算機而言,人臉辨認卻遠非一個已處置的課題。一切的人臉都具有類似的布局,在紋路上也十分附近。別的圖畫受光照、成像視點及成像距離等外界條件影響,具有“一人千面”的特色,欲樹立一種具有各種不變性的描繪模型仍是比擬艱難的。此外,人臉辨認技能研討與關(guān)聯(lián)科學(xué)的開展及人腦的知道程度嚴密關(guān)聯(lián)[3]。許多要素都使人臉辨認研討變成一項極富挑戰(zhàn)性的課題,一方面信息化進程的日益加速,電子商務(wù)、重要場所的安全認證、智能化環(huán)境等許多運用范疇對與人臉有關(guān)的信息處置提出了迫切需求;另一方面,硬件和軟件技能的開展,為滿意實習(xí)運用體系對人臉檢測、盯梢及辨認技能的實時化需求供給了能夠性[2]。所以,人臉辨認的研討不只觸及心理學(xué)、生理學(xué)、人工智能、形式辨認、核算機視覺、圖畫剖析與處置等多個學(xué)科范疇,更是形式辨認、人工智能和核算機視覺的典型事例之一[2]。對這一疑問的研討和處置,有助于對其他方針辨認疑問的研討剖析和處置,人臉辨認也因而變成這些根底研討范疇的重要課題之一,具有重要的理論研討價值。1.2國內(nèi)外研討現(xiàn)狀及開展趨勢近30年來,人臉自動辨認的研討獲得了很大的開展,從工程索引(EI)上檢索到的關(guān)聯(lián)文獻已達數(shù)千篇,包含IEEEPAMI在內(nèi)的重要世界期刊也有專欄乃至??瘓髮?dǎo)人臉辨認的最新研討開展,一起還呈現(xiàn)了專門的世界學(xué)術(shù)會議,如人臉手勢辨認世界學(xué)術(shù)會議[1]。當(dāng)前人臉辨認范疇內(nèi)最聞名的世界研討機構(gòu)包含:美國麻省理工學(xué)院媒體試驗室及人工智能試驗室、南加州大學(xué)、CMU卡內(nèi)基—梅隆機器人研討及交互體系試驗室、馬里蘭大學(xué)等。別的,一些國家或區(qū)域也有不少研討機構(gòu)在人臉辨認范疇進行了許多的研討工作[4]。90時代中后期以來,國內(nèi)的許多研討機構(gòu)在天然科學(xué)基金、863方案、攀爬方案等贊助下,開端了對人臉辨認的研討。其間首要包含清華大學(xué)核算機系、自動化系、電子系以及哈爾濱工業(yè)大學(xué)、南京理工大學(xué)信息學(xué)院、中科院自動化所、上海交通大學(xué)圖畫處置與形式辨認研討所、中山大學(xué)數(shù)學(xué)系等,他們在人臉辨認研討范疇都進行了許多很有含義的測驗,積累了經(jīng)歷[5]。1.3人臉辨認的常用辦法(1)依據(jù)幾許特征的辦法幾許特征最早是用于人臉辨認的。人臉由雙眼、鼻子、嘴巴、下巴等部件構(gòu)成,正因為這些部件的形狀、巨細和布局上的各種區(qū)別才使得世界上每個人臉千差萬別,因而對這些部件的形狀和布局聯(lián)系的幾許描繪,能夠作為人臉辨認的重要特征。將人臉用一個幾許特征矢量標(biāo)明,用形式辨認中層次聚類的思維描繪分類器到達辨認意圖[6]。這就需求挑選的幾許特征矢量具有必定的獨特性,能夠反映不一樣人臉之間的不一樣,一起又具有必定的彈性,以消除時間跨度、光照等的影響。幾許特征矢量是以人臉器官的形狀和幾許聯(lián)系為根底的特征矢量,其重量一般包含人臉指定兩點間的歐式距離、曲率、視點等[6]。(2)依據(jù)彈性模型匹配辦法彈性模型匹配辦法的思維是將人臉上的一些特征點作為基準點構(gòu)成彈性圖,每個基準點存儲一串具有代表性的特征矢量,選用分級布局的彈性圖,去掉一些冗余節(jié)點,構(gòu)成稀少的人臉描繪布局[7]。經(jīng)過測驗樣本和特征樣本的彈性匹配來完結(jié)辨認。彈性模型匹配辦法有許多,例如:在人臉圖畫上放置一組矩形網(wǎng)格節(jié)點,每個節(jié)點的特征用該節(jié)點處的多標(biāo)準Gabor起伏特征描繪,各節(jié)點之間的銜接聯(lián)系用幾許距離標(biāo)明,然后構(gòu)成依據(jù)二維拓撲圖的人臉描繪,依據(jù)兩個圖畫中各節(jié)點和銜接之間的類似性進行人臉辨認。還有將人臉圖畫標(biāo)明為可變形的3D網(wǎng)格外表,將人臉匹配疑問轉(zhuǎn)換為曲面匹配疑問,運用有限元剖析的辦法進行曲面變形,依據(jù)兩幅圖畫之間變形匹配的程度辨認人臉等。(3)神經(jīng)網(wǎng)絡(luò)辦法當(dāng)前神經(jīng)網(wǎng)絡(luò)辦法在人臉辨認中的研討方興未已。Valentin[8,9]提出一種辦法,首要獲取人臉的50個主元,然后用自關(guān)聯(lián)神經(jīng)網(wǎng)絡(luò)將它映射到5維空間中,再用一個一般的多層感知器進行區(qū)分,對一些簡略的測驗圖畫作用較好;Intrator[8,9]等提出了一種混合型神經(jīng)網(wǎng)絡(luò)來進行人臉辨認,其間非監(jiān)督神經(jīng)網(wǎng)絡(luò)用于特征獲取,而監(jiān)督神經(jīng)網(wǎng)絡(luò)用于分類。Lee[8,9]等將人臉的特色用六條規(guī)矩描繪,然后依據(jù)這六條規(guī)矩進行五官的定位,將五官之間的幾許距離輸入含糊神經(jīng)網(wǎng)絡(luò)進行辨認,作用較一般的依據(jù)歐氏距離的辦法有較大改善;Laurence[8,9]等選用卷積神經(jīng)網(wǎng)絡(luò)辦法進行人臉辨認,因為卷積神經(jīng)網(wǎng)絡(luò)中集成了相鄰像素之間的關(guān)聯(lián)性知識,然后在必定程度上獲得了對圖畫平移、旋轉(zhuǎn)和有些變形的不變性,因而得到十分抱負的辨認成果。神經(jīng)網(wǎng)絡(luò)辦法在人臉辨認上的運用比起前述幾類辦法來有必定的優(yōu)勢,因為對人臉辨認的許多規(guī)矩或規(guī)矩進行顯性的描繪是適當(dāng)艱難的,而神經(jīng)網(wǎng)絡(luò)辦法則能夠經(jīng)過學(xué)習(xí)的進程獲得對這些規(guī)矩和規(guī)矩的隱性表達,它的習(xí)慣性更強,一般也比擬簡略完結(jié)。(4)依據(jù)線性和非線性質(zhì)空間的辦法依據(jù)子空間的辦法是依據(jù)圖畫像素自身的,首要是運用核算模板和圖畫灰度的自關(guān)聯(lián)性來完結(jié)辨認功用,一般來說模板匹配法要優(yōu)于依據(jù)幾許特征法[10]。當(dāng)前,在許多子空間辦法中,運用最廣泛的是特征臉法(PCA),這是關(guān)于人臉全體特征的研討,運用Karhunen-Lobve改換原理,將圖畫標(biāo)明為一些低維的正交基組成的子空間,然后選用最小距離原則進行人臉辨認。線性區(qū)分剖析(LDA)是一種較為遍及的用于特征獲取的線性分類辦法。它使投影后的形式樣本的類間散布矩陣最大而類內(nèi)散布矩陣最小,也即是說,投影后確保形式樣本在新的空間中有最大的類間距離和最小的類內(nèi)距離,即形式在該空間中有最佳的可分離性。線性區(qū)分剖析獲取的特征向量集著重的是不一樣人臉的區(qū)別而不是照明條件、人臉表情和方向的改動。因而,選用此辦法對光照條件、人臉姿勢等的改動不太靈敏,然后有助于前進辨認作用??墒莻鹘y(tǒng)的算法常常遇到的一個疑問是樣本類內(nèi)散度矩陣一般是奇特的,即“小樣本調(diào)集疑問”。關(guān)于這一疑問已有了許多改善辦法并獲得了極好的辨認作用。獨立重量剖析(ICA)是一種很有用的獲取辦法。與PCA比擬,ICA有兩個優(yōu)勢:一是ICA獲得的獨立重量不需求滿意正交聯(lián)系,能夠消除象素間的高階核算關(guān)聯(lián)性,而PCA只能消除象素間的二階核算關(guān)聯(lián)性;二是ICA獲得的一組矢量比本征矢量更具空間有些描繪性,具有十分好的人臉描繪才能。學(xué)習(xí)SVM的Kernel辦法,PCA、LDA和ICA等都被擴大到了核空間。與線性質(zhì)空間辦法比擬,依據(jù)Kernel的辦法獲得了十分好的辨認作用[11,12]。(5)其他辦法Brunelli等對模板匹配辦法作了許多試驗,成果標(biāo)明在標(biāo)準、光照、旋轉(zhuǎn)視點等各種條件安穩(wěn)的情況下,模板匹配的作用優(yōu)于其他辦法,但它對光照、旋轉(zhuǎn)和表情改動比擬靈敏,影響了它的直接運用。Goudail等人選用有些自關(guān)聯(lián)性作為人臉辨認的區(qū)分依據(jù),它具有平移不變性,在臉部表情改動時比擬安穩(wěn)。在近來的一些工作中,Benarie等提出VFR的標(biāo)明布局并將它用于人臉辨認的工作中,Lam等人研討了不一樣視點下的人臉匹配和辨認疑問,Vetter等人評論了由單幅人臉圖畫生成其他視點的人臉圖畫的能夠性,Mirhosseini等則探討了多種信息交融的人臉辨認辦法[13]。2Gabor特征獲取算法的完結(jié)2.1Gabor小波簡介因為Gabor特征對光照、姿勢具有必定的魯棒性[7,13],因而Gabor特征在人臉辨認范疇的運用十分廣泛,當(dāng)前已經(jīng)變成了最為干流的人臉特征抽取辦法。Gabor特征具有杰出的空間有些性和方向挑選性[7,13],能夠極好的描繪圖畫的紋路信息,因而許多人臉辨認算法都選用Gabor特征作為辨認特征。EGM是最早運用Gabor特征進行人臉辨認的算法之一,該算法僅對人臉圖畫中有些要害特征點進行Gabor改換,并將人臉描繪為以這些特征點方位為極點、以其Gabor改換系數(shù)為極點特色、以其要害點方位聯(lián)系為邊特色的特色圖,然后將人臉辨認疑問轉(zhuǎn)化為圖匹配疑問。經(jīng)過合理的挑選特征點的方位,彈性圖能夠極好地一起對人臉的要害有些特征及其它們之間的聯(lián)系進行建模,然后既運用了人臉的圖畫亮度散布特征,又運用了臉部布局信息。GWN辦法從最佳描繪的視點,經(jīng)過一個優(yōu)化進程徹底自動地斷定特征方位及其相應(yīng)的小波參數(shù),并結(jié)尾用這些參數(shù)作為人臉的描繪來進行人臉辨認。但GWN是一種依據(jù)參數(shù)優(yōu)化的建模辦法,核算雜亂度很高,其用于人臉辨認的有用性還需求更多的實習(xí)查驗。GFC算法的根本思維是在大略對齊人臉圖畫的前提下,逐像素核算每個像素點的多方向、多標(biāo)準Gabor改換特征,構(gòu)成Gabor特征的人臉標(biāo)明,然后進一步用Fisher區(qū)分剖析法獲取特征,為了處置逐像素Gabor特征維數(shù)過高的疑問,Liu選用了簡略的下采樣處置辦法。AdaGabor算法選用AdaBoost算法對高維Gabor特征進行挑選的降維,該辦法選用機器學(xué)習(xí)的辦法愈加客觀地運用Gabor特征,然后能在有用降維的一起前進辨認功用。Gabor小波與人類視覺體系中簡略細胞的視覺影響呼應(yīng)十分類似。它在獲取方針的有些空間和頻率域信息方面具有杰出的特性。雖然Gabor小波自身并不能構(gòu)成正交基,但在特定參數(shù)下可構(gòu)成緊布局。Gabor小波關(guān)于圖畫的邊際靈敏,能夠供給杰出的方向挑選和標(biāo)準挑選特性,而且關(guān)于光照改動不靈敏,能夠供給對光照改動杰出的習(xí)慣性[14]。上述特色使Gabor小波被廣泛運用于視覺信息了解。二維Gabor小波改換[15]是在時頻域進行信號剖析處置的重要東西,其改換系數(shù)有著杰出的視覺特性和生物學(xué)布景,因而被廣泛運用于圖畫處置、形式辨認等范疇。與傳統(tǒng)的傅立葉改換比擬,Gabor小波改換具有杰出的時頻有些化特性。即十分簡略地調(diào)整Gabor濾波器的方向、基頻帶寬及中心頻率然后能夠最佳的統(tǒng)籌信號在時空域和頻域中的分辯才能;Gabor小波改換具有多分辯率特性即變焦才能。即選用多通道濾波技能,將一組具有不一起頻域特性的Gabor小波運用于圖畫改換,每個通道都能夠得到輸入圖畫的某種有些特性,這樣能夠依據(jù)需求在不一樣粗細粒度上剖析圖畫。此外,在特征獲取方面,Gabor小波改換與其它辦法比擬:一方面其處置的數(shù)據(jù)量較少,能滿意體系的實時性需求;另一方面,小波改換對光照改動不靈敏,且能忍受必定程度的圖畫旋轉(zhuǎn)和變形,當(dāng)選用依據(jù)歐氏距離進行辨認時,特征形式與待測特征不需求嚴厲的對應(yīng),故能前進體系的魯棒性[16,17]。無論從生物學(xué)的視點仍是技能的視點,Gabor特征都有很大的優(yōu)越性。Jones和Palmer的研討標(biāo)明[18],在根本視覺皮層里的簡略細胞的感觸野約束在很小的空域范圍內(nèi),而且高度布局化。Gabor改換所選用的核(Kernels)與哺乳動物視覺皮層簡略細胞2D感觸野剖面(Profile)十分類似,具有優(yōu)秀的空間有些性和方向挑選性,能夠捉住圖畫有些區(qū)域內(nèi)多個方向的空間頻率(標(biāo)準)和有些性布局特征。這樣,Gabor分化能夠看作一個對方向和標(biāo)準靈敏的有方向性的顯微鏡。一起,二維Gabor函數(shù)也類似于增強邊際以及峰、谷、脊概括等底層圖畫特征,這適當(dāng)于增強了被認為是臉部要害部件的雙眼、鼻子、嘴巴等信息,一起也增強了諸于黑痣、酒窩、傷痕等有些特征,然后使得在保存全體人臉信息的一起增強有些特性變成能夠[18]。圖2.1即顯現(xiàn)了這必定論。圖2.1中的每一列代表一組試驗,其間榜首行代表脊椎動物的視覺皮層感觸野,第二行是Gabor濾波器,第三行是兩者的殘差。可見兩者相差極小。Gabor濾波器的這一性質(zhì),使得其在視覺范疇中經(jīng)常被用來作圖畫的預(yù)處置。圖2.1Gabor濾波器和脊椎動物視覺皮層感觸野呼應(yīng)的比擬從圖畫處置的視點來看,Gabor特征有如下長處:(1)Gabor核函數(shù)因為去掉了直流重量,因而對有些光照的改動不靈敏,常常被用在需求對光照有習(xí)慣性的場合;(2)Gabor濾波成果能夠反映圖畫不一樣標(biāo)準、不一樣方向上的灰度散布信息。一般說來,大標(biāo)準濾波能夠反映大局性較強的信息,一起能夠掩蓋圖畫中噪聲的影響;小標(biāo)準能夠反映比擬精密的有些布局,但簡略遭到噪聲影響。小波核函數(shù)在空域和頻域上都有必定的局域性,這使得其對平移、拉伸、旋轉(zhuǎn)和標(biāo)準改換都具有必定的魯棒性。雖然平移改換對復(fù)向量的相位有必定影響,但在人臉辨認這個疑問中,平移對成果的影響是要思考的,Gabor特征依然具有極好的描寫特性。正是因為Gabor特征的這些特性,使得其在人臉辨認中得到了十分廣泛的運用。2.2人臉圖畫的Gabor特征二維Gabor小波的界說為:(2.1)式中:是與小波頻率帶寬有關(guān)的常數(shù);為空間方位坐標(biāo);斷定了Gabor內(nèi)核的方向和標(biāo)準。在選用8個方向和5個標(biāo)準的采樣時,方向和標(biāo)準上的能夠?qū)憺?。其間為采樣標(biāo)準,為標(biāo)準標(biāo)號;為采樣方向,為方向標(biāo)號。為最大頻率,是頻域中的內(nèi)核距離因子。令參數(shù)、、,能夠獲得較好的小波表征和區(qū)分作用。Gabor改換與Gabor內(nèi)核的卷積為:(2.2)設(shè)的幅值和相位別離為和,則。組合不一樣標(biāo)準和方向的,構(gòu)成圖畫在方位處的Gabor特征矢量。在獲取人臉圖畫的Gabor特征時,一般選用多個在不一樣標(biāo)準和方向上的Gabor濾波器組成濾波器組,并依據(jù)圖畫的特色和神經(jīng)生理學(xué)的定論來挑選參數(shù)。一般研討選用共包含8個方向(;)和5個標(biāo)準(;;)的Gabor濾波器組,并令,使濾波器的帶寬約為1倍頻程。因為Gabor特征具有杰出的空間有些性和方向挑選性,而且對光照、姿勢具有必定的魯棒性,因而在人臉辨認中獲得了成功的運用。但是,大有些依據(jù)Gabor特征的人臉辨認算法中,只運用了Gabor幅值信息,而沒有運用相位信息,首要原因是Gabor相位信息跟著空間方位呈周期性改動,而幅值的改動相對滑潤而安穩(wěn)。所以本論文將輸入圖畫順次與濾波器組的各個濾波器進行卷積,并取其幅值作為輸出,即,(2.4)設(shè)圖畫的巨細為,經(jīng)過40個濾波器得到Gabor特征的維數(shù)高達,核算量很大,且因為Gabor特征在相鄰像素間是高度關(guān)聯(lián)和冗余的,所以一般只需求稀少的獲取有些節(jié)點上的Gabor特征。一個人臉圖畫經(jīng)Gabor改換后就得到幅值特征和相位特征的維數(shù)都是,核算量很大,而且Gabor特征在相鄰像素間是高度關(guān)聯(lián)的,所以有必要對Gabor特征進行降維。本論文所選用的降維辦法即是對Gabor改換系數(shù)進行簡略的下采樣,如對Gabor特征進行固定行固定列均勻散布采樣。獲取單幅人臉圖畫的Gabor特征的根本過程如下:(1)區(qū)分Gabor特征的采樣點本論文區(qū)分的采樣點的個數(shù)為40*30=1200個,采樣點數(shù)目較多,意圖是為了得到愈加明晰的Gabor圖畫。區(qū)分采樣點后的人臉圖畫如圖2.2所示:圖2.2(a)原人臉圖畫圖2.2(b)區(qū)分采樣點后的人臉圖畫因為得到的Gaobr特征的維數(shù)較大,下面試驗將選用均勻下采樣對Gaobr特征進行處置,然后到達降維的意圖。(2)獲取人臉圖畫的Gabor特征這篇文章選用40*30=1200個規(guī)矩散布的采樣點,在采樣點上獲取各個濾波器輸出的值,聯(lián)合起來組成列向量,然后得到每幅圖畫的Gabor特征向量,并以此作為該人臉圖畫的有些特征向量。得到的人臉圖畫的Gabor特征如下圖所示:圖2.3(a)單幅人臉圖畫的Gabor幅值特征圖2.3(b)單幅人臉圖畫的Gabor相位特征由以上圖畫可見,與原圖灰度值隨方位的改換比擬,濾波器輸出的幅值隨方位的改動要更小更不靈敏;Gabor相位信息跟著空間方位呈周期性改動,而幅值的改動相對滑潤而安穩(wěn)。因而,即便采樣點稍有偏移也不會使獲取出的特征值發(fā)作太大改動。也即是說,Gabor特征具有杰出的空間有些性和方向挑選性,而且對光照、姿勢具有必定的魯棒性,能夠忍受更大的器官定位和對齊差錯。3人工神經(jīng)網(wǎng)絡(luò)技能3.1人工神經(jīng)網(wǎng)絡(luò)簡介心理學(xué)家McCulloch和數(shù)學(xué)家Pitts于1943年協(xié)作提出榜首個神經(jīng)核算模型(MP模型)。1949年心理學(xué)家Hebb提出了可改動神經(jīng)元銜接強度的Hebb規(guī)矩。之后,神經(jīng)網(wǎng)絡(luò)之父Rosenblatt提出感知器(Perceptron)模型,榜首次將神經(jīng)網(wǎng)絡(luò)研討從理論研討付諸于工程實習(xí)中團[19]。這些年人工神經(jīng)網(wǎng)絡(luò)技能的開展為處置傳統(tǒng)的圖畫辨認技能的難題供給了新的辦法,尤其是大規(guī)模的核算帶來的運算量與運算精度之間的不行諧和的對立。因為其大規(guī)模自習(xí)慣并行處置和散布式信息存貯滿意了對大數(shù)據(jù)量方針圖畫的實時處置需求,其高度容錯性又容許許多方針圖畫呈現(xiàn)布景含糊和有些殘損。網(wǎng)絡(luò)事前對待辨認的許多樣本進行學(xué)習(xí)練習(xí),網(wǎng)絡(luò)練習(xí)完畢,標(biāo)志著它對某一類或幾類形式已具有正確分類的才能,時間經(jīng)過神經(jīng)元間的互連權(quán)值來存貯成果。神經(jīng)網(wǎng)絡(luò)的研討內(nèi)容首要觸及網(wǎng)絡(luò)拓撲布局、節(jié)點特性、學(xué)習(xí)和練習(xí)方案。人工神經(jīng)網(wǎng)絡(luò)是由簡略處置單元(神經(jīng)元)相互銜接而成的一種并行散布式信息處置布局,信息處置經(jīng)過神經(jīng)元之間的相互作用完結(jié)。圖3.1所示為第i個根本神經(jīng)元;其間別離代表神經(jīng)元l,2,?,i,?,n與第j個神經(jīng)元的銜接強度(權(quán)值);代表來自神經(jīng)元1,2,?,i,?,n的輸入;為傳遞函數(shù);為閾值;為第j個神經(jīng)元的輸出。第j個神經(jīng)元的輸入值經(jīng)過傳遞函數(shù)后,得到第j個神經(jīng)元的輸出為:作為神經(jīng)網(wǎng)絡(luò)的根本單元,一個神經(jīng)元有三個根本要素:一是與其他神經(jīng)元的加權(quán)銜接;二是核算該神經(jīng)元輸入信號的加權(quán)和;三是運用傳遞函數(shù)求該神經(jīng)元的輸出信號。傳遞函數(shù)(激勵函數(shù))其值一般約束在(0,1)或(-1,1)之間,常用的激勵函數(shù)有階躍函數(shù)(MP模型)、分段線性函數(shù)、Sigmoid函數(shù)、高斯函數(shù)等。人工神經(jīng)網(wǎng)絡(luò)是由許多簡略的根本單元相互銜接而成的非線性動態(tài)體系,每個神經(jīng)元的布局和功用都比擬簡略,但由其組成的體系卻十分雜亂,神經(jīng)元經(jīng)過權(quán)系數(shù)相銜接。這種大規(guī)模并行布局具有很高的核算速度。在這種多層網(wǎng)絡(luò)布局中,人工神經(jīng)網(wǎng)絡(luò)將信息散布貯存于銜接的權(quán)系數(shù)中,使網(wǎng)絡(luò)具有很高的容錯性和魯棒性。依據(jù)權(quán)值的設(shè)置神經(jīng)網(wǎng)絡(luò)能夠分為有監(jiān)督和無監(jiān)督學(xué)習(xí)兩類。有監(jiān)督學(xué)習(xí)的有多層感知機和Hamming網(wǎng)絡(luò)等;無監(jiān)督的有Konhonen自組織特征映射、Carpenter及Grossberg分類器等。神經(jīng)網(wǎng)絡(luò)對參數(shù)的調(diào)整有必定的規(guī)矩,即在啥情況下需求調(diào)整參數(shù)及怎么調(diào)整,常用的學(xué)習(xí)規(guī)矩有Delta學(xué)習(xí)規(guī)矩,Hebb學(xué)習(xí)規(guī)矩及Competitive學(xué)習(xí)規(guī)矩。神經(jīng)網(wǎng)絡(luò)的無窮長處在于:(1)定量或定性的一切信息都等勢散布存儲在網(wǎng)絡(luò)中的各神經(jīng)元及其銜接權(quán)值中;有很強的魯棒性和容錯性。(2)能充沛迫臨恣意雜亂的非線性聯(lián)系。(3)自學(xué)習(xí)與習(xí)慣嚴肅不斷定性體系的動態(tài)特性。(4)銜接權(quán)值和銜接的布局能夠經(jīng)過強壯的學(xué)習(xí)功用獲得。(5)選用并行散布處置辦法使得疾速進行許多運算變成能夠[20]。因為神經(jīng)網(wǎng)絡(luò)在處置高度非線性和不斷定性體系的操控上有無窮潛力,神經(jīng)網(wǎng)絡(luò)已廣泛運用在各個范疇,首要會集在運用神經(jīng)網(wǎng)絡(luò)進行形式辨認和猜測上。3.2反向傳達算法(BP)及其改善3.2.1BP算法介紹1988年Werbos提出了聞名的BP理論。Rumelhart和MeClelland(1986,1988)的并行散布處置(PDP)理論中開展的多層網(wǎng)絡(luò)差錯反向傳達學(xué)習(xí)算法[19]是迄今為止運用最遍及的神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)算法。BP網(wǎng)絡(luò)由輸入層、隱層和輸出層組成。隱層為一層或多層,其特色是相鄰兩層神經(jīng)元全互聯(lián),不相鄰層無互聯(lián)。依據(jù)BP算法的前饋型網(wǎng)絡(luò),為處置了多層網(wǎng)絡(luò)的學(xué)習(xí)疑問,依據(jù)學(xué)習(xí)差錯巨細,把學(xué)習(xí)成果反應(yīng)到中心層次的隱單元,改動它們的權(quán)系數(shù)矩陣,然后到達預(yù)期的學(xué)習(xí)意圖。到了90時代,BP神經(jīng)網(wǎng)絡(luò)在圖畫處置范疇中已獲得杰出的作用,如:特征獲取、方針分類與辨認等[21]。為輸入層節(jié)點i的輸出;為中心層節(jié)點j的輸出;為輸出層節(jié)點k的輸出;為輸出層節(jié)點k對應(yīng)的教員信號;為節(jié)點i和節(jié)點j間的銜接權(quán)值;為節(jié)點J和節(jié)點k間的銜接權(quán)值;為中心層節(jié)點j的閾值;為輸出層節(jié)點k的閾值。神經(jīng)元的搬運函數(shù)挑選為Sigmoid函數(shù):差錯函數(shù)為二乘差錯函數(shù):(1)2、初始化①設(shè)定學(xué)習(xí)次數(shù)t=0;對網(wǎng)絡(luò)權(quán)值和閾值賦于小的隨機數(shù),,,。(一)前向核算②輸入樣本為其間N為學(xué)習(xí)樣本數(shù),,P∈{1,2,?N},。③核算隱層各節(jié)點的輸出值:(2)④核算輸出層節(jié)點的輸出:(3)(二)逆向差錯批改核算⑤輸出層節(jié)點和隱層節(jié)點之間銜接權(quán)值批改量的核算:(4)⑥隱層節(jié)點和輸入層節(jié)點間銜接權(quán)值批改量的核算:(5)⑦用⑤求出的差錯批改量以來批改輸出層和隱層間銜接權(quán)值矩陣和閾值向量。例如對節(jié)點k和隱層j的銜接權(quán)值和節(jié)點k的閾值的批改為:(6)其間為操控學(xué)習(xí)速率的系數(shù)。⑨用⑥求出的差錯批改量子,來批改隱層和輸入層間銜接權(quán)值矩陣,和閾值向量。例如隱層j和輸入層節(jié)點i的銜接權(quán)值,和節(jié)點j的閾值的批改為:(7)⑨若是悉數(shù)學(xué)習(xí)樣本未取完,則返②,不然,⑩核算差錯函數(shù)E,并區(qū)分E是不是小于規(guī)則的差錯上限,若是E小于差錯上限,則算法完畢;不然,若是學(xué)習(xí)次數(shù)到算法完畢:不然更新學(xué)習(xí)次數(shù)t=t+l,回來②。雖然BP神經(jīng)網(wǎng)絡(luò)具有重要位置,但仍存在以下缺陷[17]:(1)迭代算法次數(shù)多,使得學(xué)習(xí)功率低、收斂速度慢,一般需求幾千步迭代或更多。(2)因為選用非線性梯度優(yōu)化算法,方針函數(shù)存在有些最小卻得不到全體最優(yōu)的表象。如在某些初始條件下,差錯曲面E能夠有許多大局最小解,算法的成果會墮入有些極小點,初始隨機權(quán)值的巨細,對有些極小的影響很大,體系有能夠因為權(quán)值過大而墮入有些最小(或十分平整區(qū)),一開端就能夠使網(wǎng)絡(luò)處于S型函數(shù)的飽滿區(qū)。(3)網(wǎng)絡(luò)的隱層數(shù)及各隱層節(jié)點個數(shù)的挑選首要依據(jù)經(jīng)歷來斷定,隱含單元數(shù)與疑問的需求、輸入輸出層節(jié)點數(shù)都有直接的聯(lián)系,缺少一致而完好的理論指導(dǎo)。(4)網(wǎng)絡(luò)的推廣(泛化)疑問。即網(wǎng)絡(luò)是不是具有必定的猜測才能,而且能否迫臨規(guī)矩和關(guān)于許多未經(jīng)學(xué)習(xí)過的輸入向量也能正確處置。(5)關(guān)于新參加的樣本要影響己經(jīng)學(xué)完的樣本,不能在線學(xué)習(xí),一起描繪得一個樣本的特征數(shù)目也需求有必要一樣。3.2.2BP算法的一些改善關(guān)于BP算法的缺陷,可從調(diào)整學(xué)習(xí)速率,調(diào)整權(quán)值兩個方面進行改善。影響B(tài)P算法收斂速度的一個重要原因即學(xué)習(xí)速率挑選不妥,挑選得過小,會致使收斂速度太慢;選得過大,則能夠致使震動乃至發(fā)散。一種改善辦法為:對每個銜接選用獨自的學(xué)習(xí)速率,這些學(xué)習(xí)速率的自習(xí)慣是經(jīng)過調(diào)查最終兩個梯度的符號來完結(jié)的。①給定小的初始值;②令這樣當(dāng)接連兩次迭代梯度方向相一起,標(biāo)明降低速度太慢,可使步長加倍;當(dāng)接連兩次迭代梯度方向相反時,標(biāo)明降低過快,這時可使步長折半。挑選適宜的是較簡略的。4展望跟著微電子、核算機、網(wǎng)絡(luò)技能的開展,傳統(tǒng)的磁卡、IC卡、暗碼等身份區(qū)分辦法正面臨著嚴肅的檢測。磁卡、IC卡簡略丟掉,也簡略被不法分子盜用;暗碼簡略忘掉。也能夠被解密。人臉辨認技能的呈現(xiàn)和一日千里的開展有望在不久的將來處置這些疑問;因為,任何一個人的人臉信息特征是時辰跟從自個的,不必憂慮會丟掉和被盜;別的,因為人臉特征相對比擬雜亂,仿制艱難,作為安全密鑰具有更高的可靠性和安全性。因而,跟著大家對人臉辨認技能研討的不斷深入,跟著核算機科學(xué)技能的疾速前進,在不遠的將來,依據(jù)人臉信息辨認的信息安全技能必定會得到廣泛運用,謀福于人類。跟著圖畫處置、形式辨認、核算機視覺以及神經(jīng)網(wǎng)絡(luò)等學(xué)科的進一步開展,經(jīng)過大家持之以恒的盡力探究,人臉辨認技能必將會得到很大的開展。參考文獻1祝磊,朱善安.人臉辨認的一種新的特征獲取辦法[J].核算機學(xué)報,2007,34(6):122-12512何春風(fēng),凌捷.人臉辨認技能總述[J].核算機學(xué)報,2003,13(12)75-783陳才扣,王正群,楊靜宇,楊健.一種用于人臉辨認的非線性區(qū)分特征交融辦法[J].電子學(xué)報,2005,26(5):793-7974何國輝,甘俊英.PCA-LDA算法在性別區(qū)分中的運用[J].中國圖畫圖形學(xué)報,2006,32(19):208-2115王聃,賈云偉,林福嚴.人臉辨認體系中的特征獲取[J].自動化學(xué)報,2005,21(7-3):53-556張儉鴿,王世卿,盛光磊.依據(jù)小波和DFB-PCA的人臉辨認算法研討[J].自動化學(xué)報,2007,23(2-1):253-2557曹林,王東峰,劉小軍,鄒謀炎.依據(jù)二維Gabor小波的人臉辨認算法[

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論