神經(jīng)網(wǎng)絡(luò)在人臉識(shí)別中的應(yīng)用

上傳人：7*** IP屬地：湖北上傳時(shí)間：2022-02-06 格式：DOC 頁(yè)數(shù)：10 大?。?5.50KB 積分：18 舉報(bào) 版權(quán)申訴

神經(jīng)網(wǎng)絡(luò)在人臉識(shí)別中的應(yīng)用_第2頁(yè)

神經(jīng)網(wǎng)絡(luò)在人臉識(shí)別中的應(yīng)用_第3頁(yè)

神經(jīng)網(wǎng)絡(luò)在人臉識(shí)別中的應(yīng)用_第4頁(yè)

神經(jīng)網(wǎng)絡(luò)在人臉識(shí)別中的應(yīng)用_第5頁(yè)

已閱讀5頁(yè)，還剩5頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、人工智能及識(shí)別技術(shù) 本欄目責(zé)任編輯 :李桂瑾1引言早在上世紀(jì) 60年代末 , 人臉識(shí)別即引起了研究者的強(qiáng)烈興趣 . 但早期的人臉識(shí)別一般都需要人的某些先驗(yàn)知識(shí) , 無(wú)法擺脫人的干預(yù) 。進(jìn)入上世紀(jì) 9O 年代 , 由于高速度、高性能計(jì)算機(jī)的出現(xiàn) , 人臉識(shí)別的方法有了重大突破 , 進(jìn)入了真正的機(jī)器自動(dòng)識(shí)別階段 , 人臉識(shí)別研究得到了前所未有的重視。人臉識(shí)別方法有很多種 :(1 特征臉?lè)椒?。這種方法起源于圖像描述技術(shù) 。采用特征臉識(shí) 別方法有良好的穩(wěn)定性、位移不變性、特征向量與圖像的高度成比例變化以及轉(zhuǎn)置不變性。不足之處是受表情變化、光照角度強(qiáng) 度變化和視

2、角變化等嚴(yán)重影響 , 魯棒性較差。 (2 隱馬爾可夫模型方法 (Hidden Markov Mode1 是用于描述信號(hào)統(tǒng)計(jì)特征的一組統(tǒng)計(jì) 模型。 HMM 的基本理論是由 Baum 和 Welch 等人在 20世紀(jì) 6O 年代末 70年代初建立 , 在語(yǔ)音識(shí)別中應(yīng)用較多。在 HMM 中 , 節(jié)點(diǎn) 表示狀態(tài) , 有向邊表示狀態(tài)之間的轉(zhuǎn)移。一個(gè)狀態(tài)可以具有特征空間中的任一特征 , 對(duì)同一特征 , 不同狀態(tài)表現(xiàn)出這一特征的概率不同。 (3 彈性圖匹配方法。彈性圖匹配方法是一種基于動(dòng)態(tài)連接結(jié)構(gòu)的方法。它將人臉用格狀的稀疏圖表示。 (4 神經(jīng)網(wǎng)絡(luò)方法。人工神經(jīng)網(wǎng)絡(luò)是由多

3、個(gè)神經(jīng)元按照一定的排列順序構(gòu)成的 , 是一個(gè)非線性動(dòng)力學(xué)系統(tǒng) , 其特色在于信息的分布式存儲(chǔ)和并行協(xié)同處理。雖然單個(gè)神經(jīng)元的結(jié)構(gòu)極其簡(jiǎn)單 , 功能有限 , 但由大量沖經(jīng) 元所構(gòu)成的網(wǎng)絡(luò)系統(tǒng)卻能夠?qū)崿F(xiàn)復(fù)雜豐富的功能。神經(jīng)網(wǎng)絡(luò)系統(tǒng) 除了具有集體運(yùn)算的能力和自適應(yīng)的學(xué)習(xí)能力外 , 還有根強(qiáng)的容錯(cuò)性和魯棒性 . 善于聯(lián)想、綜合和推廣。神經(jīng)網(wǎng)絡(luò)模型各種各樣。它們是從不同的角度對(duì)生物神經(jīng)系統(tǒng)不同層次的描述和模擬。有代表性的網(wǎng)絡(luò)模型有感知器、多層映射 BP 網(wǎng)絡(luò) 、 RBF 網(wǎng)絡(luò)等。目前 , 在人工神經(jīng)網(wǎng)絡(luò)的實(shí)際應(yīng)用中 , 絕大部分的神經(jīng)網(wǎng)絡(luò)模型都是采用 BP 網(wǎng)絡(luò)及

4、其變化形式 , 它也是前向網(wǎng)絡(luò)的核心部分 , 是人工神經(jīng)網(wǎng)絡(luò)最精華的部分。 BP 網(wǎng)絡(luò) 主要用于函數(shù)逼近、模式識(shí)別、數(shù)據(jù)壓縮等領(lǐng)域。2BP 神經(jīng)網(wǎng)絡(luò)的人臉識(shí)別BP 神經(jīng)網(wǎng)絡(luò)用于人臉識(shí)別一般應(yīng)先對(duì)輸入圖像實(shí)行圖像預(yù) 處理 , 然后進(jìn)行特征提取 , 接下來(lái)就是 BP 網(wǎng)絡(luò)訓(xùn)練 , 最后用訓(xùn)練好的網(wǎng)絡(luò)進(jìn)行識(shí)別 , 獲得識(shí)別結(jié)果。圖像預(yù)處理的目的是便于特征提取 , 而特征提取是去相關(guān)過(guò)程 , 將圖像中大量的冗余信息去除 , 即實(shí) 現(xiàn)數(shù)據(jù)壓縮 , 同時(shí)也降低了神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的復(fù)雜度 , 提高了神經(jīng)網(wǎng) 絡(luò)的訓(xùn)練效率和收斂率。本文以 ORL 人臉圖像數(shù)據(jù)庫(kù)為研究對(duì) 象 , 將輸入圖像

5、進(jìn)行圖像壓縮、圖像抽樣、輸入矢量標(biāo)準(zhǔn)化等圖像預(yù)處理后 , 送入 BP 神經(jīng)網(wǎng)絡(luò)訓(xùn)練 , 經(jīng)過(guò)競(jìng)爭(zhēng)選擇 , 獲得識(shí)別結(jié) 果。下面分別敘述其處理過(guò)程。2.1人臉圖像預(yù)處理(1 圖像壓縮輸入圖像一般精度比較高 , 存在大量的冗余信息。為避免神經(jīng) 網(wǎng)絡(luò)結(jié)構(gòu)過(guò)于復(fù)雜 , 在輸入神經(jīng)網(wǎng)絡(luò)之前必須進(jìn)行圖像壓縮。圖像壓縮通常采用插值算法 , 包括近鄰插值、雙線性插值和雙立方插值。插值算法的好壞關(guān)系到圖像的失真程度 , 插值函數(shù)的設(shè)計(jì)是插值算法的核心問(wèn)題。(2 圖像抽樣所謂圖像抽樣即為將壓縮后的二維圖像矩陣一行接一行拉成一維列矢量 , 其目的是便于后續(xù)神經(jīng)網(wǎng)

6、絡(luò)的輸入。(3 輸入矢量標(biāo)準(zhǔn)化圖像抽樣的輸出是一維列矢量 , 其元素的值域范圍為 0,255。如果直接將該列矢量輸入神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練 , 由于數(shù)值較大 , 勢(shì) 必影響計(jì)算效率和收斂率。因此 , 在將該列矢量輸入神經(jīng)網(wǎng)絡(luò)之前 , 應(yīng)實(shí)行輸入矢量標(biāo)準(zhǔn)化。2.2BP 神經(jīng)網(wǎng)絡(luò)及訓(xùn)練策略2.2.1BP 神經(jīng)網(wǎng)絡(luò)介紹BP 網(wǎng)絡(luò)是一種前向網(wǎng)絡(luò) 。一般包括輸入層、中間層和輸出層。中間層可以有一層、二層甚至更多層以便于分析各因素間的相互作用 , 每一層由若干個(gè)神經(jīng)元組成 , 相鄰兩層的每一個(gè)神經(jīng) 元之間均有權(quán)值聯(lián)系 , 權(quán)值的大小反映了這兩個(gè)神經(jīng)元之間的連接強(qiáng)度 , 整個(gè)網(wǎng)絡(luò)的

7、計(jì)算過(guò)程是由輸入層到中間層再到輸出層單向進(jìn)行 , 所以稱為前向網(wǎng)絡(luò) 。2.2.2學(xué)習(xí)算法(1 每層神經(jīng)元的輸出算法 (sigmoid 函數(shù) M i =1/(1+e -Z i Z i =ni =1! W ij T j 為從輸入層 (或中間層到中間層 (或輸出層的結(jié)點(diǎn)凈輸入 , n 表示中間層 (或輸出層的個(gè)數(shù) , T j 表示輸入層 (或中間層第 j 個(gè)量 , Wij是權(quán)值。(2 權(quán)值 W ij 修正理論上 Wij的初始值可以是隨機(jī)數(shù) (或根據(jù)經(jīng)驗(yàn)自己確定 , 但如果權(quán)值不符合要求就要進(jìn)行修正。從輸出層反向傳遞到中間層 , 公式為W ij (t+1=W ij (

8、t+j M i +W ij (t-W ij (t-1W ij (t 是 t 時(shí)刻從神經(jīng)元 i 到上一層 (輸入層或中間層神經(jīng)元 j (中間層或輸出層的連接權(quán) 。 M i 是神經(jīng)元 j 在 t 時(shí)刻的實(shí)際輸出。是步長(zhǎng)調(diào)整因子 , (0, 1 , 是平滑因子 (0, 1 , j是誤差權(quán)重調(diào)因子。(下轉(zhuǎn)第 188頁(yè) 神經(jīng)網(wǎng)絡(luò)在人臉識(shí)別中的應(yīng)用劉廣亮 , 馬曉普 , 張哲(南陽(yáng)師范學(xué)院計(jì)算機(jī)與信息技術(shù)學(xué)院 , 河南南陽(yáng) 473061摘要 :將 BP 神經(jīng)網(wǎng)絡(luò)用于人臉識(shí)別 , 并建立了人臉識(shí)別模型 , 該識(shí)別模型包括圖像壓縮、圖像抽樣、輸入矢量標(biāo)準(zhǔn)化、 BP 神經(jīng)網(wǎng)絡(luò)與競(jìng)爭(zhēng)選擇

9、處理過(guò)程 , 具有簡(jiǎn)單 , 識(shí)別率較高的特點(diǎn) 。關(guān)鍵詞 :圖像壓縮 ; 圖像抽樣 ; 神經(jīng)網(wǎng)絡(luò) ; 人臉識(shí)別中圖分類號(hào) :TP183文獻(xiàn)標(biāo)識(shí)碼 :A 文章編號(hào) :1009-3044(200713-30181-01Face Recognition Based on Neural NetworkLIU Guang-liang, MA Xiao-pu , ZHANG Zhe(The school of Computer and Information Technology of Nanyang Normal University,Nanyang 473061,ChinaAbstract:The BP

10、 neural network is applied in face recognition.A face recognition model is established , and its designed includes image compression , image sampling , input vector standardization , BP neural network and competition selection. The recognition model is simple and has a high recognition rate.Key word

11、s:Image compression;Image extraction;Neural network;Face recognition收稿日期 :2007-05-21作者簡(jiǎn)介 :劉廣亮 (1978- , 男 , 安徽阜南人 , 研究方向?yàn)槿斯ぶ悄?。181人工智能及識(shí)別技術(shù)本欄目責(zé)任編輯 :李桂瑾電腦知識(shí)與技術(shù)(上接第 181頁(yè) (3 誤差分析選取網(wǎng)絡(luò)相對(duì)誤差函數(shù) E E k =(M k0-M k /M k0M k0為實(shí)際輸出值 , M k 為預(yù)測(cè)的網(wǎng)絡(luò)輸出值。一般情況下如果誤差 E k 不大于網(wǎng)絡(luò)的誤差允許值 , 就可以認(rèn) 為模型的計(jì)算不存在誤差 , 如果 E k 大于網(wǎng)絡(luò)誤差允許值

12、, 要回溯到第二步調(diào)整權(quán)值后再進(jìn)行計(jì)算。八十年代 Robert Hecht -Nielson 已證明 , 一個(gè)三層 BP 神經(jīng) 網(wǎng)絡(luò)可以實(shí)現(xiàn)任意精度、近似任何連續(xù)函數(shù) 。 BP 網(wǎng)絡(luò)能夠?qū)崿F(xiàn)一種特殊的非線性映射 , 將輸入空間變換到由輸出所張成的空間 , 使在這個(gè)空間分類問(wèn)題變得簡(jiǎn)單易行。目前 , BP 網(wǎng)絡(luò)已廣泛應(yīng)用于函數(shù)逼近、模式識(shí)別、分類、數(shù)據(jù)壓縮等方面。 BP 網(wǎng)絡(luò)用于人臉識(shí) 別時(shí) , 網(wǎng)絡(luò)的每一個(gè)輸入節(jié)點(diǎn)對(duì)應(yīng)樣本的一個(gè)特征 , 而輸出節(jié)點(diǎn)數(shù) 等于類別數(shù) , 一個(gè)輸出節(jié)點(diǎn)對(duì)應(yīng)一個(gè)類。在訓(xùn)練階段 , 如果輸入訓(xùn) 練樣本的類別標(biāo)號(hào)是 i, 則訓(xùn)練時(shí)的期望

13、輸出假設(shè)第 i 個(gè)節(jié)點(diǎn)為 1, 而其余輸出節(jié)點(diǎn)均為 0。在識(shí)別階段 , 當(dāng)一個(gè)未知類別樣本作用到輸入端時(shí) , 考察各輸出節(jié)點(diǎn)的輸出 , 并將這個(gè)樣本類別判定為具有最大值的輸出節(jié)點(diǎn)對(duì)應(yīng)的類別。如果具有最大值的輸出節(jié)點(diǎn)與其它輸出節(jié)點(diǎn)之間的距離較小 (小于某個(gè)閾值 , 則作出拒絕判斷。在 BP 網(wǎng)絡(luò)樣本訓(xùn)練過(guò)程中 , 如果采取適當(dāng)?shù)挠?xùn)練策略能有效地提高系統(tǒng)的識(shí)別率。可以有樣本采樣訓(xùn)練、樣本批量訓(xùn)練和樣本完整訓(xùn)練三種策略。所謂樣本采樣訓(xùn)練指的是對(duì)訓(xùn)練集中的樣本按間隔進(jìn)行采樣 , 并對(duì)所得樣本獨(dú)立地進(jìn)行訓(xùn)練 , 直至所有樣本訓(xùn)練完為止。至于采樣間隔的選擇應(yīng)根據(jù)訓(xùn)練集

14、中的樣本數(shù) 來(lái)確定。所謂樣本批量訓(xùn)練指的是取訓(xùn)練集中的一批樣本一同進(jìn) 行訓(xùn)練 , 訓(xùn)練完之后再取下一批 , 直到訓(xùn)練完為止。批量大小也應(yīng) 根據(jù)訓(xùn)練集中的樣本數(shù)來(lái)確定。所謂樣本完整訓(xùn)練指的是將訓(xùn)練集中的樣本一次性進(jìn)行訓(xùn)練。采取不同的訓(xùn)練策略對(duì) BP 網(wǎng)絡(luò)權(quán) 值和閾值的調(diào)節(jié)會(huì)產(chǎn)生完全不同的結(jié)果 , 繼而影響系統(tǒng)的識(shí)別率。2.3競(jìng)爭(zhēng)選擇BP 網(wǎng)絡(luò)的輸出是一維列矢量 , 所謂競(jìng)爭(zhēng)選擇 , 是將 BP 網(wǎng) 絡(luò) 的輸出映射成一個(gè)具體的類別。其實(shí)現(xiàn)過(guò)程是 , 選擇 BP 網(wǎng)絡(luò)具有最大值的輸出節(jié)點(diǎn)所在的位置標(biāo)號(hào) , 則該位置標(biāo)號(hào)對(duì)應(yīng)一個(gè)具體的輸出類別。如果 BP 網(wǎng)絡(luò)輸出節(jié)點(diǎn)同

15、時(shí)存在多個(gè)最大值 , 則作出拒絕判斷。3識(shí)別策略本文研究的原始圖像取自 ORL 人臉數(shù)據(jù)庫(kù) 。該數(shù)據(jù)庫(kù)由 40人、每人 10幅、大小為 112×92、灰度級(jí)為 256的人臉圖像所組成。訓(xùn)練集由每人前 8幅共 320幅人臉圖像所組成 , 測(cè)試集由每人后 2幅共 80幅人臉圖像所組成 , 且訓(xùn)練集和測(cè)試集中的人臉圖像互不重疊。訓(xùn)練集的樣本排列結(jié)構(gòu)為第 1類別樣本的 8幅圖像 ; 第 2類別樣本的 8幅圖像 ; .; 第 40類別樣本的 8幅圖像。輸入圖像經(jīng)壓縮處理后 , 將 112×92維圖像轉(zhuǎn)變?yōu)?8×7維。 BP 網(wǎng)絡(luò)輸入層節(jié)點(diǎn) 數(shù)

16、為 56, 隱含層節(jié)點(diǎn)數(shù)為 70, 輸出層節(jié)點(diǎn)數(shù)為 40。實(shí)驗(yàn)時(shí) , 樣本采樣訓(xùn)練、樣本批量訓(xùn)練和樣本完整訓(xùn)練三種策略配合使用。方案 I 實(shí)行樣本完整訓(xùn)練。方案 II 先實(shí)行樣本批量訓(xùn)練 , 再實(shí)行樣本完整訓(xùn)練。批量訓(xùn) 練時(shí)將訓(xùn)練集中相同類別的樣本一道訓(xùn)練 , 即以同一類別的 8幅圖像為一組進(jìn)行訓(xùn)練。方案 III 先實(shí)行樣本采樣訓(xùn)練 , 再實(shí)行樣本完整訓(xùn)練。采樣間隔取為 4。即先對(duì)第 1類別樣本的第 1幅圖像進(jìn)行訓(xùn)練 , 接著對(duì)第 1類別樣本的第 5幅圖像進(jìn)行訓(xùn)練 , 然后對(duì)第 2類別樣本的第 1幅圖像進(jìn)行訓(xùn)練 , 依次類推 , 直到第 40類別樣本的第 1幅圖像訓(xùn) 練

17、完為止。最后進(jìn)行樣本完整訓(xùn)練。方案 I 每次所得樣本均為不同類別 , 采樣間隔較大。方案 II 的批量大小固定在相同類別的樣本數(shù)上。下面表 1是實(shí)驗(yàn)中各種方案訓(xùn)練集和測(cè) 試集的錯(cuò) 誤率及其拒判率的結(jié)果。表 1識(shí)別結(jié)果對(duì)比從上面的表中可以看到訓(xùn)練集和測(cè)試集的拒判率都是 0, 訓(xùn) 練集的錯(cuò)誤率也是 0, 其中方案 III 的識(shí)別率是 94.9%, 識(shí) 別率最高 , 這說(shuō)明 BP 網(wǎng)絡(luò)不斷對(duì)新類別樣本進(jìn)行學(xué) 習(xí) , 網(wǎng) 絡(luò) 性能較好。方案 II 的識(shí)別率處于方案 I 和方案 III 之間 , 而方案 I 的識(shí)別率最底 , 說(shuō)明訓(xùn)練樣本逐步加入 , 比一

18、次性加入網(wǎng)絡(luò)調(diào)節(jié)性能要好。常規(guī)訓(xùn)練方法一般采用方案 I , 如果將方案 I 使用的樣本完整訓(xùn)練策略與其它訓(xùn)練策略相配合 , 如方案 III, 則識(shí)別率將大大提高。4結(jié)束語(yǔ)本文將 BP 神經(jīng)網(wǎng)絡(luò)用于人臉識(shí)別 , 建立了簡(jiǎn)單識(shí)別模型 , 模型用的數(shù)據(jù)庫(kù)是 ORL 人臉數(shù)據(jù)庫(kù) , 并采用了適當(dāng)?shù)挠?xùn)練策略 , 從而達(dá)到了識(shí)別人臉的目的。參考文獻(xiàn) :1蘇劍波 , 徐波 . 應(yīng)用模式識(shí)別技術(shù)導(dǎo)論人臉識(shí)別與語(yǔ)音識(shí)別 M. 上海 :上海交通大學(xué)出版社 , 2001.2金忠 . 人臉圖像特征抽取與維數(shù)研究博士學(xué)位論文 D. 南京 :南京理工大學(xué) ,1999.3宋剛 , 艾海舟 , 徐光 . 紋理約束下的人臉特征點(diǎn)跟蹤 J. 軟件學(xué)報(bào) , 2004(15,11.4邊肇祺 , 張學(xué) 工 . 模式識(shí) 別 M. 北京 :清華大學(xué) 出版社 ,2000.sl(; qhy(;k=k2;m=m2;i1=i2;j1=j

人人文庫(kù)> 全部分類> 教育資料 > 輔導(dǎo)培訓(xùn)

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

神經(jīng)網(wǎng)絡(luò)在人臉識(shí)別中的應(yīng)用

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

神經(jīng)網(wǎng)絡(luò)在人臉識(shí)別中的應(yīng)用

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔