神經(jīng)網(wǎng)絡(luò)在人臉識(shí)別中的應(yīng)用_第1頁(yè)
神經(jīng)網(wǎng)絡(luò)在人臉識(shí)別中的應(yīng)用_第2頁(yè)
神經(jīng)網(wǎng)絡(luò)在人臉識(shí)別中的應(yīng)用_第3頁(yè)
神經(jīng)網(wǎng)絡(luò)在人臉識(shí)別中的應(yīng)用_第4頁(yè)
神經(jīng)網(wǎng)絡(luò)在人臉識(shí)別中的應(yīng)用_第5頁(yè)
已閱讀5頁(yè),還剩5頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、人工智能及識(shí)別技術(shù) 本欄目責(zé)任編輯 :李桂瑾1引言早在上世紀(jì) 60年代末 , 人臉識(shí)別即引起了研究者的強(qiáng)烈興 趣 . 但早期的人臉識(shí)別一般都需要人的某些先驗(yàn)知識(shí) , 無(wú)法擺脫人 的干預(yù) 。 進(jìn)入上世紀(jì) 9O 年代 , 由于高速度 、 高性能計(jì)算機(jī)的出現(xiàn) , 人臉識(shí)別的方法有了重大突破 , 進(jìn)入了真正的機(jī)器自動(dòng)識(shí)別階 段 , 人臉識(shí)別研究得到了前所未有的重視 。 人臉識(shí)別方法有很多 種 :(1 特征臉?lè)椒?。 這種方法起源于圖像描述技術(shù) 。 采用特征臉識(shí) 別方法有良好的穩(wěn)定性 、 位移不變性 、 特征向量與圖像的高度成 比例變化以及轉(zhuǎn)置不變性 。 不足之處是受表情變化 、 光照角度強(qiáng) 度變化和視

2、角變化等嚴(yán)重影響 , 魯棒性較差 。 (2 隱馬爾可夫模型 方法 (Hidden Markov Mode1 是用于描述信號(hào)統(tǒng)計(jì)特征的一組統(tǒng)計(jì) 模型 。 HMM 的基本理論是由 Baum 和 Welch 等人在 20世紀(jì) 6O 年代末 70年代初建立 , 在語(yǔ)音識(shí)別中應(yīng)用較多 。 在 HMM 中 , 節(jié)點(diǎn) 表示狀態(tài) , 有向邊表示狀態(tài)之間的轉(zhuǎn)移 。 一個(gè)狀態(tài)可以具有特征 空間中的任一特征 , 對(duì)同一特征 , 不同狀態(tài)表現(xiàn)出這一特征的概 率不同 。 (3 彈性圖匹配方法 。 彈性圖匹配方法是一種基于動(dòng)態(tài)連 接結(jié)構(gòu)的方法 。 它將人臉用格狀的稀疏圖表示 。 (4 神經(jīng)網(wǎng)絡(luò)方法 。 人工神經(jīng)網(wǎng)絡(luò)是由多

3、個(gè)神經(jīng)元按照一定的排列順序構(gòu)成的 , 是一 個(gè)非線性動(dòng)力學(xué)系統(tǒng) , 其特色在于信息的分布式存儲(chǔ)和并行協(xié)同 處理 。 雖然單個(gè)神經(jīng)元的結(jié)構(gòu)極其簡(jiǎn)單 , 功能有限 , 但由大量沖經(jīng) 元所構(gòu)成的網(wǎng)絡(luò)系統(tǒng)卻能夠?qū)崿F(xiàn)復(fù)雜豐富的功能 。 神經(jīng)網(wǎng)絡(luò)系統(tǒng) 除了具有集體運(yùn)算的能力和自適應(yīng)的學(xué)習(xí)能力外 , 還有根強(qiáng)的容 錯(cuò)性和魯棒性 . 善于聯(lián)想 、 綜合和推廣 。神經(jīng)網(wǎng)絡(luò)模型各種各樣 。 它們是從不同的角度對(duì)生物神經(jīng)系 統(tǒng)不同層次的描述和模擬 。 有代表性的網(wǎng)絡(luò)模型有感知器 、 多層 映射 BP 網(wǎng)絡(luò) 、 RBF 網(wǎng)絡(luò)等 。 目前 , 在人工神經(jīng)網(wǎng)絡(luò)的實(shí)際應(yīng)用中 , 絕大部分的神經(jīng)網(wǎng)絡(luò)模型都是采用 BP 網(wǎng)絡(luò)及

4、其變化形式 , 它也 是前向網(wǎng)絡(luò)的核心部分 , 是人工神經(jīng)網(wǎng)絡(luò)最精華的部分 。 BP 網(wǎng)絡(luò) 主要用于函數(shù)逼近 、 模式識(shí)別 、 數(shù)據(jù)壓縮等領(lǐng)域 。2BP 神經(jīng)網(wǎng)絡(luò)的人臉識(shí)別BP 神經(jīng)網(wǎng)絡(luò)用于人臉識(shí)別一般應(yīng)先對(duì)輸入圖像實(shí)行圖像預(yù) 處理 , 然后進(jìn)行特征提取 , 接下來(lái)就是 BP 網(wǎng)絡(luò)訓(xùn)練 , 最后用訓(xùn)練好 的網(wǎng)絡(luò)進(jìn)行識(shí)別 , 獲得識(shí)別結(jié)果 。 圖像預(yù)處理的目的是便于特征提 取 , 而特征提取是去相關(guān)過(guò)程 , 將圖像中大量的冗余信息去除 , 即實(shí) 現(xiàn)數(shù)據(jù)壓縮 , 同時(shí)也降低了神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的復(fù)雜度 , 提高了神經(jīng)網(wǎng) 絡(luò)的訓(xùn)練效率和收斂率 。 本文以 ORL 人臉圖像數(shù)據(jù)庫(kù)為研究對(duì) 象 , 將輸入圖像

5、進(jìn)行圖像壓縮 、 圖像抽樣 、 輸入矢量標(biāo)準(zhǔn)化等圖像 預(yù)處理后 , 送入 BP 神經(jīng)網(wǎng)絡(luò)訓(xùn)練 , 經(jīng)過(guò)競(jìng)爭(zhēng)選擇 , 獲得識(shí)別結(jié) 果 。 下面分別敘述其處理過(guò)程 。2.1人臉圖像預(yù)處理(1 圖像壓縮輸入圖像一般精度比較高 , 存在大量的冗余信息 。 為避免神經(jīng) 網(wǎng)絡(luò)結(jié)構(gòu)過(guò)于復(fù)雜 , 在輸入神經(jīng)網(wǎng)絡(luò)之前必須進(jìn)行圖像壓縮 。 圖像 壓縮通常采用插值算法 , 包括近鄰插值 、 雙線性插值和雙立方插 值 。 插值算法的好壞關(guān)系到圖像的失真程度 , 插值函數(shù)的設(shè)計(jì)是插 值算法的核心問(wèn)題 。(2 圖像抽樣所謂圖像抽樣即為將壓縮后的二維圖像矩陣 一 行 接 一 行 拉 成一維列矢量 , 其目的是便于后續(xù)神經(jīng)網(wǎng)

6、絡(luò)的輸入 。(3 輸入矢量標(biāo)準(zhǔn)化圖像抽樣的輸出是一維列矢量 , 其元素的值域范圍為 0,255。 如果直接將該列矢量輸入神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練 , 由于數(shù)值較大 , 勢(shì) 必影響計(jì)算效率和收斂率 。 因此 , 在將該列矢量輸入神經(jīng)網(wǎng)絡(luò)之 前 , 應(yīng)實(shí)行輸入矢量標(biāo)準(zhǔn)化 。2.2BP 神經(jīng)網(wǎng)絡(luò)及訓(xùn)練策略2.2.1BP 神經(jīng)網(wǎng)絡(luò)介紹BP 網(wǎng)絡(luò)是一種前向網(wǎng)絡(luò) 。 一般包括輸入層 、 中間層和輸出 層 。 中間層可以有一層 、 二層甚至更多層以便于分析各因素間的 相互作用 , 每一層由若干個(gè)神經(jīng)元組成 , 相鄰兩層的每一個(gè)神經(jīng) 元之間均有權(quán)值聯(lián)系 , 權(quán)值的大小反映了這兩個(gè)神經(jīng)元之間的連 接強(qiáng)度 , 整個(gè)網(wǎng)絡(luò)的

7、計(jì)算過(guò)程是由輸入層到中間層再到輸出層單 向進(jìn)行 , 所以稱為前向網(wǎng)絡(luò) 。2.2.2學(xué)習(xí)算法(1 每層神經(jīng)元的輸出算法 (sigmoid 函數(shù) M i =1/(1+e -Z i Z i =ni =1! W ij T j 為 從 輸 入 層 (或 中 間 層 到 中 間 層 (或輸出層 的結(jié)點(diǎn)凈輸入 , n 表示中間層 (或輸出層 的個(gè)數(shù) , T j 表示輸入層 (或中間層 第 j 個(gè)量 , Wij是權(quán)值 。(2 權(quán)值 W ij 修正理論上 Wij的初始值可以是隨機(jī)數(shù) (或根據(jù)經(jīng)驗(yàn)自己確定 , 但如果權(quán)值不符合要求就要進(jìn)行修正 。從輸出層反向傳遞到中間層 , 公式為W ij (t+1=W ij (

8、t+j M i +W ij (t-W ij (t-1W ij (t 是 t 時(shí)刻從神經(jīng)元 i 到上一層 (輸入層或中間層 神經(jīng)元 j (中間層或輸出層 的連接權(quán) 。 M i 是神經(jīng)元 j 在 t 時(shí)刻的實(shí)際輸出 。 是步長(zhǎng)調(diào)整因子 , (0, 1 , 是平滑因子 (0, 1 , j是誤 差權(quán)重調(diào)因子 。(下轉(zhuǎn)第 188頁(yè) 神經(jīng)網(wǎng)絡(luò)在人臉識(shí)別中的應(yīng)用劉廣亮 , 馬曉普 , 張哲(南陽(yáng)師范學(xué)院計(jì)算機(jī)與信息技術(shù)學(xué)院 , 河南 南陽(yáng) 473061摘要 :將 BP 神經(jīng)網(wǎng)絡(luò)用于人臉識(shí)別 , 并建立了人臉識(shí)別模型 , 該識(shí)別模型包括圖像壓縮 、 圖像抽樣 、 輸入矢量標(biāo)準(zhǔn)化 、 BP 神經(jīng)網(wǎng)絡(luò)與 競(jìng)爭(zhēng)選擇

9、處理過(guò)程 , 具有簡(jiǎn)單 , 識(shí)別率較高的特點(diǎn) 。關(guān)鍵詞 :圖像壓縮 ; 圖像抽樣 ; 神經(jīng)網(wǎng)絡(luò) ; 人臉識(shí)別中圖分類號(hào) :TP183文獻(xiàn)標(biāo)識(shí)碼 :A 文章編號(hào) :1009-3044(200713-30181-01Face Recognition Based on Neural NetworkLIU Guang-liang, MA Xiao-pu , ZHANG Zhe(The school of Computer and Information Technology of Nanyang Normal University,Nanyang 473061,ChinaAbstract:The BP

10、 neural network is applied in face recognition.A face recognition model is established , and its designed includes image compression , image sampling , input vector standardization , BP neural network and competition selection. The recognition model is simple and has a high recognition rate.Key word

11、s:Image compression;Image extraction;Neural network;Face recognition收稿日期 :2007-05-21作者簡(jiǎn)介 :劉廣亮 (1978- , 男 , 安徽阜南人 , 研究方向?yàn)槿斯ぶ悄?。181人工智能及識(shí)別技術(shù)本欄目責(zé)任編輯 :李桂瑾 電腦知識(shí)與技術(shù)(上接第 181頁(yè) (3 誤差分析選取網(wǎng)絡(luò)相對(duì)誤差函數(shù) E E k =(M k0-M k /M k0M k0為實(shí)際輸出值 , M k 為預(yù)測(cè)的網(wǎng)絡(luò)輸出值 。一般情況下如果誤差 E k 不大于網(wǎng)絡(luò)的誤差允許值 , 就可以認(rèn) 為模型的計(jì)算不存在誤差 , 如果 E k 大于網(wǎng)絡(luò)誤差允許值

12、, 要回溯 到第二步調(diào)整權(quán)值后再進(jìn)行計(jì)算 。八十年代 Robert Hecht -Nielson 已證明 , 一個(gè)三層 BP 神經(jīng) 網(wǎng)絡(luò)可以實(shí)現(xiàn)任意精度 、 近似任何連續(xù)函數(shù) 。 BP 網(wǎng)絡(luò)能夠?qū)崿F(xiàn)一 種特殊的非線性映射 , 將輸入空間變換到由輸出所張成的空間 , 使 在這個(gè)空間分類問(wèn)題變得簡(jiǎn)單易行 。 目前 , BP 網(wǎng)絡(luò)已廣泛應(yīng)用于 函數(shù)逼近 、 模式識(shí)別 、 分類 、 數(shù)據(jù)壓縮等方面 。 BP 網(wǎng)絡(luò)用于人臉識(shí) 別時(shí) , 網(wǎng)絡(luò)的每一個(gè)輸入節(jié)點(diǎn)對(duì)應(yīng)樣本的一個(gè)特征 , 而輸出節(jié)點(diǎn)數(shù) 等于類別數(shù) , 一個(gè)輸出節(jié)點(diǎn)對(duì)應(yīng)一個(gè)類 。 在訓(xùn)練階段 , 如果輸入訓(xùn) 練樣本的類別標(biāo)號(hào)是 i, 則訓(xùn)練時(shí)的期望

13、輸出假設(shè)第 i 個(gè)節(jié)點(diǎn)為 1, 而其余輸出節(jié)點(diǎn)均為 0。 在識(shí)別階段 , 當(dāng)一個(gè)未知類別樣本作用到 輸入端時(shí) , 考察各輸出節(jié)點(diǎn)的輸出 , 并將這個(gè)樣本類別判定為具有 最大值的輸出節(jié)點(diǎn)對(duì)應(yīng)的類別 。 如果具有最大值的輸出節(jié)點(diǎn)與其 它輸出節(jié)點(diǎn)之間的距離較小 (小于某個(gè)閾值 , 則作出拒絕判斷 。在 BP 網(wǎng)絡(luò)樣本訓(xùn)練過(guò)程中 , 如果采取適當(dāng)?shù)挠?xùn)練策略能有 效地提高系統(tǒng)的識(shí)別率 。 可以有樣本采樣訓(xùn)練 、 樣本批量訓(xùn)練和 樣本完整訓(xùn)練三種策略 。 所謂樣本采樣訓(xùn)練指的是對(duì)訓(xùn)練集中的 樣本按間隔進(jìn)行采樣 , 并對(duì)所得樣本獨(dú)立地進(jìn)行訓(xùn)練 , 直至所有 樣本訓(xùn)練完為止 。 至于采樣間隔的選擇應(yīng)根據(jù)訓(xùn)練集

14、中的樣本數(shù) 來(lái)確定 。 所謂樣本批量訓(xùn)練指的是取訓(xùn)練集中的一批樣本一同進(jìn) 行訓(xùn)練 , 訓(xùn)練完之后再取下一批 , 直到訓(xùn)練完為止 。 批量大小也應(yīng) 根據(jù)訓(xùn)練集中的樣本數(shù)來(lái)確定 。 所謂樣本完整訓(xùn)練指的是將訓(xùn)練 集中的樣本一次性進(jìn)行訓(xùn)練 。 采取不同的訓(xùn)練策略對(duì) BP 網(wǎng)絡(luò)權(quán) 值和閾值的調(diào)節(jié)會(huì)產(chǎn)生完全不同的結(jié)果 , 繼而影響系統(tǒng)的識(shí)別率 。2.3競(jìng)爭(zhēng)選擇BP 網(wǎng)絡(luò)的輸出是一維列矢量 , 所謂競(jìng)爭(zhēng)選擇 , 是將 BP 網(wǎng) 絡(luò) 的輸出映射成一個(gè)具體的類別 。 其實(shí)現(xiàn)過(guò)程是 , 選擇 BP 網(wǎng)絡(luò)具有 最大值的輸出節(jié)點(diǎn)所在的位置標(biāo)號(hào) , 則該位置標(biāo)號(hào)對(duì)應(yīng)一個(gè)具體 的輸出類別 。 如果 BP 網(wǎng)絡(luò)輸出節(jié)點(diǎn)同

15、時(shí)存在多個(gè)最大值 , 則作出 拒絕判斷 。3識(shí)別策略本文研究的原始圖像取自 ORL 人臉數(shù)據(jù)庫(kù) 。 該數(shù)據(jù)庫(kù)由 40人 、 每人 10幅 、 大小為 112×92、灰度級(jí)為 256的人臉圖像所組成 。 訓(xùn)練集由每人前 8幅共 320幅人臉圖像所組成 , 測(cè)試集由每人后 2幅共 80幅人臉圖像所組成 , 且訓(xùn)練集和測(cè)試集中的人臉圖像互不 重疊 。 訓(xùn)練集的樣本排列結(jié)構(gòu)為第 1類別樣本的 8幅圖像 ; 第 2類 別樣本的 8幅圖像 ; .; 第 40類別樣本的 8幅圖像 。 輸入圖像經(jīng)壓縮處理后 , 將 112×92維圖像轉(zhuǎn)變?yōu)?8×7維 。 BP 網(wǎng)絡(luò)輸入層節(jié)點(diǎn) 數(shù)

16、為 56, 隱含層節(jié)點(diǎn)數(shù)為 70, 輸出層節(jié)點(diǎn)數(shù)為 40。 實(shí)驗(yàn)時(shí) , 樣本采 樣訓(xùn)練 、 樣本批量訓(xùn)練和樣本完整訓(xùn)練三種策略配合使用 。方案 I 實(shí)行樣本完整訓(xùn)練 。方案 II 先實(shí)行樣本批量訓(xùn)練 , 再實(shí)行樣本完整訓(xùn)練 。 批量訓(xùn) 練時(shí)將訓(xùn)練集中相同類別的樣本一道訓(xùn)練 , 即以同一類別的 8幅 圖像為一組進(jìn)行訓(xùn)練 。方案 III 先實(shí)行樣本采樣訓(xùn)練 , 再實(shí)行樣本完整訓(xùn)練 。 采樣間隔取為 4。即先對(duì)第 1類別樣本的第 1幅圖像進(jìn)行訓(xùn)練 , 接著對(duì)第 1類別樣本的第 5幅圖像進(jìn)行訓(xùn)練 , 然后對(duì)第 2類別樣本的第 1幅圖像進(jìn)行訓(xùn)練 , 依次類推 , 直到第 40類別樣本的第 1幅圖像訓(xùn) 練

17、完為止 。 最后進(jìn)行樣本完整訓(xùn)練 。方案 I 每次所得樣本均為不同類別 , 采樣間隔較大 。方案 II 的 批量大小固定在相同類別的樣本數(shù)上 。下面表 1是實(shí)驗(yàn)中各種方案訓(xùn)練集和 測(cè) 試 集 的 錯(cuò) 誤 率 及 其 拒判率的結(jié)果 。表 1識(shí)別結(jié)果對(duì)比從上面的表中可以看到訓(xùn)練集和測(cè)試集的拒判率都是 0, 訓(xùn) 練集的錯(cuò)誤率也是 0, 其中方案 III 的識(shí)別率是 94.9%, 識(shí) 別 率 最 高 , 這說(shuō)明 BP 網(wǎng)絡(luò)不斷對(duì)新類別樣本進(jìn)行學(xué) 習(xí) , 網(wǎng) 絡(luò) 性 能 較 好 。 方案 II 的識(shí)別率處于方案 I 和方案 III 之間 , 而方案 I 的識(shí)別率最 底 , 說(shuō)明訓(xùn)練樣本逐步加入 , 比一

18、次性加入網(wǎng)絡(luò)調(diào)節(jié)性能要好 。 常 規(guī)訓(xùn)練方法一般采用方案 I , 如果將方案 I 使用的樣本完整訓(xùn)練 策略與其它訓(xùn)練策略相配合 , 如方案 III, 則識(shí)別率將大大提高 。4結(jié)束語(yǔ)本文將 BP 神經(jīng)網(wǎng)絡(luò)用于人臉識(shí)別 , 建立了簡(jiǎn)單識(shí)別模型 , 模 型用的數(shù)據(jù)庫(kù)是 ORL 人臉數(shù)據(jù)庫(kù) , 并采用了適當(dāng)?shù)挠?xùn)練策略 , 從 而達(dá)到了識(shí)別人臉的目的 。參考文獻(xiàn) :1蘇劍波 , 徐波 . 應(yīng)用模式識(shí)別技術(shù)導(dǎo)論 人臉識(shí)別與語(yǔ)音 識(shí)別 M. 上海 :上海交通大學(xué)出版社 , 2001.2金忠 . 人臉圖像特征抽取與維數(shù)研究 博士學(xué)位論文 D. 南 京 :南京理工大學(xué) ,1999.3宋剛 , 艾海舟 , 徐光 . 紋理約束下的人臉特征點(diǎn)跟蹤 J. 軟件 學(xué)報(bào) , 2004(15,11.4邊 肇 祺 , 張 學(xué) 工 . 模 式 識(shí) 別 M. 北 京 :清 華 大 學(xué) 出 版 社 ,2000.sl(; qhy(;k=k2;m=m2;i1=i2;j1=j

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論