版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、 基于卷積神經(jīng)網(wǎng)絡(luò)的智慧校園人臉識別系統(tǒng)設(shè)計與研究 謝玲莉Summary: 為了讓學生的學習、生活更加智能化,提高教學管理效率,同時建立一個更加安全的校園環(huán)境,采用卷積神經(jīng)網(wǎng)絡(luò)實現(xiàn)智慧校園人臉識別。文章對卷積神經(jīng)網(wǎng)絡(luò)的卷積層、池化層、全連接層和輸出層的原理及實現(xiàn)進行了闡述,訓練了olivettifaces人臉數(shù)據(jù)庫小樣本數(shù)據(jù)集。實驗結(jié)果表明,模型的誤差率降低到5%以下。用數(shù)據(jù)庫中注冊的人臉圖像與攝像頭實時獲取的人臉圖像進行匹配時,效果良好,能滿足設(shè)計需求。Key: 卷積神經(jīng)網(wǎng)絡(luò); 智慧校園; 人臉識別; 圖像:TP311 :A :1006-8228(2021)10-72-03Design an
2、d research of convolutional neural networks based intelligentcampus face recognition systemXie Lingli(Longyan Agricultural School, Longyan, Fujian 364000, China)Absrtact: In order to make students study and life more intelligent, improve the efficiency of teaching management, and at the same time es
3、tablish a safer campus environment, convolutional neural networks are used to realize smart campus face recognition. This paper describes the principles and implementation of the convolutional layer, pooling layer, fully connected layer and output layer of the convolutional neural networks. The smal
4、l sample data set of the olivettifaces face database is trained. The experiment results show that the error rate of the model is reduced to 5% or less. When the face image registered in the database is used to match the face image obtained by the camera in actual time, the effect is good and can mee
5、t the design requirements.Key words: convolutional neural networks; smart campus; face recognition; image0 引言為了提高學校的安全管理水平,創(chuàng)建更為安全的學習環(huán)境,學校使用智慧校園人臉識別系統(tǒng),本系統(tǒng)是一種一對一的身份驗證。智慧校園人臉識別系統(tǒng)立足于我們學校智能化的視頻監(jiān)控系統(tǒng)、數(shù)字化校園平臺以及成熟的物聯(lián)網(wǎng)技術(shù),將學校在校生和教職員工的人臉等信息通過管理平臺上傳到系統(tǒng),建立人臉數(shù)據(jù)庫,人員在識別時與人臉庫比對,確認身份,該系統(tǒng)能幫助學校對在校學生的日常行動軌跡信息進行有效管理分析,加強在
6、校生的日常行為管制能力,并且可以為事后提供數(shù)據(jù),做到異常事件提前預(yù)警,便于教師及時掌握本地及在線學生的學習狀態(tài)數(shù)據(jù),并及時對學生的學習進行引導。還可以通過系統(tǒng)對教職員工進行人事考勤管理。經(jīng)過攝像機探測跟蹤人臉,并自動獲取含有人臉的圖像,進而對探測到的人臉開展面部圖像獲取、人臉定位、人臉識別,本系統(tǒng)有效助力實現(xiàn)校園場景智能監(jiān)控,提升校園安全系數(shù)。1 人臉圖像采集人臉識別是基于人臉特征的唯一性進行身份識別的一種方法,學校在新生注冊報名登記時,利用PCP人像采集系統(tǒng)4.0,統(tǒng)一進行人臉采集,采集的是靜態(tài)圖像,以JPG格式存儲到計算機內(nèi),形成人臉圖像文件,每張人臉圖像大小限制在100K以內(nèi),學生按姓名
7、+學號命名,以班級為單位收集,教職員工按工號命名,將這些圖像文件生成相對應(yīng)的編碼,以便計算機識別處理,采集學生的人臉照片可以用于學籍檔案、學生證和一卡通等,教職員工可用于上班考勤,該軟件支持從攝像機直接讀取圖像,同時支持照片與數(shù)據(jù)的批量導入導出,方便與第三方系統(tǒng)進行對接。另一種是經(jīng)過學校大門的臨時人員,用攝像機捕捉當前的人臉圖像,并將當前獲取的人臉圖像文件生成面紋編碼。2 軟件系統(tǒng)設(shè)計2.1 卷積神經(jīng)網(wǎng)絡(luò)簡介本論文使用卷積神經(jīng)網(wǎng)絡(luò)實現(xiàn)智慧校園人臉識別,1在機器學習中,卷積神經(jīng)網(wǎng)絡(luò)是一種深度前饋人工神經(jīng)網(wǎng)絡(luò),人工神經(jīng)元可以響應(yīng)周圍單元,可以進行大型圖像處理,已成功的應(yīng)用于圖像識別。卷積神經(jīng)網(wǎng)絡(luò)由
8、于2它的局部感知和權(quán)值共享結(jié)構(gòu),使其更接近現(xiàn)實世界的生物神經(jīng)網(wǎng)絡(luò),權(quán)值共享結(jié)構(gòu)降低了神經(jīng)網(wǎng)絡(luò)的復(fù)雜度,這樣可以避免進行數(shù)據(jù)重建時,特征提取與分類過程的復(fù)雜度。卷積神經(jīng)網(wǎng)絡(luò)的訓練是基于python,圖像庫PIL、矩陣計算Numpy,深度學習庫theano。2.2 數(shù)據(jù)的預(yù)處理在將學習數(shù)據(jù)輸入卷積神經(jīng)網(wǎng)絡(luò)前,對原始圖像數(shù)據(jù)進行預(yù)處理,本論文用的訓練數(shù)據(jù)是3olivettifaces人臉數(shù)據(jù)庫,是紐約大學組建的一個比較小的人臉數(shù)據(jù)庫,包含40個人的人臉圖片,每個人10張人臉樣本,組成一張有400張人臉的大圖片,整張圖片大小是1190*942,每張照片大小是(1190/20)(942/20)= 57*
9、47。訓練數(shù)據(jù)RGB數(shù)據(jù)范圍在0,255之間,不需要再進行歸一化處理,需對訓練圖片進行去均值、白化預(yù)處理操作,去均值是將各個特征值減數(shù)據(jù)集RGB通道的均值,使得數(shù)據(jù)的分布變?yōu)榫?,方差為1的數(shù)據(jù),先將訓練數(shù)據(jù)導入numpy庫,在Python中的代碼:import numpy as np; X -= np.mean(400, axis = 0)。白化的目的降低輸入的冗余性,減少特征之間的相關(guān)性,讓訓練數(shù)據(jù)具有相同的分布。CNN 執(zhí)行的是有監(jiān)督的訓練,需將圖片數(shù)據(jù)統(tǒng)一格式,對訓練數(shù)據(jù)帶上標簽(labels),每個人的10張人臉樣本,設(shè)置一個相同的標簽,標簽的值域需符合激活函數(shù)的值,對命名好的40
10、0張圖片劃分為數(shù)據(jù)集(train_data),驗證集(valid_data),訓練集(test_data)三個數(shù)據(jù)集:# 劃分數(shù)據(jù)集train_data=numpy.empty(320,2679)train_label=numpy.empty(320)valid_data=numpy.empty(40,2679)valid_label=numpy.empty(40)test_data=numpy.empty(40,2679)test_label=numpy.empty(40)for i in range(40):2.3 卷積卷積層主要完成圖像的特征提取,使用卷積核與輸入圖像進行卷積運算,卷積核
11、在工作時,將卷積核沿著輸入圖像(或特征圖像)的水平方向和垂直方向以一定的步長(stride)進行滑動,每移動一個步長,會有規(guī)律地掃過輸入特征,在感受野內(nèi)對輸入圖像和filter的對應(yīng)位置元素相乘再求和,最后加上偏置項,運算結(jié)果被放置在與卷積核位置相對應(yīng)的輸出特征圖像上,隨著滑動的結(jié)束,可以得到一張新的特征圖。卷積運算是一種線性運算,需要引入非線性函數(shù)(即激活函數(shù))來增強網(wǎng)絡(luò)的性能,保證卷積神經(jīng)網(wǎng)絡(luò)的非線性能力,然后經(jīng)過激勵函數(shù)計算后送入池化層。Relu激活函數(shù)具有收斂快,求梯度簡單,對輸入的負值輸出全為0,對于輸入正值原樣輸出。為了描述卷積計算過程,在卷積過程中,輸入圖像的每個像素需要進行編號
12、,用xi,j表示圖像的第 i行第j列元素;用wm,n表示第m行第n列權(quán)重,用wb表示filter的偏置項,用f表示激活項,用ai,j表示Feature Map的第i行第j列元素,計算卷積的公式:ai,j=f(m=0m.n=0nwm,nxi+m,j+n,+wb) 假設(shè)有一個7*7的圖像,使用一個3*3的過濾器進行卷積,卷積的步長為2,根據(jù)公式,對于輸出圖左上角元素a0,0 來說,其卷積計算方法為:a0,0=relu(w0,0 x0,0+w0,1x0,1+w0,2x0,2+w1,0 x1,0+w1,1x1,1+w1,2x1,2+w2,0 x2,0+w2,1x2,1+w2,2x2,2)=relu(1
13、*1+1*1+1*1)=3依次求出ai,j的值,得到一個3*3的Feature Map,如圖1所示。以上工作重復(fù)進行,直至差平方和為0,模型訓練完畢,可以交付使用。2.4 池化在圖像分類任務(wù)中,只關(guān)心某個特征是否出現(xiàn),不需要關(guān)心它出現(xiàn)的具體位置,而池化在獲取圖像時,具有平移不變性,正好滿足這樣的需求。池化層在連續(xù)的卷積層中間,主要用于特征降維,提高計算速度,減小過擬合。為了減少網(wǎng)絡(luò)參數(shù)優(yōu)化結(jié)構(gòu),最常見的池化操作有平均池化(average pooling)、最大池化(max pooling),實際最大池化用得較多。對于每個2*2的窗口選出最大的數(shù)作為輸出矩陣的相應(yīng)元素的值,其操作過程如圖2所示。
14、池化層與卷積層經(jīng)常成對出現(xiàn),通過池化操作,特征不變性和特征降維,一定程度上防止過擬合,增強網(wǎng)絡(luò)對圖像的魯棒性。2.5 全連接層全連接層的作用主要就是實現(xiàn)分類4,全連接層的每一個結(jié)點都與上一層的所有結(jié)點相連,用來把前面提取到的特征綜合起來,全連接層一般會把卷積輸出的二維特征圖(feature map)轉(zhuǎn)化為一維(N*1)的一個向量,對這個向量做乘法,最終降低其維度。根據(jù)圖1,feature map是333,那么就需要把這個feature map 拉成271的列向量,相當于有了27個像素點,這時候,再乘一個權(quán)重,這個權(quán)重要把27個像素點都包含進去,這個權(quán)重的矩陣形式應(yīng)該是127,所以經(jīng)過一個全連接
15、層后的輸出就是127271=11,假如需要3個11的神經(jīng)元,輸出為3X(127271)=3(11)。這個3在權(quán)重矩陣中代表3行,即每一行與輸入相乘,得到一個輸出:2.6 輸出分類器的作用就是將這些通過全連接層的特征按照概率分布,輸出屬于一類的概率或分類結(jié)果。本論文的分類函數(shù)使用的是softmax函數(shù),softmax函數(shù)的每個輸出信號值在0至1之間,且輸出值的總和為1,因此,把softmax函數(shù)的結(jié)果可以看做概率分布,一般而言,神經(jīng)網(wǎng)絡(luò)只把輸出值最大的神經(jīng)元所對應(yīng)的類別作為識別結(jié)果。softmax函數(shù)的公式:yk=ceajci=1neai 這個公式5表示假設(shè)輸出層共有n個神經(jīng)元,計算第k個神經(jīng)元
16、的輸出。softmax函數(shù)的分子是輸出層輸入信號的指數(shù)函數(shù),分母是所有輸入信號的指數(shù)函數(shù)的和,這里的C可以使用任何值,為了防止溢出,一般會使用輸入信號中的最大值。根據(jù)公式,softmax函數(shù)的python 編程如下:Import numpy as npDefsoftmax(a):Exp=np.exp(a-c)Sum_exp=np.exp(exp)Y=exp/sum_expReturn yA=np.array(3,1,-3)Y=softmax(a)Print(y)Print(y.(sum)輸出為:0.87912088 0.11868132 0.00219781.03 實驗與分析系統(tǒng)設(shè)計好之后,對
17、系統(tǒng)的功能進行初步測試,測試本文方法在智慧校園人臉識別中的應(yīng)用性能,對olivettifaces人臉數(shù)據(jù)庫中的10人共80張人臉圖像作為研究樣本進行特征提取,能實現(xiàn)人臉的準確識別,對數(shù)據(jù)庫中注冊的人臉與攝像頭實時獲取的人臉進行匹配,顯示有95%的相似度,滿足設(shè)計需求。4 結(jié)束語在這人工智能技術(shù)時代,生物識別檢測技術(shù)已經(jīng)成熟并被用于普通的電子數(shù)字設(shè)備中,人臉識別實現(xiàn)身份驗證,在很多的領(lǐng)域都被使用,該方法易于被師生接受。本文研究了在卷積神經(jīng)網(wǎng)絡(luò)下的人臉識別,介紹了卷積層對輸入數(shù)據(jù)進行特征提取,池化層在一定程度上防止過擬合,增強網(wǎng)絡(luò)對圖像的魯棒性,softmax函數(shù)對全連接層的特征進行了分類,輸出結(jié)果以概率分布,得到非常理想的識別結(jié)果,能夠?qū)崿F(xiàn)智慧校園的人臉識別。該系統(tǒng)可推廣應(yīng)用于智慧小區(qū),系統(tǒng)的不足之處是使用小樣本數(shù)據(jù)集建模,隨著數(shù)據(jù)量的增加,該系統(tǒng)還需進一步完善。Reference(References):1
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 銀行員工業(yè)務(wù)培訓規(guī)范制度
- 銀行內(nèi)部調(diào)查與處理制度
- 清華大學物理學課件-牛頓和力學的成熟
- 【大學課件】通信技術(shù)入門
- 突發(fā)環(huán)境事件應(yīng)急預(yù)案十三篇
- 酒店實習報告1000字左右(30篇)
- 八年級軸對稱圖形復(fù)習課課件
- 車企電商化之路-構(gòu)建一站式汽車生活服務(wù)平臺案例報告
- 關(guān)于扶不扶問題的道德討論
- 《認識工作世界》課件
- 期末測試卷(一)2024-2025學年 人教版PEP英語五年級上冊(含答案含聽力原文無聽力音頻)
- 2023-2024學年廣東省深圳市南山區(qū)八年級(上)期末英語試卷
- 2024廣西專業(yè)技術(shù)人員繼續(xù)教育公需科目參考答案(100分)
- 2024年上海市中考語文備考之150個文言實詞刷題表格及答案
- 2024年漢口銀行股份有限公司招聘筆試沖刺題(帶答案解析)
- 中醫(yī)跨文化傳播智慧樹知到期末考試答案章節(jié)答案2024年浙江中醫(yī)藥大學
- 2024年日歷表(空白)(一月一張-可編輯做工作日歷)
- 廣東省中山市2023-2024學年四年級上學期期末數(shù)學試卷
- 2022-2024年國際經(jīng)濟與貿(mào)易專業(yè)人才培養(yǎng)調(diào)研報告
- 剪刀式升降車專項施工方案
- 慢性腎衰中醫(yī)護理方案
評論
0/150
提交評論