基于BP神經(jīng)網(wǎng)絡(luò)的手寫數(shù)字識別實驗報告

上傳人：順*** IP屬地：廣東上傳時間：2021-10-17 格式：DOC 頁數(shù)：9 大小：386.35KB 積分：22 舉報 版權(quán)申訴

基于BP神經(jīng)網(wǎng)絡(luò)的手寫數(shù)字識別實驗報告_第2頁

基于BP神經(jīng)網(wǎng)絡(luò)的手寫數(shù)字識別實驗報告_第3頁

基于BP神經(jīng)網(wǎng)絡(luò)的手寫數(shù)字識別實驗報告_第4頁

基于BP神經(jīng)網(wǎng)絡(luò)的手寫數(shù)字識別實驗報告_第5頁

已閱讀5頁，還剩4頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、.基于BP神經(jīng)網(wǎng)絡(luò)的手寫體數(shù)字圖像識別PT1700105 寧崇宇PT1700106 陳玉磊PT1700104 安傳旭摘要在信息化飛速發(fā)展的時代，光學(xué)字符識別是一個重要的信息錄入與信息轉(zhuǎn)化的手段，其中手寫體數(shù)字的識別有著廣泛地應(yīng)用，如：郵政編碼、統(tǒng)計報表、銀行票據(jù)等等，因其廣泛地應(yīng)用范圍，能帶來巨大的經(jīng)濟(jì)與社會效益。本文結(jié)合深度學(xué)習(xí)理論，利用BP神經(jīng)網(wǎng)絡(luò)對手寫體數(shù)字?jǐn)?shù)據(jù)集MNIST進(jìn)行分析，作為機(jī)器學(xué)習(xí)課程的一次實踐，熟悉了目前廣泛使用的Matlab工具，深入理解了神經(jīng)網(wǎng)絡(luò)的訓(xùn)練過程，作為非計算機(jī)專業(yè)的學(xué)生，結(jié)合該課題掌握了用神經(jīng)網(wǎng)絡(luò)處理實際問題的方法，為今后將深度學(xué)習(xí)與自身領(lǐng)域相結(jié)合打下了基礎(chǔ)

2、。1 引言從計算機(jī)發(fā)明之初，人們就希望它能夠幫助甚至代替人類完成重復(fù)性勞作。利用巨大的存儲空間和超高的運(yùn)算速度，計算機(jī)已經(jīng)可以非常輕易地完成一些對于人類非常困難的工作，然而，一些人類通過直覺可以很快解決的問題，卻很難通過計算機(jī)解決，這些問題包括自然語言處理、圖像識別、語音識別等等，它們就是人工智能需要解決的問題。計算機(jī)要想人類一樣完成更多的智能工作，就需要掌握關(guān)于這個世界的海量知識，很多早期的人工智能系統(tǒng)只能成功應(yīng)用于相對特定的環(huán)境，在這些特定環(huán)境下，計算機(jī)需要了解的知識很容易被嚴(yán)格完整地定義。為了使計算機(jī)更多地掌握開放環(huán)境下的知識，研究人員進(jìn)行了很多的嘗試。其中影響力很大的一個領(lǐng)域就是知識圖

3、庫（Ontology），WordNet是在開放環(huán)境中建立的一個較大且有影響力的知識圖庫，也有不少研究人員嘗試將Wikipedia中的知識整理成知識圖庫，但是建立知識圖庫一方面需要花費(fèi)大量的人力和物力，另一方面知識圖庫方式明確定義的知識有限，不是所有的知識都可以明確地定義成計算機(jī)可以理解的固定格式。很大一部分無法明確定義的知識，就是人類的經(jīng)驗，如何讓計算機(jī)跟人類一樣從歷史的經(jīng)驗中獲取新的知識，這就是機(jī)器學(xué)習(xí)需要解決的問題。卡內(nèi)基梅隆大學(xué)的Tom Michael Mitchell教授在1997年出版的書籍中將機(jī)器學(xué)習(xí)定義為“如果一個程序可以在任務(wù)T上，隨著經(jīng)驗E的增加，效果P也可以隨之增加，則稱這

4、個程序可以從經(jīng)驗中學(xué)習(xí)”。邏輯提取算法可以從訓(xùn)練數(shù)據(jù)中計算出每個特征和預(yù)測結(jié)果的相關(guān)度，在大部分情況下，在訓(xùn)練數(shù)據(jù)達(dá)到一定數(shù)量之前，越多的訓(xùn)練數(shù)據(jù)可以使邏輯回歸算法的判斷越精確，但是邏輯回歸算法有可能無法從數(shù)據(jù)中學(xué)習(xí)到好的特征表達(dá)，這也是很多傳統(tǒng)機(jī)器學(xué)習(xí)算法的共同問題。對機(jī)器學(xué)習(xí)問題來說，特征提取不是一件簡單的事情。在一些復(fù)雜問題上，要通過人工的方式設(shè)計有效的特征集合，需要很多的時間和精力，甚至需要整個領(lǐng)域數(shù)十年的研究投入。既然人工無法很好地抽取實體中的特征，那么是否有自動的方式呢？深度學(xué)習(xí)解決的核心問題就是自動地將簡單的特征組合成更加復(fù)雜的特征，并使用這些特征解決問題。因為深度學(xué)習(xí)的通用性，

5、深度學(xué)習(xí)的研究者往往可以跨越多個研究方向，甚至同時活躍于數(shù)個研究方向。雖然深度學(xué)習(xí)受到了大腦工作原理的啟發(fā)，但現(xiàn)代深度學(xué)習(xí)研究的發(fā)展并不拘泥于模擬人腦神經(jīng)元和人腦的工作原理，各種廣泛應(yīng)用的機(jī)器學(xué)習(xí)框架也不是由神經(jīng)網(wǎng)絡(luò)啟發(fā)而來的。MATLAB是美國MathWorks公司出品的商業(yè)數(shù)學(xué)軟件，用于算法開發(fā)、數(shù)據(jù)可視化、數(shù)據(jù)分析以及數(shù)值計算的高級技術(shù)計算語言和交互式環(huán)境，主要包括MATLAB和Simulink兩大部分。MNIST是一個非常有名的手寫體數(shù)字識別數(shù)據(jù)集，被廣泛用作機(jī)器學(xué)習(xí)的入門樣例，它包含了60000張圖片作為訓(xùn)練數(shù)據(jù)，10000張圖片作為測試數(shù)據(jù)，每一張圖片代表了09中的一個數(shù)字，圖片的

6、大小為28x28，且數(shù)字會出現(xiàn)在圖片的正中間。本文以該數(shù)據(jù)集為例，基于Matlab來分析BP神經(jīng)網(wǎng)絡(luò)的性能。2 運(yùn)行環(huán)境本設(shè)計在Windows 10 下進(jìn)行設(shè)計、主要利用 Matlab工具環(huán)境，進(jìn)行模擬演示。3 方法概述3.1 神經(jīng)元網(wǎng)絡(luò)神經(jīng)網(wǎng)絡(luò)是一種模仿動物神經(jīng)網(wǎng)絡(luò)行為特征，進(jìn)行分布式并行信息處理的算法數(shù)學(xué)模型。這種網(wǎng)絡(luò)依靠系統(tǒng)的復(fù)雜程度，通過調(diào)整內(nèi)部大量節(jié)點之間相互連接的關(guān)系，從而達(dá)到處理信息的目的。神經(jīng)網(wǎng)絡(luò)由多個神經(jīng)元構(gòu)成，下圖就是單個神經(jīng)元的圖1所示：圖1 神經(jīng)元模型這個神經(jīng)元是以以及截距為輸入值的運(yùn)算單元，其輸出為，其中函數(shù)被稱作“激活函數(shù)”。一般選用sigmoid函數(shù)作為激活函數(shù)圖

7、2 sigmoid函數(shù)圖像神經(jīng)網(wǎng)絡(luò)就是將許多個單一的神經(jīng)元聯(lián)結(jié)在一起，這樣，一個神經(jīng)元的輸出就可以是另一個神經(jīng)元的輸入。例如，下圖就是一個簡單的神經(jīng)網(wǎng)絡(luò)：圖3 神經(jīng)網(wǎng)絡(luò)示意圖我們用第層第單元的激活值（輸出值）。當(dāng)時，也就是第個輸入值。對于給定的參數(shù)集合，神經(jīng)網(wǎng)絡(luò)就可以按照函數(shù)來計算輸出結(jié)果。3.2 BP神經(jīng)網(wǎng)絡(luò)BP(back propagation)神經(jīng)網(wǎng)絡(luò)是1986年由Rumelhart和McClelland為首的科學(xué)家提出的概念，是一種按照誤差逆向傳播算法訓(xùn)練的多層前饋神經(jīng)網(wǎng)絡(luò)，是目前應(yīng)用最廣泛的神經(jīng)網(wǎng)絡(luò)。BP神經(jīng)網(wǎng)絡(luò)是一種按誤差反向傳播(簡稱誤差反傳)訓(xùn)練的多層前饋網(wǎng)絡(luò)，其算法稱為BP算

8、法，它的基本思想是梯度下降法，利用梯度搜索技術(shù)，以期使網(wǎng)絡(luò)的實際輸出值和期望輸出值的誤差均方差為最小?；綛P算法包括信號的前向傳播和誤差的反向傳播兩個過程。即計算誤差輸出時按從輸入到輸出的方向進(jìn)行，而調(diào)整權(quán)值和閾值則從輸出到輸入的方向進(jìn)行。正向傳播時，輸入信號通過隱含層作用于輸出節(jié)點，經(jīng)過非線性變換，產(chǎn)生輸出信號，若實際輸出與期望輸出不相符，則轉(zhuǎn)入誤差的反向傳播過程。誤差反傳是將輸出誤差通過隱含層向輸入層逐層反傳，并將誤差分?jǐn)偨o各層所有單元，以從各層獲得的誤差信號作為調(diào)整各單元權(quán)值的依據(jù)。通過調(diào)整輸入節(jié)點與隱層節(jié)點的聯(lián)接強(qiáng)度和隱層節(jié)點與輸出節(jié)點的聯(lián)接強(qiáng)度以及閾值，使誤差沿梯度方向下降，經(jīng)過反

9、復(fù)學(xué)習(xí)訓(xùn)練，確定與最小誤差相對應(yīng)的網(wǎng)絡(luò)參數(shù)(權(quán)值和閾值)，訓(xùn)練即告停止。此時經(jīng)過訓(xùn)練的神經(jīng)網(wǎng)絡(luò)即能對類似樣本的輸入信息，自行處理輸出誤差最小的經(jīng)過非線形轉(zhuǎn)換的信息。4 數(shù)據(jù)結(jié)果分析經(jīng)過訓(xùn)練的神經(jīng)網(wǎng)絡(luò)對手寫數(shù)字識別的精確度是85.88%，以下是數(shù)據(jù)結(jié)果：圖4.1 MSE走勢曲線：4.1 MSE走勢曲線圖4.2 梯度和校驗檢查曲線：圖4.2 梯度和校驗檢查曲線圖4.3回歸曲線：圖4.3回歸曲線圖4.4訓(xùn)練結(jié)構(gòu)圖：圖4.4訓(xùn)練結(jié)構(gòu)圖總結(jié)本次設(shè)計在MATLAB上進(jìn)行測試訓(xùn)練集，驗證了BP神經(jīng)網(wǎng)絡(luò)的計算過程由正向計算過程和反向計算過程組成。正向傳播過程，輸入模式從輸入層經(jīng)隱單元層逐層處理，并轉(zhuǎn)向輸出層，每一層神經(jīng)元的狀態(tài)只影響下一層神經(jīng)元的狀態(tài)。如果在輸出層不能得到期望的輸出，則轉(zhuǎn)入反向傳播，將誤差信號沿原來的連接通路返回，通過修改各神經(jīng)元的權(quán)值，使得誤差信號最小。BP神經(jīng)網(wǎng)絡(luò)無論在網(wǎng)絡(luò)理論還是在性能方面已比較成熟。其突出優(yōu)點就是具有很強(qiáng)的非線性映射能力和柔性的網(wǎng)絡(luò)結(jié)構(gòu)。網(wǎng)絡(luò)的中間層數(shù)、各層的神經(jīng)元個數(shù)可根據(jù)具體情況任意設(shè)定，并且隨著結(jié)構(gòu)的差異其性能也有所不同。但是BP神經(jīng)網(wǎng)絡(luò)也存在以下的一些主要缺陷。學(xué)習(xí)速度慢，即使是一個簡單的問題，一般也需要幾百次甚至上千次的學(xué)習(xí)才能收斂；容易陷入局部極小值；網(wǎng)絡(luò)層數(shù)、神經(jīng)元個數(shù)的選擇沒有相應(yīng)的理論指導(dǎo)；

人人文庫> 全部分類> 應(yīng)用文書 > 工作計劃

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

基于BP神經(jīng)網(wǎng)絡(luò)的手寫數(shù)字識別實驗報告

文檔簡介

溫馨提示

最新文檔

評論

基于BP神經(jīng)網(wǎng)絡(luò)的手寫數(shù)字識別實驗報告

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔