基于深度學習AlexNet模型的藝術畫風格識別方法設計_第1頁
基于深度學習AlexNet模型的藝術畫風格識別方法設計_第2頁
基于深度學習AlexNet模型的藝術畫風格識別方法設計_第3頁
基于深度學習AlexNet模型的藝術畫風格識別方法設計_第4頁
基于深度學習AlexNet模型的藝術畫風格識別方法設計_第5頁
已閱讀5頁,還剩17頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

湖南商務職業(yè)技術學院畢業(yè)設計

目錄

1引言............................................................................................................................1

1.1項目背景......................................................................................................1

1.2開發(fā)環(huán)境與工具..........................................................................................1

1.2.1Python簡介..........................................................................................1

1.2.2Tensorflow簡介..................................................................................2

1.2.3Jypyternotebook簡介......................................................................2

1.2.4Python第三方庫簡介..........................................................................2

2需求分析....................................................................................................................3

2.1可行性需求分析..........................................................................................3

2.2數(shù)據(jù)集采集功能分析..................................................................................3

2.3關鍵技術分析..............................................................................................4

2.3.1AlexNet模型與傳統(tǒng)的圖畫分類........................................................4

2.3.2卷積神經網(wǎng)絡原理...............................................................................4

2.3.3Web框架技術(Flask/Django)........................................................4

3數(shù)據(jù)采集....................................................................................................................5

3.1數(shù)據(jù)集獲取分析..........................................................................................5

3.2數(shù)據(jù)集需求分析..........................................................................................7

3.3編程實現(xiàn)......................................................................................................7

4數(shù)據(jù)集處理................................................................................................................8

4.1數(shù)據(jù)預處理..................................................................................................8

4.2數(shù)據(jù)增強......................................................................................................9

4.3切分訓練集和測試集................................................................................10

5模型構建及評估分析..............................................................................................10

5.1模型構建....................................................................................................10

5.1.1模型網(wǎng)絡結構.....................................................................................10

5.1.2創(chuàng)建模型.............................................................................................11

I

湖南商務職業(yè)技術學院畢業(yè)設計

5.2模型編譯....................................................................................................13

5.2.1優(yōu)化器設置.........................................................................................13

5.2.2損失函數(shù)設置.....................................................................................13

5.3模型訓練與調優(yōu)........................................................................................13

5.3.1模型訓練設置.....................................................................................13

5.3.2學習率調優(yōu).........................................................................................13

5.3.3batch_size設置................................................................................15

5.4系統(tǒng)部署....................................................................................................15

5.4.1基于python和Android的系統(tǒng)設計實現(xiàn).......................................15

5.4.2圖片識別功能.....................................................................................16

5.4.3信息展示功能.....................................................................................16

6小結..........................................................................................................................18

參考資料.........................................................................................................................20

II

湖南商務職業(yè)技術學院畢業(yè)設計

基于深度學習AlexNet模型的藝術畫風格識別方法設計

1引言

一個圖畫作品主要是由內容和風格組成,對于內容相同的圖畫、不同圖畫

風格的作者會使得最后作品的感觸也不盡相同。近幾年隨著AI和深度學習的

發(fā)展,我們可以使用神經網(wǎng)絡提取作品的圖畫風格、使之融合到我們自己的作

品上。

1.1項目背景

據(jù)網(wǎng)絡統(tǒng)計顯示、社交軟件WeChat每一個月的使用用戶已達到10億之

多。如何讓自己在上面的發(fā)送出去的圖片更有特色,它成為一個值得我們去思

考探討的課題。隨著技術的提升、由深度學習所引發(fā)的AI熱潮,已經開始越

來越廣泛地影響到社會中的各層各面,例如人臉識別、在線翻譯等。在這其中

AI和圖像的風格碰在一起產生了火花。在深度學習和藝術中引起了關注,也降

低了人們創(chuàng)作作品的難度。

一個圖像的內容在人們看來是一目了然的,但是圖畫中卻是完全不同的。

我們雖然可以輕易的描述出圖畫的內容,但是對于圖畫的風格我們只能粗略的

道出其中的冰山一角。圖像的氣概發(fā)展至今、已經出現(xiàn)了各種各樣的派系。

圖畫在計算機看來中就是一個個像素點、圖畫的內容和氣概的信息就蘊藏在這

些由一個個像素點組成的矩陣中。

1.2開發(fā)環(huán)境與工具

1.2.1Python簡介

Python是由GuidoRossum于1989年誕生。

2005-2012年,Google大量應用python,引起廣泛關注,促進了python

的發(fā)展。

2012年云計算興起,其中最主要的OpenStack框架由python開發(fā),使得

python火了一把。2014年AI興起,AI中大量關鍵算法都是由python開發(fā),

因為python中含有很好的第三方庫特別適合做算法,加上入門低、開發(fā)效率

高,這樣又進一步促使python的火爆。

2017年python走進大眾視野(指非IT人士),走進學科教育。

1

湖南商務職業(yè)技術學院畢業(yè)設計

如今已經發(fā)展成一門廣泛使用的高級編程語言。它可應用于網(wǎng)絡爬蟲、機

器學習、數(shù)據(jù)分析和可視化等多種領域。它的特點是開源(免費)、豐富的

庫、簡單易學、支持跨平臺而且可移植性強。

1.2.2Tensorflow簡介

作為數(shù)據(jù)可視化的產品,與數(shù)據(jù)庫相連接,呈現(xiàn)波動的數(shù)據(jù)變化,更加直

覺的進行數(shù)據(jù)分析和可視化呈現(xiàn)。它實現(xiàn)數(shù)據(jù)與圖形的完滿嫁接,它的程序很

容易動手,各公司可以用它將較多的數(shù)據(jù)拖放至數(shù)字“畫表”上,瞬間就能創(chuàng)

建好各種圖表。這一軟件的理念是,每一個界面的數(shù)據(jù)越容易操作,公司對自

己在所在業(yè)務范圍里的工作到底是正確還是錯誤,就能了解得越滲透。

1.2.3Jypyternotebook簡介

它是一種Web應用,它能使得用戶將文本、方程、代碼和其他所有的內

容全部組合到一個方便分享的文件中,非常方便研究和教學。在初始的python

與ipython中,打印顯示在單獨的彈窗中進行,而文字以及各種函數(shù)和類底

本包含在獨立的文件中。但是它能將這一切集中到一點,讓用戶看起來跟明

了。

它特別適合做數(shù)據(jù)的預處理,而且用途可以包括數(shù)據(jù)清洗和探索、深度

學習和大數(shù)據(jù)的分析。

安裝它,最簡單的方法就是使用anaconda,其版本附帶并包含了它。

1.2.4Python第三方庫簡介

最和睦的網(wǎng)絡爬蟲功能庫requests,是實現(xiàn)的簡單易用的HTTP庫,使用

起來比其他的庫更簡便很多,Python的三方庫在使用之前要先進行安裝。

正則表達式re解析和處理功能庫,里面包含了多種字符串匹配的方法。

作為HTML和XML的解析庫,BeautifulSoup可以對HTML、XML格式進行

刨析,從中提取信息;還可以對所提供的任何式子進行相關的數(shù)據(jù)爬取,而且

對它進行無規(guī)則解析。

NumPy庫是Python數(shù)據(jù)分析的基礎,是處理數(shù)組的Python庫,NumPy庫

的數(shù)據(jù)結構比Python自帶的更加高效。

pandas庫數(shù)據(jù)分析并保存為csv文件,python數(shù)據(jù)分析高層次應用庫,

還可以進行數(shù)據(jù)清洗。

matplotlib繪圖庫,主要是偏向于二維繪圖包括折線圖、條形圖、扇形

2

湖南商務職業(yè)技術學院畢業(yè)設計

圖、散點圖、直方圖等等。

pyecharts:繪圖。

statsmodels:統(tǒng)計建模。

wordcloud、scipy、jieba:生成中文詞云的。

pylab:設置畫圖能顯示中文。

2需求分析

2.1可行性需求分析

1.技術可行性

Python編程語言通俗易懂、是一種動態(tài)的面對對象的腳本語言。這讓它對

于爬蟲領域有著巨大的優(yōu)勢,是當前爬蟲的首選語言。本項目便是利用python

采集數(shù)據(jù),通過python第三方庫進行數(shù)據(jù)分析、與數(shù)據(jù)可視化的展示。

Tableau是一款對人操作十分友好的軟件,利用它對數(shù)據(jù)可視化進行展示和分

析也十分便捷。

2.項目可行性

隨著計算機技術圖像處理方向的不斷發(fā)展和推廣,古代壁畫圖像也向著數(shù)

字化時代邁進,如何去使用這些巨量數(shù)字資源是一個有待解決的問題,嚴重的

需求就是確定探究對象。對圖畫進行篩選與分開,方便更直觀快速有效地從數(shù)

字圖畫庫中搜羅目標圖像,以便對圖像進行有秩序地管理和維護。與傳統(tǒng)的特

點的提取方式有一定的效果,但需要豐富的學習知識,同時它獲取到的特征會

存在表達不充分和缺乏能力的問題。因此需要將卷積神經網(wǎng)絡用于圖畫分類,

借鑒經典的神經網(wǎng)絡構造,通過所具有的多向擴展特點的網(wǎng)絡模型來實現(xiàn)圖畫

圖像的有效分類。

2.2數(shù)據(jù)集采集功能分析

傳統(tǒng)的畫像的分類模型框架包括特征的提取、特征的編碼、特征的匯聚和

分類器4部分。這個時期特征提取原理是上是人工進行設計,所以特征的提取

的好壞會直接影響到分類后模型的性能。為解決圖畫圖像特征的提取各種各樣

的問題,將卷積神經網(wǎng)絡使用到圖像的分類,然后借鑒經典的卷積網(wǎng)alexnet

的網(wǎng)絡結構,從主體上考慮壁畫數(shù)據(jù)的量和網(wǎng)絡結構對其影響的各種因素。

3

湖南商務職業(yè)技術學院畢業(yè)設計

2.3關鍵技術分析

2.3.1AlexNet模型與傳統(tǒng)的圖畫分類

模型的結構如圖片2-1所示;

圖2-1AlexNet模型展示圖2-2Alexnet模型

AlexNet是首個成功展示卷積神經網(wǎng)絡的潛力的模型,網(wǎng)絡結構如圖2-2

Alexnet模型所示,size是卷積核和池化核大小與數(shù)目,stride表示為步長,

drop—outrate是輸出的概率,class是各個類別的個數(shù)。由圖可以看出,

AlexNet網(wǎng)絡是由5個卷積層與3個全連接層相互組織而成,并且采用的是雙通

道的結構,因為這有限于當時的局限條件,Krizhevsky等人采用僅兩臺的gpu

服務器并行來繼續(xù)模型訓練速度。從中看到,從最后的卷積層到全連接層的大

小或數(shù)量并沒有減半,主要由于考慮到參數(shù)大部分集中在全連接層。

2.3.2卷積神經網(wǎng)絡原理

可視化起源于圖形學、計算機的圖形學、科學、AI以及用戶的界面等領

域,也是當前計算機科學的一個重點研究的方向,它使用計算機對較多的信息

進行直接的表示,以便于快速檢索信息和簡單識別的能力。

數(shù)據(jù)可視化是項目中十分重要的一環(huán),主要通過計算機圖形圖像技術手段

展現(xiàn)出數(shù)據(jù)的基本特征或者隱含規(guī)律,它將復雜的數(shù)據(jù)轉化為更容易的方式傳

遞給受眾,并給人意想不到的洞察力,所以建立數(shù)據(jù)可視化確實可以使分析的

數(shù)據(jù)任務更清晰、更容易理解,特別是對于大規(guī)模的數(shù)據(jù)集。

2.3.3Web框架技術(Flask/Django)

可視化技術起源于圖形學、計算機圖形學、科學可視化、人工智能以及用

4

湖南商務職業(yè)技術學院畢業(yè)設計

戶界面等領域,也是當前計算機科學的一個重要研究方向,它利用計算機對抽

象信息進行直觀的表示,以利于快速檢索信息和怎強認知能力。

數(shù)據(jù)可視化是項目中十分重要的一環(huán),主要通過計算機圖形圖像技術手段

展現(xiàn)出數(shù)據(jù)的基本特征或者隱含規(guī)律,它將復雜的數(shù)據(jù)轉化為更容易的方式傳

遞給受眾,并給人意想不到的洞察力,所以建立數(shù)據(jù)可視化確實可以使分析的

數(shù)據(jù)任務更清晰、更容易理解,特別是對于大規(guī)模的數(shù)據(jù)集。

3數(shù)據(jù)采集

3.1數(shù)據(jù)集獲取分析

如圖3-1數(shù)據(jù)集訓練及篩選流程所示;

首先,提取壁畫圖像一層的邊緣等邊緣特征;之后采用結構不同的多通道

網(wǎng)絡對提取的一層特征進行二層的深層籠統(tǒng),得到兩個通道的特征;

最后,融合兩個通道的特征,一塊構建損失的函數(shù)得到篩選的結果,從而

提高模型的韌性和特征表達能力。

圖3-1數(shù)據(jù)集訓練及篩選流程

所需的數(shù)據(jù)來自于《中國敦煌壁畫全集》與《中國絲綢之路的墓室壁畫》

畫冊中的掃描版,時間上至漢代,下至清代,從地域上跨越東部、中部與西

部,覆蓋了不同朝代與不同地區(qū)的壁畫題材。

收集到的不同形態(tài)圖片如圖3-2所示,不同朝代的圖片如圖3-3所示,同

地域圖片如圖3-4所示;

5

湖南商務職業(yè)技術學院畢業(yè)設計

圖3-2不同形態(tài)的圖片

圖3-3不同朝代的圖片

6

湖南商務職業(yè)技術學院畢業(yè)設計

圖3-4不同地域圖片

3.2數(shù)據(jù)集需求分析

針對單網(wǎng)絡可能對圖像的特點學習不夠充分,結合寬度的影響條件,以經

典alexnet模型為基礎,將網(wǎng)絡拓展到兩個通道充分提取圖畫特征,提出了一

種結合特征結合思想的網(wǎng)絡模型用于傳統(tǒng)圖畫圖像的快速篩選分離。

圖3-5網(wǎng)絡拓展流程

如圖3-5所示為網(wǎng)絡拓展流程。

3.3編程實現(xiàn)

導入所需庫,如3-6所示;

7

湖南商務職業(yè)技術學院畢業(yè)設計

圖3-6導入所需庫頁面

設置請求頭,偽裝成瀏覽器訪問服務器,定義position_data存放所有數(shù)

據(jù),用于最后數(shù)據(jù)保存循環(huán)網(wǎng)頁。

4數(shù)據(jù)集處理

數(shù)據(jù)的清洗是指發(fā)現(xiàn)并修改數(shù)據(jù)文本中可辨別的錯誤的最后一個運行程

序,包括檢查數(shù)據(jù)相同性,處理不相關值和缺失的數(shù)據(jù)。

數(shù)據(jù)的質量評審重要方法還包括數(shù)據(jù)的預處理,數(shù)據(jù)處理是實現(xiàn)所有數(shù)據(jù)

序列化的必要過程,是檢查數(shù)據(jù)的重要環(huán)節(jié),也是實現(xiàn)數(shù)據(jù)共享的重要步驟。

對天氣的預報、圖書的存放、超級市場、馬路鐵路、航天、工農業(yè)、軍方

的事務,數(shù)據(jù)的預處理深入其中,人類的發(fā)展從古至今都離開不了數(shù)據(jù)的處

理,現(xiàn)代的社會,人們生活與數(shù)據(jù)處理聯(lián)系越來越密切,離開了數(shù)據(jù)處理將無

法生存。

沒有了數(shù)據(jù)處理,股票市場、銀行、鐵路局、天氣預報都將無法正常進

行。

4.1數(shù)據(jù)預處理

通過對收集的傳統(tǒng)圖畫藝術圖畫進行研究,將數(shù)據(jù)集的分類設定為佛、

薩、祥、世俗、弟子、動植物和建筑等藝術形象。對采集到的數(shù)據(jù)進行縮小放

大、亮度改變、降噪和旋轉等數(shù)據(jù)集加強算法來進行擴展。

8

湖南商務職業(yè)技術學院畢業(yè)設計

圖4-1圖畫分類數(shù)據(jù)集示例

4.2數(shù)據(jù)增強

為了分析卷積層數(shù)和全連接層數(shù)對圖像圖像特征表達的影響,選擇的學習

率為0.000l的Aclam優(yōu)化器用于模型的訓練,每個實驗均運行一萬步,并

且目標的優(yōu)化函數(shù)、參數(shù)更新方式都是一樣的。在雙通道特征提取層Conv.33

結構的基礎上,各選擇2,3,4層全連接層進行對比實驗。圖4-2是運行時

間對比。圖4-2是在不同全連接層模型準確率隨迭代變化的曲線。

9

湖南商務職業(yè)技術學院畢業(yè)設計

圖4-2不同全連接層準確率迭代曲線

4.3切分訓練集和測試集

二進制:保存爬取的圖片、動態(tài)頻、音頻等不同式子的數(shù)據(jù)。

這里我用to_csv()方法保存清洗后的數(shù)據(jù),文件名為data,index=false

輸出不顯示索引值,編碼方式為gbk,如圖4-3所示。

圖4-3數(shù)據(jù)存儲頁面

5模型構建及評估分析

5.1模型構建

5.1.1模型網(wǎng)絡結構

導入相關庫,使用pandas加載源數(shù)據(jù),如圖5-1所示。

10

湖南商務職業(yè)技術學院畢業(yè)設計

圖5-1數(shù)據(jù)準備頁面

5.1.2創(chuàng)建模型

圖5-2比較結果

與結合預設計的經典的模型相比,準確度大概有1%-5%的提升,如圖5-3

顯示。主要是因為模型并未在這樣的數(shù)據(jù)集上進行預處理,而是直接從圖畫自

身開始訓練模型,提取的特征更接近壁畫圖像特點,說明自然圖畫與融合了人

的客觀設計思想的壁畫圖像在特點提取方面有一定的差距。

11

湖南商務職業(yè)技術學院畢業(yè)設計

圖5-3與結合處理的模型相比

與一些改過的神經模型相比,準確度均有大約5%的提高,如圖5-4顯示。

說明模型的設計的網(wǎng)絡層可以學習到更加豐富的特征,同時不同的積核的使用

也豐富了網(wǎng)絡的表現(xiàn)能力。

圖5-4與改過的神經模型相比

12

湖南商務職業(yè)技術學院畢業(yè)設計

5.2模型編譯

5.2.1優(yōu)化器設置

隨機梯度:基本是通過梯度的下降法,使得網(wǎng)絡的參數(shù)不斷擴散到全部

(或者局部)min值,但是由于網(wǎng)絡層太多,需要通過反向的傳播算法,把誤

差層層地從輸出傳播到輸入,更新網(wǎng)絡參數(shù)。由于方向是函數(shù)值變大的最快的

方向,因此負梯度方向則是函數(shù)變小的最快的方向。沿著負梯度方向一步一步

變化,便能快速地到函數(shù)min值。實現(xiàn)SGD優(yōu)化算法,帶動量優(yōu)化算法,帶動

量SGD優(yōu)化算法,并且可擁有多項。

5.2.2損失函數(shù)設置

圖5-5數(shù)據(jù)展示頁面

如圖5-5,平均絕對誤差,即計算預測值與真實值的差的絕對值,衡量預

測值與真實值之間距離的平均誤差幅度,范圍為0到無窮大。

5.3模型訓練與調優(yōu)

5.3.1模型訓練設置

數(shù)據(jù)、損失函數(shù)、模型、迭代訓練。這五個步驟中數(shù)據(jù)和損失函數(shù)是沒法

改變的,而在迭代訓練的過程中模型的一些參數(shù)和優(yōu)化器中的一些緩存是會變

的,需要保留這些信息,另外還需要保留次數(shù)和學習率。

5.3.2學習率調優(yōu)

梯度更新公式:θ=θ?η??θJ(θ);

根據(jù)上述公式,如果學習率較大,那么參數(shù)的更新度就會很快,可以加快

網(wǎng)絡的速度,但如果學習率過大,可能會導致參數(shù)在最優(yōu)解附近變化,代價函

數(shù)難以改變,甚至可能會錯過最優(yōu)解,導致參數(shù)向錯誤的方向,代價函數(shù)不僅

不收斂反而可能爆炸(如圖5-6(a)所示)。如果學習率較小,網(wǎng)絡可能不

會錯過最優(yōu)點,但是網(wǎng)絡學習速度變慢。同時,如果學習率小,則很可能會陷

13

湖南商務職業(yè)技術學院畢業(yè)設計

入局部最優(yōu)點(如圖5-6(b)所示)。

因此,找到合適的學習率,才能使代價函數(shù)以較快的速度逼近全局最優(yōu)

解。

圖5-6不同學習率下的梯度更新

在不同的學習階段指定的學習率,在每段內學習率相同。該過程可為:

boundaries=[100,200]#指定學習率改變的邊界點為100和200;

values=[1.0,0.5,0.1]#指定不同區(qū)間下的學習率大小;

learning_rate=1.0;

學習率成指數(shù)衰減,每次將當前學習率乘以給定的衰減率得到下一個學習

率。指數(shù)衰減的為:new_learning_rate=last_learning_rate*gamma;

每次將當前學習率乘以給定的衰減率的自然指數(shù)得到下一個學習率。其公

式表達為new_learning_rate=learning_rate*?―???????????;學習率按照

指定的輪數(shù)間隔進行衰減,該過程learning_rate=0.5#學習率初始,

step_size每訓練30個epoch進行一次衰減。

gamma=0.1#衰減率;

learning_rate=0.5ifepoch<30

learning_rate=0.05if30<=epoch<60

learning_rate=0.005if60<=epoch<90;

學習率按特定間隔進行衰減,與間隔衰減的區(qū)別在于:間隔衰減的epoch

間隔是單一且固定的,而多間隔衰減中的epoch間隔是預先指定的多間隔。該

過程為:

learning_rate=0.5#學習率初始值

milestones=[30,50]#指定輪數(shù)間隔

14

湖南商務職業(yè)技術學院畢業(yè)設計

gamma=0.1#衰減率

learning_rate=0.5ifepoch<30

learning_rate=0.05if30<=epoch<50

learning_rate=0.005if50<=epoch;

當loss停止下降時,降低學習率。其思想是:一旦模型表現(xiàn)不再提升,

將學習率降低2-10倍對模型的訓練往往有益。此外,每降低一次學習率后,

將會進入一個冷靜期。在冷靜期內不會監(jiān)控loss變化也不會進行衰減。當冷

靜期結束后,會繼續(xù)監(jiān)控loss的上升或下降。

5.3.3batch_size設置

在訓練中通常會將batch_size設置較大,從而使得GPU或者CPU滿載運

行,提高訓練的速度。并且會使梯度下降的方向更加準確。并且不使用較小的

batch_size,如果batch_size為1時,因為每一個樣本都具有自己獨特的特

征,會對梯度的計算產生波動,即模型的收斂是不利的。梯度的方差表示為:

1

Var(g)=Var(∑?,))

??=1?(????

公式解讀:D(cx)=c^2D(x);

m即BATCH_SIZE設置大小,即增大BATCH_SIZE的大小可以使得梯度方差

的大小減小。直接使梯度更加準確。

但在測試中:我們通常會將batch_size設置為1,主要是因為一些將數(shù)據(jù)

統(tǒng)一的操作來使其可以放到一個batch中(例如:cv領域中的將圖像調整大小

致相同,NLP領域中Bert模型也會將token長度的向同一個batch中最大的長

度對齊),這樣就會帶來一個問題,模型效果的降低,所以在測試時:為了盡

可能的表現(xiàn)模型的能力,將其設置batch_size為1。

5.4系統(tǒng)部署

5.4.1基于python和Android的系統(tǒng)設計實現(xiàn)

在Python中開發(fā)基于Android的APP相對來說比較便捷,需要調用

Python的APP開發(fā)庫kivy。

使用kivy庫開發(fā)APP的時候,可使用kv描述文檔與各模塊的參數(shù)和動作

來進行更加簡潔的APP開發(fā)。

獲取圖片分別有兩種方式,一種可以通過文件選擇器然后在設備內存中獲

取,另外一種方法就是通過調用攝像頭拍照獲取。通過文件選擇器在設備內存

15

湖南商務職業(yè)技術學院畢業(yè)設計

中獲取圖片,用到了kivy庫中的FileChooser模塊。

使用該模塊的FileChooserIconView子模塊,可以小視圖的方式瀏覽文件

夾。然后當用戶選擇文件時,獲取改文件的完整路徑,后臺可從該路徑讀取圖

片數(shù)據(jù)。

調用攝像頭拍照,用到了kivy庫中的核心模塊Camera,使用這個模塊即

直接調用攝像頭,然后通過獲取截圖攝像頭內的畫面,以達到拍照的效果。

5.4.2圖片識別功能

所有該功能進行訪問本地文件,將數(shù)據(jù)輸入已訓練好的模型獲取輸出結

果。這一步的需要用到TensorFlow庫import_meta_graph函數(shù),通過meta文

件加載已訓練好的模型結構和參數(shù)。然后使用TensorFlow中的

get_default_graph獲取已加載的模型。獲取到模型之后,還要獲取輸入節(jié)點

和輸出節(jié)點,需要通過get_tensor_by_name來獲取節(jié)點,直至獲取到對應的

節(jié)點,就可傳入數(shù)據(jù)并進行預測和輸出。結果如圖5-7所示。

圖5-7識別圖片結果對比

5.4.3信息展示功能

將預測的結果處理后展示在信息顯示界面。識別圖片功能預測輸出的是獨

熱編碼,而信息展示功能第一個讀取num_name.npy文件獲取保存的字典格式信

息(字典中,獨熱編碼作為鍵,與獨熱編碼對應的圖像名稱作為值),再通過預

測獨熱編碼在字典獲取其對應的圖像名稱,然后讀取info.npy文件獲取鍵值分

別為圖像名稱與圖像介紹信息的字典格式信息,然后在字典中通過圖像名稱獲

16

湖南商務職業(yè)技術學院畢業(yè)設計

取對應的圖像介紹信息。結果如圖5-8所示。

圖5-8信息展示界面

實際應用時,為保證結果能更好的滿足用戶需求,需要在實際應用時做一

些額外的處理以擴大預測的結果集。首先將用戶需要識別的圖片copy為100

份,再將100份數(shù)據(jù)使用已訓練好的模型進行識別預測,然后統(tǒng)計其識別結果

中每種結果出現(xiàn)的頻率,取頻率出現(xiàn)最高的五種結果,最后將結果和其對應的

圖像展示在信息顯示界面,其流程如圖5-9所示;實驗結果如圖5-10所示。

圖5-9用戶輸入到結果展示處理過程

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論