基于深度學(xué)習(xí)AlexNet模型的時尚標(biāo)簽識別方法設(shè)計_第1頁
基于深度學(xué)習(xí)AlexNet模型的時尚標(biāo)簽識別方法設(shè)計_第2頁
基于深度學(xué)習(xí)AlexNet模型的時尚標(biāo)簽識別方法設(shè)計_第3頁
基于深度學(xué)習(xí)AlexNet模型的時尚標(biāo)簽識別方法設(shè)計_第4頁
基于深度學(xué)習(xí)AlexNet模型的時尚標(biāo)簽識別方法設(shè)計_第5頁
已閱讀5頁,還剩20頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計

目錄

1引言............................................................................................................................1

1.1項目背景......................................................................................................1

1.2開發(fā)環(huán)境與工具簡介..................................................................................2

1.2.1Python簡介..........................................................................................2

1.2.2Tensorflow簡介..................................................................................3

1.2.3Python第三方庫簡介..........................................................................4

2需求分析....................................................................................................................4

2.1可行性分析..................................................................................................4

2.2數(shù)據(jù)采集功能分析......................................................................................5

2.2.1數(shù)據(jù)采集功能簡單分析.......................................................................5

2.2.2torch技術(shù)分析....................................................................................6

2.2.3torchvision技術(shù)分析........................................................................7

3數(shù)據(jù)集準(zhǔn)備................................................................................................................7

3.1數(shù)據(jù)采集......................................................................................................7

3.2數(shù)據(jù)集獲取分析..........................................................................................8

3.3了解Fashion-MNIST數(shù)據(jù)集......................................................................8

4數(shù)據(jù)可視化與數(shù)據(jù)集預(yù)處理....................................................................................9

4.1數(shù)據(jù)預(yù)處理..................................................................................................9

4.2安裝相關(guān)庫................................................................................................10

4.3數(shù)據(jù)集可視化............................................................................................10

5模型構(gòu)建及評估分析..............................................................................................12

5.1模網(wǎng)絡(luò)型結(jié)構(gòu)............................................................................................12

5.1.1AlexNet網(wǎng)絡(luò)搭建..............................................................................12

5.1.2模型構(gòu)建.............................................................................................13

5.2定義模型,預(yù)測數(shù)據(jù)................................................................................15

I

湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計

5.2.1服裝分類數(shù)據(jù)集.................................................................................15

5.2.2損失函數(shù)設(shè)置.....................................................................................16

5.2.3訓(xùn)練模型.............................................................................................16

5.2.4定義動態(tài)學(xué)習(xí)率.................................................................................17

5.2.5如何設(shè)置batch_size值...................................................................18

5.3成品展示....................................................................................................18

5.3.1前端界面設(shè)計.....................................................................................18

5.3.2作品展示.............................................................................................19

6小結(jié)..........................................................................................................................21

參考資料.........................................................................................................................23

II

湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計

基于深度學(xué)習(xí)AlexNet模型的時尚標(biāo)簽設(shè)計方法

1引言

互聯(lián)網(wǎng)是20世紀(jì)末至21世紀(jì)初人類社會最具影響力的技術(shù)革命

之一,其突出的特點是信息共享和數(shù)字化交流,改變了人們的生活和

工作方式,對社會和經(jīng)濟(jì)的發(fā)展帶來了深刻的影響。然而,隨著技術(shù)

的不斷發(fā)展和應(yīng)用,互聯(lián)網(wǎng)的形態(tài)和功能也在不斷變化,未來互聯(lián)網(wǎng)

將面臨更多的挑戰(zhàn)和機(jī)遇。本文將探討未來互聯(lián)網(wǎng)的發(fā)展趨勢,包括

技術(shù)發(fā)展趨勢、應(yīng)用領(lǐng)域拓展、安全與隱私保護(hù)、數(shù)字化轉(zhuǎn)型以及產(chǎn)

業(yè)變革等方面。

隨著時尚行業(yè)的不斷發(fā)展,消費(fèi)者對于時尚產(chǎn)品的需求也越來越

高。然而,當(dāng)前市面上存在大量的時尚產(chǎn)品,消費(fèi)者往往難以準(zhǔn)確地

了解每個產(chǎn)品的種類和特點,從而帶來了購買體驗的不便。

為了解決這一問題,我們設(shè)計了一款基于alexnet模型的時尚標(biāo)

簽識別系統(tǒng)。該系統(tǒng)將利用深度學(xué)習(xí)技術(shù),對數(shù)千張時尚圖片進(jìn)行訓(xùn)

練,并且能夠快速、準(zhǔn)確地識別各種時尚品類。

該系統(tǒng)采用了AlexNet深度神經(jīng)網(wǎng)絡(luò)模型,該模型在2012年

ImageNet競賽中獲得了當(dāng)時最高的準(zhǔn)確率。通過使用該模型,我們

可以有效地降低時尚圖片的識別誤差率,提高系統(tǒng)的整體性能。

此外,我們還將引入大規(guī)模數(shù)據(jù)集來進(jìn)行模型訓(xùn)練。我們相信,

這將有助于提高模型的魯棒性,并且能夠更好地滿足用戶的需求。

總之,我們的時尚標(biāo)簽識別系統(tǒng)將為消費(fèi)者提供更好的購物體驗,

并且有望成為時尚行業(yè)的一款重要工具。我們非常期待看到這個系統(tǒng)

在未來得到更廣泛的應(yīng)用。

1.1項目背景

隨著科學(xué)技術(shù)的發(fā)展,信息化水平逐步提升,人們生活質(zhì)量逐步

的提高,每天能吃飽的前提而心靈和精神的需求也隨之而不斷提高,

人們對“時尚”這個詞語不斷的完善和認(rèn)識,在不同的場所更加注重

自己的形象和打扮。

在這個信息高速發(fā)展的時代,懶人經(jīng)濟(jì)將是以后發(fā)展的主流之一

而如果只通過自己的眼睛來觀察“時尚”是一個比較麻煩、繁雜的所

1

湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計

以不適合以后的懶人經(jīng)濟(jì)。就例如因此,我們可以通過大數(shù)據(jù)、來篩

選每個人對自己“時尚”領(lǐng)域的理解。

近年來,隨著時尚行業(yè)的迅速發(fā)展和消費(fèi)者需求的不斷提高,時

尚標(biāo)簽識別系統(tǒng)在服裝設(shè)計和市場營銷領(lǐng)域中扮演著越來越重要的

角色。alenet模型是一種基于人工智能技術(shù)的高效、準(zhǔn)確的時尚標(biāo)

簽識別系統(tǒng)。而本文所述的“alenet模型的時尚標(biāo)簽識別系統(tǒng)設(shè)計

項目背景”將介紹該項目的相關(guān)情況。

該項目旨在開發(fā)一種有效的時尚標(biāo)簽識別系統(tǒng),可以幫助服裝設(shè)

計師、生產(chǎn)企業(yè)和銷售商更加精準(zhǔn)地了解市場需求,滿足消費(fèi)者的個

性化需求。同時,該系統(tǒng)也可以為消費(fèi)者提供更好的購物體驗和更加

豐富多樣的時尚選擇。

為了實現(xiàn)這一目標(biāo),該項目團(tuán)隊結(jié)合了深度學(xué)習(xí)、計算機(jī)視覺和

自然語言處理等技術(shù),構(gòu)建了一個完整的時尚標(biāo)簽識別系統(tǒng)。該系統(tǒng)

通過分析衣服的圖片和描述信息,能夠識別出其款式、材質(zhì)、風(fēng)格、

顏色等多個方面的標(biāo)簽,并將這些標(biāo)簽與用戶的喜好進(jìn)行匹配,從而

提供個性化的推薦和購物建議。

除此之外,該系統(tǒng)還具備快速、準(zhǔn)確的搜索功能,用戶可以通過

輸入關(guān)鍵詞或上傳圖片等方式,快速找到所需的商品和相關(guān)信息。同

時,該系統(tǒng)還提供了數(shù)據(jù)分析和預(yù)測功能,可以幫助企業(yè)了解市場趨

勢、預(yù)測銷售情況,從而做出更加科學(xué)合理的決策。

總的來說,alenet模型的時尚標(biāo)簽識別系統(tǒng)設(shè)計項目背景重點在

于結(jié)合人工智能技術(shù)和時尚行業(yè)實際需求,構(gòu)建一個高效、準(zhǔn)確、個

性化的時尚標(biāo)簽識別系統(tǒng),為服裝設(shè)計和市場營銷領(lǐng)域的發(fā)展提供有

力支持。

1.2開發(fā)環(huán)境與工具簡介

1.2.1Python簡介

Python是一種面向?qū)ο蟮慕忉屝陀嬎銠C(jī)程序設(shè)計語言,由荷蘭人

GuidovanRossum于1989年發(fā)明,第一個公開發(fā)行版發(fā)行于1991年。

2

湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計

Python通常應(yīng)用于各種領(lǐng)域,是一種通用語言,無論是從網(wǎng)站、

游戲開發(fā)、機(jī)器人,人工智能,大數(shù)據(jù),云計算或是一些高科技的航

天飛機(jī)控制都可以用到python語言。

Python是一種高級的編程語言,它的設(shè)計理念強(qiáng)調(diào)代碼的可讀性

和簡潔性。Python語言具有簡單、易學(xué)、功能強(qiáng)大等特點,被廣泛

應(yīng)用于各類軟件開發(fā)、數(shù)據(jù)分析和人工智能等領(lǐng)域。

Python語言的優(yōu)點在于其靈活性,可以勝任多種任務(wù)。Python支

持多種編程范式,包括面向?qū)ο?、結(jié)構(gòu)化、函數(shù)式編程等,因此在不

同場景下都可以使用Python來完成任務(wù)。

另外,Python社區(qū)十分活躍,有著龐大而豐富的第三方庫和工具,

可以讓開發(fā)者快速構(gòu)建應(yīng)用程序和解決問題。同時,Python的開源

性質(zhì)也為開發(fā)者們提供了更加廣泛的學(xué)習(xí)資源和交流機(jī)會。

總之,Python是一門優(yōu)秀的編程語言,它的簡單易學(xué)、靈活多樣

以及強(qiáng)大的第三方庫和工具使得它成為了眾多開發(fā)者的首選語言。而

且,Python語言正在逐步成為行業(yè)標(biāo)準(zhǔn),相信它會在未來的軟件開

發(fā)、數(shù)據(jù)分析和人工智能等領(lǐng)域中扮演越來越重要的角色。

1.2.2Tensorflow簡介

TensorFlow是由Google公司開發(fā)的一個用于機(jī)器學(xué)習(xí)和深度學(xué)

習(xí)的開源框架。它能夠自動推斷輸入數(shù)據(jù)的形狀,使得程序員可以更

加方便地設(shè)計神經(jīng)網(wǎng)絡(luò)和其他機(jī)器學(xué)習(xí)模型。

TensorFlow的主要特點是它提供了一個高度靈活、可擴(kuò)展的編程

接口,并且支持多種編程語言,包括Python、C++和Java等。這意

味著使用TensorFlow可以編寫各種類型的機(jī)器學(xué)習(xí)模型,從簡單的

線性回歸模型到復(fù)雜的深度神經(jīng)網(wǎng)絡(luò)。

另一個重要的特性是TensorFlow的計算圖,這是一種表示計算任

務(wù)的圖形結(jié)構(gòu)。在這個圖形中,節(jié)點表示操作,邊緣表示數(shù)據(jù)流動。

這種結(jié)構(gòu)使得TensorFlow能夠?qū)⒂嬎闳蝿?wù)分成多個小塊,從而實現(xiàn)

并行計算,大大提高了計算效率。

除此之外,TensorFlow還提供了許多額外的功能,例如自動微分、

分布式計算、模型優(yōu)化等。這些功能使得TensorFlow成為了當(dāng)今最

流行的機(jī)器學(xué)習(xí)框架之一,被廣泛地應(yīng)用于諸如計算機(jī)視覺、自然語

言處理、語音識別等領(lǐng)域。

3

湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計

總之,TensorFlow是一個強(qiáng)大的機(jī)器學(xué)習(xí)框架,它具有靈活、可

擴(kuò)展和高效的計算能力,是現(xiàn)代機(jī)器學(xué)習(xí)應(yīng)用不可或缺的工具之一。

1.2.3Python第三方庫簡介

Python是一種功能強(qiáng)大且易于學(xué)習(xí)的編程語言,由于其靈活性和

可擴(kuò)展性,成為了各行業(yè)的首選。在Python編程中,第三方庫是常

用的工具,它們可以幫助我們快速地完成任務(wù)并提高代碼效率

下面對幾個常用的Python第三方庫進(jìn)行簡單介紹:

NumPy是Python中最受歡迎的科學(xué)計算庫之一,主要用于處理大

型數(shù)組和矩陣運(yùn)算。NumPy還提供了許多有用的函數(shù)和工具,例如FFT、

線性代數(shù)、隨機(jī)數(shù)生成等。

Pandas是一個強(qiáng)大的數(shù)據(jù)分析庫,主要用于數(shù)據(jù)清洗、整合、轉(zhuǎn)

換和操作。它可以輕松地讀取、處理和分析各種格式的數(shù)據(jù),包括CSV、

Excel、SQL數(shù)據(jù)庫等。

Matplotlib是一個基于Python的繪圖庫,用于創(chuàng)建各種類型的

圖表、圖形和可視化工具。Matplotlib支持多種不同的繪圖樣式,

如折線圖、散點圖、條形圖等,并且可以根據(jù)需要進(jìn)行自定義修改。

Scikit-learn是一個廣泛使用的Python機(jī)器學(xué)習(xí)庫,提供了許

多流行的機(jī)器學(xué)習(xí)算法和模型,例如分類、回歸、聚類和降維等方法。

Scikit-learn還包括許多有用的工具,如數(shù)據(jù)預(yù)處理、特征選擇和

模型評估等。

BeautifulSoup是一個用于解析HTML和XML文檔的Python庫,

能夠幫助我們輕松地從網(wǎng)頁中提取需要的信息。它支持各種不同的解

析器,并且可以非常方便地遍歷和搜索文檔內(nèi)容。

總之,對于Python開發(fā)人員來說,掌握這些常用的第三方庫是至

關(guān)重要的。它們可以極大地提高編程效率、改善代碼質(zhì)量、加速開發(fā)

過程,并且為我們提供更豐富的可視化和數(shù)據(jù)分析工具。

2需求分析

2.1可行性分析

1.技術(shù)可行性

4

湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計

人工智能時尚標(biāo)簽系統(tǒng)技術(shù)是可行的。這種技術(shù)基于機(jī)器學(xué)習(xí)和

深度學(xué)習(xí)算法,可以幫助設(shè)計師、營銷人員和消費(fèi)者更好地理解和購

買時尚產(chǎn)品。該系統(tǒng)可以分析時尚產(chǎn)品的圖像、文本和其他信息,自

動為其添加標(biāo)簽,從而提高時尚產(chǎn)品的搜索可見性和銷售潛力。此外,

人工智能時尚標(biāo)簽系統(tǒng)技術(shù)還可以幫助消費(fèi)者查找與他們喜歡的時

尚款式、品牌和顏色相關(guān)的產(chǎn)品。因此,人工智能時尚標(biāo)簽系統(tǒng)技術(shù)

是非常有前途和實用的。

2.項目可行性

人工智能時尚標(biāo)簽系統(tǒng)技術(shù)可行性是可能的,因為現(xiàn)在已經(jīng)有許

多機(jī)器學(xué)習(xí)和深度學(xué)習(xí)算法,可以用來分析圖像、識別物體、人臉、

情緒等。這些算法可以幫助我們自動識別出衣物顏色、款式、搭配等

特征,生成衣物標(biāo)簽。同時,我們也可以使用自然語言處理技術(shù),將

這些標(biāo)簽轉(zhuǎn)化為易于理解的文字描述,從而實現(xiàn)對時尚的科學(xué)分類和

標(biāo)注。此外,我們還需要考慮如何對數(shù)據(jù)進(jìn)行處理、存儲和保護(hù),以

及如何優(yōu)化算法,提高系統(tǒng)的準(zhǔn)確性和效率。因此,總的來說,人工

智能時尚標(biāo)簽系統(tǒng)項目技術(shù)可行性較高。

2.2數(shù)據(jù)采集功能分析

2.2.1數(shù)據(jù)采集功能簡單分析

隨著互聯(lián)網(wǎng)的普及和信息化程度的提高,數(shù)據(jù)采集已經(jīng)成為了企

業(yè)運(yùn)營和決策中非常重要的一環(huán)。在數(shù)據(jù)采集過程中,Python作為

一種簡潔、高效的編程語言,具有廣泛的適用性和應(yīng)用場景。

Python的數(shù)據(jù)采集功能非常強(qiáng)大,可以通過多種方式實現(xiàn)數(shù)據(jù)的

采集、存儲和分析。首先,在網(wǎng)頁數(shù)據(jù)采集方面,Python有強(qiáng)大的

requests庫和beautifulsoup庫,可以爬取任意網(wǎng)站的數(shù)據(jù)并進(jìn)行

處理;其次,在數(shù)據(jù)存儲方面,Python可以通過MySQL、MongoDB等

數(shù)據(jù)庫進(jìn)行數(shù)據(jù)的存儲和管理;最后,在數(shù)據(jù)分析方面,Python還

具備pandas、numpy等強(qiáng)大的數(shù)據(jù)分析庫,可以對數(shù)據(jù)進(jìn)行統(tǒng)計分析

和可視化呈現(xiàn)。

Python的這些特點使得它在數(shù)據(jù)采集領(lǐng)域中有著廣泛的應(yīng)用場

景,如輿情監(jiān)測、價格監(jiān)測、競品分析等。以輿情監(jiān)測為例,通過

Python的數(shù)據(jù)采集功能,可以快速地搜集社交媒體、新聞報道等各

5

湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計

類信息,然后進(jìn)行文本分析、情感判斷等一系列操作,從而更好地把

握市場風(fēng)向和消費(fèi)者需求。

總之,Python作為一種高效、靈活的編程語言,在數(shù)據(jù)采集領(lǐng)域

中具有非常大的優(yōu)勢大的requests庫和beautifulsoup庫,可以爬

取任意網(wǎng)站的數(shù)據(jù)并進(jìn)行處理;其次,在數(shù)據(jù)存儲方面,Python可

以通過MySQL、MongoDB等數(shù)據(jù)庫進(jìn)行數(shù)據(jù)的存儲和管理;最后,在

數(shù)據(jù)分析方面,Python還具備pandas、numpy等強(qiáng)大的數(shù)據(jù)分析庫,

可以對數(shù)據(jù)進(jìn)行統(tǒng)計分析和可視化呈現(xiàn)。

Python的這些特點使得它在數(shù)據(jù)采集領(lǐng)域中有著廣泛的應(yīng)用場

景,如輿情監(jiān)測、價格監(jiān)測、競品分析等。以輿情監(jiān)測為例,通過

Python的數(shù)據(jù)采集功能,可以快速地搜集社交媒體、新聞報道等各

類信息,然后進(jìn)行文本分析、情感判斷等一系列操作,從而更好地把

握市場風(fēng)向和消費(fèi)者需求。

總之,Python作為一種高效、靈活的編程語言,在數(shù)據(jù)采集領(lǐng)域

中具有非常大的優(yōu)勢,可以從多個角度實現(xiàn)數(shù)據(jù)的采集、存儲和分析。

相信隨著技術(shù)的不斷發(fā)展,Python在數(shù)據(jù)采集領(lǐng)域中的應(yīng)用將會越

來越廣泛。

2.2.2torch技術(shù)分析

torch是一個開源的機(jī)器學(xué)習(xí)框架,它基于Lua編程語言,并且

提供了強(qiáng)大的GPU加速功能,可以幫助用戶快速地構(gòu)建和訓(xùn)練深度神

經(jīng)網(wǎng)絡(luò)模型。

torch的核心是Tensor,也就是多維數(shù)組,可以看作是NumPy的

擴(kuò)展。Torch還提供了一些高級模塊,如nn(神經(jīng)網(wǎng)絡(luò))、optim(優(yōu)

化器)和cudnn(CUDA加速庫),這些模塊可以幫助用戶更方便地構(gòu)

建和訓(xùn)練深度神經(jīng)網(wǎng)絡(luò)模型。

在使用Torch進(jìn)行技術(shù)分析時,可以使用其強(qiáng)大的GPU加速功能

來加速計算,從而更快地進(jìn)行模型訓(xùn)練和預(yù)測。同時,Torch提供了

一些常用的深度學(xué)習(xí)模型,如卷積神經(jīng)網(wǎng)絡(luò)(CNN)、循環(huán)神經(jīng)網(wǎng)絡(luò)

(RNN)和自編碼器(Autoencoder),可以根據(jù)不同的應(yīng)用場景選擇

合適的模型進(jìn)行分析。

除此之外,Torch還提供了一些可視化工具,如gnuplot和

visdom,可以幫助用戶更直觀地觀察模型的訓(xùn)練過程和結(jié)果。

6

湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計

2.2.3torchvision技術(shù)分析

Torchvision是PyTorch的一個子模塊,提供了一系列計算機(jī)視

覺操作的函數(shù)和類。它包括數(shù)據(jù)集、模型架構(gòu)、圖像轉(zhuǎn)換、評價指標(biāo)

等多個模塊。

其中,數(shù)據(jù)集模塊提供了許多常用的計算機(jī)視覺數(shù)據(jù)集,比如

MNIST、CIFAR10、COCO等,可以方便地進(jìn)行數(shù)據(jù)加載和預(yù)處理。模

型架構(gòu)模塊提供了許多經(jīng)典的計算機(jī)視覺模型,比如AlexNet、VGG、

ResNet等,可以直接調(diào)用和使用。圖像轉(zhuǎn)換模塊提供了一系列常用

的圖像增強(qiáng)操作,比如隨機(jī)裁剪、隨機(jī)旋轉(zhuǎn)、隨機(jī)翻轉(zhuǎn)等,可以用于

數(shù)據(jù)增強(qiáng)和模型訓(xùn)練。評價指標(biāo)模塊提供了一些常用的評價指標(biāo),比

如精度、召回率、F1值等,可以用于模型評估。

總的來說,Torchvision提供了很多方便實用的函數(shù)和類,可以

大大簡化計算機(jī)視覺任務(wù)的實現(xiàn)過程。

3數(shù)據(jù)集準(zhǔn)備

3.1數(shù)據(jù)采集

首先進(jìn)入MicrosoftEdge瀏覽器,找到搜索引擎并且搜索百度照

片,進(jìn)入官網(wǎng)輸入關(guān)鍵字:時尚服裝手繪圖片.

頁面如下:

圖3-1數(shù)據(jù)網(wǎng)址頁面圖

7

湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計

按F12調(diào)出開發(fā)者工具,刷新頁面,如圖3-2。利用全局搜索工

具定位所需數(shù)據(jù)位置,點擊開發(fā)者工具按Ctrl+f查找jpg圖片。

3.2數(shù)據(jù)集獲取分析

右鍵以后選擇檢查,調(diào)出網(wǎng)頁后臺,利用全局搜索工具中搜索關(guān)

鍵詞,如“衣服”、“褲子”,“裙子”等jpg或者png圖片位置鏈

接。接下來我們分析他是以什么形式的數(shù)據(jù)存放的。顯然這是一個

jpg或者png數(shù)據(jù)。

利用python爬蟲來獲取寵物的數(shù)據(jù)。

圖3-2獲取數(shù)據(jù)頁面

3.3了解Fashion-MNIST數(shù)據(jù)集

Fashion-MNIST數(shù)據(jù)集與MNIST手寫數(shù)字?jǐn)?shù)據(jù)集不一樣。但他們

都有共同點就是都是灰度圖片

頁面圖如下;

8

湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計

圖3-3Fashion-MNST數(shù)據(jù)集頁面

4數(shù)據(jù)可視化與數(shù)據(jù)集預(yù)處理

4.1數(shù)據(jù)預(yù)處理

數(shù)據(jù)預(yù)處理是數(shù)據(jù)分析和建模的重要步驟,它可以幫助我們提高

數(shù)據(jù)質(zhì)量,減少誤差和偏差,從而得到更準(zhǔn)確可靠的結(jié)果。以下是一

些常見的數(shù)據(jù)預(yù)處理方法及其用途:

1.缺失值填充:在原始數(shù)據(jù)中存在缺失值時,我們可以采用插

值、均值、中位數(shù)等方法填充缺失值,從而保證數(shù)據(jù)完整性。

2.異常值處理:在原始數(shù)據(jù)中存在異常值時,我們可以采用刪

除、替換等方法處理異常值,從而避免異常值對數(shù)據(jù)分析和建模的影

響。

3.數(shù)據(jù)變換:通過標(biāo)準(zhǔn)化、歸一化等方法將不同單位和范圍的

數(shù)據(jù)轉(zhuǎn)換成統(tǒng)一的標(biāo)準(zhǔn),從而方便后續(xù)的數(shù)據(jù)分析和建模。

4.數(shù)據(jù)降維:通過主成分分析、因子分析等方法將高維數(shù)據(jù)轉(zhuǎn)

換為低維數(shù)據(jù),從而簡化數(shù)據(jù)結(jié)構(gòu),減少計算復(fù)雜度,提高數(shù)據(jù)分析

和建模效率。

5.特征選擇:通過相關(guān)系數(shù)、卡方檢驗等方法篩選出與目標(biāo)變

9

湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計

量相關(guān)性較高的特征,從而提高模型的預(yù)測精度。

以上僅是數(shù)據(jù)預(yù)處理中一些常見的方法和用途,具體的數(shù)據(jù)預(yù)處

理方法應(yīng)根據(jù)實際情況選擇。在使用數(shù)據(jù)預(yù)處理方法時,需要注意保

證數(shù)據(jù)的準(zhǔn)確性和完整性,避免過度處理導(dǎo)致信息丟失或誤差增加。

4.2安裝相關(guān)庫

安裝matplotlibd2l庫對數(shù)據(jù)進(jìn)行處理操作,如下圖所示:

圖4-2安裝相關(guān)庫

注:d2l為斯坦福大學(xué)李沐教授打包的一個庫,其中包含一些深度學(xué)習(xí)中

常用的函數(shù)方法。

導(dǎo)入torch等等相關(guān)數(shù)據(jù)庫進(jìn)行處理操作,如圖所示:

圖4-2導(dǎo)入相關(guān)庫

4.3數(shù)據(jù)集可視化

Python是一種強(qiáng)大的編程語言,擁有豐富的數(shù)據(jù)處理和可視化庫。

下面是Python中常用的幾個數(shù)據(jù)可視化庫:

1.Matplotlib:Matplotlib是Python中最流行的繪圖庫之一,

支持繪制線圖、散點圖、柱狀圖、餅圖等多種圖表。

2.Seaborn:Seaborn是基于Matplotlib的高級可視化庫,可

以繪制出更加美觀和復(fù)雜的圖表。

3.Plotly:Plotly是一個交互式可視化庫,支持繪制動態(tài)圖表、

地圖、3D圖等。

10

湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計

4.Bokeh:Bokeh也是一個交互式可視化庫,與Plotly類似,

但是更加注重數(shù)據(jù)的交互性和實時性。

5.ggplot:ggplot是基于R語言中的ggplot2庫開發(fā)的Python

可視化庫,可以繪制出高度定制化的圖表。

以上這些可視化庫都有自己的特點和適用場景,具體使用哪個庫

取決于具體的需求。

可視化效果圖如下:

圖4-3可視化代碼圖

預(yù)測圖如下:

圖4-3可視化預(yù)測圖

11

湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計

5模型構(gòu)建及評估分析

5.1模網(wǎng)絡(luò)型結(jié)構(gòu)

5.1.1AlexNet網(wǎng)絡(luò)搭建

AlexNet是一個深度卷積神經(jīng)網(wǎng)絡(luò),由AlexKrizhevsky、

IlyaSutskever和GeoffreyHinton在2012年ImageNet圖像分

類挑戰(zhàn)中提出并獲得冠軍。它是第一個使用深度學(xué)習(xí)技術(shù)在大規(guī)模圖

像數(shù)據(jù)上取得成功的模型,也是深度學(xué)習(xí)領(lǐng)域的重要里程碑之一。

AlexNet的網(wǎng)絡(luò)結(jié)構(gòu)如下:輸入層:原始圖像尺寸為224x224x3。

第一層:卷積層,96個大小為11x11x3的卷積核,步長為4,無

補(bǔ)零操作,使用ReLU激活函數(shù)。

第二層:池化層,大小為3x3的最大池化操作,步長為2。

第三層:卷積層,256個大小為5x5x48的卷積核,步長為1,補(bǔ)

零操作,使用ReLU激活函數(shù)。

第四層:池化層,大小為3x3的最大池化操作,步長為2。

第五層:卷積層,384個大小為3x3x256的卷積核,步長為1,補(bǔ)

零操作,使用ReLU激活函數(shù)。

第六層:卷積層,384個大小為3x3x192的卷積核,步長為1,補(bǔ)

零操作,使用ReLU激活函數(shù)。

第七層:卷積層,256個大小為3x3x192的卷積核,步長為1,補(bǔ)

12

湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計

零操作,使用ReLU激活函數(shù)。

第八層:池化層,大小為3x3的最大池化操作,步長為2。

第九層:全連接層,4096個神經(jīng)元,使用ReLU激活函數(shù)。

第十層:全連接層,4096個神經(jīng)元,使用ReLU激活函數(shù)。

第十一層:輸出層,1000個神經(jīng)元,使用softmax激活函數(shù),對

應(yīng)ImageNet數(shù)據(jù)集的1000個類別。

AlexNet采用了多個卷積層和池化層交替堆疊的結(jié)構(gòu),同時使用

了ReLU激活函數(shù)、局部響應(yīng)歸一化等技術(shù),從而實現(xiàn)了較高的分類

準(zhǔn)確率。

AleNet網(wǎng)絡(luò)結(jié)構(gòu)代碼圖如下:

圖5-1.1AleNet網(wǎng)絡(luò)結(jié)構(gòu)代碼

5.1.2模型構(gòu)建

模型構(gòu)建是指利用已有的數(shù)據(jù)和統(tǒng)計學(xué)方法,通過建立數(shù)學(xué)模型

來描述數(shù)據(jù)之間的關(guān)系,并通過該模型對未知數(shù)據(jù)進(jìn)行預(yù)測或分類的

過程。一般而言,模型構(gòu)建包括以下步驟:

13

湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計

1.數(shù)據(jù)收集:收集與研究問題相關(guān)的數(shù)據(jù),這些數(shù)據(jù)可以來自

各種不同的渠道,例如實驗、調(diào)查、觀察等。

2.數(shù)據(jù)清洗和處理:對收集到的數(shù)據(jù)進(jìn)行清洗和處理,以消除

噪聲、缺失值和異常值等。

3.特征選擇和提?。簭奶幚砗蟮臄?shù)據(jù)中選取對于研究問題有用

的特征,并將其提取出來。

4.模型選擇:根據(jù)問題的特點和數(shù)據(jù)的性質(zhì)選擇適合的模型,

例如線性回歸、決策樹、神經(jīng)網(wǎng)絡(luò)等。

5.訓(xùn)練模型:使用已標(biāo)記的數(shù)據(jù)訓(xùn)練模型,使其能夠?qū)π碌臄?shù)

據(jù)進(jìn)行預(yù)測或分類。

6.模型評估:使用測試數(shù)據(jù)對訓(xùn)練好的模型進(jìn)行評估,以確定

其準(zhǔn)確性和泛化能力。

7.模型優(yōu)化:根據(jù)模型評估結(jié)果對模型進(jìn)行優(yōu)化,例如調(diào)整模

型參數(shù)、增加特征等。

8.模型應(yīng)用:將訓(xùn)練好的模型應(yīng)用于實際問題中,進(jìn)行預(yù)測或

分類等任務(wù)。

代碼如下:

圖5-1.2結(jié)構(gòu)模型代碼

14

湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計

5.2定義模型,預(yù)測數(shù)據(jù)

5.2.1服裝分類數(shù)據(jù)集

使用服裝分類數(shù)據(jù)集可以分為以下幾個步驟:

1.下載和導(dǎo)入數(shù)據(jù)集:可以從官方GitHub倉庫中下載數(shù)據(jù)集,

并使用相應(yīng)的庫將數(shù)據(jù)集導(dǎo)入到代碼中。

2.數(shù)據(jù)預(yù)處理:對數(shù)據(jù)進(jìn)行預(yù)處理,如歸一化、標(biāo)準(zhǔn)化、圖像

增強(qiáng)等,以便更好地訓(xùn)練模型。

3.構(gòu)建模型:選擇適當(dāng)?shù)哪P徒Y(jié)構(gòu)和參數(shù),并使用訓(xùn)練集對模

型進(jìn)行訓(xùn)練。

4.模型評估:使用測試集對模型進(jìn)行評估,計算模型的精度、

召回率、F1值等指標(biāo)。

5.模型優(yōu)化:根據(jù)評估結(jié)果,對模型進(jìn)行優(yōu)化,如調(diào)整超參數(shù)、

增加正則化項等。

6.模型應(yīng)用:使用訓(xùn)練好的模型對新數(shù)據(jù)進(jìn)行分類預(yù)測,實現(xiàn)

圖像分類應(yīng)用。

在實際操作中,還需要注意數(shù)據(jù)集的劃分、批量處理、迭代次數(shù)

等問題,以獲得更好的訓(xùn)練效果。同時,也需要注意防止模型過擬合

和欠擬合的問題,可以通過調(diào)整超參數(shù)和增加正則化項等方法來解決。

圖5-2.1優(yōu)化器設(shè)置

15

湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計

5.2.2損失函數(shù)設(shè)置

損失函數(shù)是深度學(xué)習(xí)模型中非常重要的一部分,用于評估模型輸

出與真實標(biāo)簽之間的差異。不同的任務(wù)和模型可能需要使用不同的損

失函數(shù)。以下是幾種常見的損失函數(shù):

1.交叉熵?fù)p失函數(shù):交叉熵是分類問題中常用的損失函數(shù),可

以衡量模型輸出的概率分布與真實標(biāo)簽之間的差異。通常情況下,交

叉熵?fù)p失函數(shù)可以與softmax激活函數(shù)配合使用,用于多類別分類問

題。

2.均方誤差損失函數(shù):均方誤差是回歸問題中常用的損失函數(shù),

可以衡量模型預(yù)測值與真實值之間的差異。均方誤差損失函數(shù)可以用

于預(yù)測連續(xù)值的回歸問題。

3.二元交叉熵?fù)p失函數(shù):二元交叉熵是二分類問題中常用的損

失函數(shù),可以衡量模型輸出的概率分布與真實標(biāo)簽之間的差異。通常

情況下,二元交叉熵?fù)p失函數(shù)可以與sigmoid激活函數(shù)配合使用。

4.KL散度損失函數(shù):KL散度是一種衡量兩個概率分布之間差異

的度量方法,可以用于模型訓(xùn)練過程中的正則化。KL散度損失函數(shù)

可以用于對模型輸出的概率分布進(jìn)行調(diào)整,以使得模型更加平滑和穩(wěn)

定。

在設(shè)置損失函數(shù)時,需要根據(jù)具體問題和模型結(jié)構(gòu)進(jìn)行選擇和調(diào)

整。同時,還需要注意防止模型過擬合和欠擬合的問題,可以通過調(diào)

整超參數(shù)和增加正則化項等方法來解決。

5.2.3訓(xùn)練模型

訓(xùn)練模型是指使用給定的數(shù)據(jù)集,通過迭代優(yōu)化模型參數(shù),使得

模型能夠更好地擬合數(shù)據(jù)集中的樣本,并達(dá)到更好的預(yù)測效果。在深

度學(xué)習(xí)中,訓(xùn)練模型通常使用反向傳播算法,根據(jù)模型輸出與真實標(biāo)

簽之間的差異,計算損失函數(shù)并更新模型參數(shù)。

16

湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計

圖5-2.3訓(xùn)練模型

5.2.4定義動態(tài)學(xué)習(xí)率

動態(tài)學(xué)習(xí)率是指在訓(xùn)練神經(jīng)網(wǎng)絡(luò)時,根據(jù)模型在訓(xùn)練過程中的表

現(xiàn)調(diào)整學(xué)習(xí)率的技術(shù)。通常情況下,學(xué)習(xí)率越大,模型的收斂速度就

越快。但是,如果學(xué)習(xí)率過大,可能會導(dǎo)致模型在訓(xùn)練過程中出現(xiàn)震

蕩或無法收斂的情況。因此,動態(tài)學(xué)習(xí)率可以根據(jù)模型在訓(xùn)練過程中

的表現(xiàn)來自適應(yīng)地調(diào)整學(xué)習(xí)率,以提高模型的訓(xùn)練效果和準(zhǔn)確性。常

用的動態(tài)學(xué)習(xí)率算法有Adagrad、Adam等。

圖5-2.4定義動態(tài)學(xué)習(xí)率

17

湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計

5.2.5如何設(shè)置batch_size值

batch_size是指每次迭代中使用的樣本數(shù)量,它是深度學(xué)習(xí)模型

訓(xùn)練中的一個重要參數(shù)。batch_size的大小直接影響訓(xùn)練時間和內(nèi)

存使用情況,同時也會影響模型的性能和泛化能力。

在設(shè)置batch_size時,需要根據(jù)具體問題和數(shù)據(jù)集進(jìn)行適當(dāng)調(diào)整,

一般可以從以下幾個方面考慮:

1.計算資源:batch_size的大小會影響計算資源的使用情況,過

大的batch_size可能會導(dǎo)致內(nèi)存不足或計算速度變慢。因此,在選

擇batch_size時需要考慮計算資源的限制。

2.數(shù)據(jù)集規(guī)模:數(shù)據(jù)集規(guī)模越大,一般可以選擇較大的

batch_size,以加快訓(xùn)練速度。但是,如果batch_size過大,可能

會導(dǎo)致模型無法收斂或者出現(xiàn)過擬合等問題。

3.模型復(fù)雜度:模型復(fù)雜度越高,一般需要選擇較小的

batch_size,以避免出現(xiàn)過擬合等問題。

4.確定最佳值:一般可以通過嘗試不同的batch_size值來確定最

佳值??梢允褂镁W(wǎng)格搜索或隨機(jī)搜索等方法,尋找最佳的batch_size

值。

5.3成品展示

5.3.1前端界面設(shè)計

Python前端界面設(shè)計可以使用多種工具和框架,以下是其中幾

個比較常用的:

18

湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計

1.Tkinter:Tkinter是Python自帶的GUI庫,可以快速構(gòu)建簡

單的窗口應(yīng)用程序。它易于學(xué)習(xí)且功能齊全,可以滿足大部分簡單的

界面需求。

2.PyQt:PyQt是Python的一個GUI工具包,它是基于Qt框架開

發(fā)的,提供了豐富的控件和樣式,支持跨平臺運(yùn)行,并且有很好的文

檔和社區(qū)支持,但是需要安裝額外的庫。

3.wxPython:wxPython是一個開源的GUI工具包,使用Python

語言進(jìn)行開發(fā),它基于wxWidgets庫,支持跨平臺運(yùn)行,提供了多種

控件和樣式,并且有完善的文檔和社區(qū)支持。

4.PySide:PySide是一個Python綁定Qt庫的GUI工具包,與PyQt

類似,但是PySide完全開源,可以免費(fèi)使用,并且有良好的文檔和

社區(qū)支持。

在使用以上工具和框架時,可以參考官方文檔和示例代碼,根據(jù)

項目需求選擇合適的工具和框架,并結(jié)合前端界面設(shè)計的要點進(jìn)行設(shè)

計和開發(fā)。

圖5-3.1前端界面展示

5.3.2作品展示

本設(shè)計方法通過AleNet模型,在通過圖片進(jìn)行篩選出你所需要

19

湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計

的圖片而進(jìn)行標(biāo)注

以下是效果

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論