




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計
目錄
1引言............................................................................................................................1
1.1項目背景......................................................................................................1
1.2開發(fā)環(huán)境與工具簡介..................................................................................2
1.2.1Python簡介..........................................................................................2
1.2.2Tensorflow簡介..................................................................................3
1.2.3Python第三方庫簡介..........................................................................4
2需求分析....................................................................................................................4
2.1可行性分析..................................................................................................4
2.2數(shù)據(jù)采集功能分析......................................................................................5
2.2.1數(shù)據(jù)采集功能簡單分析.......................................................................5
2.2.2torch技術(shù)分析....................................................................................6
2.2.3torchvision技術(shù)分析........................................................................7
3數(shù)據(jù)集準(zhǔn)備................................................................................................................7
3.1數(shù)據(jù)采集......................................................................................................7
3.2數(shù)據(jù)集獲取分析..........................................................................................8
3.3了解Fashion-MNIST數(shù)據(jù)集......................................................................8
4數(shù)據(jù)可視化與數(shù)據(jù)集預(yù)處理....................................................................................9
4.1數(shù)據(jù)預(yù)處理..................................................................................................9
4.2安裝相關(guān)庫................................................................................................10
4.3數(shù)據(jù)集可視化............................................................................................10
5模型構(gòu)建及評估分析..............................................................................................12
5.1模網(wǎng)絡(luò)型結(jié)構(gòu)............................................................................................12
5.1.1AlexNet網(wǎng)絡(luò)搭建..............................................................................12
5.1.2模型構(gòu)建.............................................................................................13
5.2定義模型,預(yù)測數(shù)據(jù)................................................................................15
I
湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計
5.2.1服裝分類數(shù)據(jù)集.................................................................................15
5.2.2損失函數(shù)設(shè)置.....................................................................................16
5.2.3訓(xùn)練模型.............................................................................................16
5.2.4定義動態(tài)學(xué)習(xí)率.................................................................................17
5.2.5如何設(shè)置batch_size值...................................................................18
5.3成品展示....................................................................................................18
5.3.1前端界面設(shè)計.....................................................................................18
5.3.2作品展示.............................................................................................19
6小結(jié)..........................................................................................................................21
參考資料.........................................................................................................................23
II
湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計
基于深度學(xué)習(xí)AlexNet模型的時尚標(biāo)簽設(shè)計方法
1引言
互聯(lián)網(wǎng)是20世紀(jì)末至21世紀(jì)初人類社會最具影響力的技術(shù)革命
之一,其突出的特點是信息共享和數(shù)字化交流,改變了人們的生活和
工作方式,對社會和經(jīng)濟(jì)的發(fā)展帶來了深刻的影響。然而,隨著技術(shù)
的不斷發(fā)展和應(yīng)用,互聯(lián)網(wǎng)的形態(tài)和功能也在不斷變化,未來互聯(lián)網(wǎng)
將面臨更多的挑戰(zhàn)和機(jī)遇。本文將探討未來互聯(lián)網(wǎng)的發(fā)展趨勢,包括
技術(shù)發(fā)展趨勢、應(yīng)用領(lǐng)域拓展、安全與隱私保護(hù)、數(shù)字化轉(zhuǎn)型以及產(chǎn)
業(yè)變革等方面。
隨著時尚行業(yè)的不斷發(fā)展,消費(fèi)者對于時尚產(chǎn)品的需求也越來越
高。然而,當(dāng)前市面上存在大量的時尚產(chǎn)品,消費(fèi)者往往難以準(zhǔn)確地
了解每個產(chǎn)品的種類和特點,從而帶來了購買體驗的不便。
為了解決這一問題,我們設(shè)計了一款基于alexnet模型的時尚標(biāo)
簽識別系統(tǒng)。該系統(tǒng)將利用深度學(xué)習(xí)技術(shù),對數(shù)千張時尚圖片進(jìn)行訓(xùn)
練,并且能夠快速、準(zhǔn)確地識別各種時尚品類。
該系統(tǒng)采用了AlexNet深度神經(jīng)網(wǎng)絡(luò)模型,該模型在2012年
ImageNet競賽中獲得了當(dāng)時最高的準(zhǔn)確率。通過使用該模型,我們
可以有效地降低時尚圖片的識別誤差率,提高系統(tǒng)的整體性能。
此外,我們還將引入大規(guī)模數(shù)據(jù)集來進(jìn)行模型訓(xùn)練。我們相信,
這將有助于提高模型的魯棒性,并且能夠更好地滿足用戶的需求。
總之,我們的時尚標(biāo)簽識別系統(tǒng)將為消費(fèi)者提供更好的購物體驗,
并且有望成為時尚行業(yè)的一款重要工具。我們非常期待看到這個系統(tǒng)
在未來得到更廣泛的應(yīng)用。
1.1項目背景
隨著科學(xué)技術(shù)的發(fā)展,信息化水平逐步提升,人們生活質(zhì)量逐步
的提高,每天能吃飽的前提而心靈和精神的需求也隨之而不斷提高,
人們對“時尚”這個詞語不斷的完善和認(rèn)識,在不同的場所更加注重
自己的形象和打扮。
在這個信息高速發(fā)展的時代,懶人經(jīng)濟(jì)將是以后發(fā)展的主流之一
而如果只通過自己的眼睛來觀察“時尚”是一個比較麻煩、繁雜的所
1
湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計
以不適合以后的懶人經(jīng)濟(jì)。就例如因此,我們可以通過大數(shù)據(jù)、來篩
選每個人對自己“時尚”領(lǐng)域的理解。
近年來,隨著時尚行業(yè)的迅速發(fā)展和消費(fèi)者需求的不斷提高,時
尚標(biāo)簽識別系統(tǒng)在服裝設(shè)計和市場營銷領(lǐng)域中扮演著越來越重要的
角色。alenet模型是一種基于人工智能技術(shù)的高效、準(zhǔn)確的時尚標(biāo)
簽識別系統(tǒng)。而本文所述的“alenet模型的時尚標(biāo)簽識別系統(tǒng)設(shè)計
項目背景”將介紹該項目的相關(guān)情況。
該項目旨在開發(fā)一種有效的時尚標(biāo)簽識別系統(tǒng),可以幫助服裝設(shè)
計師、生產(chǎn)企業(yè)和銷售商更加精準(zhǔn)地了解市場需求,滿足消費(fèi)者的個
性化需求。同時,該系統(tǒng)也可以為消費(fèi)者提供更好的購物體驗和更加
豐富多樣的時尚選擇。
為了實現(xiàn)這一目標(biāo),該項目團(tuán)隊結(jié)合了深度學(xué)習(xí)、計算機(jī)視覺和
自然語言處理等技術(shù),構(gòu)建了一個完整的時尚標(biāo)簽識別系統(tǒng)。該系統(tǒng)
通過分析衣服的圖片和描述信息,能夠識別出其款式、材質(zhì)、風(fēng)格、
顏色等多個方面的標(biāo)簽,并將這些標(biāo)簽與用戶的喜好進(jìn)行匹配,從而
提供個性化的推薦和購物建議。
除此之外,該系統(tǒng)還具備快速、準(zhǔn)確的搜索功能,用戶可以通過
輸入關(guān)鍵詞或上傳圖片等方式,快速找到所需的商品和相關(guān)信息。同
時,該系統(tǒng)還提供了數(shù)據(jù)分析和預(yù)測功能,可以幫助企業(yè)了解市場趨
勢、預(yù)測銷售情況,從而做出更加科學(xué)合理的決策。
總的來說,alenet模型的時尚標(biāo)簽識別系統(tǒng)設(shè)計項目背景重點在
于結(jié)合人工智能技術(shù)和時尚行業(yè)實際需求,構(gòu)建一個高效、準(zhǔn)確、個
性化的時尚標(biāo)簽識別系統(tǒng),為服裝設(shè)計和市場營銷領(lǐng)域的發(fā)展提供有
力支持。
1.2開發(fā)環(huán)境與工具簡介
1.2.1Python簡介
Python是一種面向?qū)ο蟮慕忉屝陀嬎銠C(jī)程序設(shè)計語言,由荷蘭人
GuidovanRossum于1989年發(fā)明,第一個公開發(fā)行版發(fā)行于1991年。
2
湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計
Python通常應(yīng)用于各種領(lǐng)域,是一種通用語言,無論是從網(wǎng)站、
游戲開發(fā)、機(jī)器人,人工智能,大數(shù)據(jù),云計算或是一些高科技的航
天飛機(jī)控制都可以用到python語言。
Python是一種高級的編程語言,它的設(shè)計理念強(qiáng)調(diào)代碼的可讀性
和簡潔性。Python語言具有簡單、易學(xué)、功能強(qiáng)大等特點,被廣泛
應(yīng)用于各類軟件開發(fā)、數(shù)據(jù)分析和人工智能等領(lǐng)域。
Python語言的優(yōu)點在于其靈活性,可以勝任多種任務(wù)。Python支
持多種編程范式,包括面向?qū)ο?、結(jié)構(gòu)化、函數(shù)式編程等,因此在不
同場景下都可以使用Python來完成任務(wù)。
另外,Python社區(qū)十分活躍,有著龐大而豐富的第三方庫和工具,
可以讓開發(fā)者快速構(gòu)建應(yīng)用程序和解決問題。同時,Python的開源
性質(zhì)也為開發(fā)者們提供了更加廣泛的學(xué)習(xí)資源和交流機(jī)會。
總之,Python是一門優(yōu)秀的編程語言,它的簡單易學(xué)、靈活多樣
以及強(qiáng)大的第三方庫和工具使得它成為了眾多開發(fā)者的首選語言。而
且,Python語言正在逐步成為行業(yè)標(biāo)準(zhǔn),相信它會在未來的軟件開
發(fā)、數(shù)據(jù)分析和人工智能等領(lǐng)域中扮演越來越重要的角色。
1.2.2Tensorflow簡介
TensorFlow是由Google公司開發(fā)的一個用于機(jī)器學(xué)習(xí)和深度學(xué)
習(xí)的開源框架。它能夠自動推斷輸入數(shù)據(jù)的形狀,使得程序員可以更
加方便地設(shè)計神經(jīng)網(wǎng)絡(luò)和其他機(jī)器學(xué)習(xí)模型。
TensorFlow的主要特點是它提供了一個高度靈活、可擴(kuò)展的編程
接口,并且支持多種編程語言,包括Python、C++和Java等。這意
味著使用TensorFlow可以編寫各種類型的機(jī)器學(xué)習(xí)模型,從簡單的
線性回歸模型到復(fù)雜的深度神經(jīng)網(wǎng)絡(luò)。
另一個重要的特性是TensorFlow的計算圖,這是一種表示計算任
務(wù)的圖形結(jié)構(gòu)。在這個圖形中,節(jié)點表示操作,邊緣表示數(shù)據(jù)流動。
這種結(jié)構(gòu)使得TensorFlow能夠?qū)⒂嬎闳蝿?wù)分成多個小塊,從而實現(xiàn)
并行計算,大大提高了計算效率。
除此之外,TensorFlow還提供了許多額外的功能,例如自動微分、
分布式計算、模型優(yōu)化等。這些功能使得TensorFlow成為了當(dāng)今最
流行的機(jī)器學(xué)習(xí)框架之一,被廣泛地應(yīng)用于諸如計算機(jī)視覺、自然語
言處理、語音識別等領(lǐng)域。
3
湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計
總之,TensorFlow是一個強(qiáng)大的機(jī)器學(xué)習(xí)框架,它具有靈活、可
擴(kuò)展和高效的計算能力,是現(xiàn)代機(jī)器學(xué)習(xí)應(yīng)用不可或缺的工具之一。
1.2.3Python第三方庫簡介
Python是一種功能強(qiáng)大且易于學(xué)習(xí)的編程語言,由于其靈活性和
可擴(kuò)展性,成為了各行業(yè)的首選。在Python編程中,第三方庫是常
用的工具,它們可以幫助我們快速地完成任務(wù)并提高代碼效率
下面對幾個常用的Python第三方庫進(jìn)行簡單介紹:
NumPy是Python中最受歡迎的科學(xué)計算庫之一,主要用于處理大
型數(shù)組和矩陣運(yùn)算。NumPy還提供了許多有用的函數(shù)和工具,例如FFT、
線性代數(shù)、隨機(jī)數(shù)生成等。
Pandas是一個強(qiáng)大的數(shù)據(jù)分析庫,主要用于數(shù)據(jù)清洗、整合、轉(zhuǎn)
換和操作。它可以輕松地讀取、處理和分析各種格式的數(shù)據(jù),包括CSV、
Excel、SQL數(shù)據(jù)庫等。
Matplotlib是一個基于Python的繪圖庫,用于創(chuàng)建各種類型的
圖表、圖形和可視化工具。Matplotlib支持多種不同的繪圖樣式,
如折線圖、散點圖、條形圖等,并且可以根據(jù)需要進(jìn)行自定義修改。
Scikit-learn是一個廣泛使用的Python機(jī)器學(xué)習(xí)庫,提供了許
多流行的機(jī)器學(xué)習(xí)算法和模型,例如分類、回歸、聚類和降維等方法。
Scikit-learn還包括許多有用的工具,如數(shù)據(jù)預(yù)處理、特征選擇和
模型評估等。
BeautifulSoup是一個用于解析HTML和XML文檔的Python庫,
能夠幫助我們輕松地從網(wǎng)頁中提取需要的信息。它支持各種不同的解
析器,并且可以非常方便地遍歷和搜索文檔內(nèi)容。
總之,對于Python開發(fā)人員來說,掌握這些常用的第三方庫是至
關(guān)重要的。它們可以極大地提高編程效率、改善代碼質(zhì)量、加速開發(fā)
過程,并且為我們提供更豐富的可視化和數(shù)據(jù)分析工具。
2需求分析
2.1可行性分析
1.技術(shù)可行性
4
湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計
人工智能時尚標(biāo)簽系統(tǒng)技術(shù)是可行的。這種技術(shù)基于機(jī)器學(xué)習(xí)和
深度學(xué)習(xí)算法,可以幫助設(shè)計師、營銷人員和消費(fèi)者更好地理解和購
買時尚產(chǎn)品。該系統(tǒng)可以分析時尚產(chǎn)品的圖像、文本和其他信息,自
動為其添加標(biāo)簽,從而提高時尚產(chǎn)品的搜索可見性和銷售潛力。此外,
人工智能時尚標(biāo)簽系統(tǒng)技術(shù)還可以幫助消費(fèi)者查找與他們喜歡的時
尚款式、品牌和顏色相關(guān)的產(chǎn)品。因此,人工智能時尚標(biāo)簽系統(tǒng)技術(shù)
是非常有前途和實用的。
2.項目可行性
人工智能時尚標(biāo)簽系統(tǒng)技術(shù)可行性是可能的,因為現(xiàn)在已經(jīng)有許
多機(jī)器學(xué)習(xí)和深度學(xué)習(xí)算法,可以用來分析圖像、識別物體、人臉、
情緒等。這些算法可以幫助我們自動識別出衣物顏色、款式、搭配等
特征,生成衣物標(biāo)簽。同時,我們也可以使用自然語言處理技術(shù),將
這些標(biāo)簽轉(zhuǎn)化為易于理解的文字描述,從而實現(xiàn)對時尚的科學(xué)分類和
標(biāo)注。此外,我們還需要考慮如何對數(shù)據(jù)進(jìn)行處理、存儲和保護(hù),以
及如何優(yōu)化算法,提高系統(tǒng)的準(zhǔn)確性和效率。因此,總的來說,人工
智能時尚標(biāo)簽系統(tǒng)項目技術(shù)可行性較高。
2.2數(shù)據(jù)采集功能分析
2.2.1數(shù)據(jù)采集功能簡單分析
隨著互聯(lián)網(wǎng)的普及和信息化程度的提高,數(shù)據(jù)采集已經(jīng)成為了企
業(yè)運(yùn)營和決策中非常重要的一環(huán)。在數(shù)據(jù)采集過程中,Python作為
一種簡潔、高效的編程語言,具有廣泛的適用性和應(yīng)用場景。
Python的數(shù)據(jù)采集功能非常強(qiáng)大,可以通過多種方式實現(xiàn)數(shù)據(jù)的
采集、存儲和分析。首先,在網(wǎng)頁數(shù)據(jù)采集方面,Python有強(qiáng)大的
requests庫和beautifulsoup庫,可以爬取任意網(wǎng)站的數(shù)據(jù)并進(jìn)行
處理;其次,在數(shù)據(jù)存儲方面,Python可以通過MySQL、MongoDB等
數(shù)據(jù)庫進(jìn)行數(shù)據(jù)的存儲和管理;最后,在數(shù)據(jù)分析方面,Python還
具備pandas、numpy等強(qiáng)大的數(shù)據(jù)分析庫,可以對數(shù)據(jù)進(jìn)行統(tǒng)計分析
和可視化呈現(xiàn)。
Python的這些特點使得它在數(shù)據(jù)采集領(lǐng)域中有著廣泛的應(yīng)用場
景,如輿情監(jiān)測、價格監(jiān)測、競品分析等。以輿情監(jiān)測為例,通過
Python的數(shù)據(jù)采集功能,可以快速地搜集社交媒體、新聞報道等各
5
湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計
類信息,然后進(jìn)行文本分析、情感判斷等一系列操作,從而更好地把
握市場風(fēng)向和消費(fèi)者需求。
總之,Python作為一種高效、靈活的編程語言,在數(shù)據(jù)采集領(lǐng)域
中具有非常大的優(yōu)勢大的requests庫和beautifulsoup庫,可以爬
取任意網(wǎng)站的數(shù)據(jù)并進(jìn)行處理;其次,在數(shù)據(jù)存儲方面,Python可
以通過MySQL、MongoDB等數(shù)據(jù)庫進(jìn)行數(shù)據(jù)的存儲和管理;最后,在
數(shù)據(jù)分析方面,Python還具備pandas、numpy等強(qiáng)大的數(shù)據(jù)分析庫,
可以對數(shù)據(jù)進(jìn)行統(tǒng)計分析和可視化呈現(xiàn)。
Python的這些特點使得它在數(shù)據(jù)采集領(lǐng)域中有著廣泛的應(yīng)用場
景,如輿情監(jiān)測、價格監(jiān)測、競品分析等。以輿情監(jiān)測為例,通過
Python的數(shù)據(jù)采集功能,可以快速地搜集社交媒體、新聞報道等各
類信息,然后進(jìn)行文本分析、情感判斷等一系列操作,從而更好地把
握市場風(fēng)向和消費(fèi)者需求。
總之,Python作為一種高效、靈活的編程語言,在數(shù)據(jù)采集領(lǐng)域
中具有非常大的優(yōu)勢,可以從多個角度實現(xiàn)數(shù)據(jù)的采集、存儲和分析。
相信隨著技術(shù)的不斷發(fā)展,Python在數(shù)據(jù)采集領(lǐng)域中的應(yīng)用將會越
來越廣泛。
2.2.2torch技術(shù)分析
torch是一個開源的機(jī)器學(xué)習(xí)框架,它基于Lua編程語言,并且
提供了強(qiáng)大的GPU加速功能,可以幫助用戶快速地構(gòu)建和訓(xùn)練深度神
經(jīng)網(wǎng)絡(luò)模型。
torch的核心是Tensor,也就是多維數(shù)組,可以看作是NumPy的
擴(kuò)展。Torch還提供了一些高級模塊,如nn(神經(jīng)網(wǎng)絡(luò))、optim(優(yōu)
化器)和cudnn(CUDA加速庫),這些模塊可以幫助用戶更方便地構(gòu)
建和訓(xùn)練深度神經(jīng)網(wǎng)絡(luò)模型。
在使用Torch進(jìn)行技術(shù)分析時,可以使用其強(qiáng)大的GPU加速功能
來加速計算,從而更快地進(jìn)行模型訓(xùn)練和預(yù)測。同時,Torch提供了
一些常用的深度學(xué)習(xí)模型,如卷積神經(jīng)網(wǎng)絡(luò)(CNN)、循環(huán)神經(jīng)網(wǎng)絡(luò)
(RNN)和自編碼器(Autoencoder),可以根據(jù)不同的應(yīng)用場景選擇
合適的模型進(jìn)行分析。
除此之外,Torch還提供了一些可視化工具,如gnuplot和
visdom,可以幫助用戶更直觀地觀察模型的訓(xùn)練過程和結(jié)果。
6
湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計
2.2.3torchvision技術(shù)分析
Torchvision是PyTorch的一個子模塊,提供了一系列計算機(jī)視
覺操作的函數(shù)和類。它包括數(shù)據(jù)集、模型架構(gòu)、圖像轉(zhuǎn)換、評價指標(biāo)
等多個模塊。
其中,數(shù)據(jù)集模塊提供了許多常用的計算機(jī)視覺數(shù)據(jù)集,比如
MNIST、CIFAR10、COCO等,可以方便地進(jìn)行數(shù)據(jù)加載和預(yù)處理。模
型架構(gòu)模塊提供了許多經(jīng)典的計算機(jī)視覺模型,比如AlexNet、VGG、
ResNet等,可以直接調(diào)用和使用。圖像轉(zhuǎn)換模塊提供了一系列常用
的圖像增強(qiáng)操作,比如隨機(jī)裁剪、隨機(jī)旋轉(zhuǎn)、隨機(jī)翻轉(zhuǎn)等,可以用于
數(shù)據(jù)增強(qiáng)和模型訓(xùn)練。評價指標(biāo)模塊提供了一些常用的評價指標(biāo),比
如精度、召回率、F1值等,可以用于模型評估。
總的來說,Torchvision提供了很多方便實用的函數(shù)和類,可以
大大簡化計算機(jī)視覺任務(wù)的實現(xiàn)過程。
3數(shù)據(jù)集準(zhǔn)備
3.1數(shù)據(jù)采集
首先進(jìn)入MicrosoftEdge瀏覽器,找到搜索引擎并且搜索百度照
片,進(jìn)入官網(wǎng)輸入關(guān)鍵字:時尚服裝手繪圖片.
頁面如下:
圖3-1數(shù)據(jù)網(wǎng)址頁面圖
7
湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計
按F12調(diào)出開發(fā)者工具,刷新頁面,如圖3-2。利用全局搜索工
具定位所需數(shù)據(jù)位置,點擊開發(fā)者工具按Ctrl+f查找jpg圖片。
3.2數(shù)據(jù)集獲取分析
右鍵以后選擇檢查,調(diào)出網(wǎng)頁后臺,利用全局搜索工具中搜索關(guān)
鍵詞,如“衣服”、“褲子”,“裙子”等jpg或者png圖片位置鏈
接。接下來我們分析他是以什么形式的數(shù)據(jù)存放的。顯然這是一個
jpg或者png數(shù)據(jù)。
利用python爬蟲來獲取寵物的數(shù)據(jù)。
圖3-2獲取數(shù)據(jù)頁面
3.3了解Fashion-MNIST數(shù)據(jù)集
Fashion-MNIST數(shù)據(jù)集與MNIST手寫數(shù)字?jǐn)?shù)據(jù)集不一樣。但他們
都有共同點就是都是灰度圖片
頁面圖如下;
8
湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計
圖3-3Fashion-MNST數(shù)據(jù)集頁面
4數(shù)據(jù)可視化與數(shù)據(jù)集預(yù)處理
4.1數(shù)據(jù)預(yù)處理
數(shù)據(jù)預(yù)處理是數(shù)據(jù)分析和建模的重要步驟,它可以幫助我們提高
數(shù)據(jù)質(zhì)量,減少誤差和偏差,從而得到更準(zhǔn)確可靠的結(jié)果。以下是一
些常見的數(shù)據(jù)預(yù)處理方法及其用途:
1.缺失值填充:在原始數(shù)據(jù)中存在缺失值時,我們可以采用插
值、均值、中位數(shù)等方法填充缺失值,從而保證數(shù)據(jù)完整性。
2.異常值處理:在原始數(shù)據(jù)中存在異常值時,我們可以采用刪
除、替換等方法處理異常值,從而避免異常值對數(shù)據(jù)分析和建模的影
響。
3.數(shù)據(jù)變換:通過標(biāo)準(zhǔn)化、歸一化等方法將不同單位和范圍的
數(shù)據(jù)轉(zhuǎn)換成統(tǒng)一的標(biāo)準(zhǔn),從而方便后續(xù)的數(shù)據(jù)分析和建模。
4.數(shù)據(jù)降維:通過主成分分析、因子分析等方法將高維數(shù)據(jù)轉(zhuǎn)
換為低維數(shù)據(jù),從而簡化數(shù)據(jù)結(jié)構(gòu),減少計算復(fù)雜度,提高數(shù)據(jù)分析
和建模效率。
5.特征選擇:通過相關(guān)系數(shù)、卡方檢驗等方法篩選出與目標(biāo)變
9
湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計
量相關(guān)性較高的特征,從而提高模型的預(yù)測精度。
以上僅是數(shù)據(jù)預(yù)處理中一些常見的方法和用途,具體的數(shù)據(jù)預(yù)處
理方法應(yīng)根據(jù)實際情況選擇。在使用數(shù)據(jù)預(yù)處理方法時,需要注意保
證數(shù)據(jù)的準(zhǔn)確性和完整性,避免過度處理導(dǎo)致信息丟失或誤差增加。
4.2安裝相關(guān)庫
安裝matplotlibd2l庫對數(shù)據(jù)進(jìn)行處理操作,如下圖所示:
圖4-2安裝相關(guān)庫
注:d2l為斯坦福大學(xué)李沐教授打包的一個庫,其中包含一些深度學(xué)習(xí)中
常用的函數(shù)方法。
導(dǎo)入torch等等相關(guān)數(shù)據(jù)庫進(jìn)行處理操作,如圖所示:
圖4-2導(dǎo)入相關(guān)庫
4.3數(shù)據(jù)集可視化
Python是一種強(qiáng)大的編程語言,擁有豐富的數(shù)據(jù)處理和可視化庫。
下面是Python中常用的幾個數(shù)據(jù)可視化庫:
1.Matplotlib:Matplotlib是Python中最流行的繪圖庫之一,
支持繪制線圖、散點圖、柱狀圖、餅圖等多種圖表。
2.Seaborn:Seaborn是基于Matplotlib的高級可視化庫,可
以繪制出更加美觀和復(fù)雜的圖表。
3.Plotly:Plotly是一個交互式可視化庫,支持繪制動態(tài)圖表、
地圖、3D圖等。
10
湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計
4.Bokeh:Bokeh也是一個交互式可視化庫,與Plotly類似,
但是更加注重數(shù)據(jù)的交互性和實時性。
5.ggplot:ggplot是基于R語言中的ggplot2庫開發(fā)的Python
可視化庫,可以繪制出高度定制化的圖表。
以上這些可視化庫都有自己的特點和適用場景,具體使用哪個庫
取決于具體的需求。
可視化效果圖如下:
圖4-3可視化代碼圖
預(yù)測圖如下:
圖4-3可視化預(yù)測圖
11
湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計
5模型構(gòu)建及評估分析
5.1模網(wǎng)絡(luò)型結(jié)構(gòu)
5.1.1AlexNet網(wǎng)絡(luò)搭建
AlexNet是一個深度卷積神經(jīng)網(wǎng)絡(luò),由AlexKrizhevsky、
IlyaSutskever和GeoffreyHinton在2012年ImageNet圖像分
類挑戰(zhàn)中提出并獲得冠軍。它是第一個使用深度學(xué)習(xí)技術(shù)在大規(guī)模圖
像數(shù)據(jù)上取得成功的模型,也是深度學(xué)習(xí)領(lǐng)域的重要里程碑之一。
AlexNet的網(wǎng)絡(luò)結(jié)構(gòu)如下:輸入層:原始圖像尺寸為224x224x3。
第一層:卷積層,96個大小為11x11x3的卷積核,步長為4,無
補(bǔ)零操作,使用ReLU激活函數(shù)。
第二層:池化層,大小為3x3的最大池化操作,步長為2。
第三層:卷積層,256個大小為5x5x48的卷積核,步長為1,補(bǔ)
零操作,使用ReLU激活函數(shù)。
第四層:池化層,大小為3x3的最大池化操作,步長為2。
第五層:卷積層,384個大小為3x3x256的卷積核,步長為1,補(bǔ)
零操作,使用ReLU激活函數(shù)。
第六層:卷積層,384個大小為3x3x192的卷積核,步長為1,補(bǔ)
零操作,使用ReLU激活函數(shù)。
第七層:卷積層,256個大小為3x3x192的卷積核,步長為1,補(bǔ)
12
湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計
零操作,使用ReLU激活函數(shù)。
第八層:池化層,大小為3x3的最大池化操作,步長為2。
第九層:全連接層,4096個神經(jīng)元,使用ReLU激活函數(shù)。
第十層:全連接層,4096個神經(jīng)元,使用ReLU激活函數(shù)。
第十一層:輸出層,1000個神經(jīng)元,使用softmax激活函數(shù),對
應(yīng)ImageNet數(shù)據(jù)集的1000個類別。
AlexNet采用了多個卷積層和池化層交替堆疊的結(jié)構(gòu),同時使用
了ReLU激活函數(shù)、局部響應(yīng)歸一化等技術(shù),從而實現(xiàn)了較高的分類
準(zhǔn)確率。
AleNet網(wǎng)絡(luò)結(jié)構(gòu)代碼圖如下:
圖5-1.1AleNet網(wǎng)絡(luò)結(jié)構(gòu)代碼
5.1.2模型構(gòu)建
模型構(gòu)建是指利用已有的數(shù)據(jù)和統(tǒng)計學(xué)方法,通過建立數(shù)學(xué)模型
來描述數(shù)據(jù)之間的關(guān)系,并通過該模型對未知數(shù)據(jù)進(jìn)行預(yù)測或分類的
過程。一般而言,模型構(gòu)建包括以下步驟:
13
湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計
1.數(shù)據(jù)收集:收集與研究問題相關(guān)的數(shù)據(jù),這些數(shù)據(jù)可以來自
各種不同的渠道,例如實驗、調(diào)查、觀察等。
2.數(shù)據(jù)清洗和處理:對收集到的數(shù)據(jù)進(jìn)行清洗和處理,以消除
噪聲、缺失值和異常值等。
3.特征選擇和提?。簭奶幚砗蟮臄?shù)據(jù)中選取對于研究問題有用
的特征,并將其提取出來。
4.模型選擇:根據(jù)問題的特點和數(shù)據(jù)的性質(zhì)選擇適合的模型,
例如線性回歸、決策樹、神經(jīng)網(wǎng)絡(luò)等。
5.訓(xùn)練模型:使用已標(biāo)記的數(shù)據(jù)訓(xùn)練模型,使其能夠?qū)π碌臄?shù)
據(jù)進(jìn)行預(yù)測或分類。
6.模型評估:使用測試數(shù)據(jù)對訓(xùn)練好的模型進(jìn)行評估,以確定
其準(zhǔn)確性和泛化能力。
7.模型優(yōu)化:根據(jù)模型評估結(jié)果對模型進(jìn)行優(yōu)化,例如調(diào)整模
型參數(shù)、增加特征等。
8.模型應(yīng)用:將訓(xùn)練好的模型應(yīng)用于實際問題中,進(jìn)行預(yù)測或
分類等任務(wù)。
代碼如下:
圖5-1.2結(jié)構(gòu)模型代碼
14
湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計
5.2定義模型,預(yù)測數(shù)據(jù)
5.2.1服裝分類數(shù)據(jù)集
使用服裝分類數(shù)據(jù)集可以分為以下幾個步驟:
1.下載和導(dǎo)入數(shù)據(jù)集:可以從官方GitHub倉庫中下載數(shù)據(jù)集,
并使用相應(yīng)的庫將數(shù)據(jù)集導(dǎo)入到代碼中。
2.數(shù)據(jù)預(yù)處理:對數(shù)據(jù)進(jìn)行預(yù)處理,如歸一化、標(biāo)準(zhǔn)化、圖像
增強(qiáng)等,以便更好地訓(xùn)練模型。
3.構(gòu)建模型:選擇適當(dāng)?shù)哪P徒Y(jié)構(gòu)和參數(shù),并使用訓(xùn)練集對模
型進(jìn)行訓(xùn)練。
4.模型評估:使用測試集對模型進(jìn)行評估,計算模型的精度、
召回率、F1值等指標(biāo)。
5.模型優(yōu)化:根據(jù)評估結(jié)果,對模型進(jìn)行優(yōu)化,如調(diào)整超參數(shù)、
增加正則化項等。
6.模型應(yīng)用:使用訓(xùn)練好的模型對新數(shù)據(jù)進(jìn)行分類預(yù)測,實現(xiàn)
圖像分類應(yīng)用。
在實際操作中,還需要注意數(shù)據(jù)集的劃分、批量處理、迭代次數(shù)
等問題,以獲得更好的訓(xùn)練效果。同時,也需要注意防止模型過擬合
和欠擬合的問題,可以通過調(diào)整超參數(shù)和增加正則化項等方法來解決。
圖5-2.1優(yōu)化器設(shè)置
15
湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計
5.2.2損失函數(shù)設(shè)置
損失函數(shù)是深度學(xué)習(xí)模型中非常重要的一部分,用于評估模型輸
出與真實標(biāo)簽之間的差異。不同的任務(wù)和模型可能需要使用不同的損
失函數(shù)。以下是幾種常見的損失函數(shù):
1.交叉熵?fù)p失函數(shù):交叉熵是分類問題中常用的損失函數(shù),可
以衡量模型輸出的概率分布與真實標(biāo)簽之間的差異。通常情況下,交
叉熵?fù)p失函數(shù)可以與softmax激活函數(shù)配合使用,用于多類別分類問
題。
2.均方誤差損失函數(shù):均方誤差是回歸問題中常用的損失函數(shù),
可以衡量模型預(yù)測值與真實值之間的差異。均方誤差損失函數(shù)可以用
于預(yù)測連續(xù)值的回歸問題。
3.二元交叉熵?fù)p失函數(shù):二元交叉熵是二分類問題中常用的損
失函數(shù),可以衡量模型輸出的概率分布與真實標(biāo)簽之間的差異。通常
情況下,二元交叉熵?fù)p失函數(shù)可以與sigmoid激活函數(shù)配合使用。
4.KL散度損失函數(shù):KL散度是一種衡量兩個概率分布之間差異
的度量方法,可以用于模型訓(xùn)練過程中的正則化。KL散度損失函數(shù)
可以用于對模型輸出的概率分布進(jìn)行調(diào)整,以使得模型更加平滑和穩(wěn)
定。
在設(shè)置損失函數(shù)時,需要根據(jù)具體問題和模型結(jié)構(gòu)進(jìn)行選擇和調(diào)
整。同時,還需要注意防止模型過擬合和欠擬合的問題,可以通過調(diào)
整超參數(shù)和增加正則化項等方法來解決。
5.2.3訓(xùn)練模型
訓(xùn)練模型是指使用給定的數(shù)據(jù)集,通過迭代優(yōu)化模型參數(shù),使得
模型能夠更好地擬合數(shù)據(jù)集中的樣本,并達(dá)到更好的預(yù)測效果。在深
度學(xué)習(xí)中,訓(xùn)練模型通常使用反向傳播算法,根據(jù)模型輸出與真實標(biāo)
簽之間的差異,計算損失函數(shù)并更新模型參數(shù)。
16
湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計
圖5-2.3訓(xùn)練模型
5.2.4定義動態(tài)學(xué)習(xí)率
動態(tài)學(xué)習(xí)率是指在訓(xùn)練神經(jīng)網(wǎng)絡(luò)時,根據(jù)模型在訓(xùn)練過程中的表
現(xiàn)調(diào)整學(xué)習(xí)率的技術(shù)。通常情況下,學(xué)習(xí)率越大,模型的收斂速度就
越快。但是,如果學(xué)習(xí)率過大,可能會導(dǎo)致模型在訓(xùn)練過程中出現(xiàn)震
蕩或無法收斂的情況。因此,動態(tài)學(xué)習(xí)率可以根據(jù)模型在訓(xùn)練過程中
的表現(xiàn)來自適應(yīng)地調(diào)整學(xué)習(xí)率,以提高模型的訓(xùn)練效果和準(zhǔn)確性。常
用的動態(tài)學(xué)習(xí)率算法有Adagrad、Adam等。
圖5-2.4定義動態(tài)學(xué)習(xí)率
17
湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計
5.2.5如何設(shè)置batch_size值
batch_size是指每次迭代中使用的樣本數(shù)量,它是深度學(xué)習(xí)模型
訓(xùn)練中的一個重要參數(shù)。batch_size的大小直接影響訓(xùn)練時間和內(nèi)
存使用情況,同時也會影響模型的性能和泛化能力。
在設(shè)置batch_size時,需要根據(jù)具體問題和數(shù)據(jù)集進(jìn)行適當(dāng)調(diào)整,
一般可以從以下幾個方面考慮:
1.計算資源:batch_size的大小會影響計算資源的使用情況,過
大的batch_size可能會導(dǎo)致內(nèi)存不足或計算速度變慢。因此,在選
擇batch_size時需要考慮計算資源的限制。
2.數(shù)據(jù)集規(guī)模:數(shù)據(jù)集規(guī)模越大,一般可以選擇較大的
batch_size,以加快訓(xùn)練速度。但是,如果batch_size過大,可能
會導(dǎo)致模型無法收斂或者出現(xiàn)過擬合等問題。
3.模型復(fù)雜度:模型復(fù)雜度越高,一般需要選擇較小的
batch_size,以避免出現(xiàn)過擬合等問題。
4.確定最佳值:一般可以通過嘗試不同的batch_size值來確定最
佳值??梢允褂镁W(wǎng)格搜索或隨機(jī)搜索等方法,尋找最佳的batch_size
值。
5.3成品展示
5.3.1前端界面設(shè)計
Python前端界面設(shè)計可以使用多種工具和框架,以下是其中幾
個比較常用的:
18
湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計
1.Tkinter:Tkinter是Python自帶的GUI庫,可以快速構(gòu)建簡
單的窗口應(yīng)用程序。它易于學(xué)習(xí)且功能齊全,可以滿足大部分簡單的
界面需求。
2.PyQt:PyQt是Python的一個GUI工具包,它是基于Qt框架開
發(fā)的,提供了豐富的控件和樣式,支持跨平臺運(yùn)行,并且有很好的文
檔和社區(qū)支持,但是需要安裝額外的庫。
3.wxPython:wxPython是一個開源的GUI工具包,使用Python
語言進(jìn)行開發(fā),它基于wxWidgets庫,支持跨平臺運(yùn)行,提供了多種
控件和樣式,并且有完善的文檔和社區(qū)支持。
4.PySide:PySide是一個Python綁定Qt庫的GUI工具包,與PyQt
類似,但是PySide完全開源,可以免費(fèi)使用,并且有良好的文檔和
社區(qū)支持。
在使用以上工具和框架時,可以參考官方文檔和示例代碼,根據(jù)
項目需求選擇合適的工具和框架,并結(jié)合前端界面設(shè)計的要點進(jìn)行設(shè)
計和開發(fā)。
圖5-3.1前端界面展示
5.3.2作品展示
本設(shè)計方法通過AleNet模型,在通過圖片進(jìn)行篩選出你所需要
19
湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計
的圖片而進(jìn)行標(biāo)注
以下是效果
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 公共政策與經(jīng)濟(jì)關(guān)系2025年國際金融理財師考試試題及答案
- 健全風(fēng)險控制的年度工作框架計劃
- 急診文書書寫規(guī)范的培訓(xùn)方式計劃
- 制定前臺工作月度總結(jié)報告計劃
- 會展現(xiàn)場管理案例分析與策略
- 團(tuán)支部活動策劃方案
- 新技能學(xué)習(xí)的月度安排計劃
- 小語種證書考試的題型分析試題及答案
- 關(guān)注銀行從業(yè)職業(yè)前景的試題及答案
- 常見錯誤解析特許金融分析師試題及答案
- 中小學(xué)教師資格證面試課件講義
- Oracle-EBS生產(chǎn)制造解決方案
- 植物生理學(xué)第十三章植物的逆境生理課件
- 宮頸癌護(hù)理查房
- 施工單位人員退場制度
- 漢譯巴利三藏相應(yīng)部3-蘊(yùn)篇
- 建筑外窗抗風(fēng)壓性能計算書
- 年產(chǎn)萬噸酒精發(fā)酵車間設(shè)計
- 生物化學(xué)與分子生物學(xué)人衛(wèi)版教材全集
- 照片里的故事
- 土木工程畢業(yè)設(shè)計框架結(jié)構(gòu)教學(xué)樓計算書
評論
0/150
提交評論