淺析卷積神經(jīng)網(wǎng)絡(luò)的圖像特征提取技術(shù)_第1頁(yè)
淺析卷積神經(jīng)網(wǎng)絡(luò)的圖像特征提取技術(shù)_第2頁(yè)
淺析卷積神經(jīng)網(wǎng)絡(luò)的圖像特征提取技術(shù)_第3頁(yè)
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、淺析卷積神經(jīng)網(wǎng)絡(luò)的圖像特征提取技術(shù)薛先貴黎路【摘要】本文對(duì)卷積神經(jīng)網(wǎng)絡(luò)的圖像特征提取技術(shù)進(jìn)行了綜述,探討了它的原理和開展方向,對(duì)于它的存在問題給出了相關(guān)的建議?!娟P(guān)鍵詞】卷積神經(jīng)網(wǎng)絡(luò);圖像特征;特征提取中圖分類號(hào):TP183;TP391.41文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):2095-2457202107-0083-002DOI:10.19694/j ki.issn2095-2457.2021.07.033【Abstract】Inthispaper,theimagefeatureextractiontechnologybasedonconvolutionalneuralnetworkissummariz

2、ed,itsprincipleanddevelopmentdirectionarediscussed,andsomesuggestionsforitsproblemsaregiven.【Keywords】ConvolutionalNeuralNetwork;Imagefeatures;Featureextraction0前言目前,對(duì)于流行全球的深度學(xué)習(xí),一般來說有三種根本架構(gòu):DBN結(jié)構(gòu),SAE結(jié)構(gòu)與卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)CNN,分別活潑于大數(shù)據(jù)挖掘,數(shù)據(jù)分類和圖像處理等領(lǐng)域。其中卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)CNN由于在機(jī)器視覺方面的突出表現(xiàn),使之成為圖像處理的不二人選,本文介紹了CNN技術(shù)在圖像特征提取中的應(yīng)

3、用。1卷積神經(jīng)網(wǎng)絡(luò)的原理及其經(jīng)典的四種結(jié)構(gòu)卷積神經(jīng)網(wǎng)絡(luò)CNN是一種局部連接網(wǎng)絡(luò),相對(duì)于典型的BP全連接神經(jīng)網(wǎng)絡(luò)來說,具有局部連接性和權(quán)值共享性的的特點(diǎn)。這種神經(jīng)網(wǎng)絡(luò)不僅大量的減少了訓(xùn)練參數(shù),還符合自然圖像中越近的像素對(duì)旁邊的像素影響越大的特點(diǎn)。卷積神經(jīng)網(wǎng)絡(luò)的權(quán)重共享構(gòu)成卷積核,并且它與給定圖像做卷積后就可以提取圖像的某種特征。在圖像處理的過程中,通過許多不同的卷積核參數(shù)的訓(xùn)練,就可以自動(dòng)提取相同圖像的不同圖像特征。目前,根據(jù)卷積神經(jīng)網(wǎng)絡(luò)的開展歷程,共有四種經(jīng)典結(jié)構(gòu)用于圖像特征提?。篖eNet網(wǎng)絡(luò),AlexNet網(wǎng)絡(luò),VggNet網(wǎng)絡(luò),ResNet網(wǎng)絡(luò)。LeNet網(wǎng)絡(luò)是在1994年由YanLeC

4、un提出,也就是第一代卷積神經(jīng)網(wǎng)絡(luò)。LeNet主要用來進(jìn)行手寫字符的識(shí)別與分類,準(zhǔn)確率到達(dá)了98,已經(jīng)在美國(guó)的銀行中投入了使用,被用于讀取北美約10的支票。AlexNet網(wǎng)絡(luò)由Hinton的學(xué)生AlexKrizhevsky于2021年提出,是LeNet的一種更深更寬的版本,通過與其他各種圖像識(shí)別算法的比較,確定了卷積神經(jīng)網(wǎng)絡(luò)在計(jì)算機(jī)視覺中的優(yōu)勢(shì)。VGGNet網(wǎng)絡(luò)是由牛津大學(xué)計(jì)算機(jī)視覺組和GoogleDeepMind進(jìn)一步開發(fā)的深度卷積神經(jīng)網(wǎng)絡(luò)【2】。ResNet殘差神經(jīng)網(wǎng)絡(luò)由何華明等人于2021年提出。通過殘差學(xué)習(xí),可以做到更深的網(wǎng)絡(luò)結(jié)構(gòu),從而存貯更多圖像特征,識(shí)別更加精準(zhǔn)。2卷積神經(jīng)網(wǎng)絡(luò)提取

5、圖像特征的原理卷積神經(jīng)網(wǎng)絡(luò)識(shí)別圖像是將一個(gè)完整的圖片經(jīng)過屢次或者并行的自動(dòng)特征提取,然后把每個(gè)圖像特征匯總到一起,在比較相似性之后,可以從高概率完成圖像識(shí)別的過程。從本質(zhì)上說,這是一個(gè)深度的自動(dòng)學(xué)習(xí)過程,我們前面所定義的圖像特征可能并不適合卷積神經(jīng)網(wǎng)絡(luò)的特征分類,對(duì)于卷積神經(jīng)網(wǎng)絡(luò)的提取特征而言,雖然有很多的復(fù)原算法試圖理解機(jī)器所提取的特征,但是就目前而言,機(jī)器所提取的特征不太適合人腦理解,甚至可能找到了人腦所沒發(fā)現(xiàn)的圖像特征。2.1圖像特征提取技術(shù)構(gòu)成2.1.1建立卷積層提取初步特征卷積層的作用就是提取圖片中的某個(gè)初步特征,類似一個(gè)濾波器其細(xì)節(jié)不完全相同,經(jīng)過大量的訓(xùn)練以后,機(jī)器自動(dòng)調(diào)整卷積核

6、的值,然后與圖片矩陣做卷積,可以從圖像中提取一定的特征出來,卷積核的數(shù)量對(duì)初步特征提取有很大影響,但是時(shí)間消耗相應(yīng)地增加。2.1.2建立池化層提取主要特征聚集層連接到卷積層,因此聚集層的輸入是由卷積層和相應(yīng)的卷積核輸出的原始數(shù)據(jù)的輸出矩陣。目前,有很多文章指出,不用池化層也不影響特征提取的質(zhì)量,但是,池化層的主要作用是可以減少訓(xùn)練參數(shù)的數(shù)量,降低卷積層輸出的特征向量的維數(shù)【3】和減少過度擬合現(xiàn)象,僅保存最有用的圖像信息,并減少噪聲的傳播。2.1.3建立一個(gè)完全連接的層來匯總每個(gè)局部的功能卷積層和池化層的共同作用下,不僅可以提取圖像特征,同時(shí)大大減少原始圖像帶來的參數(shù)。最后,我們應(yīng)用完全連接的層

7、來生成一個(gè)等于我們需要的類數(shù)的分類器。將權(quán)重矩陣相乘,添加偏移值,然后使用ReLU激活函數(shù)使用梯度下降方法優(yōu)化參數(shù)。最后鑒別圖像的圖像特征都提取出來了,就可以從特征的不同和相同出發(fā),用神經(jīng)網(wǎng)絡(luò)的來識(shí)別千萬(wàn)張圖片中的特定一張了。3圖像特征提取的開展方向目前,對(duì)這種神經(jīng)網(wǎng)絡(luò)的改進(jìn)集中于如上所述將圖像特征提取到神經(jīng)網(wǎng)絡(luò)中的過程。首先,對(duì)于卷積層的改進(jìn)有以下幾種:卷積核小型化,1x1卷積,NetworkInNetwork,Inception機(jī)制,卷積分解Factorization,反卷積運(yùn)算等等。例如,NetworkInNetwork的主要思想是用小規(guī)模神經(jīng)網(wǎng)絡(luò)替換卷積層的線性濾波器【4】。1x1卷積

8、可用于減少信道維數(shù)或用于完整卷積網(wǎng)絡(luò),確保卷積網(wǎng)絡(luò)可接受任何大小的輸入圖像。并能做逐像素的預(yù)測(cè)。其次,對(duì)于池化層的改進(jìn)主要有以下幾種:L-P池化,混合池化,隨機(jī)池化,Spatialpyramidpooling,ROIpooling。Spatialpyramidpooling在SPP網(wǎng)絡(luò)中提出,ROIpooling在FastR-CNN算法中提出。然后,還有其他功能可以更改網(wǎng)絡(luò)的其他局部,例如激活功能。ReLU,ELU,PReLU等取得了良好的效果,其中ReLU及其改進(jìn)型廣泛應(yīng)用于卷積網(wǎng)絡(luò)。最后,目前開展最快的是網(wǎng)絡(luò)結(jié)構(gòu)的改進(jìn),比方殘差網(wǎng)絡(luò)和DenseNet等結(jié)構(gòu)等等。4總結(jié)目前,基于卷積神經(jīng)網(wǎng)絡(luò)

9、圖像分類的應(yīng)用很多,識(shí)別效果非常好。但是,一些迫切的問題目前都沒有解決:首先,還沒有形成一套完整的結(jié)構(gòu)理論或解釋理論?,F(xiàn)在許多識(shí)別系統(tǒng)都是根據(jù)特定的數(shù)據(jù)庫(kù),然后設(shè)計(jì)特別的網(wǎng)絡(luò),通過不斷的訓(xùn)練,同時(shí)結(jié)合人工來發(fā)現(xiàn)最正確的參數(shù)和優(yōu)化算法,這樣應(yīng)用的局限性比較大,同時(shí)也沒有較系統(tǒng)的理論來糾正后期錯(cuò)誤。第二,現(xiàn)有的算法和結(jié)構(gòu)尚存在一些缺陷。比方對(duì)海量圖像進(jìn)行分類識(shí)別時(shí),初始狀態(tài)參數(shù)以及圖片算法的選取,會(huì)對(duì)網(wǎng)絡(luò)訓(xùn)練造成很大影響。但不可否認(rèn)的是,卷積神經(jīng)網(wǎng)絡(luò)在圖像處理領(lǐng)域的統(tǒng)治地位已經(jīng)牢不可破,更多的可能是,我們需要更好的理論來解釋和控制神經(jīng)網(wǎng)絡(luò)?!緟⒖嘉墨I(xiàn)】【1】何立民,萬(wàn)躍華.數(shù)字圖書館中基于內(nèi)容的圖像檢索關(guān)鍵技術(shù)J.中國(guó)圖書館學(xué)報(bào),2021,286:39-43.【2】佘鵬,甘健侯,文斌,etal.經(jīng)典

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論