如何解決工業(yè)缺陷檢測(cè)小樣本問(wèn)題

上傳人：1*** IP屬地：湖南上傳時(shí)間：2024-09-20 格式：DOCX 頁(yè)數(shù)：4 大小：15.51KB 積分：6 舉報(bào) 版權(quán)申訴

全文預(yù)覽已結(jié)束

 下載本文檔

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

在工業(yè)生產(chǎn)制造中，由于生產(chǎn)過(guò)程是一個(gè)多因素耦合的復(fù)雜過(guò)程，生產(chǎn)過(guò)程中的任何異常都會(huì)導(dǎo)致產(chǎn)品缺陷產(chǎn)生，及時(shí)識(shí)別異常產(chǎn)品的缺陷模式是提高生產(chǎn)質(zhì)量和生產(chǎn)效率的有效途徑，所以缺陷檢測(cè)具有十分重要的研究意義。早期的產(chǎn)品缺陷模式識(shí)別主要是通過(guò)機(jī)器學(xué)習(xí)方法進(jìn)行的，如支持向量機(jī)、反向傳播網(wǎng)絡(luò)等。這些方法與用肉眼直接對(duì)產(chǎn)品缺陷進(jìn)行識(shí)別相比，大大降低了工作量。但是這些早期方法存在以下不足：識(shí)別準(zhǔn)確率低且需要大量的標(biāo)簽數(shù)據(jù)對(duì)模型進(jìn)行訓(xùn)練。近年來(lái)隨著深度學(xué)習(xí)的發(fā)展，大量基于卷積神經(jīng)網(wǎng)絡(luò)的算法在視覺(jué)任務(wù)中大放異彩。由于卷積神經(jīng)網(wǎng)絡(luò)具有非常強(qiáng)大的特征提取能力，卷積神經(jīng)網(wǎng)絡(luò)在缺陷檢測(cè)任務(wù)中得到了廣泛的應(yīng)用。與傳統(tǒng)的機(jī)器學(xué)習(xí)方法相比，基于卷積神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)方法在缺陷識(shí)別領(lǐng)域具有更高的識(shí)別準(zhǔn)確率和工作效率。但是這種方法和機(jī)器學(xué)習(xí)方法具有同樣的缺點(diǎn)，首先是模型訓(xùn)練需要大量的標(biāo)簽數(shù)據(jù)，而具有缺陷模式標(biāo)簽的圖像是不容易獲取的，因?yàn)楂@取帶有產(chǎn)品缺陷模式標(biāo)簽的圖像需要人工監(jiān)督，即需要大量有經(jīng)驗(yàn)的專(zhuān)業(yè)人員進(jìn)行人工標(biāo)注，這是非常昂貴且耗時(shí)的。此外在某些高度自動(dòng)化的生產(chǎn)場(chǎng)景中，產(chǎn)品的良率特別高，收集缺陷樣本非常耗時(shí)，而當(dāng)前的用于缺陷檢測(cè)的深度學(xué)習(xí)方法大多是基于大量缺陷樣本建立模型，缺陷樣本的缺乏導(dǎo)致模型難以上線。針對(duì)某些行業(yè)比如汽車(chē)行業(yè)的多型號(hào)小批量生產(chǎn)場(chǎng)景（每種型號(hào)產(chǎn)品只生產(chǎn)幾天），在完成缺陷樣本收集前某種型號(hào)產(chǎn)品已經(jīng)不再生產(chǎn)了，這種場(chǎng)景下大量的缺陷樣本收集是不可能的。此外，由于缺陷是由生產(chǎn)過(guò)程中的非受控因素產(chǎn)生的，缺陷的形態(tài)是多種多樣的，各種形態(tài)的樣本很難收集完整，這也限制了深度學(xué)習(xí)在工業(yè)檢測(cè)領(lǐng)域的應(yīng)用。01小樣本檢測(cè)算法為了拓展深度學(xué)習(xí)在工業(yè)檢測(cè)領(lǐng)域的應(yīng)用范圍及提升易用性，小樣本檢測(cè)算法的研究成為必然。解決工業(yè)檢測(cè)小樣本問(wèn)題有兩種路徑，第一種是工程路徑，第二種是算法路徑。其中工程路徑常見(jiàn)有兩種方法，第一種是基于真實(shí)產(chǎn)品手動(dòng)制造缺陷，第二種是基于真實(shí)圖像手動(dòng)仿真缺陷。這兩種方法的優(yōu)勢(shì)在于操作簡(jiǎn)單，產(chǎn)生的缺陷也與真實(shí)缺陷比較接近，但劣勢(shì)也比較明顯?；谡鎸?shí)產(chǎn)品手動(dòng)制造缺陷會(huì)對(duì)產(chǎn)品造成不可逆的破壞，對(duì)于高價(jià)值產(chǎn)品破壞成本較高，而且，因?yàn)槿毕菥煞鞘芸匾蛩禺a(chǎn)生，手動(dòng)制造的缺陷不一定與實(shí)際缺陷情況完成吻合，會(huì)存在一些差異。而基于圖像手動(dòng)仿真缺陷則存在對(duì)操作人員要求高，產(chǎn)生速度慢的問(wèn)題。因此，使用工程路徑解決小樣本問(wèn)題可以在一些比較緊急的情況下使用，比如項(xiàng)目初期需要緊急上線時(shí)。02算法路徑基本思路從算法路徑解決小樣本問(wèn)題，基本的思路有兩種，第一種是增加樣本，第二種是減少算法對(duì)樣本的依賴(lài)。1、增加樣本基于第一種思路的算法研究方向有數(shù)據(jù)增廣和缺陷生成，其中數(shù)據(jù)增廣在深度網(wǎng)絡(luò)訓(xùn)練時(shí)為了防止過(guò)擬合已成為一個(gè)標(biāo)準(zhǔn)手段，站在工業(yè)檢測(cè)的視角上看，數(shù)據(jù)增廣是一種性價(jià)比比較高的擴(kuò)增樣本的手段，但因?yàn)槟壳皵?shù)據(jù)增廣的方法大多是基于一些傳統(tǒng)圖像處理方法，所以能仿真缺陷的位置和一些簡(jiǎn)單紋理變化，但無(wú)法仿真缺陷的形狀和復(fù)雜紋理，所以數(shù)據(jù)增廣一般作為一個(gè)基礎(chǔ)手段，可以解決一部分小樣本問(wèn)題，對(duì)于一些簡(jiǎn)單場(chǎng)景是有幫助的。而要解決更復(fù)雜場(chǎng)景的樣本生成問(wèn)題，需要用缺陷生成算法。我們將缺陷生成算法的研究分為三個(gè)階段：第一階段是單一產(chǎn)品單一型號(hào)缺陷生成；第二階段是單一產(chǎn)品多型號(hào)缺陷生成；第三階段是實(shí)現(xiàn)跨產(chǎn)品缺陷的生成。當(dāng)前缺陷生成算法大致可以分為兩種：一種是自動(dòng)生成算法，整個(gè)生成過(guò)程完全不需要人工干預(yù)，第二種是半自動(dòng)生成算法，需要一些簡(jiǎn)單的人工交互。自動(dòng)生成算法的典型算法有DCGAN、WGAN，輸入一張缺陷圖像可以直接生成多張真實(shí)的缺陷圖像。半自動(dòng)生成算法的典型算法有CGAN、CVAE、Pix2Pix，需要人工交互給定缺陷生成的類(lèi)別或形狀，然后根據(jù)給定信息生成指定類(lèi)型缺陷。但當(dāng)前無(wú)論是自動(dòng)生成算法還是半自動(dòng)生成算法，對(duì)訓(xùn)練樣本的需求量雖然比監(jiān)督算法少，但還是有一定要求，而且目前還沒(méi)有一種能在所有數(shù)據(jù)上通用的解決方案，當(dāng)前仍需要針對(duì)不同的場(chǎng)景制定不同算法版本。通用的缺陷生成算法會(huì)這個(gè)研究方向下一步的重點(diǎn)。2、減少算法對(duì)樣本的依賴(lài)算法路徑解決小樣本問(wèn)題的第二個(gè)思路是減少算法對(duì)樣本的依賴(lài)，基于這個(gè)思路衍生出兩條算法路線：第一條路線是完全不需要缺陷樣本的非監(jiān)督學(xué)習(xí)算法，基于非監(jiān)督算法訓(xùn)練模型時(shí)僅需要OK圖像參與訓(xùn)練即可。第二條路線仍基于有監(jiān)督算法，對(duì)缺陷樣本的需求量大大降低。非監(jiān)督算法實(shí)現(xiàn)的思路大體上分為兩種：一種是基于生成模型，基本思路是訓(xùn)練一個(gè)只能生成OK圖像的生成網(wǎng)絡(luò)，推理時(shí)針對(duì)輸入的NG圖像，找到一個(gè)與NG圖像最接近的OK圖像，然后求兩張圖的差異，根據(jù)差異大小判斷是否為NG，典型算法有AE，VAE，Ano-GAN等。另一種思路是基于特征表示，基本思路是找個(gè)一個(gè)較好的特征表示，將OK圖和NG圖分別映射到高維特征空間，OK圖對(duì)應(yīng)特征點(diǎn)的類(lèi)內(nèi)距離很小，推理時(shí)一張圖對(duì)應(yīng)特征點(diǎn)與OK圖特征簇的中心距離很遠(yuǎn)就可以判定為NG，典型算法有SVDD、OCSVM、DeepSVDD等。基于有監(jiān)督算法減少樣本依賴(lài)的思路分為兩種：一種是對(duì)輸入數(shù)據(jù)進(jìn)行歸一化，降低不同缺陷樣本之間的差異，歸一化算法基于傳統(tǒng)圖像處理算法實(shí)現(xiàn)，需要針對(duì)不同場(chǎng)景做不同的算法設(shè)計(jì)，很難有通用性，因此僅作為一些臨時(shí)處理手段。另一種思路是基于遷移學(xué)習(xí)，典型的算法研發(fā)方向是域適應(yīng)（DomainAdaption，DA）和域泛化（DomainGeneration,DG）。DA處理的問(wèn)題要求可以獲取一部分目標(biāo)域的圖像，且不能實(shí)現(xiàn)跨類(lèi)別的遷移，因此適合用于處理跨產(chǎn)品型號(hào)的問(wèn)題。DG在DA的基礎(chǔ)上，放寬了對(duì)目標(biāo)域數(shù)據(jù)的要求，可以不需要目標(biāo)域數(shù)據(jù)，且可以實(shí)現(xiàn)跨類(lèi)別遷移，因此可以實(shí)現(xiàn)跨產(chǎn)品、跨型號(hào)、跨缺陷類(lèi)別的遷移。DA算法當(dāng)前研究的基本思路有三種，一是基于差異度量，核心思路是找一個(gè)差異度量函數(shù)，讓源域與目標(biāo)域樣本的特征在這個(gè)度量函數(shù)下最小，代表算法為MMD；二是基于對(duì)抗，核心思路是通過(guò)構(gòu)造對(duì)抗網(wǎng)絡(luò)，訓(xùn)練一個(gè)分類(lèi)器讓判別器無(wú)法區(qū)分?jǐn)?shù)據(jù)是來(lái)自源域還是目標(biāo)域，這樣就實(shí)現(xiàn)了源域和目標(biāo)域的融合，代表算法為DomConfusion；三是基于重構(gòu)，核心思路是將構(gòu)造源域和目標(biāo)域的通用特征，僅利用通用特征去執(zhí)行相應(yīng)的任務(wù)，代表算法為DomainSeparationNetworks。DG算法當(dāng)前的研究思路也分為三種，第一種是推理時(shí)選取一個(gè)分布最近的源域的模型直接使用，第二種是通過(guò)拆解域相關(guān)與域無(wú)關(guān)的組件并進(jìn)行組合來(lái)實(shí)現(xiàn)對(duì)目標(biāo)域數(shù)據(jù)的處理，第三種是訓(xùn)練得到域不變的特征。03總結(jié)當(dāng)前基于有監(jiān)督的缺陷檢測(cè)算法，在數(shù)據(jù)量充足的場(chǎng)景下已經(jīng)逐步成功落地，但工業(yè)場(chǎng)景具有一定的離散性，大部分應(yīng)用場(chǎng)景均為小樣本檢測(cè)場(chǎng)景，小樣本問(wèn)題的解決有助于將AI技

人人文庫(kù)> 全部分類(lèi)> 行業(yè)資料 > 信息產(chǎn)業(yè)

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

如何解決工業(yè)缺陷檢測(cè)小樣本問(wèn)題

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

如何解決工業(yè)缺陷檢測(cè)小樣本問(wèn)題

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔