維視智造-人工智能行業(yè):2022年AI工業(yè)視覺解決方案白皮書_第1頁
維視智造-人工智能行業(yè):2022年AI工業(yè)視覺解決方案白皮書_第2頁
維視智造-人工智能行業(yè):2022年AI工業(yè)視覺解決方案白皮書_第3頁
維視智造-人工智能行業(yè):2022年AI工業(yè)視覺解決方案白皮書_第4頁
維視智造-人工智能行業(yè):2022年AI工業(yè)視覺解決方案白皮書_第5頁
已閱讀5頁,還剩102頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

2022AIINDUSTRIALVISIONSOLUTIONSCOPYRIGHT本白皮書出品方為維視智造科技股份有限公司,版權(quán)受法律保護(hù)。轉(zhuǎn)載、摘編CONTENTS3.1.1額外的硬件3.1.2發(fā)熱量和功耗3.1.3大量的訓(xùn)練數(shù)據(jù)4.2.1數(shù)據(jù)收集274.2.2分類及數(shù)據(jù)標(biāo)記4.2.3模型訓(xùn)練4.2.4在線推理及優(yōu)化4.3.1缺陷檢測344.3.2圖像分類4.3.3字符識別4.3.4深度學(xué)習(xí)與傳統(tǒng)算法的融合5工業(yè)視覺技術(shù)概述工業(yè)視覺也稱機(jī)器視覺,是人工智能正在快速發(fā)展的一個分支,是在工業(yè)上為自動檢查、過程控制和機(jī)器人引導(dǎo)等應(yīng)用提供基于圖像的自動檢查和分析的技術(shù)及方法。機(jī)送給專用的圖像處理系統(tǒng),得到被攝目標(biāo)的形態(tài)信息,根據(jù)像素分布和亮度、顏色等如果我們將1969年CCD芯片的產(chǎn)生作為機(jī)器視覺技術(shù)的起點(diǎn),該項(xiàng)技術(shù)的發(fā)展已經(jīng)有半個世紀(jì)的歷史,經(jīng)過長時間的發(fā)展,機(jī)器視覺技術(shù)日益取得重大突破和廣泛應(yīng)用,當(dāng)前已經(jīng)遍布工業(yè)生產(chǎn)的各個環(huán)節(jié),在一些不適合于人工作業(yè)的危險工作環(huán)境或人工視覺難以滿足要求的場合,常用機(jī)器視覺來替代人工視覺;同時在大批量工業(yè)生產(chǎn)過程中,用人工視覺檢查產(chǎn)品質(zhì)量效率低且精度不高,用機(jī)器視覺檢測方法可以大大提高生產(chǎn)效率和生產(chǎn)的自動化程度。而且機(jī)器視覺易于實(shí)現(xiàn)自動化集成,軟件集成,是實(shí)現(xiàn)智能制造的基礎(chǔ)技術(shù)。根據(jù)不完全統(tǒng)計,目前廣泛應(yīng)用工業(yè)視覺的工業(yè)生產(chǎn)行業(yè)6工業(yè)視覺典型應(yīng)用場景機(jī)器視覺在工業(yè)領(lǐng)域應(yīng)用廣泛,按功能和場景主要分為四大類:識別、定位、測量、識別包括有無、顏色和條碼/二維碼識別,主要通過甄別目標(biāo)物體的物體特征來進(jìn)行判定位功能是在識別出物體的基礎(chǔ)上,經(jīng)過測量準(zhǔn)確的給出目標(biāo)物體的坐標(biāo)位置,制造業(yè)自動生產(chǎn)裝配過程中,機(jī)器人需要知道來料的位置,才能完成后續(xù)的加工、裝配、測量泛指利用被測物體特征進(jìn)行全局或局部尺寸數(shù)據(jù)獲取的應(yīng)用,包括:長度、平行度、角度、圓弧長、圓直徑、半徑、點(diǎn)到線的距離、點(diǎn)點(diǎn)距離等等,尺寸測量既可以用于產(chǎn)品生產(chǎn)過程中的尺寸數(shù)據(jù)管控,也可以用于數(shù)據(jù)的獲取,在工業(yè)應(yīng)用場景中占檢測指的是對目標(biāo)物體表面的缺陷進(jìn)行檢出。產(chǎn)品生產(chǎn)制造過程中產(chǎn)生的表面缺陷會影響其性能及客戶體驗(yàn),傳統(tǒng)人工檢測的方法需要耗費(fèi)大量的人力,且無法滿足現(xiàn)代生產(chǎn)工藝和節(jié)奏的要求,利用機(jī)器視覺的方法進(jìn)行智能化檢測可以有效的解決這一問題,同時節(jié)省成本、提高產(chǎn)能。因此,表面缺陷檢測是機(jī)器視覺最重要的應(yīng)用方向之7難點(diǎn):缺陷區(qū)域呈現(xiàn)隨機(jī)灰度等級的黑色或白色,難點(diǎn):缺陷區(qū)域呈現(xiàn)隨機(jī)灰度等級的黑色或白色,難以提取全部缺陷區(qū)域好爛難點(diǎn):不同類別的棗無任何歸一的特征規(guī)律,無法基于特征參數(shù)區(qū)分工業(yè)視覺面臨的挑戰(zhàn)及發(fā)展趨勢總體來說,工業(yè)視覺在定位、測量、識別、檢測等各來越高、速度越來越快、準(zhǔn)確率要求越來越高的挑戰(zhàn)。這平的提高得到了有效的解決,比如采集硬件的分辨率、傳是也有一部分問題,需要長周期的實(shí)踐和迭代升級才有解表,就是復(fù)雜場景下的缺陷檢測。以下是幾類傳統(tǒng)算法難難點(diǎn):缺陷特征被隨機(jī)的螺牙背景干擾,難以獨(dú)立分割出缺陷區(qū)域難點(diǎn):待定位的特征呈現(xiàn)相對隨機(jī)的輪廓,無法以特定模板匹配8此類問題在工業(yè)現(xiàn)場是普遍存在且用戶需求迫切希望得到解決的,這為工業(yè)視覺的算法發(fā)展提出了新的挑戰(zhàn)。同時,如果這些問題得到解決,那么工業(yè)視覺的應(yīng)用邊界,將會得到極大的拓展,由原來只能在產(chǎn)品標(biāo)準(zhǔn)化、一致性極高的場景,變成幾乎可以替代人眼進(jìn)行任意場景下的視覺檢測應(yīng)用,而且不止是工業(yè)生產(chǎn)方面,在農(nóng)業(yè)、民用深度學(xué)習(xí)技術(shù)概述深度學(xué)習(xí)技術(shù)概述深度學(xué)習(xí)是機(jī)器學(xué)習(xí)中一種基于對數(shù)據(jù)進(jìn)行表征學(xué)習(xí)的方法。在給予它一組輸入后,在規(guī)律和表示層次,這些學(xué)習(xí)過程中獲得的信息對諸如文字,圖像和聲音等數(shù)據(jù)的解釋有很大的幫助。它的最終目標(biāo)是讓機(jī)器能夠像人一樣具有分析學(xué)習(xí)能力,能夠識別文字、圖像和聲音等數(shù)據(jù)。深度學(xué)習(xí)是一個復(fù)雜的機(jī)器學(xué)習(xí)算法,在語音和圖像識別方面取得的效果,遠(yuǎn)遠(yuǎn)超過先前相關(guān)技術(shù)。深度學(xué)習(xí)在搜索技術(shù),數(shù)據(jù)挖掘,機(jī)器學(xué)習(xí),機(jī)器翻譯,自然語言處理,多媒體學(xué)習(xí),語音,推薦和個性化技術(shù),以及其他相關(guān)領(lǐng)域都取得了很多成果。深度學(xué)習(xí)使機(jī)器模仿視聽和思考等人類的活動,解決了很(2)明確了特征學(xué)習(xí)的重要性。也就是說,通過逐層特征變換,將樣本在原空間的特征表示變換到一個新特征空間,從而使分類或預(yù)測更容易。與人工規(guī)則構(gòu)造特征的方法(3)通過設(shè)計建立適量的神經(jīng)元計算節(jié)點(diǎn)和多層運(yùn)算層次結(jié)構(gòu),選擇合適的輸入層和輸出層,通過網(wǎng)絡(luò)的學(xué)習(xí)和調(diào)優(yōu),建立起從輸入到輸出的函數(shù)關(guān)系,雖然不能100%找到輸入與輸出的函數(shù)關(guān)系,但是可以盡可能的逼近現(xiàn)實(shí)的關(guān)聯(lián)關(guān)系。使用訓(xùn)練成功的網(wǎng)工業(yè)視覺深度學(xué)習(xí)技術(shù)發(fā)展趨勢在工業(yè)視覺方面,深度學(xué)習(xí)的典型應(yīng)用領(lǐng)域是異常檢測、圖像分類、缺陷檢測和物體深度學(xué)習(xí)和傳統(tǒng)機(jī)器視覺方法的差異主要在于,傳統(tǒng)機(jī)器學(xué)習(xí)的步驟是人工分析圖片的特征,通過圖像算法提取特征,然后通過特征的數(shù)值來區(qū)分物品。在分析的時候不需要大量的圖片,只需要幾種分類的典型圖片,和類別之間的臨界圖片。人工分析在整個過程當(dāng)中起到了主導(dǎo)的作用。而深度學(xué)習(xí)的步驟是采集大量圖片,標(biāo)注圖片,把圖片放進(jìn)網(wǎng)絡(luò)訓(xùn)練,查看訓(xùn)練結(jié)果,調(diào)節(jié)參數(shù)和網(wǎng)絡(luò)結(jié)構(gòu),再次訓(xùn)練,得到最好的結(jié)果。深度學(xué)習(xí)在標(biāo)注和訓(xùn)練的時候不需要專業(yè),網(wǎng)絡(luò)會自動提取和篩選特征,規(guī)劃分割閾值。只是在調(diào)整參數(shù)和網(wǎng)絡(luò)結(jié)構(gòu)時需要專業(yè)工程師,但是在一些項(xiàng)目中可以不用其次,當(dāng)檢測不同的物體和特征時,深度學(xué)習(xí)方法的優(yōu)勢是能夠檢測以不同形式出現(xiàn)再次,經(jīng)過適當(dāng)訓(xùn)練的神經(jīng)網(wǎng)絡(luò)可以很好地識別出變量環(huán)境(如變化的背景、不同的分辨率或光源條件)中的物體,無需針對每個可能的特性進(jìn)行專門訓(xùn)練。但是需要大當(dāng)然,深度學(xué)習(xí)工業(yè)視覺的實(shí)施也需要具備一定的條件和成本。在硬件配置方面,通常需要增加額外的GPU作為算力支撐,在實(shí)施方面,需要準(zhǔn)備大量的訓(xùn)練樣本數(shù)據(jù),大量的人工標(biāo)注工作量等,但是,考慮到期在識別能力上,算法的適應(yīng)力上和特征提取和分類的流程上的優(yōu)勢,隨著市場需求、行業(yè)技術(shù)水平的發(fā)展,硬件性能提升,成與傳統(tǒng)方法相比,為了在應(yīng)用中充分發(fā)揮純深度學(xué)習(xí)方法的優(yōu)勢,往往需要對使用的深度學(xué)習(xí)架構(gòu)復(fù)雜精巧、功能強(qiáng)大,其突出特點(diǎn)在于它是由大量的神經(jīng)網(wǎng)絡(luò)層構(gòu)成。因此,運(yùn)行深度學(xué)習(xí)的應(yīng)用程序需要用到大量的內(nèi)存和計算能力。通常只有將計算任務(wù)轉(zhuǎn)移到額外的處理器(如GPU顯卡)上同時執(zhí)行計算,才能在可接受的短時間內(nèi)完成處理工作。在目前的市場條件下,增加GPU顯卡對于很多用戶來說是一項(xiàng)不小的成大型神經(jīng)網(wǎng)絡(luò)對計算能力的要求較高,因此增加了應(yīng)用的功耗,并相應(yīng)地增加了發(fā)熱量。這尤其會對嵌入式系統(tǒng)造成問題,因?yàn)橥ǔP枰獙η度胧较到y(tǒng)的低功耗和熱管理要想可靠地識別物體,首先需要大量的訓(xùn)練圖像,這些圖像會描述和標(biāo)記所有物體和屬性,以便讓系統(tǒng)能在盡可能多的不同變量和環(huán)境中完成識別。用于訓(xùn)練的不同圖像數(shù)據(jù)量越多,深度學(xué)習(xí)網(wǎng)絡(luò)就越容易學(xué)會如何識別物體。在開發(fā)機(jī)器視覺應(yīng)用時,要獲取成百上千幅所需的圖像往往是一項(xiàng)艱巨的任務(wù)。更多的時候,工廠可能根本就不獲取到的大量數(shù)據(jù)是不能立即使用的,需要人給這些數(shù)據(jù)進(jìn)行標(biāo)注,對于圖像分割,需要精準(zhǔn)的標(biāo)準(zhǔn)圖像中要分割的區(qū)域,這樣才能在推理圖片的時候得到精準(zhǔn)的區(qū)域。這些標(biāo)注工作都只能是人工手動完成,所以在數(shù)據(jù)大的時候,還需要檢測是否有標(biāo)注上述幾個應(yīng)用的條件正是深度學(xué)習(xí)工業(yè)視覺項(xiàng)目落地的阻礙,也是用戶的痛點(diǎn),相對·發(fā)熱量和功耗:思路之一能將深度學(xué)習(xí)與傳統(tǒng)算法進(jìn)行深度融合,采用傳統(tǒng)算法解決·大量的訓(xùn)練數(shù)據(jù):行業(yè)內(nèi)通用的解決方案是采用小樣本訓(xùn)練,然后在推理過程中不斷技術(shù)解析對應(yīng)3.1提出的用戶痛點(diǎn)問題及解決思路,結(jié)合實(shí)際落地的項(xiàng)目經(jīng)驗(yàn),目前AI工業(yè)視覺深度學(xué)習(xí)算法對計算資源的需求是確定的,如何提高深度學(xué)習(xí)應(yīng)用部署效率,降低運(yùn)學(xué)習(xí)算法平臺努力的目標(biāo)。由于工業(yè)領(lǐng)域深度學(xué)習(xí)應(yīng)用的特殊分開實(shí)施,模型訓(xùn)練完畢后的運(yùn)行機(jī)往往裝在設(shè)備上交付給終端用戶,不再需要大規(guī)模的持續(xù)訓(xùn)練和升級,這就使得深度學(xué)習(xí)在CPU上運(yùn)行具備了基礎(chǔ)條件。由于大量的務(wù)指標(biāo)。然而通過提升推理服務(wù)在CPU上的性能,可以幫助實(shí)現(xiàn)GPU遷移到CPU上的針對一些代表性的場景如特征明顯但存在異物干擾的情況,使用傳統(tǒng)算法唯一的問題是會造成一定程度的過殺,但是其實(shí)施效率高、消耗的算力和功耗少,是深度學(xué)習(xí)無法比擬的優(yōu)勢。在這種場景下,使用傳統(tǒng)算法進(jìn)行過殺,然后對NG的圖片進(jìn)行深度學(xué)習(xí)標(biāo)注和訓(xùn)練,將傳統(tǒng)算法與深度學(xué)習(xí)有機(jī)的結(jié)合在一起,可以實(shí)現(xiàn)事半功倍的效果稱之為缺陷檢測深度學(xué)習(xí)過濾技術(shù)。此外,傳統(tǒng)軟件和深度學(xué)習(xí)的結(jié)合還可以用于圖21案例:鍵盤表面缺陷,會有毛發(fā)、指紋、灰塵等異物干擾目前大部分的深度學(xué)習(xí)模型,都是監(jiān)督學(xué)習(xí)的方式進(jìn)行的,需要海量的數(shù)據(jù)支持。而現(xiàn)實(shí)生產(chǎn)環(huán)境中,數(shù)據(jù)集通常較小,只有幾萬甚至幾百個樣本。此時,通常我們采用第一:利用預(yù)訓(xùn)練模型進(jìn)行遷移微調(diào)(?ne-tuning),預(yù)訓(xùn)練模型通常在特征上擁有很好的語義表達(dá)。此時,只需將模型在小數(shù)據(jù)集上進(jìn)行微調(diào)就能取得不錯的效果。這也是目前大部分小數(shù)據(jù)集常用的訓(xùn)練方式。視覺領(lǐng)域內(nèi),通常會ImageNet上訓(xùn)練完成本類別遠(yuǎn)遠(yuǎn)大于樣本數(shù)量的情況等極端數(shù)據(jù)集。例如有1000個類別,每個類別只提供常仍然在學(xué)習(xí)不同類別的語義,而少樣本學(xué)習(xí)通常需要學(xué)習(xí)樣本之間的距離度量。例有些常用的方式:數(shù)據(jù)集增強(qiáng)、正則或者半監(jiān)督學(xué)習(xí)等方式來解決小樣本數(shù)據(jù)集的訓(xùn)此外,也有深度學(xué)習(xí)廠家研發(fā)了一些幫助用戶進(jìn)行樣本圖片生成的工具,可以將收集AI工業(yè)視覺解決方案架構(gòu)及組成1、圖像采集部分:通常由一套或者多套這樣的成像系統(tǒng)組成,包括工業(yè)相機(jī)、工業(yè)鏡2、照明光源:光源是影響機(jī)器視覺系統(tǒng)輸入的重要因素,它直接影響輸入數(shù)據(jù)的質(zhì)量3、控制單元:控制單元一般包含光電傳感器、I/O、運(yùn)動控制、電平轉(zhuǎn)化單元等,用4、圖像處理算力設(shè)備:工控機(jī)或GPU服務(wù)器,是視覺系統(tǒng)的核心算力,部署于靠近相機(jī)的端側(cè),完成圖像數(shù)據(jù)的處理和絕大部分的控制邏輯,對于檢測識別類型或采用深度學(xué)習(xí)算法的應(yīng)用,通常都需要高性能的CPU/GP機(jī)器視覺軟件用來完成輸入的圖像數(shù)據(jù)的處理,通過圖像識別得出結(jié)果,這個輸出的5、執(zhí)行機(jī)構(gòu):可能是機(jī)械臂、氣動裝置等,用于執(zhí)行運(yùn)算結(jié)構(gòu)后進(jìn)行相應(yīng)的剔除、抓邊緣學(xué)習(xí)將基于規(guī)則的高效機(jī)器視覺嵌入到一套預(yù)先訓(xùn)練的深度學(xué)習(xí)算法中,以創(chuàng)建針對工廠自動化優(yōu)化過的一個集成工具集。該技術(shù)無需機(jī)器視覺和深度學(xué)習(xí)方面的專業(yè)知識。相反,生產(chǎn)線工程師可以基于其對所需解決任務(wù)的現(xiàn)有了解來訓(xùn)練邊緣學(xué)習(xí)邊緣學(xué)習(xí)與現(xiàn)有深度學(xué)習(xí)框架的不同之處在于,其并非通用的解決方案,而是專門為工業(yè)自動化應(yīng)用量身定制的。邊緣學(xué)習(xí)與其他深度學(xué)習(xí)產(chǎn)品的不同之處在于,其專注于確保在應(yīng)用部署的所有階段都易于使用。舉例來說,邊緣學(xué)習(xí)僅需更少的圖像即可實(shí)施流程量的要求,然后在實(shí)際生產(chǎn)中去收集足夠的對應(yīng)樣本數(shù)據(jù)。通常情況下,訓(xùn)練用的數(shù)據(jù)集必須要有足夠的代表性,需要包含實(shí)際生產(chǎn)中各種可能的情況,而且對應(yīng)各種情況的圖像數(shù)量分布要均勻。在數(shù)量方面,訓(xùn)練用的數(shù)據(jù)集樣本一定要相對較多,根據(jù)模型的復(fù)雜程度,高質(zhì)量的圖片數(shù)量,以及負(fù)樣本的數(shù)量必須足夠。樣本圖片的收集圖像數(shù)據(jù)的收集工作在某些場景下需要耗費(fèi)大量的人力以及時間,且往往對深度學(xué)習(xí)項(xiàng)目最終能否成功實(shí)施、或最終的檢出率是否達(dá)標(biāo)具有至關(guān)重要的意義。因此在評估深度學(xué)習(xí)項(xiàng)目時,要格外關(guān)注此部分工作的實(shí)現(xiàn)難度,對工作量做出客觀和準(zhǔn)確的評估,并入系統(tǒng)成本考量維度。另外值得注意的是,負(fù)樣本的收集往往是瓶頸站點(diǎn),因?yàn)楣S自動化生產(chǎn)過程中NG產(chǎn)品的比例是相對較低且無法人為制造的,但是檢出所有在獲取了足夠的圖像數(shù)據(jù)之后,依據(jù)圖像的屬性進(jìn)行準(zhǔn)確的分類,如果是缺陷檢測目的,通常只需要劃分為OK/NG兩類,如果是圖像分類,則需要根據(jù)特征劃分為對應(yīng)的種是全圖標(biāo)記(也稱全圖分類一種是像素分割。典型的全圖分類模式下標(biāo)記主界面如圖所示,界面上可以顯示多幅圖像形成的圖像列表。這種標(biāo)記方式的好處是效率較高,可以支持超大規(guī)模的圖像快速標(biāo)記。他允許用戶對整幅圖片進(jìn)行類別的標(biāo)記,速的完成標(biāo)記和訓(xùn)練,取得準(zhǔn)確的判定結(jié)果。同時,由于標(biāo)記所需圖片可以從高分辨率圖像中裁切獲得,對樣本的數(shù)據(jù)量依賴問題得到了較好的解決,在樣本圖片的裁切當(dāng)然,全圖標(biāo)記的標(biāo)注方法也有其局限性。當(dāng)被測物的缺陷種類眾多、產(chǎn)品背景復(fù)雜、產(chǎn)品本身類型眾多、缺陷位置無法自動定位時,全圖標(biāo)記在小分辨率訓(xùn)練圖像自動相對于全圖分類的對整幅圖像進(jìn)行標(biāo)記,像素分割是在圖片中對缺陷區(qū)域進(jìn)行標(biāo)記,不明顯的裂紋第一、如上圖所示的不明顯裂紋,利用傳統(tǒng)算法很難分割出來,就算分割出來了,也會同時把其他的一些干擾因素分割出來,造成誤檢?;谏疃葘W(xué)習(xí)像素分割,可以不通過閾值等傳統(tǒng)方法分割,而是通過大量類似的數(shù)據(jù)訓(xùn)練出類腦模型后,進(jìn)行裂紋區(qū)基于像素分割模型的推理效果第二、當(dāng)干擾因素和缺陷類似,或干擾因素的層次感比缺陷還高時,用傳統(tǒng)分割算法盡管右下角的臟污比中間的裂紋更明顯,但是依然只準(zhǔn)確的檢測出裂紋隱約的裂紋缺陷也不會和其他非裂紋特征混淆量的圖像數(shù)據(jù)需要人工進(jìn)行缺陷類型以及位置的準(zhǔn)確標(biāo)相較于傳統(tǒng)的民用級深度學(xué)習(xí)開發(fā)過程中“創(chuàng)建數(shù)據(jù)集-加載數(shù)據(jù)集-創(chuàng)建神經(jīng)網(wǎng)絡(luò)模型-創(chuàng)建損失函數(shù)-設(shè)置優(yōu)化器-設(shè)置訓(xùn)練網(wǎng)絡(luò)的超參數(shù)-開始訓(xùn)練并記錄訓(xùn)練結(jié)果-保存更簡便,對人員的開發(fā)能力要求大大降低。無論是全圖分類還是像素分割,標(biāo)記工作完成之后,即可進(jìn)行深度學(xué)習(xí)模型訓(xùn)練的工作。深度學(xué)習(xí)軟件區(qū)別于傳統(tǒng)軟件最重要的特點(diǎn)之一,就是不需要具備圖像處理的基礎(chǔ)知識,不需要進(jìn)行復(fù)雜的算子選擇和程序創(chuàng)建,模型的訓(xùn)練完全是自動化進(jìn)行的,操作極其簡單,只需要借助GPU強(qiáng)大的算在模型訓(xùn)練的過程中,我們往往比較關(guān)注訓(xùn)練時間、準(zhǔn)確率/損失值等數(shù)據(jù)。訓(xùn)練時間的長短主要取決于廠家算法性能、訓(xùn)練用圖片分辨率、樣本數(shù)量、計算機(jī)提供的算力等。而準(zhǔn)確率/損失值數(shù)據(jù),跟圖片標(biāo)注的準(zhǔn)確率、樣本質(zhì)量、算法性能、訓(xùn)練輪數(shù)等有較大關(guān)系。對于支持小樣本訓(xùn)練的算法軟件,通??梢韵仁褂蒙倭繕颖具M(jìn)行標(biāo)注和訓(xùn)練多輪次,將準(zhǔn)確率提升至一定程度后進(jìn)行試運(yùn)行,過程中將檢測錯誤的圖片進(jìn)行重新標(biāo)注和訓(xùn)練,以快速、高效的提升模型準(zhǔn)確率。支持繼續(xù)訓(xùn)練也是這一方法可以實(shí)施的必要條件。使用大量圖片進(jìn)行驗(yàn)證、校驗(yàn)原有的標(biāo)注數(shù)據(jù)準(zhǔn)確性,也是模型訓(xùn)完成訓(xùn)練得到模型之后,深度學(xué)習(xí)項(xiàng)目即具備了上線運(yùn)行的基本條件,此時需要專門的人員進(jìn)行一定時長的跟機(jī)工作,在推理過程中,進(jìn)行模型準(zhǔn)確度的驗(yàn)證,實(shí)時發(fā)現(xiàn)誤檢、漏檢的圖片案例并進(jìn)行收集、再訓(xùn)練,不斷完善模型的準(zhǔn)確率,直至達(dá)到驗(yàn)收要求。通常需要預(yù)設(shè)一定的時間或樣本的數(shù)量,來驗(yàn)證項(xiàng)目是否達(dá)到了需求中的識別率、準(zhǔn)確率等數(shù)據(jù),因?yàn)橹挥性谡鎸?shí)的在線生產(chǎn)過程中滿足了這些指標(biāo)要求,深度學(xué)在工業(yè)生產(chǎn)中用戶經(jīng)常面臨的痛苦之一,是由于產(chǎn)品的種類更換、設(shè)備本身磨損帶來的產(chǎn)品一致性問題,會有新的種類及不良類型不斷產(chǎn)生,相比傳統(tǒng)視覺,使用深度學(xué)習(xí)帶來的額外好處是,在這種情況下,只需要在原來模型的基礎(chǔ)上進(jìn)行簡單的操作,AI工業(yè)視覺解決方案典型應(yīng)用場景使命就是執(zhí)行檢查任務(wù),例如檢測制造產(chǎn)品中的缺陷、污染物、功能缺陷等異常。相比人類視覺,機(jī)器視覺因其速度、準(zhǔn)確性和可重復(fù)性而在結(jié)構(gòu)化場景的定量測量中具有優(yōu)勢。利用適當(dāng)?shù)南鄼C(jī)分辨率和光學(xué)件配置制造的機(jī)器視覺系統(tǒng)可以輕松檢測人眼難以看到的物體細(xì)節(jié),并且檢測的可靠性較高,錯誤也較少。在生產(chǎn)線上,機(jī)器視覺系統(tǒng)可以可靠且重復(fù)地每分鐘檢查數(shù)百或數(shù)千個部件,遠(yuǎn)遠(yuǎn)超過人類的檢測能力。但是與傳統(tǒng)的機(jī)器視覺不同,人類擅長區(qū)分細(xì)微的表面和功能缺陷,以及區(qū)分可能影響感知質(zhì)量的部分外觀變化。雖然人類處理信息的速度有限,但人類有特殊的概念化和概括的能力。人類擅長通過實(shí)例學(xué)習(xí),并且在部件有小異常時,能夠區(qū)分真正重要的部分。在很多情況下,這使人類視覺成為定性解釋復(fù)雜、非結(jié)構(gòu)化場景的理想選擇,項(xiàng)目背景:在螺紋的生產(chǎn)加工過程中,因?yàn)楦鞣N原因會產(chǎn)生一定比例的不合格品,如果不能夠?qū)⒉缓细衿窓z測出來,會對產(chǎn)品本身的強(qiáng)度造成嚴(yán)重影響,采用傳統(tǒng)的視覺檢測方法對螺紋進(jìn)行檢測,因?yàn)槁菁y本身的紋理干擾等因素,在檢測的過程中無法檢測或者誤判率非常高,采用的深度學(xué)習(xí)功能,將誤判率大大的降低,良品率能夠達(dá)到用深度學(xué)習(xí)缺陷過濾模塊截圖截圖保存路徑設(shè)置截取的圖像項(xiàng)目背景:在電腦鍵盤字符印刷的過程中,經(jīng)常會產(chǎn)生各種印刷不良,采用傳統(tǒng)的視覺檢測方法進(jìn)行檢測,粉塵、毛屑、指紋等如果殘留在鍵盤上,就會對視覺檢測造成干擾,在檢測過程中將其誤檢為字符的印刷不良,使合格品被誤檢為不合格品,從而影響產(chǎn)線的生產(chǎn)效率,針對以上存在的問題,使用深度學(xué)習(xí)功能對鍵盤進(jìn)行檢測,使調(diào)用“模型分類”工具并加載訓(xùn)練好的表情識別模型基于深度學(xué)習(xí)的表情識別歸一化基于深度學(xué)習(xí)的表情識別相對于工業(yè)場景的分類來說,實(shí)現(xiàn)難度是比較小的,因?yàn)楸砬椴町惖奶卣髟趫D片上的數(shù)據(jù)差異是非常大的。以1000萬像素的手機(jī)圖片來說,同一而真正的難點(diǎn)是工業(yè)領(lǐng)域的分類。以目前算法比較成熟的紅棗分類檢測舉例,以500萬像素的工業(yè)相機(jī)來說,不同類型紅棗之間的特征差異,可能只有幾百個像素,而且差首先我們要選取合適的標(biāo)注方式,結(jié)合前文的介紹,紅棗的分類顯然更適合全圖分類2、使用截圖工具截取紅棗占據(jù)較大畫面比例的小分辨率圖像,得到全圖標(biāo)注所需要的采用這種標(biāo)注方式實(shí)現(xiàn)深度學(xué)習(xí)圖像分類的好處是顯而易見的,首先缺陷過濾模型相負(fù)樣本的差異性會大很多,訓(xùn)練成熟網(wǎng)絡(luò)模型需要的圖像數(shù)量相對較少,模型復(fù)雜程度相對較低。其次數(shù)據(jù)標(biāo)注相對容易,效率更高,因?yàn)閿?shù)據(jù)標(biāo)注時都是針對指定區(qū)域基于深度學(xué)習(xí)的字符識別可以比較有效的解決這一問題,字符識別也是深度學(xué)習(xí)技術(shù)典型的應(yīng)用場景之一。在工業(yè)生產(chǎn)尤其是包裝生產(chǎn)線上,存在大量的包裝袋、包裝盒體上的生產(chǎn)日期、批號字符需要進(jìn)行檢測,利用深度學(xué)習(xí)進(jìn)行小樣本的訓(xùn)練即可獲得缺陷顏色比背景“深”缺陷顏色比背景“淺”對于背景單一,真實(shí)缺陷和干擾因素比較明顯的缺陷,可以用傳統(tǒng)BLO

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論