




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
wlllliiiiiiiimai。。lllllliiiiiiiii。 13■機(jī)器視覺與智能制造14■合理算法模型,助力智能制造事半功倍19■打造敏捷自動(dòng)化的缺陷識(shí)別系統(tǒng)25■英特爾軟硬件工具27■小結(jié)29■基于時(shí)間序列的智能預(yù)測(cè)35■用時(shí)間序列預(yù)測(cè)未來的產(chǎn)能38■面向時(shí)序數(shù)據(jù)的維護(hù)性預(yù)測(cè)44■基于時(shí)序數(shù)據(jù),推動(dòng)智能運(yùn)維發(fā)展48■英特爾軟硬件工具49■小結(jié) 硬件產(chǎn)品軟件和框架4545趨趨6新技術(shù)浪潮正推動(dòng)著工業(yè)制造行業(yè)飛速革新,并以人工智能(ArtificialIntelligence,AI業(yè)革命的進(jìn)程。這一過程中,信息科技的進(jìn)步、AI技術(shù)的普及以及5G通訊技術(shù)的成熟,都將加速人類生產(chǎn)方式的迭代,與信息技術(shù)相伴的智力型勞動(dòng)將大規(guī)模代替體力勞動(dòng),進(jìn)而驅(qū)化使傳統(tǒng)工業(yè)制造、能源生產(chǎn)等企業(yè)轉(zhuǎn)型需求加凸顯等,使中國(guó)制造業(yè)成本已經(jīng)大幅上升。來自波士頓咨詢的制造成本為基準(zhǔn)指數(shù)100,中國(guó)的制造成本已高達(dá)961。加之經(jīng)濟(jì)發(fā)展進(jìn)入新常態(tài)后,出口貿(mào)易等領(lǐng)域的稅收優(yōu)惠在日益減少,使得無論是中小企業(yè)還是大型企業(yè),都面臨著生產(chǎn)、管理成本增加的嚴(yán)峻挑戰(zhàn);?市場(chǎng)需求的變化:市場(chǎng)消費(fèi)需求趨于個(gè)性化、差異化、定轉(zhuǎn)向?qū)€(gè)性定制和差異化的需求,且越來越便利的網(wǎng)購和物流使潮流更迭越來越快。以前單一款式、大批量生產(chǎn)的新的挑戰(zhàn)往往伴隨著前所未有的機(jī)遇。對(duì)于目前的工業(yè)領(lǐng)域,要縮減成本,就需要優(yōu)化生產(chǎn)和流通環(huán)節(jié),壓縮人力成本和開銷,提高良品率;要滿足個(gè)性化定制化需求,就需要更好地控更彈性的方式去運(yùn)營(yíng)生產(chǎn)和協(xié)調(diào)供應(yīng)鏈。這些需求,無疑為例如,利用機(jī)器視覺、智能預(yù)測(cè)等技術(shù),不僅能使產(chǎn)品故障率更能通過自動(dòng)化檢測(cè)幫助企業(yè)大幅減少人力成本;另外,通過深度學(xué)習(xí)等AI方法構(gòu)建的產(chǎn)能預(yù)測(cè)解決方案,還能幫助企業(yè)利用AI帶來的技術(shù)革新、生產(chǎn)效率優(yōu)化以及運(yùn)營(yíng)效率提升,不僅可以幫助傳統(tǒng)制造企業(yè)從容應(yīng)對(duì)成本和市場(chǎng)帶來的挑戰(zhàn),加快產(chǎn)業(yè)升級(jí),更可以完成從人力密集型到技術(shù)密集型的轉(zhuǎn)故障監(jiān)控、維保預(yù)測(cè)、能源管理、機(jī)械臂控制以及市場(chǎng)分析預(yù)估等使用場(chǎng)景中,越來越多的AI軟硬件產(chǎn)品及解決方案正發(fā)揮越來越大的作用,市場(chǎng)前景廣闊。如圖1-1-1所示,來自Tractica數(shù)據(jù)表明,到2025年,工業(yè)制造領(lǐng)域的AI投資規(guī)Tractica$14,000$12,000$10,000 $8,000 $6,000 $4,000 $2,000$-SoftwareServices20182019202020212022202320242025Source:Source:Tractica特特戰(zhàn)趨勢(shì)篇7特特戰(zhàn)趨勢(shì)篇8與其他領(lǐng)域相比,工業(yè)制造領(lǐng)域涉足信息化和自動(dòng)化的歷史堪段都有其局限性,在企業(yè)實(shí)施智能制造的轉(zhuǎn)型中,由于生產(chǎn)流?使用成本高:傳統(tǒng)信息化、自動(dòng)化方案一般都是軟硬件一體?靈活性不足:傳統(tǒng)信息化、自動(dòng)化方案基本都是接口。即便有接口,不同廠商的設(shè)備之間也缺能將基于AI方法的數(shù)據(jù)處理和分析能力部署到最接近生產(chǎn)一如圖1-1-2所示,通過深度學(xué)習(xí)、機(jī)器學(xué)習(xí)等方法所構(gòu)建的目前,AI應(yīng)用在工業(yè)制造有兩個(gè)方向上備受關(guān)注,分別是基于機(jī)器視覺(MachineVision)的工業(yè)輔助檢測(cè)和基于時(shí)序得益于圖像采集硬件、深度學(xué)習(xí)算法以及邊緣計(jì)算等技術(shù)的蓬勃發(fā)展,基于機(jī)器視覺的工業(yè)輔助檢測(cè)目前已在電子制造、汽車、紡織等領(lǐng)域獲得了廣泛的應(yīng)用。與人工檢測(cè)相比,其依托先進(jìn)的鏡頭技術(shù)和成像技術(shù),以及推陳出新的深度學(xué)習(xí)、機(jī)器?精度更高:機(jī)器視覺具有256級(jí),相對(duì)于64級(jí)灰度的人 ?速度更快:人眼無法追蹤高速物體,而?數(shù)據(jù)更豐富:利用機(jī)器視覺系統(tǒng),用戶可以留而基于時(shí)序數(shù)據(jù)的智能預(yù)測(cè),則能幫助眾多?企業(yè)可通過IT智能運(yùn)維,更好釋放IT資源潛力,助力業(yè)這些優(yōu)勢(shì)與收益,讓基于機(jī)器視覺的工業(yè)輔助檢測(cè)以及基于時(shí)序數(shù)據(jù)的智能預(yù)測(cè)成為了傳統(tǒng)工業(yè)制造企業(yè)實(shí)施智能轉(zhuǎn)型的左膀右臂。這一過程中,來自英特爾的至強(qiáng)?可擴(kuò)展處理平臺(tái)等一系列先進(jìn)產(chǎn)品與技術(shù),為智能方案成功實(shí)施和運(yùn)行提供了堅(jiān)實(shí)基礎(chǔ)。通過這些高性能硬件基礎(chǔ)設(shè)施和軟件框架業(yè)的生產(chǎn)和運(yùn)營(yíng)可以實(shí)現(xiàn)從自動(dòng)化向智能化的轉(zhuǎn)變特特戰(zhàn)趨勢(shì)篇9特戰(zhàn)實(shí)戰(zhàn)篇AI機(jī)器視覺落地實(shí)戰(zhàn)篇行業(yè)面向未來、尋求突破的關(guān)鍵路徑。通過融合機(jī)器人、大數(shù)和控制問題,而融合了計(jì)算機(jī)視覺和AI技術(shù)的機(jī)器視覺,則如圖2-1-1所示,機(jī)器視覺系統(tǒng)的基本架構(gòu),是通過工業(yè)相機(jī)等圖像采集裝置,將目標(biāo)轉(zhuǎn)換成圖像信號(hào),再通過網(wǎng)顏色等信息,抽取目標(biāo)特征,最終得到判別結(jié)果,并利用工控這一方法進(jìn)行紡織品的瑕疵自動(dòng)化檢測(cè)。由于紡織機(jī)械運(yùn)行速度非常高,流水線速度可達(dá)數(shù)米每秒,漏針、破洞、錯(cuò)針等瑕通過引入機(jī)器視覺,紡織產(chǎn)線不僅可以準(zhǔn)確地記錄時(shí)間與位置,還能與生產(chǎn)控制系統(tǒng)相關(guān)聯(lián),根據(jù)檢測(cè)情利用工業(yè)化視覺系統(tǒng)來提升自動(dòng)化生產(chǎn)效能并非新生事物,早在上個(gè)世紀(jì)就有很多企業(yè)開始了這方面的探索與部署。但傳統(tǒng)的機(jī)器視覺方案存在許多不足和局限,主要體現(xiàn)在以下?成本昂貴,使用門檻高:傳統(tǒng)的機(jī)器視覺方案方式固化在工業(yè)相機(jī)等類特定硬件上。一旦檢測(cè)精度或檢測(cè)?靈活性差:傳統(tǒng)機(jī)器視覺方案往往都基于固定識(shí)別模式開發(fā),靈活性較差,導(dǎo)致在部署檢測(cè)系統(tǒng)時(shí),需要對(duì)相關(guān)產(chǎn)線進(jìn)行調(diào)整,且對(duì)檢測(cè)對(duì)象的位置、尺寸及擺放方向都有嚴(yán)格要求,被檢測(cè)對(duì)象的任何偏離也都會(huì)造成檢測(cè)結(jié)果的不可信。同時(shí),由于傳統(tǒng)機(jī)器視覺方案與硬件緊密耦合,對(duì)位置、環(huán)境以及溫濕度等也都有更高要求,因此很難做特特戰(zhàn)實(shí)戰(zhàn)篇特特戰(zhàn)實(shí)戰(zhàn)篇?開放性兼容性差:傳統(tǒng)機(jī)器視覺方案一般都采用軟硬一體緊耦合的模式,方案商同時(shí)也是設(shè)備商。因此,難以在同一套設(shè)備上集成多種機(jī)器視覺方案,即便工廠對(duì)設(shè)備實(shí)施二次開發(fā),也要付出極高的成本。如果更換設(shè)備供應(yīng)商,機(jī)器學(xué)習(xí)等AI方法引入傳統(tǒng)的機(jī)器視覺方案,并取得了良好首先,在成本方面,以深度學(xué)習(xí)框架為基礎(chǔ)的AI機(jī)器視覺方案是一個(gè)完全開放的平臺(tái),其核心是開源的深度學(xué)習(xí)框架和通用的計(jì)算設(shè)備(例如基于英特爾?架構(gòu)的服務(wù)器企業(yè)完全身要求的檢測(cè)算法和應(yīng)用。當(dāng)應(yīng)用需求發(fā)生變化需依賴外部資源,可自行在新的數(shù)據(jù)集上進(jìn)行模型和算法的迭代優(yōu)化。同時(shí),完全解耦的軟硬件架構(gòu)也使升級(jí)和應(yīng)用整合變合開源深度學(xué)習(xí)框架,可彈性滿足用戶多樣化的部署和其次,在靈活性方面,深度學(xué)習(xí)是完全基于大數(shù)據(jù)的AI數(shù)據(jù)分析和處理方法。它不需要預(yù)設(shè)任何模式或框架自主采集數(shù)據(jù),形成自己的機(jī)器視覺應(yīng)用標(biāo)準(zhǔn)和規(guī)范。由此形成的方案源于企業(yè)的實(shí)際應(yīng)用需求,獨(dú)立于設(shè)備供應(yīng)商之外,工業(yè)檢測(cè)是現(xiàn)代化制造業(yè)中不可或缺的流程要通過人眼識(shí)別或工具輔助方式進(jìn)行產(chǎn)品檢率也不高。AI機(jī)器視覺的出現(xiàn),能逐一彌補(bǔ)這些不足,為產(chǎn)品檢測(cè)精度和效率帶來成百上千倍的提升?;跈C(jī)業(yè)輔助檢測(cè)系統(tǒng)需要使用高效、適宜的圖像分類、目標(biāo)檢測(cè)以■YOLO算法傳統(tǒng)的R-CNN、Faster-RCNN等目標(biāo)檢測(cè)算法,由于目標(biāo)識(shí)別和目標(biāo)定位分離的設(shè)計(jì)模式,都無法達(dá)到工業(yè)輔助檢測(cè)所需的低延遲和實(shí)時(shí)性。近年來出現(xiàn)的SSD(SingleShot法,將目標(biāo)識(shí)別和目標(biāo)定位兩個(gè)步驟合二為一,大幅提升了如圖2-1-2所示,YOLO算法將目標(biāo)檢測(cè)任務(wù)轉(zhuǎn)換成一個(gè)回 超過24幀每秒的人眼感知速度,達(dá)到了實(shí)時(shí)性■SSD算法雖然YOLO算法在執(zhí)行速度上有了巨大提升,但檢測(cè)準(zhǔn)確率相對(duì)不足。SSD算法彌補(bǔ)了這一短板,融合了YOLO算法的如圖2-1-3所示,SSD算法通常基于傳統(tǒng)的圖像分類網(wǎng)絡(luò),與其他算法不同的是,SSD有多個(gè)候選框和特征圖。在神經(jīng)網(wǎng)絡(luò)中,淺層的特征圖往往包含更多細(xì)節(jié)信息,適合較小目標(biāo)的檢測(cè);較深的特征圖包含更多全局信息,適合大目標(biāo)的檢殘差網(wǎng)絡(luò)(ResidualNet,ResNet)是目前常用的分類模型算法之一。眾所周知,在深度神經(jīng)網(wǎng)絡(luò)中,網(wǎng)絡(luò)層數(shù)越多,輸出的特征表達(dá)能力越強(qiáng)。但過深的網(wǎng)絡(luò)也會(huì)帶來梯度消失由此反而引起分類準(zhǔn)確率的下降。ResNet算法通過創(chuàng)新的結(jié)構(gòu)來有效地解決這一問題。如圖xVGG-16throughPool5layerExtraFeatureVGG-16throughPool5layerDetections:7308perClassNon-MaximumSuppression Classifier:Conv:3x3x(3x(Classes+4))Detections:7308perClassNon-MaximumSuppressionClassifier:Conv:3x3x(6x(Classes+4))SSD72.1mAP58FPSSSD72.1mAP58FPSConv:3x3x1024Conv:1x1x1024Conv:1x1x256Conv:1x1x128Conv:1x1x128AvgConv:3x3x512-s2Conv:3x3x256-s2Conv:3x3x256-s2特特戰(zhàn)實(shí)戰(zhàn)篇特特戰(zhàn)實(shí)戰(zhàn)篇隨著機(jī)器視覺在工業(yè)輔助檢測(cè)場(chǎng)景中的廣泛應(yīng)用,理的部署也逐漸不再限于大型數(shù)據(jù)中心的服務(wù)器中。MEC)的發(fā)展讓更多企業(yè)和機(jī)構(gòu)傾向于將AI應(yīng)用向邊緣側(cè)部署。因此,機(jī)器視覺也需要引入更為輕銳的輕量級(jí)目SSDLite+MobileNetV2模型是近年來備受矚目的輕量級(jí)目標(biāo)檢測(cè)算法模型之一。通過將輕量級(jí)網(wǎng)絡(luò)MobilenetV2替換傳統(tǒng)SSD算法中的VGG部分,同時(shí)將SSD算法中的普通卷積替換為深度可分離卷積(DepthwiseSeparable基于圖像數(shù)據(jù)的缺陷檢測(cè)通常會(huì)用到圖像分類、目標(biāo)檢測(cè)以及實(shí)例分割等深度學(xué)習(xí)方法。那么,在日常缺陷檢測(cè)應(yīng)用中如何而沒有對(duì)于目標(biāo)物體位置的訴求,可以直接采用分類算法進(jìn)行嘗試,利用預(yù)訓(xùn)練好的拓?fù)淠P屯ㄟ^模型微調(diào)(fine-tuning)的方式應(yīng)用到自有的數(shù)據(jù)當(dāng)中。常用模型有:測(cè)或者分割的方式。這兩種模型的一個(gè)區(qū)別是,可根據(jù)具體的需求來選擇,通常YOLO類和SSD類是滿足■項(xiàng)目背景望通過完整、可復(fù)制的產(chǎn)品缺陷檢測(cè)方案,來完善其智能制造產(chǎn)業(yè)鏈中的關(guān)鍵環(huán)節(jié)。如前面提到的,由工業(yè)相機(jī)、工控機(jī)以及機(jī)器人組成的傳統(tǒng)視覺方案存在諸多問題,例如定制化開發(fā)周期長(zhǎng)、成本高,檢測(cè)內(nèi)容多樣化造成參數(shù)標(biāo)定繁瑣?對(duì)單個(gè)檢測(cè)項(xiàng)目形成通用的推理算法,并可推廣至不同?可在任何產(chǎn)線上做到無縫部署,不干擾現(xiàn)有生產(chǎn)和工藝來自生產(chǎn)一線的海量數(shù)據(jù)資源,讓美的具備了利用AI技術(shù),美的通過前端高清圖像采集、后端訓(xùn)練推理的架構(gòu),構(gòu)建了基于深度學(xué)習(xí)的工業(yè)視覺檢測(cè)云平臺(tái),為旗下各產(chǎn)線提供瑕疵檢在這一過程中,英特爾不僅為新方案提供了AnalyticsZoo再到數(shù)據(jù)預(yù)測(cè)、特征提取的全流程,還針對(duì)美的各生產(chǎn)線的■基于AnalyticsZoo的端到端解決方案在前端,執(zhí)行圖像采集的機(jī)器人通常裝有多個(gè)工業(yè)相機(jī),通過機(jī)器人與旋轉(zhuǎn)臺(tái)的聯(lián)動(dòng),先使用遠(yuǎn)距離相機(jī)拍攝微波爐待再驅(qū)動(dòng)近距離相機(jī)進(jìn)行局部拍攝。相機(jī)采集到的不同圖像,先需求確定需要傳輸?shù)皆贫撕?,再將?shù)據(jù)傳送到后端云服務(wù)器,雖然這一架構(gòu)并不復(fù)雜,但新方案要達(dá)到美的希望的靈活、敏捷和高通用性卻并非易事。尤其是以端到端方式構(gòu)建從數(shù)據(jù)采自行建設(shè),勢(shì)必會(huì)耗費(fèi)大量的時(shí)間和開發(fā)成本,且容易造成軟等多種技術(shù)框架,可直接運(yùn)行在英特爾?架構(gòu)服務(wù)器構(gòu)建的大數(shù)據(jù)集群上,并可通過對(duì)英特爾?至強(qiáng)?可擴(kuò)展處理器進(jìn)行深度優(yōu)化,充分釋放強(qiáng)大的性能潛力。同時(shí),Analytics覺檢測(cè)云平臺(tái)大幅提升特征訓(xùn)練、圖片預(yù)測(cè)以及數(shù)據(jù)批處理等▲特特戰(zhàn)實(shí)戰(zhàn)篇特特戰(zhàn)實(shí)戰(zhàn)篇通過雙方的緊密合作,英特爾幫助美的在其新方案后端的云服務(wù)器中,基于AnalyticsZoo1.通過Spark,方案以分布式方式處理來自各產(chǎn)線工業(yè)PySpark從磁盤中讀取視頻或圖像數(shù)據(jù)并進(jìn)行預(yù)處理,構(gòu)3.直接使用在第一步中預(yù)處理的圖像RDD,以分布式方式在Spark集群上訓(xùn)練(或微調(diào))對(duì)象檢測(cè)模型。例如,為了以分將原始圖像數(shù)據(jù)讀取到RDD中,然后應(yīng)用一些變換來解碼圖),它可以直接用于創(chuàng)建TensorFlow模型,并在Analyti上進(jìn)行分布式訓(xùn)練。通過創(chuàng)建TFDataset(如下所示可以);https://analytics-zoo.github.io/master/#ProgrammingGuide/通過這樣的方法,新方案可以對(duì)預(yù)處理過的圖像進(jìn)行識(shí)別,系統(tǒng)會(huì)將識(shí)別結(jié)果傳遞給機(jī)械臂等自動(dòng)化設(shè)備來執(zhí)行下一步AVX-512)等技術(shù)得以大展拳腳,以出色的并行計(jì)算能力,如前文所述,提升基于機(jī)器視覺的工業(yè)輔助檢測(cè)系統(tǒng)能,關(guān)鍵在于為其選擇高效、適宜的目標(biāo)檢測(cè)。美的的新方案利用AnalyticsZoo,新方案使用TFDataset來表示一個(gè)分布式存儲(chǔ)的記錄集合,每條記錄包含一個(gè)或多個(gè)TensorFlow如以下代碼所示,方案通過TensorFlowObjectDetection最終方案在驗(yàn)證數(shù)據(jù)集上的成效可達(dá)0.97mAP@0.5?!龇桨赋尚⑸疃葘W(xué)習(xí)的方法引入工業(yè)輔助檢測(cè)領(lǐng)域,不僅讓美的工業(yè)視覺檢測(cè)云平臺(tái)可以快速、敏捷、自動(dòng)地識(shí)別出待測(cè)產(chǎn)品重要的是,該云平臺(tái)能夠良好適應(yīng)非標(biāo)準(zhǔn)變化內(nèi)容和環(huán)境發(fā)生變化,云平臺(tái)也能很快適應(yīng),省去了冗長(zhǎng)的新特征識(shí)別、驗(yàn)證時(shí)間。同時(shí),這一方案也能有效地提高檢測(cè)的新方案在美的產(chǎn)線中實(shí)際部署后,達(dá)到了很好的應(yīng)用效果。從延遲在線服務(wù)所耗費(fèi)的人力物力成本。相比傳統(tǒng)的案,如圖2-1-8所示,項(xiàng)目部署周期縮短了57%,物料成本減少30%,人工成本減少70%4。傳統(tǒng)方案?jìng)鹘y(tǒng)方案新方案0.70.30.43人力成本物料成本項(xiàng)目周期11法模型也有效提升了方案的執(zhí)行效率和準(zhǔn)確率。來自一線的數(shù)據(jù)表明,方案對(duì)諸多缺陷的識(shí)別率達(dá)到了99.98%,推理預(yù)測(cè)/intel-analytics/analytics-zoo/blob/master/意味著設(shè)備產(chǎn)能越大,收益率越高,因此良品率一直是制造業(yè)傳統(tǒng)上,制造企業(yè)通過人工方法進(jìn)行缺陷檢測(cè)。但這種依靠密集勞動(dòng)力的方法不僅效率低下,準(zhǔn)確率也不高,且抬升人隨著機(jī)器視覺技術(shù)的蓬勃發(fā)展,更多制造企業(yè)正利用基于學(xué)習(xí)的機(jī)器視覺技術(shù),構(gòu)建更為敏捷和高效的自動(dòng)化缺陷識(shí)別高清生產(chǎn)影像,從中計(jì)算提取出不同的識(shí)別特征來用于缺陷識(shí)包括英特爾工廠在內(nèi)的生產(chǎn)企業(yè)正通過ADC系統(tǒng)的部署,在晶圓封裝、測(cè)試等核心生產(chǎn)環(huán)節(jié)中,實(shí)現(xiàn)更高效的■項(xiàng)目背景晶圓的加工、封裝及測(cè)試是芯片制造中的關(guān)鍵步驟。英特爾工廠需要在其產(chǎn)線上部署同步缺陷測(cè)量(InlinedefectMetrology)的流程,從微觀的芯片布名員工實(shí)現(xiàn)90%的檢測(cè)準(zhǔn)確率,需要6-9個(gè)月的時(shí)間,但隨著時(shí)間的推移,人工檢測(cè)準(zhǔn)確率會(huì)從90%逐漸下降到75%-80%。究其原因,一方面是因?yàn)槠诤椭貜?fù)勞動(dòng)會(huì)降低人工檢測(cè)的生產(chǎn)效率,另一方面,日新月異的工藝進(jìn)步,也會(huì)使員該數(shù)據(jù)來自美的與英特爾合作項(xiàng)目未公開的測(cè)試報(bào)告:《美的微波爐特特戰(zhàn)實(shí)戰(zhàn)篇特特戰(zhàn)實(shí)戰(zhàn)篇20例如圖2-1-9所示,在晶圓封裝流程中,由環(huán)氧樹脂噴涂工帶來的問題,尺寸都在微米級(jí)甚至更小,使得肉眼辨別非常為此,英特爾工廠在晶圓產(chǎn)線中引入了基于機(jī)器視覺的ADC■基于機(jī)器學(xué)習(xí)方法,構(gòu)建高效敏捷的自動(dòng)化缺英特爾工廠希望利用基于機(jī)器視覺技術(shù)的ADC系統(tǒng)來解決晶圓生產(chǎn)、封裝流程中的自動(dòng)化缺陷檢測(cè)識(shí)別,并將檢測(cè)結(jié)果反解決方案架構(gòu)如圖2-1-10所示,首先,由工控機(jī)控制的高清會(huì)根據(jù)需求,采集高清圖像推送至其后的分類模型推理服務(wù)器找出缺陷瑕疵并進(jìn)行相應(yīng)的分類識(shí)別。分類識(shí)別的結(jié)果將被送圖像采集裝置!產(chǎn)線工控機(jī)!i!i分析數(shù)據(jù)庫端的模型訓(xùn)練服務(wù)器上進(jìn)行模型迭代和優(yōu)化。迭代優(yōu)化完成之后,更新的模型會(huì)被再次推送到前端的分類模型推理服務(wù)進(jìn)行升級(jí)。無論是數(shù)據(jù)提取、處理、還是模型訓(xùn)練,方用了分布式的并行處理的架構(gòu),可以方便地根據(jù)業(yè)務(wù)需求實(shí)現(xiàn)?數(shù)據(jù)分類:在晶圓的各個(gè)層級(jí)上,有過數(shù)以缺陷識(shí)別和定義進(jìn)行了預(yù)搜集。在新方案中,?特征學(xué)習(xí):根據(jù)不同產(chǎn)線的需求,方案加入了基于不同算法全面優(yōu)化升級(jí)的微架構(gòu),為方案帶去了更強(qiáng)勁的計(jì)算力。同■方案成效目前,利用ADC系統(tǒng),英特爾工廠可在不升任何額外設(shè)備的情況下,將高效、敏捷的自動(dòng)化產(chǎn)品缺陷瑕疵的同時(shí),也使AI基礎(chǔ)設(shè)施架構(gòu)悄然發(fā)生變化,且在制造業(yè)中表現(xiàn)尤為明顯。如圖2-1-11所示,傳統(tǒng)制造企業(yè)產(chǎn)線與IT設(shè)施分布往往是多層、豎井式的:企業(yè)總部的數(shù)據(jù)中心一般會(huì)器上會(huì)部署生產(chǎn)管理相關(guān)的調(diào)度系統(tǒng);而底層這樣的架構(gòu)會(huì)對(duì)AI系統(tǒng)的構(gòu)建和運(yùn)行帶來阻礙。如前所述,被局限在各個(gè)分廠、各個(gè)子系統(tǒng)中間,缺乏橫向連接,因而無法聚合成為AI應(yīng)用的強(qiáng)效動(dòng)力引擎;其次,總部數(shù)據(jù)中心也往往不能與生產(chǎn)一線的自動(dòng)化操作系統(tǒng)、檢測(cè)系統(tǒng)實(shí)現(xiàn)數(shù)據(jù)互動(dòng),導(dǎo)致優(yōu)化策略無法實(shí)時(shí)下達(dá)到生產(chǎn)一線,AI應(yīng)用難以實(shí)現(xiàn)迭代優(yōu)化。另外,來自車間、產(chǎn)線的海量邊緣數(shù)據(jù)需要進(jìn)行實(shí)時(shí)采集與分析,而且對(duì)響應(yīng)時(shí)延也有著苛刻的要求,這對(duì)傳統(tǒng)集中式的數(shù)據(jù)中心模式也提出了嚴(yán)峻挑戰(zhàn)。因此,要推動(dòng)智能制造系統(tǒng)的發(fā)展,必須對(duì)AI基礎(chǔ)架構(gòu)做出合理調(diào)推動(dòng)業(yè)務(wù)下沉,在網(wǎng)絡(luò)邊緣構(gòu)建有效的AI處理機(jī)制是應(yīng)對(duì)這一挑戰(zhàn)的有力手段。隨著邊緣技術(shù)的發(fā)展與成熟,更多基于邊緣、端、云協(xié)同的AI應(yīng)用模式正走向前臺(tái),并顯現(xiàn)出多項(xiàng)?緩解網(wǎng)絡(luò)帶寬與數(shù)據(jù)中心壓力:在制海量數(shù)據(jù)供訓(xùn)練和推理使用。通過在邊緣側(cè)對(duì)數(shù)?增強(qiáng)設(shè)備響應(yīng)能力:邊緣計(jì)算的近距離服務(wù)模式能減少因網(wǎng)絡(luò)連接和路由不穩(wěn)等因素帶來的長(zhǎng)時(shí)延。部?提升數(shù)據(jù)安全性:位于企業(yè)生產(chǎn)內(nèi)網(wǎng)的邊緣計(jì)算節(jié)點(diǎn),為企業(yè)關(guān)鍵性隱私數(shù)據(jù)的存儲(chǔ)和使用提供了基礎(chǔ)設(shè)施,關(guān)鍵數(shù)據(jù)可在邊緣側(cè)完成推理而無須上傳云端,大幅提升了數(shù)■項(xiàng)目背景該方案來自某全球領(lǐng)先的鋰電池研發(fā)和制造企業(yè)。面對(duì)加的市場(chǎng)需求,該企業(yè)積極引入了智能制造技術(shù),對(duì)多種鋰電池的各個(gè)生產(chǎn)環(huán)節(jié)進(jìn)行調(diào)控與優(yōu)化,提高生產(chǎn)效率,在保持優(yōu)特特戰(zhàn)實(shí)戰(zhàn)篇21特特戰(zhàn)實(shí)戰(zhàn)篇22為有效應(yīng)對(duì)以上問題,這家企業(yè)在英特爾的支持下,利用AI方法構(gòu)建全新的動(dòng)力電池缺陷檢測(cè)方案。通過對(duì)產(chǎn)能需求的評(píng)估,該企業(yè)希望新方案能夠達(dá)到單條產(chǎn)線423FPS新方案一方面根據(jù)動(dòng)力電池產(chǎn)線的實(shí)際部署情況,以基于緣計(jì)算節(jié)點(diǎn))-端(產(chǎn)線工控機(jī)、工業(yè)相機(jī))的架構(gòu),并引入形成端到端的機(jī)器視覺缺陷檢測(cè)方案;另一方面,根景的差異,方案中也部署了多種不同的深度學(xué)習(xí)和機(jī)器學(xué)習(xí)算■“云-邊-端”協(xié)同,構(gòu)建基于機(jī)器為構(gòu)建高性能的缺陷檢測(cè)平臺(tái),雙方首先從基礎(chǔ)架構(gòu)入手,根據(jù)總部云數(shù)據(jù)中心、各產(chǎn)線的生產(chǎn)管理系統(tǒng)、各類檢測(cè)缺陷檢測(cè)流程中的不同作用,以及所處的不同場(chǎng)景帶來的中心,可以利用強(qiáng)大的計(jì)算能力和來自各產(chǎn)線的豐富數(shù)據(jù),根據(jù)生產(chǎn)場(chǎng)景需要進(jìn)行集中化的模型訓(xùn)練,再將訓(xùn)練好的模型發(fā)這一架構(gòu)經(jīng)部署后對(duì)提升缺陷檢測(cè)效率效果顯著。如圖2-1-12所示,首先,方案采用了分層推理的方案。從前文可知,無論哪種目標(biāo)檢測(cè)算法,都會(huì)耗費(fèi)龐大的算力和帶寬(用于數(shù)據(jù)傳輸)資源;且離產(chǎn)線越遠(yuǎn),檢測(cè)時(shí)延就越高。在新方案中,端側(cè)系統(tǒng)采用開源的OpenCV計(jì)算機(jī)視覺庫對(duì)采集的圖像流實(shí)施預(yù)處理,并將預(yù)分類等簡(jiǎn)單工作負(fù)載部署在基于對(duì)于目標(biāo)檢測(cè)、圖像分割等較“重”的工作負(fù)載,則通過邊緣處理器的服務(wù)器(集群)構(gòu)建,可以從云數(shù)據(jù)中心調(diào)取合適的模型和參數(shù),并通過英特爾提供的統(tǒng)一大數(shù)據(jù)分析及AI平臺(tái)而云端數(shù)據(jù)中心則主要承擔(dān)高強(qiáng)度模型訓(xùn)練、推構(gòu)成高性能計(jì)算集群外,云端還配備了可擴(kuò)展的中心存儲(chǔ)數(shù)據(jù) 標(biāo)檢測(cè)、圖像分割)邊緣計(jì)經(jīng)過本地預(yù)處理的海量圖像流匯集到云端后,方案采用Labelme標(biāo)注工具對(duì)數(shù)據(jù)集中的圖像進(jìn)行標(biāo)注,并將標(biāo)注后的特征類別及位置信息傳輸?shù)接?jì)算集群中進(jìn)行訓(xùn)練和推理。Labelme工具不僅可以標(biāo)注各種形狀,還具備圖像分類、目標(biāo)檢測(cè)、場(chǎng)景分割、實(shí)例分割、視頻標(biāo)注等功能,可以很好覆蓋動(dòng)力電池缺陷檢測(cè)的范圍。更重要的是,該工具支持像素級(jí)值得一提的是,云端的算力雖然充沛,但其遠(yuǎn)離產(chǎn)線,實(shí)時(shí)性片轉(zhuǎn)換工具,可輕松應(yīng)對(duì)各種圖像檢測(cè)場(chǎng)景。新框架不僅繼承了原生PyTorch簡(jiǎn)潔、靈活的特點(diǎn),還引入面向深度神經(jīng)網(wǎng)供的模型優(yōu)化器、指令集優(yōu)化等功能,令新方案獲得了非常好變得更為順暢。這一架構(gòu)將Spark、PyTorch、OpenVI工具套件以及其它軟件和框架,無縫集成到同于新方案將數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)處理以及訓(xùn)練推■針對(duì)不同檢測(cè)場(chǎng)景,采用適宜檢測(cè)算法在這家全球領(lǐng)先的鋰電池生產(chǎn)制造企業(yè)的動(dòng)力電池三種主要的動(dòng)力電池缺陷檢測(cè)場(chǎng)景:絕緣膜間隙檢測(cè)、正負(fù)極檢測(cè)速度、檢測(cè)精度以及檢測(cè)參數(shù)都有不同的要求。通過縝密■絕緣膜間隙檢測(cè)絕緣膜是電池充放電時(shí)鋰離子傳輸?shù)闹匾橘|(zhì),其間隙過大或過小都會(huì)影響電池的性能,因此在生產(chǎn)中需要嚴(yán)格把控絕緣膜現(xiàn)精細(xì)的絕緣膜間隙檢測(cè)流程。MaskR-CNN模型是Faster的分類,進(jìn)而確定圖像中檢測(cè)目標(biāo)的類別和位置,并測(cè)量實(shí)現(xiàn)產(chǎn)線所需的0.3-3.9mm的測(cè)量需求,超過該范圍即■正負(fù)極偏差檢測(cè)在動(dòng)力鋰電池生產(chǎn)過程中,正極片、絕緣膜、負(fù)極片三層材料會(huì)疊壓在一起進(jìn)行卷繞,正常的電池正負(fù)極需交替出現(xiàn),且個(gè)存在缺陷,需及時(shí)進(jìn)行自動(dòng)糾偏調(diào)整來控制質(zhì)量,這對(duì)實(shí)時(shí)性英特爾在方案中建議采用輕量級(jí)快速目標(biāo)檢測(cè)模型——YOLOv3來進(jìn)行正負(fù)極偏差檢測(cè)。如前文(第14頁“YOLO算法”部分)所述,YOLO算法模型的主要特點(diǎn)就是檢測(cè)速度高,而YOLOv3模型作為其輕量級(jí)進(jìn)階版本,在檢測(cè)準(zhǔn)確率和推理速度上有了進(jìn)一步的提升,尤其適用于諸如動(dòng)力電池產(chǎn)線正負(fù)特特戰(zhàn)實(shí)戰(zhàn)篇23特特戰(zhàn)實(shí)戰(zhàn)篇24■絕緣膜異常問題檢測(cè)絕緣膜異常問題檢測(cè)主要用于避免動(dòng)力電池中的絕緣膜異常,導(dǎo)致正負(fù)極接觸而引發(fā)短路事故。如圖2-1-15所示,絕緣膜非常薄,因此該檢測(cè)對(duì)精細(xì)度和準(zhǔn)確率要求非常高。在經(jīng)典的深度神經(jīng)網(wǎng)絡(luò)中,網(wǎng)絡(luò)層數(shù)越多,能夠提取到的圖像特征越豐富,也更符合該類檢測(cè)的需求。但隨著網(wǎng)絡(luò)深度的增加,退化如果繼續(xù)增加深度,準(zhǔn)確率反而會(huì)下降。ResNet可有效解決這一問題。其由多個(gè)殘差塊和恒等映射塊拼接而成,與一般深度神經(jīng)網(wǎng)絡(luò)相比,能有效梯度消失和退化問題。因此,英特爾在方案中■混合學(xué)習(xí)方法和遷移學(xué)習(xí)訓(xùn)練,提升檢測(cè)效率經(jīng)過產(chǎn)線檢測(cè)實(shí)踐發(fā)現(xiàn),通過單一的深度學(xué)習(xí)方法獲得更優(yōu)疑給整個(gè)檢測(cè)過程帶來了一定的不確定性,并增加了使用難度。為此,英特爾在方案中推薦采用機(jī)器學(xué)習(xí)中的支持向量機(jī)網(wǎng)絡(luò)一起,組成混合模型來實(shí)施檢測(cè),同樣也可以達(dá)到類似的優(yōu)化效果。SVM分類器能夠依據(jù)支持向量與分類超平面間隔最大化的原則,通過多次訓(xùn)練迭代,尋求最優(yōu)的分類超平面來針對(duì)絕緣膜異常檢測(cè)中的多分類(multiple-class)問題,SVM能將其分解為多個(gè)二分類問題,再構(gòu)造多個(gè)分類器來解決。ResNet50+SVM的組合方案,不僅很好地解決了絕緣膜破損、丟失、褶皺等異常問題的檢測(cè)難題,還大幅提升模型的檢測(cè)效率和準(zhǔn)確度除了與選擇合適的模型相關(guān)外,還需要有充足的訓(xùn)練數(shù)據(jù)。一般情況下,要滿足實(shí)用要求,數(shù)量級(jí)需達(dá)到百萬級(jí)甚至千萬級(jí)。但在實(shí)際產(chǎn)線中,如此針對(duì)這種矛盾,英特爾在新方案推薦采用遷移學(xué)習(xí)訓(xùn)練已有的預(yù)訓(xùn)練源模型進(jìn)行微調(diào)(fine-tuning將源模型的初始參數(shù)重新配置,直接從最后一層或最后幾層開始重新訓(xùn)練,這樣只需依靠少量數(shù)據(jù)集作為樣本,并在訓(xùn)練集中加入曾經(jīng)預(yù)測(cè)錯(cuò)誤的圖片,就可以提升模型在新樣本中對(duì)于該類別的訓(xùn)練準(zhǔn)確度。通過調(diào)整,這一措施得出的模型精度甚至可以和采用為了幫助合作伙伴更好地探索優(yōu)化方案,英特爾也從其解決方案的實(shí)際需求出發(fā),給出了多樣化的配置優(yōu)化代碼示例。以下是使用PyTorch,對(duì)ResNet50殘差網(wǎng)絡(luò)做模型微調(diào)的■方案成效創(chuàng)新的架構(gòu)以及適宜檢測(cè)算法的運(yùn)用,使該企業(yè)的電池生產(chǎn)全在滿足產(chǎn)線所需的檢測(cè)精度和檢測(cè)速度之外,新方案在目標(biāo)檢和SVM分類器的混合模型在絕緣膜異常問題檢測(cè)場(chǎng)景中的使用效果為例,在驗(yàn)證測(cè)試中,先以1,000在ResNet50模型中進(jìn)行模型微調(diào)得到基準(zhǔn)值(97.85%的準(zhǔn)99.00%98.00%可將準(zhǔn)確率提高至99%,將召回率提高至97.56%,而加入SVM分類器后,更是將準(zhǔn)確率提升至99.12%,將召回率提99.00%98.00%100.00%97.00%96.00%95.00%94.00%93.00%92.00%91.00%97.85%99%99.12%mm召回率94%97.56%99.16% 97.85%99%99.12%94%97.56%99.16%在智能制造系統(tǒng)中,AI的部署與應(yīng)用需要支持日趨多樣和復(fù)同時(shí),在基于機(jī)器視覺的智能制造方案中,也需要算機(jī)視覺庫工具予以支撐。由英特爾推出的Op具套件,可幫助制造行業(yè)用戶更有效地加速深度學(xué)習(xí)的推理以?內(nèi)置深度學(xué)習(xí)部署工具包(DeepLearningDeployment特特戰(zhàn)實(shí)戰(zhàn)篇25特特戰(zhàn)實(shí)戰(zhàn)篇26可為深度學(xué)習(xí)推理帶來多達(dá)19倍的性能提升8。下面簡(jiǎn)單介■加速深度學(xué)習(xí)部署為了幫助用戶加速深度學(xué)習(xí)部署,OpenVINO?工具套件提供了DLDT,包括模型優(yōu)化器和推理引擎兩個(gè)核心組件以及Caffe、TensorFlow、MXNet等主流深度學(xué)習(xí)框架,并預(yù)置于模型訓(xùn)練;其次,系統(tǒng)通過運(yùn)行模型優(yōu)化器,根據(jù)訓(xùn)網(wǎng)絡(luò)拓?fù)?、?quán)重和偏差值以及其他可選參數(shù),生成模型的bin(經(jīng)訓(xùn)練的數(shù)據(jù)文件)和xml(描述網(wǎng)絡(luò)拓?fù)涞奈募﹥煞N格式的文件;然后,通過OpenVINO?工具套件提供的推式對(duì)模型進(jìn)行測(cè)試;最后,在AI應(yīng)用中集成推理引擎,進(jìn)而■FP32/INT8模型轉(zhuǎn)換OpenVINO?工具套件能將訓(xùn)練好的開放神經(jīng)網(wǎng)絡(luò)交換行轉(zhuǎn)換和優(yōu)化,生成FP32格式的IR文件;而后通過校準(zhǔn)工信息損失最小化,上述的轉(zhuǎn)換過程中會(huì)使用一個(gè)小批量的驗(yàn)證數(shù)據(jù)集,并且會(huì)將轉(zhuǎn)換量化過程中的統(tǒng)計(jì)數(shù)據(jù)存儲(chǔ)下來,以便更多OpenVINO?工具套件信息,可參閱本手冊(cè)技術(shù)篇相關(guān)內(nèi)容,或在終端數(shù)據(jù)采集部署階段,通過與英特爾開展的技術(shù)合作,用戶可以采用分布式的數(shù)據(jù)預(yù)處理,優(yōu)化特征提取模型,使影像讀取時(shí)間縮短數(shù)倍;在模型訓(xùn)練過程中,由英特AnalyticsZoo平臺(tái)提供了端到端、分布式的模型訓(xùn)練系統(tǒng),著更好的支持,能大幅提升方案的模型推理速模式標(biāo)記,篩選過濾模式標(biāo)記,篩選過濾…數(shù)據(jù)采集及預(yù)處理優(yōu)化?分布式數(shù)據(jù)預(yù)處理?特征提取模型代碼優(yōu)化,提升特征提取速度數(shù)據(jù)采集及預(yù)處理優(yōu)化?分布式數(shù)據(jù)預(yù)處理?特征提取模型代碼優(yōu)化,提升特征提取速度?影像讀取時(shí)間縮短數(shù)倍海量數(shù)據(jù)管理?基于海量數(shù)據(jù)管理?基于Hadoop/Spark的大數(shù)據(jù)存儲(chǔ)管理系統(tǒng)?優(yōu)化數(shù)據(jù)處理流程AnalyticsZoo,AnalyticsZoo,分布式模型訓(xùn)練?創(chuàng)建/適配檢測(cè)模型?通過AnalyticsZoo的TFoptimizer工具,在基于英特爾?架構(gòu)處理器的服務(wù)器節(jié)點(diǎn)進(jìn)行分布式訓(xùn)練模型重定義模型重定義?模型評(píng)估?根據(jù)用戶數(shù)據(jù)實(shí)時(shí)優(yōu)化模型,并適配多樣化處理器?基于至強(qiáng)?可擴(kuò)展處理器帶來的強(qiáng)勁算力,將整體預(yù)測(cè)時(shí)間從原先秒級(jí)縮短至毫秒級(jí)?提供?提供JavaWebServerInference模式的支持SE5C620.86B.02.01.0009.0928201902303.10.0-957.el7.x86_64對(duì)實(shí)時(shí)性、精度要求也更高。為此,企業(yè)需要對(duì)AI算法模型為此,英特爾與眾多合作伙伴一起,充分評(píng)估一線生產(chǎn)場(chǎng)景的在速度和精度上的需要;另一方面,也推動(dòng)邊緣計(jì)算等創(chuàng)新基英特爾還計(jì)劃與更多合作伙伴一起,推動(dòng)更多先進(jìn)的軟硬件產(chǎn)品與AI技術(shù)相融合,針對(duì)機(jī)器視覺在智能制造中的應(yīng)用,推特特戰(zhàn)實(shí)戰(zhàn)篇27英特爾中英特爾中實(shí)戰(zhàn)28實(shí)戰(zhàn)28隨著人工智能、大數(shù)據(jù)、工業(yè)物聯(lián)網(wǎng)等技術(shù)業(yè)中發(fā)揮越來越重要的作用。所謂預(yù)測(cè),是根據(jù)歷史及當(dāng)前狀況,以一定邏輯對(duì)事物的未來發(fā)展趨勢(shì)進(jìn)行預(yù)想和判斷。合理例如,市場(chǎng)部門可根據(jù)銷售數(shù)據(jù)和市場(chǎng)變化實(shí)方案做出優(yōu)化;生產(chǎn)部門可根據(jù)設(shè)備日志來預(yù)測(cè)流水線的和故障情況,進(jìn)而調(diào)整未來一段時(shí)間內(nèi)的生產(chǎn)或檢修計(jì)見,構(gòu)建良好的預(yù)測(cè)模型,能切實(shí)幫助企業(yè)優(yōu)化產(chǎn)能、實(shí)現(xiàn)降構(gòu)建預(yù)測(cè)方法的重要方法之一,是根據(jù)預(yù)測(cè)目標(biāo)的當(dāng)前和歷史錄的數(shù)據(jù)列,其數(shù)據(jù)的表征口徑必須一致。典型的時(shí)序數(shù)據(jù)中,通常會(huì)有一列專門的數(shù)據(jù)類型timestamp對(duì)時(shí)間2019-07-26T09:55:01Zserver12019-07-26T16:56:11Zserver22019-07-27T11:56:11Zserver12019-07-28T18:56:11ZServer3斷,準(zhǔn)確率和時(shí)效性不高?,F(xiàn)在通過AI方法,例如回歸、聚類、決策樹等模型的引入,企業(yè)得以在海量時(shí)序數(shù)據(jù)中厘清頭緒,并結(jié)合科學(xué)的邏輯推理算法來做出預(yù)測(cè),使率大為提升。目前,常見的時(shí)間序列預(yù)測(cè)算法有自回歸滑動(dòng)平差分整合移動(dòng)平均自回歸模型(AutoregressiveIntegrated價(jià)格預(yù)測(cè)0100110010基于時(shí)間序列的解決方案故障預(yù)警產(chǎn)量預(yù)測(cè)價(jià)格預(yù)測(cè)0100110010基于時(shí)間序列的解決方案故障預(yù)警產(chǎn)量預(yù)測(cè)能源需求預(yù)測(cè)銷量預(yù)測(cè)智能運(yùn)維如圖2-2-1所示,基于時(shí)間序列的AI預(yù)測(cè)解決方案目前正廣負(fù)載預(yù)測(cè)等多個(gè)領(lǐng)域。其中,用于設(shè)備生產(chǎn)效率提升的產(chǎn)能預(yù)測(cè)、用于設(shè)備故障檢測(cè)的維護(hù)性預(yù)測(cè)及保障企業(yè)IT設(shè)施健康質(zhì)量質(zhì)量預(yù)測(cè)負(fù)載預(yù)測(cè)供應(yīng)鏈供應(yīng)鏈預(yù)測(cè)在企業(yè)向智能制造轉(zhuǎn)型的過程中,迫切需要生產(chǎn)線和設(shè)此傳統(tǒng)制造、能源等企業(yè)亟待利用產(chǎn)能預(yù)測(cè)方法,方法來開展故障預(yù)警和設(shè)備檢測(cè),企業(yè)可大帶來的高昂成本,延長(zhǎng)設(shè)備的工作時(shí)間和使用和維護(hù)成本,提升產(chǎn)量。目前,維護(hù)性預(yù)測(cè)關(guān)注,如圖2-2-2的研究數(shù)據(jù)表明,至2022年,全球維護(hù)10,96211,000-10,000-11,000-10,000-9,000-8,1468,000-7,000-5,9836,000-5,000-4,3055,000-4,000-3,0703,000-2,000-3,000-2,000-1,4981,000-0-2016201720182019202020212022特特戰(zhàn)實(shí)戰(zhàn)篇29有有特特戰(zhàn)實(shí)戰(zhàn)篇30IT設(shè)施的運(yùn)行狀態(tài),例如處理器與內(nèi)存使用率、磁盤吞吐量等進(jìn)行監(jiān)控、檢測(cè)與維護(hù),并及時(shí)做出反應(yīng)。傳統(tǒng)的運(yùn)維方法一般是依靠經(jīng)驗(yàn)以及專家規(guī)則等來制定自動(dòng)化策略。但隨著制造、能源等企業(yè)的業(yè)務(wù)與IT設(shè)施的綁定日趨緊密,企業(yè)對(duì)IT運(yùn)維的實(shí)時(shí)性、可靠性以及預(yù)測(cè)前瞻性等方面都提出了■現(xiàn)有預(yù)測(cè)方法的不足規(guī)則或決策樹制定的專家系統(tǒng)。隨著制造、能源等傳統(tǒng)企業(yè)進(jìn)也不同,面對(duì)新問題、新需求時(shí),傳統(tǒng)的專列預(yù)測(cè)方案的機(jī)器學(xué)習(xí)和深度學(xué)習(xí)算法越來越多改造優(yōu)化過的算法。這些日新月異的算法速集成、部署和應(yīng)用,這對(duì)傳統(tǒng)工業(yè)制造企業(yè)相對(duì)薄弱的?覆蓋性不足:在工業(yè)制造領(lǐng)域涉及的時(shí)序數(shù)據(jù)中,相當(dāng)一部為幫助企業(yè)有效應(yīng)對(duì)這些問題,英特爾與眾多合作伙伴一起,從生產(chǎn)應(yīng)用的實(shí)際需求出發(fā),基于創(chuàng)新的深度學(xué)習(xí)、機(jī)器學(xué)習(xí)框架以及先進(jìn)的軟硬件產(chǎn)品,助力企業(yè)構(gòu)建全新的智能預(yù)每種算法都有自己的特點(diǎn),對(duì)承載平臺(tái)的系統(tǒng)性能要相同。企業(yè)需要根據(jù)自身的實(shí)際情況進(jìn)行橫向?qū)Ρ?,找出最適■基于統(tǒng)計(jì)分析的時(shí)間序列預(yù)測(cè)算法許多工礦、能源企業(yè)就已經(jīng)著手利用傳統(tǒng)的數(shù)學(xué)統(tǒng)計(jì)分析來預(yù)測(cè)產(chǎn)量、倉儲(chǔ)狀態(tài),或者用于對(duì)齒輪、軸承等機(jī)械零件進(jìn)ARMA模型是傳統(tǒng)基于統(tǒng)計(jì)分析的時(shí)間序列預(yù)測(cè)算法中,處理平穩(wěn)時(shí)間序列的重要方法。如名稱所示,其由自回歸模型MA)組成。它的基本原理是將預(yù)測(cè)指標(biāo)和timestamp組成的數(shù)據(jù)序列作為一個(gè)隨機(jī)序列。這一序列不僅體現(xiàn)了原始數(shù)據(jù)在時(shí)間上的延續(xù)性,也體現(xiàn)了影響因子隨時(shí)間變動(dòng)的規(guī)律。假設(shè)影響因子為:i1,i2,i3…in,噪聲為d,則預(yù)測(cè)對(duì)O可以表示為:ARIMA模型是在ARMA模型的基礎(chǔ)上增加了差分階數(shù)均值、方差和自協(xié)方差均要求為常數(shù),因此當(dāng)數(shù)據(jù)處于不穩(wěn)定狀態(tài)時(shí),例如呈持續(xù)上升或持續(xù)下降的,就可以采用ARIMA從上述幾種模型的特性可知,基于統(tǒng)計(jì)分析的時(shí)間序法一般用于處理線性數(shù)據(jù)。對(duì)于序列中的一些季節(jié)性規(guī)律和變化,或者有數(shù)據(jù)缺失等情況尚難以有效應(yīng)對(duì),用戶只能手工處理。同時(shí),每個(gè)序列的模型都要用戶手工維護(hù),靈活性不高,因此這類模型一般只用于目標(biāo)種類較少、維度單一,且準(zhǔn)確率■基于機(jī)器學(xué)習(xí)的時(shí)間序列算法機(jī)器學(xué)習(xí)方法也是時(shí)間序列預(yù)測(cè)解決方案中常見的算法,是各類基于樹的機(jī)器學(xué)習(xí)方法,常用的有XGBoost、隨機(jī)森隨機(jī)森林是以決策樹為基礎(chǔ)的機(jī)器學(xué)習(xí)算法。決想如圖2-2-3所示,作為一個(gè)樹形結(jié)構(gòu),決策樹構(gòu)建時(shí)會(huì)將數(shù)據(jù)劃分為具有相似值的子集,其每一個(gè)非葉節(jié)點(diǎn)都是一個(gè)特征屬性的測(cè)試,并由這些測(cè)試來產(chǎn)生許多分支,每個(gè)分支就是某個(gè)值域的輸出子集。而最終的每個(gè)葉子,就是輸出預(yù)測(cè)結(jié)果成的強(qiáng)分類器。其核心思想,就是通過不斷成新的分叉樹,每添加一個(gè)樹,其實(shí)就是學(xué)習(xí)一個(gè)新函數(shù)來擬正常:故障數(shù)據(jù)比例超過了100~1,000萬:1,此時(shí)沿用深森林、XGBoost等機(jī)器學(xué)習(xí)算法對(duì)高維數(shù)據(jù)以及非平衡數(shù)據(jù)■基于深度學(xué)習(xí)的時(shí)間序列算法各類深度學(xué)習(xí)方法是目前時(shí)間序列預(yù)測(cè)方案中的常見算模型會(huì)對(duì)上一時(shí)刻的輸入與當(dāng)前狀態(tài)進(jìn)行結(jié)合,再由于RNN模型結(jié)構(gòu)是線性化時(shí)序關(guān)系,因此很容易造成長(zhǎng)期無有無有無有無有無無特特戰(zhàn)實(shí)戰(zhàn)篇31特特戰(zhàn)實(shí)戰(zhàn)篇32依賴問題(即預(yù)測(cè)結(jié)果與非常久遠(yuǎn)的時(shí)序輸入相關(guān),在很難實(shí)現(xiàn),造成長(zhǎng)期記憶失效)。因此,還可以使用RNN的結(jié)合體,其中Sigmod函數(shù)會(huì)輸出一個(gè)0到1之間的值來描LSTM等深度學(xué)習(xí)網(wǎng)絡(luò)對(duì)既包含長(zhǎng)周期、又包含短周期的時(shí)序數(shù)據(jù)有著良好的訓(xùn)練和預(yù)測(cè)效果。例如在光伏發(fā)電場(chǎng)景中,用戶需要對(duì)太陽能功率輸出進(jìn)行預(yù)測(cè),數(shù)據(jù)中既包括了季節(jié)影響等長(zhǎng)周期,也包括晝夜、云的移動(dòng)等短周期,此時(shí)采用深度學(xué)習(xí)時(shí)間序列(例如LSTM)?可以一次性處理所有序列同時(shí)學(xué)習(xí)序列?可以處理任何顆粒度,例如每秒、每分長(zhǎng)短低高■數(shù)據(jù)準(zhǔn)備高質(zhì)量的原始數(shù)據(jù)是實(shí)施時(shí)間序列預(yù)測(cè)的基礎(chǔ)。在工業(yè)制造、能源生產(chǎn)等領(lǐng)域,數(shù)據(jù)采樣率通常比較高,常見設(shè)備每秒采樣在幾次到十幾次之間,數(shù)據(jù)量比較大,且數(shù)據(jù)時(shí)間跨度較長(zhǎng)。在這種情況下,模型選擇可以采用交叉驗(yàn)證(CrossValidation)的方式來對(duì)數(shù)據(jù)進(jìn)行分組,訓(xùn)練組與測(cè)試組可以設(shè)一個(gè)比例,例如60%-40%。數(shù)據(jù)準(zhǔn)備階段的另一項(xiàng)重要工作是對(duì)數(shù)據(jù)質(zhì)量進(jìn)行校驗(yàn)工業(yè)制造、能源生產(chǎn)等領(lǐng)域的工作環(huán)境往往比較惡劣,導(dǎo)致很多返回的傳感數(shù)據(jù)是空白甚至是錯(cuò)誤的,這些數(shù)的預(yù)測(cè)結(jié)果造成影響。如果數(shù)據(jù)缺失不多,可以用插值等方法進(jìn)行彌補(bǔ),如果缺失或錯(cuò)值過多,就必須放棄這組數(shù)據(jù)。實(shí)踐■數(shù)據(jù)導(dǎo)入在數(shù)據(jù)導(dǎo)入階段,需要考慮多維度、多變量數(shù)據(jù)的處理。當(dāng)輸入數(shù)據(jù)具有多維度、多變量特征,且這些多變量之間還有一定的依賴關(guān)系時(shí),就需要對(duì)數(shù)據(jù)進(jìn)行維度轉(zhuǎn)換。最簡(jiǎn)單的方法是溫度、濕度、電壓、電流等,用于監(jiān)控設(shè)備的運(yùn)行狀況。在數(shù)據(jù)導(dǎo)入之前,需要把多維度轉(zhuǎn)換成單維度進(jìn)行處■數(shù)據(jù)預(yù)處理在大多數(shù)情況下,時(shí)間序列都可以轉(zhuǎn)換為監(jiān)督學(xué)習(xí)。在轉(zhuǎn)程中,會(huì)把不需要的數(shù)據(jù)剔除,把空缺的數(shù)據(jù)補(bǔ)充上,然后將■模型定義接下來需要選擇模型參數(shù)。模型參數(shù)的選擇將直接影響模型運(yùn)行的性能,參數(shù)包括了迭代數(shù)量、迭代序列長(zhǎng)度、隱含■擬合與預(yù)測(cè)擬合和預(yù)測(cè)過程是根據(jù)模型進(jìn)行訓(xùn)練和推理的過程,需要根據(jù)■過擬合判斷所謂過擬合,是指AI學(xué)習(xí)時(shí)選擇的模型包含參數(shù)過多,以致出現(xiàn)這一模型對(duì)已知數(shù)據(jù)預(yù)測(cè)很好,但對(duì)未為幫助用戶更好地基于英特爾?架構(gòu)開展時(shí)間序列AI預(yù)測(cè)方法的研究與探索,英特爾已根據(jù)不同的用戶應(yīng)用場(chǎng)景,在多種模型算法上給出了相應(yīng)的優(yōu)化代碼示例,以下是使用數(shù)據(jù)導(dǎo)入數(shù)據(jù)預(yù)處理模型定義擬合與預(yù)測(cè)過擬合判斷數(shù)據(jù)導(dǎo)入數(shù)據(jù)預(yù)處理模型定義擬合與預(yù)測(cè)過擬合判斷特特戰(zhàn)實(shí)戰(zhàn)篇33特特戰(zhàn)實(shí)戰(zhàn)篇34為了進(jìn)一步提升訓(xùn)練的效果,自定義了多項(xiàng)式的學(xué)習(xí)率下降規(guī)根據(jù)不同的用戶的目標(biāo),還可以自定義評(píng)價(jià)標(biāo)準(zhǔn),讓模型更加如前所述,隨著AI算法研究的深入,更多機(jī)器學(xué)習(xí)和深度學(xué)習(xí)算法正被應(yīng)用到工業(yè)制造領(lǐng)域的智能預(yù)測(cè)方案中,例如針對(duì)不同的使用場(chǎng)景,選擇不同的算法模型、軟硬件基礎(chǔ)設(shè)施,包括數(shù)據(jù)存儲(chǔ)處理平臺(tái)、計(jì)算平臺(tái)等,都會(huì)對(duì)預(yù)測(cè)效率和準(zhǔn)確率造成影響。因此在實(shí)際的方案部署中,企業(yè)需要根據(jù)需求的變化,選擇、調(diào)整或優(yōu)化不同的算法模型以于時(shí)間序列預(yù)測(cè)解決方案所需的分布式訓(xùn)練或預(yù)測(cè)。同時(shí),在現(xiàn)在,英特爾正與合作伙伴一起,基于An于風(fēng)電、光伏場(chǎng)景的時(shí)間序列功率預(yù)測(cè)解決方案,以及用于設(shè)■項(xiàng)目背景氣溫等環(huán)境因素,會(huì)給發(fā)電設(shè)備的運(yùn)行效率、設(shè)備安全很大影響。因此,對(duì)風(fēng)機(jī)等設(shè)備的輸出功率開展預(yù)測(cè),不僅有度學(xué)習(xí)功率預(yù)測(cè)算法平臺(tái),來提升功率預(yù)測(cè)算法■基于時(shí)序數(shù)據(jù)的深度學(xué)習(xí)功率預(yù)測(cè)方案智能功率預(yù)測(cè)一般可分為數(shù)據(jù)采集、存儲(chǔ)、治理,訓(xùn)等流程。部署在風(fēng)機(jī)、光伏面板、電網(wǎng)等處負(fù)責(zé)數(shù)據(jù)采集的邊緣傳感器,會(huì)把溫度、功率、發(fā)電量等既有數(shù)據(jù)通過網(wǎng)絡(luò)傳送數(shù)據(jù)中心進(jìn)行存儲(chǔ),而后在數(shù)據(jù)治理模塊中進(jìn)行有效數(shù)據(jù)的篩選,并使用選定模型對(duì)數(shù)據(jù)進(jìn)行訓(xùn)練和推理,最終得到預(yù)測(cè)數(shù)如圖2-2-6可以看到,金風(fēng)慧能的功率預(yù)測(cè)是一個(gè)端到端的fThings,IoT)設(shè)備采集,并在存儲(chǔ)后通過數(shù)據(jù)治理等環(huán)節(jié),再采用特定的模型完成訓(xùn)練,最終實(shí)現(xiàn)AI的應(yīng)用落地。由于IoT設(shè)備的不穩(wěn)定性,原始數(shù)據(jù)的質(zhì)量通常無法保證,數(shù)據(jù)治特特戰(zhàn)實(shí)戰(zhàn)篇35特特戰(zhàn)實(shí)戰(zhàn)篇36環(huán)境參數(shù)、功率、發(fā)電量等數(shù)據(jù)樣本進(jìn)行訓(xùn)練和推理。雖然這一方法可對(duì)較近的時(shí)間點(diǎn)(15-30分鐘內(nèi))準(zhǔn)確預(yù)測(cè),但隨著預(yù)測(cè)時(shí)間的增加而導(dǎo)致預(yù)測(cè)準(zhǔn)確率會(huì)降低。對(duì)于電力生產(chǎn)所需的功率預(yù)測(cè)系統(tǒng)而言,最常見的超短期預(yù)測(cè)也需要系統(tǒng)能預(yù)測(cè)4小時(shí)內(nèi)的功率輸出,這意味著,預(yù)測(cè)系統(tǒng)需要在未來16個(gè)時(shí)間點(diǎn)(每15分鐘計(jì)為一個(gè)時(shí)間點(diǎn))上,都保持較高的預(yù)新方案采用了面向時(shí)序數(shù)據(jù)的深度學(xué)習(xí)模型來構(gòu)建功率預(yù)測(cè)方案。在方案構(gòu)建之初,金風(fēng)慧能首先嘗試使用傳統(tǒng)的RNN(LSTM)這類經(jīng)典的深度學(xué)習(xí)算法模型。但在實(shí)踐中發(fā)現(xiàn)模型的預(yù)測(cè)效果并不盡如人意。究其原因,更多是來自于數(shù)據(jù)本身,即原有數(shù)據(jù)的缺失率非常高,且缺失數(shù)據(jù)的填充方法對(duì)于測(cè)中更為準(zhǔn)確的長(zhǎng)短期時(shí)間序列網(wǎng)絡(luò)(LongandSh所示,這一面向時(shí)序數(shù)據(jù)的算法模型融合了三種不同的網(wǎng)絡(luò)拓?fù)?,即用于短期非線性時(shí)序特征的CNN、用于長(zhǎng)期非線性時(shí)結(jié)合自回歸等線性預(yù)測(cè)一同預(yù)測(cè)最后的功率值,滿足了基于這一算法,金風(fēng)慧能構(gòu)建了全新的功率預(yù)測(cè)解決方案。如圖2-2-8所示,首先,方案會(huì)將來自風(fēng)機(jī)或光伏的數(shù)據(jù)導(dǎo)入開源Kafka流處理平臺(tái)上,然后進(jìn)行數(shù)據(jù)ETL(Extract-累,模型可以實(shí)現(xiàn)滿足不同周期的迭代優(yōu)化,實(shí)現(xiàn)閉環(huán)的AI數(shù)據(jù)ETL 如圖2-2-9所示,AnalyticsZoo能夠幫助金風(fēng)慧能將中的Spark、TensorFlow、Keras以及其它軟件和框架無縫集成到同一管道中,有助于金風(fēng)慧能將數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)處理以及訓(xùn)練推理的流水線整合到統(tǒng)一的基礎(chǔ)設(shè)施,來大幅提升方案的部署效率、資源利用率和可擴(kuò)展性,并減少硬件同時(shí),AnalyticsZoo還能將英特爾提供的眾多底層加速庫,案的優(yōu)化中去,并可將TensorFlow、Keras模型透明地?cái)U(kuò)展到大數(shù)據(jù)集群,讓用戶能更方便地在訓(xùn)練或推理方案中采用分針對(duì)時(shí)序數(shù)據(jù)分析,AnalyticsZoo預(yù)置了豐?功率預(yù)測(cè)中常用的數(shù)據(jù)預(yù)處理和特征工程:Datetime通過這些組件,AnalyticsZoo能對(duì)不同時(shí)序分析應(yīng)用,例如時(shí)序預(yù)測(cè)、異常檢測(cè)、時(shí)序表征學(xué)習(xí)、時(shí)序隨著更多的時(shí)序網(wǎng)絡(luò)模型的加入,Analy特特戰(zhàn)實(shí)戰(zhàn)篇37特特戰(zhàn)實(shí)戰(zhàn)篇38■方案成效為驗(yàn)證基于時(shí)序數(shù)據(jù)的深度學(xué)習(xí)功率預(yù)測(cè)方案在實(shí)際場(chǎng)景中的運(yùn)行表現(xiàn),金風(fēng)慧能與英特爾一起,在全國(guó)多個(gè)需要重點(diǎn)的光伏測(cè)試場(chǎng)站進(jìn)行了測(cè)試。以月為周期,在每一個(gè)測(cè)試的光伏場(chǎng)中在單小時(shí)內(nèi),使用30,000條記錄對(duì)LSTNet模型進(jìn)行5,000次迭代優(yōu)化,并在50毫秒內(nèi)獲得未來2小時(shí)的功率預(yù)測(cè)數(shù)據(jù)。如圖2-2-10所示,在預(yù)測(cè)準(zhǔn)確率上,原方案的59%,達(dá)到了79.41%,而在訓(xùn)練速度上,新方案90%79.41%59%60%30%0%訓(xùn)練時(shí)長(zhǎng)(小時(shí))54432110一如上述測(cè)試取得的良好成效,通過雙方的也在實(shí)踐中取得了豐碩的成果。經(jīng)初步估計(jì),在一個(gè)30兆瓦時(shí)序數(shù)據(jù)是預(yù)測(cè)性維護(hù)方法中的重要數(shù)據(jù)基預(yù)測(cè)解決方案通常使用聚類分析、回歸分析等經(jīng)典數(shù)據(jù)挖掘方法來處理。近年來,基于機(jī)器學(xué)習(xí)算法模型的新方案逐漸成熟并受到用戶的青睞。總體而言,基于機(jī)器學(xué)習(xí)方法的預(yù)測(cè)性維護(hù)主要通過兩個(gè)分支方法來實(shí)現(xiàn),即分類方法和回歸方法。針對(duì)這兩類方法,諸多經(jīng)典機(jī)器學(xué)習(xí)算法,例如LR、SVM、對(duì)制造、能源等領(lǐng)域的企業(yè)而言,數(shù)據(jù)一般來自機(jī)器和傳感器一些精密儀表或者齒輪軸承等核心部件上,故障樣本與非故障樣本的比例往往達(dá)到幾千萬比一;另一方面是數(shù)據(jù)往往有著高而企業(yè)對(duì)于齒輪軸承這些核心部件的故障預(yù)常高,甚至需要達(dá)到毫秒級(jí)。因此,預(yù)測(cè)模型需要在獲得短短數(shù)組或數(shù)十組時(shí)序數(shù)據(jù)后,即得到預(yù)測(cè)結(jié)果,這對(duì)以往各類經(jīng)典的機(jī)器學(xué)習(xí)算法模型無疑提出了極大的挑戰(zhàn)。為開展創(chuàng)新算法的研究,并在遠(yuǎn)景能源齒輪故障預(yù)測(cè)方案的實(shí)踐南京智谷人工智能研究院是依托計(jì)算機(jī)軟件新技術(shù)國(guó)家南京智谷人工智能研究院是依托計(jì)算機(jī)軟件新技術(shù)國(guó)家重點(diǎn)實(shí)驗(yàn)室(南京大學(xué)由南京大學(xué)人工智能學(xué)院人才團(tuán)隊(duì)與南京經(jīng)濟(jì)技術(shù)開發(fā)區(qū)管理委員會(huì)簽約共建。南京大學(xué)周志華教授為研究院學(xué)術(shù)顧問。研究院著眼產(chǎn)業(yè)經(jīng)濟(jì)發(fā)展需求,面向人工智能領(lǐng)域前沿技術(shù)、共性技術(shù)和應(yīng)用技術(shù)開展研發(fā),充分發(fā)揮研究院及南京大學(xué)各方南京大學(xué)LAMDA團(tuán)隊(duì)隸屬于計(jì)算機(jī)軟件新技術(shù)國(guó)家重點(diǎn)實(shí)驗(yàn)室和南京大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)系。團(tuán)隊(duì)在周志華教授的帶領(lǐng)下,專注于機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘、模式識(shí)別等領(lǐng)域的研究與創(chuàng)新,成為國(guó)內(nèi)乃至全球首屈一指的>>>>/<>>>>/<■深度森林模型決策樹是機(jī)器學(xué)習(xí)中常用的分類預(yù)測(cè)模型,但傳統(tǒng)的決策樹模型在學(xué)習(xí)容量上非常有限,一般僅能做到幾層模型。在面對(duì)高維數(shù)據(jù)時(shí),模型容量不足以承載足夠的訓(xùn)練數(shù)據(jù)來進(jìn)行團(tuán)隊(duì)提出了一種全新基于決策樹的集成方法,被稱為多粒度級(jí)型設(shè)計(jì)了一種新的級(jí)聯(lián)結(jié)構(gòu)來進(jìn)行表征學(xué)習(xí)。如圖2-2-11所示,級(jí)聯(lián)的每個(gè)層級(jí)包括了兩個(gè)隨機(jī)森林(黑色表示)和兩個(gè)完全隨機(jī)樹木森林(藍(lán)色表示)。假設(shè)訓(xùn)練中有三個(gè)要預(yù)測(cè)的類,每個(gè)森林都將輸出三維類向量,并在聯(lián)接后作為下一層級(jí)與其他算法相比,由于級(jí)聯(lián)層級(jí)能根據(jù)需要進(jìn)行調(diào)節(jié),這使得小規(guī)模數(shù)據(jù)集在gcForest模型中也有著不俗表數(shù)據(jù)為例,僅需要少量時(shí)序數(shù)據(jù)(幾組到十幾組)就可以得到準(zhǔn)確率較高的預(yù)測(cè)模型。而針對(duì)數(shù)據(jù)中的高維特性,該模型也其表征學(xué)習(xí)能力。同時(shí),gcForest所需的超參90%88%86%84%82%在gcForest模型的基礎(chǔ)上,LAMDA團(tuán)隊(duì)又進(jìn)一步提出了基于決策樹集成方法的自編碼器(auto-encoder)eForest,以及可進(jìn)行表征學(xué)習(xí)的多層梯度提升決策樹(Multi-LayeredeForest能使gcForest利用樹決策路徑所定義的最大相容規(guī)戶僅使用10%的輸入比特,就能令模型以很高的精度重建原而mGBDT則充分融合了樹集成(TreeEnsembles)的優(yōu)秀性能,以及分層分布式表示帶來的表征學(xué)習(xí)能力,其使用梯度針對(duì)分類場(chǎng)景的對(duì)比測(cè)試結(jié)果如圖2-2-12所示,在預(yù)測(cè)準(zhǔn)確率上,gcForest模型有著不亞于深度神經(jīng)網(wǎng)絡(luò)、隨特特戰(zhàn)實(shí)戰(zhàn)篇39特特戰(zhàn)實(shí)戰(zhàn)篇40■基于英特爾?架構(gòu)的處理器為新模型提供強(qiáng)勁深度森林主要是基于多層級(jí)的樹架構(gòu)來構(gòu)建,其每一層均可視為一系列的決策樹。因此,它需要并行在多棵樹上執(zhí)行任務(wù),即更多地進(jìn)行并行決策計(jì)算,而這正是擁有眾即可同步帶來訓(xùn)練效率的線性增長(zhǎng),這讓英特爾擅長(zhǎng)的多核架線程,微架構(gòu)也進(jìn)行了全面升級(jí)優(yōu)化,配備了更快、效率更高的高速緩存來提升處理效能,并可支持高達(dá)36TB的系統(tǒng)級(jí)內(nèi)深度森林訓(xùn)練任務(wù)提供強(qiáng)勁的計(jì)算力,也能應(yīng)對(duì)深度森林多任持久內(nèi)存有著良好的支持。深度森林需要在多棵決執(zhí)行任務(wù),因此需要大量?jī)?nèi)存空間用于中間過程的迭代。傳統(tǒng)存的組合,可以很好滿足這一需求,幫助AI平臺(tái)輕松應(yīng)對(duì)訓(xùn)創(chuàng)新算法助力遠(yuǎn)景能源構(gòu)建風(fēng)機(jī)齒輪故障■項(xiàng)目背景作為人們最為熟悉的清潔、可再生能源之一,風(fēng)力發(fā)電源格局中呈現(xiàn)更重要的角色。來自國(guó)家能源局的數(shù)據(jù)顯示,2019年上半年,全國(guó)風(fēng)電發(fā)電量同比增長(zhǎng)11.5%15。作為全球領(lǐng)先的清潔科技企業(yè),遠(yuǎn)景能源以智能風(fēng)機(jī)、智慧風(fēng)場(chǎng)、分風(fēng)電機(jī)組是典型的旋轉(zhuǎn)機(jī)械設(shè)備,齒輪是風(fēng)機(jī)的核心設(shè)備,其故障是風(fēng)機(jī)運(yùn)行中最常見的問題。傳統(tǒng)上,企業(yè)是根據(jù)VDI3834等故障檢測(cè)標(biāo)準(zhǔn),利用壓電加速傳感器一類設(shè)備感利用振動(dòng)信號(hào)來判別風(fēng)機(jī)齒輪運(yùn)行狀態(tài)是目前常用的檢測(cè)方表現(xiàn),與上一代產(chǎn)品相比,性能提升高達(dá)30倍13,有力提升的軟件和編譯器的助力,深度森林所蘊(yùn)含的潛力可以被深入地探索和發(fā)掘,在一項(xiàng)利用該處理器開展的基于決策樹的工作任■基于機(jī)器學(xué)習(xí)的齒輪故障預(yù)測(cè)方案英特爾與南京智谷為遠(yuǎn)景能源設(shè)計(jì)的基于機(jī)器學(xué)習(xí)的齒輪故障預(yù)測(cè)方案主要分為兩個(gè)核心環(huán)節(jié):特征提取和分類模型用于將原始的時(shí)序齒輪振動(dòng)信號(hào)數(shù)據(jù)轉(zhuǎn)化為訓(xùn)練樣本,后者是■普通特征提取首先需要進(jìn)行數(shù)據(jù)正規(guī)化和直方圖特征化,即得到正規(guī)化—如圖2-2-13所示,系統(tǒng)首先從原始XML數(shù)據(jù)文件中解析出HSS值(軸承原生轉(zhuǎn)速)、頻域數(shù)據(jù)X-Y數(shù)值對(duì)以及峰值數(shù)據(jù)peak。其中數(shù)據(jù)正規(guī)化是將X值除以HSS值,且只取0-80區(qū)間內(nèi)的值,Y值除以峰值數(shù)據(jù)peak;而直方圖特征化是指將數(shù)據(jù)正規(guī)化后的X軸進(jìn)一步按0.1切分,得到800個(gè)區(qū)間,然后將每個(gè)區(qū)間內(nèi)的Y值求和,由此得到一個(gè)長(zhǎng)度為800的向量。特征組(1在正規(guī)化信號(hào)上,判斷peak頻率是否為某故為1,否不是則為0。此特征維度為1;特征組(2分別提取故障頻率及其2-10倍頻的Y值;以及故障頻率及其2-10倍頻左右一倍邊頻范圍內(nèi)的Y值,并計(jì)算標(biāo)準(zhǔn)差。若該通道內(nèi)包含f個(gè)故障頻率,則該特征維特征組(4然后在直方圖信號(hào)上,進(jìn)行haar、db1、coif1、bior1.1四種小波變換,分別使用變換后的上、下邊帶信號(hào)進(jìn)行逆小波變換,由此得到8組重構(gòu)信號(hào),特征維度為特征組(5對(duì)于特征組(4)中重構(gòu)的信號(hào),分別計(jì)算信特征組(7在正規(guī)化信號(hào)上,提取故障頻率及其2-3倍頻左右0.5倍邊頻范圍內(nèi)的Y值并計(jì)算熵值。若該通道包含f個(gè)故障頻率,則該特征維度為f;因此,在普通特征提取步驟中,一共可得到的特征維度為:■普通特征拼接為了得到通道層級(jí)的特征向量,需要將屬于相同通道的測(cè)點(diǎn)特征進(jìn)行拼接,從而得到通道層級(jí)的特征向量。例如在某設(shè)備前端通道的單個(gè)測(cè)點(diǎn)上,采集的XML文件中包含BPFO、BPFI、BSF、FTF四個(gè)故障頻率,那么該測(cè)點(diǎn)的數(shù)據(jù)提取出的樣本特征維度即為14+21*4+6400=6498,而在訓(xùn)練分類器時(shí)實(shí)際使用了其中的98維特征(重構(gòu)信號(hào)的6,400維特征在訓(xùn)練分類器中一般不使用)。如圖2-2-14所示,如已知設(shè)備前端通道包含了4個(gè)這樣的測(cè)點(diǎn),因此拼接后設(shè)備前端DSVEL(lowclass)DSVEL(highclass)DSENV3(lowclass)DSENV3(highclass)14+21*4=9814+21*4=9814+21*4=9814+21*4=9814+21*4=9898*4=392特特戰(zhàn)實(shí)戰(zhàn)篇41特特戰(zhàn)實(shí)戰(zhàn)篇42最后,方案進(jìn)行倍頻ZeroRatio(零比例)特征的高階特征4.統(tǒng)計(jì)這些峰值的索引值,并計(jì)算兩兩間的差值繪制曲線,5.計(jì)算紅色曲線的差值,得到圖2-2-15中藍(lán)色曲線,藍(lán)色曲6.對(duì)于所有窗口的ZeroRatio取最大值、平均值和方差等統(tǒng)風(fēng)機(jī)齒輪故障預(yù)測(cè),主要是采用分類方法來實(shí)現(xiàn)。習(xí)系統(tǒng)的泛化能力。新方案采用了融合多種機(jī)新集成算法模型,其中包括了LR、RF和XGBoost三種基礎(chǔ)如圖2-2-16所示,齒輪故障集成分類模型首先將訓(xùn)練集通過EasyEnsemble算法得到N個(gè)采樣集,并分別對(duì)這些采樣集進(jìn)行基礎(chǔ)模型訓(xùn)練。爾后,使用LR、RF和XGBoost三種分類器得到各個(gè)采樣集的預(yù)測(cè)結(jié)果。從圖中可以看到,方案中區(qū)分度很高,有故障模式的樣本基本可以抓到,召回也率很高;第二層分類器使用高階倍頻特征以及其余的如峰值大小可以排除第一層分類器誤報(bào)的樣本,進(jìn)一步提高準(zhǔn)確率。通過這種分層集成模型,可以有效地提升模型■方案成效通過在多個(gè)風(fēng)場(chǎng)進(jìn)行的部署驗(yàn)證,遠(yuǎn)景能源新的基于機(jī)器學(xué)習(xí)的齒輪故障預(yù)測(cè)方案充分展現(xiàn)了“快”和“準(zhǔn)”的預(yù)測(cè)實(shí)時(shí)性方面,新方案中的模型在學(xué)習(xí)過大量故障案例后,在現(xiàn)場(chǎng)無須從零開始學(xué)習(xí),通過小規(guī)模的樣本集,例如10~15條時(shí)域信號(hào)即可快速發(fā)現(xiàn)齒輪故障;而在預(yù)測(cè)準(zhǔn)確率上,在某風(fēng)場(chǎng)的現(xiàn)場(chǎng)預(yù)測(cè)中,召回率和準(zhǔn)確率均達(dá)到了90%以上16。>預(yù)測(cè)結(jié)果#1>預(yù)測(cè)結(jié)果#1>/>/寶信以無監(jiān)督的深度學(xué)習(xí)方法構(gòu)建設(shè)備故■項(xiàng)目背景作為國(guó)內(nèi)領(lǐng)先的工業(yè)軟件行業(yè)應(yīng)用解決方案和服務(wù)提供商,力于推動(dòng)新一代信息技術(shù)與制造技術(shù)融合發(fā)展,引領(lǐng)中國(guó)工業(yè)化與信息化的深度融合,為工業(yè)制造、鋼鐵、能源等行業(yè)設(shè)備異常檢測(cè)是工業(yè)制造企業(yè)中最普遍,也是最重要的工作流程之一。傳統(tǒng)上,企業(yè)通過定期停機(jī)檢修維護(hù)、提前更換設(shè)備零部件等操作來避免設(shè)備出現(xiàn)異常。為了幫助企業(yè)提升生產(chǎn)效率,降低因檢修停機(jī)或頻繁更換部件帶來寶信軟件結(jié)合大數(shù)據(jù)以及AI技術(shù),推出過多種設(shè)備振動(dòng)信號(hào)異常檢測(cè)解決方案。但這類解決方案通常以傳感器信息作為數(shù)據(jù)源,其應(yīng)用在真實(shí)場(chǎng)景中尚存在問題。一方面,傳感器往往探測(cè)頻率較高,數(shù)據(jù)量很大,大型企業(yè)每天接受到的數(shù)據(jù)量可能達(dá)到TB級(jí);另一方面,數(shù)據(jù)類型也五花八門,導(dǎo)致并沒有一個(gè)明確的目標(biāo)變量,而是需要系統(tǒng)自己去紛繁復(fù)雜因此,寶信軟件在構(gòu)建新的解決方案時(shí)面臨兩個(gè)挑戰(zhàn):一是如何結(jié)合工業(yè)制造企業(yè)的IT狀況以及海量數(shù)據(jù),建立良好便為此,寶信軟件與英特爾開展深度技術(shù)合作,基于AnalyticsZoo,用無監(jiān)督的深度學(xué)習(xí)方法構(gòu)建全新的設(shè)備故障自動(dòng)檢測(cè)■方案與成效型”兩個(gè)主要模塊組成。以伺服電機(jī)的全壽來自設(shè)備傳感器的數(shù)據(jù)進(jìn)入數(shù)據(jù)預(yù)處理階段,首先要進(jìn)行特征提取,針對(duì)每秒數(shù)據(jù)提取均方根、峰度、峰值以及小波包分解得到的各頻段能量值等,一共11個(gè)特征;然后進(jìn)行特征預(yù)處理,包括小波去噪、標(biāo)準(zhǔn)化和滑動(dòng)平均處理等過程。為其設(shè)計(jì)了LSTM檢測(cè)模型。模型由三個(gè)LSTM層和一個(gè)密集層組成,并采用每50個(gè)點(diǎn)訓(xùn)練下一個(gè)點(diǎn)的方式進(jìn)行訓(xùn)練。最終得到異常檢測(cè)結(jié)果。通過在多個(gè)實(shí)際場(chǎng)景中的驗(yàn)證測(cè)試,如圖2-2-18所示,模型最終成功預(yù)測(cè)了設(shè)備的異常點(diǎn)(橙色), 特特戰(zhàn)實(shí)戰(zhàn)篇43特特戰(zhàn)實(shí)戰(zhàn)篇44基于時(shí)序數(shù)據(jù),推動(dòng)智能運(yùn)維隨著IT技術(shù)的發(fā)展與普及,各類信息化系統(tǒng)正日趨成為工業(yè)制造領(lǐng)域不可或缺的基礎(chǔ)能力,推動(dòng)著業(yè)務(wù)部門、高效運(yùn)行,因此對(duì)信息化系統(tǒng)的高質(zhì)量運(yùn)維,是工業(yè)制造企業(yè)保持高效生產(chǎn)的關(guān)鍵。傳統(tǒng)上,企業(yè)IT運(yùn)維是通過系統(tǒng)指標(biāo)斷系統(tǒng)是否存在問題與隱患。隨著企業(yè)信息化系統(tǒng)日趨多樣,加之軟硬件平臺(tái)不再緊密耦合,單一系統(tǒng)可能存在多個(gè)廠商的硬件與服務(wù),因此信息化系統(tǒng)的復(fù)雜程度正呈指數(shù)化增長(zhǎng),給雖然許多企業(yè)已經(jīng)部署了自動(dòng)化的運(yùn)維監(jiān)控系統(tǒng),并基規(guī)則對(duì)異常指標(biāo)進(jìn)行告警,但這種借助經(jīng)驗(yàn)構(gòu)建的系統(tǒng),無法讓運(yùn)維人員通過告警信息即時(shí)進(jìn)行原因分析。在英特爾與南京基石數(shù)據(jù)技術(shù)有限責(zé)任公司(以下簡(jiǎn)稱“基石數(shù)據(jù)”)看來,要根本解決這一問題,需要從運(yùn)維生態(tài)入手,如圖2-2-19所示,借助基于時(shí)序數(shù)據(jù)構(gòu)建為了使“IT健康分析”系統(tǒng)和智能分析模型發(fā)揮更大效能,英特爾為之提供了多種先進(jìn)軟硬件產(chǎn)品與框架,為智能分析模型的訓(xùn)練推理過程提供強(qiáng)勁算力和工具。同時(shí),新方案還引入提升運(yùn)維能力的實(shí)時(shí)性;另一方面,利用云端的專家知識(shí)庫,現(xiàn)在,這一全新的系統(tǒng)方案正廣泛地在“數(shù)據(jù)庫健康狀態(tài)評(píng)基石數(shù)據(jù)以機(jī)器健康模型,提升企業(yè)數(shù)據(jù)■項(xiàng)目背景作為IT系統(tǒng)的核心組件之一,數(shù)據(jù)庫的健康對(duì)于企業(yè)信息化系統(tǒng)的高效運(yùn)行至關(guān)重要。傳統(tǒng)上,運(yùn)維工程師需要通過數(shù)據(jù)工具,以人工方式對(duì)數(shù)據(jù)庫進(jìn)行統(tǒng)一的管理、控制和調(diào)配。但復(fù)雜,且與業(yè)務(wù)緊密關(guān)聯(lián)時(shí),配置優(yōu)化效果將直產(chǎn)的效率。以產(chǎn)線自動(dòng)化監(jiān)控系統(tǒng)為例,通過高清攝像頭采集的產(chǎn)線圖像需要在數(shù)據(jù)庫中暫存后再送至后端處理,在吞吐量的場(chǎng)景中,如何設(shè)置數(shù)據(jù)庫的緩存機(jī)制,如何在阻基石數(shù)據(jù)推出的機(jī)器健康模型能有效應(yīng)對(duì)以上挑戰(zhàn)。這一模型利用數(shù)據(jù)庫豐富的時(shí)序化監(jiān)控?cái)?shù)據(jù),例如連接狀態(tài)、處理器/內(nèi)存使用率、磁盤讀寫時(shí)延、緩存大小、等待時(shí)間等,通過機(jī)器學(xué)習(xí)或深度學(xué)習(xí)的方法進(jìn)行訓(xùn)練,并得到合理的數(shù)據(jù)庫健康同時(shí),這一健康預(yù)測(cè)方法,也是英特爾與基石數(shù)據(jù)合作開展署在邊緣的數(shù)據(jù)庫健康預(yù)測(cè)系統(tǒng)所得到的預(yù)測(cè)結(jié)果,可以與云端的D-Smart運(yùn)維知識(shí)自動(dòng)化系統(tǒng)形成交互,對(duì)方案實(shí)施■基石數(shù)據(jù)機(jī)器健康模型方案描述基石數(shù)據(jù)機(jī)器健康模型方案基本架構(gòu)如圖2-2-20所示,貼近電網(wǎng)管線、電力生產(chǎn)等一線部署的機(jī)器健康模型,由數(shù)據(jù)預(yù)處理、模型訓(xùn)練&驗(yàn)證以及預(yù)測(cè)系統(tǒng)幾部分組成,可以使用訓(xùn)練數(shù)據(jù),通過特定算法訓(xùn)練模型,并利用測(cè)試數(shù)據(jù)對(duì)模型效果進(jìn)行驗(yàn)證,迭代優(yōu)化模型。最終的預(yù)測(cè)結(jié)果將傳送到位于云端的D-Smart運(yùn)維知識(shí)庫,并可以對(duì)接內(nèi)外部專家系統(tǒng)、廠商支撐、系統(tǒng)優(yōu)化團(tuán)隊(duì)以及專門的IT系統(tǒng)健康管理團(tuán)隊(duì),根據(jù)V!!!特特戰(zhàn)實(shí)戰(zhàn)篇45
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 職工持股意向協(xié)議書
- 汽車買賣租售協(xié)議書
- 私人合資買房協(xié)議書
- 人防跨區(qū)支援協(xié)議書
- 木工合伙協(xié)議書范本
- 影片聯(lián)合投資協(xié)議書
- 2025年浙江工商職業(yè)技術(shù)學(xué)院高職單招語文2019-2024歷年真題考點(diǎn)試卷含答案解析
- 量化培訓(xùn)面試題及答案解析
- 2024年園藝師考試的生態(tài)保護(hù)教學(xué)試題及答案
- 2025至2030年防爆型電子水處理儀項(xiàng)目投資價(jià)值分析報(bào)告
- 《餐廳托盤的使用技》課件
- 【化學(xué)】化學(xué)與可持續(xù)發(fā)展教學(xué)設(shè)計(jì)-2024-2025學(xué)年九年級(jí)化學(xué)人教版下冊(cè)
- Unit 2 Know your body(說課稿) -2024-2025學(xué)年外研版(三起)(2024)英語三年級(jí)下冊(cè)
- 6.3.1+平面向量基本定理(教學(xué)課件)-高一數(shù)學(xué)(人教A版2019)
- 酒店的突發(fā)事件及案例
- 【農(nóng)學(xué)課件】瓜類蔬菜栽培
- 三年級(jí)下冊(cè)兩位數(shù)乘兩位數(shù)豎式計(jì)算練習(xí)200題有答案
- 護(hù)士生涯職業(yè)生涯規(guī)劃
- 三級(jí)綜合醫(yī)院評(píng)審標(biāo)準(zhǔn)(2024年版)
- DB14∕T 2163-2020 信息化項(xiàng)目軟件運(yùn)維費(fèi)用測(cè)算指南
- 交換機(jī)調(diào)試報(bào)告范文
評(píng)論
0/150
提交評(píng)論