版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
制造系統(tǒng)大數(shù)據(jù)分析技術(shù)基礎(chǔ)第3章CONTENTS工業(yè)大數(shù)據(jù)數(shù)據(jù)驅(qū)動(dòng)建模技術(shù)路線(xiàn)數(shù)據(jù)預(yù)處理技術(shù)回歸分析與關(guān)聯(lián)分析分類(lèi)建模與模型集成目錄時(shí)間序列建模與預(yù)測(cè)深度學(xué)習(xí)01PARTONE工業(yè)大數(shù)據(jù)工業(yè)大數(shù)據(jù)工業(yè)大數(shù)據(jù)概述工業(yè)大數(shù)據(jù)概述工業(yè)大數(shù)據(jù)涉及智能制造全過(guò)程的數(shù)據(jù)及相關(guān)技術(shù),涵蓋結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)。它涉及生產(chǎn)控制、質(zhì)量監(jiān)測(cè)、設(shè)備維護(hù)、供應(yīng)鏈管理等。工業(yè)大數(shù)據(jù)的作用優(yōu)化生產(chǎn)、設(shè)備維護(hù)、提高產(chǎn)品質(zhì)量、優(yōu)化供應(yīng)鏈、節(jié)能減排。深入分析生產(chǎn)數(shù)據(jù),識(shí)別并解決瓶頸,提高生產(chǎn)效率和質(zhì)量。預(yù)測(cè)性維護(hù)減少故障率和停機(jī)時(shí)間。優(yōu)化庫(kù)存和物流,降低成本并提高客戶(hù)滿(mǎn)意度。節(jié)能減排實(shí)現(xiàn)綠色制造。工業(yè)大數(shù)據(jù)的影響隨著信息技術(shù)和工業(yè)互聯(lián)網(wǎng)的發(fā)展,工業(yè)大數(shù)據(jù)成為制造業(yè)轉(zhuǎn)型升級(jí)的關(guān)鍵。它幫助企業(yè)實(shí)現(xiàn)智能化、自動(dòng)化和精細(xì)化管理,提升制造系統(tǒng)的柔性和響應(yīng)能力。同時(shí),為企業(yè)的創(chuàng)新發(fā)展提供支持。因此,掌握工業(yè)大數(shù)據(jù)對(duì)制造業(yè)企業(yè)至關(guān)重要。工業(yè)大數(shù)據(jù)工業(yè)大數(shù)據(jù)與智能制造的關(guān)系制造業(yè)發(fā)展催生工業(yè)大數(shù)據(jù)工業(yè)大數(shù)據(jù)涵蓋產(chǎn)品全生命周期數(shù)據(jù),制造業(yè)大數(shù)據(jù)是其重要來(lái)源。制造業(yè)數(shù)字化、智能化產(chǎn)生巨量數(shù)據(jù),如傳感器數(shù)據(jù)、設(shè)備運(yùn)行數(shù)據(jù)等。數(shù)據(jù)的采集、存儲(chǔ)和管理形成工業(yè)大數(shù)據(jù)基礎(chǔ),推動(dòng)制造業(yè)對(duì)數(shù)據(jù)的利用,促進(jìn)智能制造發(fā)展。工業(yè)大數(shù)據(jù)促進(jìn)制造模式轉(zhuǎn)型升級(jí)工業(yè)大數(shù)據(jù)支持智能制造,整合數(shù)據(jù)至云端優(yōu)化生產(chǎn),實(shí)現(xiàn)實(shí)時(shí)監(jiān)控、預(yù)測(cè)性維護(hù)等功能。優(yōu)化供應(yīng)鏈管理提升效率、質(zhì)量和資源利用率,促進(jìn)制造業(yè)轉(zhuǎn)型升級(jí)。滿(mǎn)足個(gè)性化需求,從大規(guī)模生產(chǎn)向柔性、定制化轉(zhuǎn)變,適應(yīng)市場(chǎng)需求。工業(yè)大數(shù)據(jù)與智能制造相輔相成,推動(dòng)工業(yè)領(lǐng)域發(fā)展和變革。隨著技術(shù)進(jìn)步和應(yīng)用拓展,它們關(guān)系將更加緊密。工業(yè)大數(shù)據(jù)智能制造系統(tǒng)中的大數(shù)據(jù)特征智能制造系統(tǒng)中的大數(shù)據(jù)不僅具有大數(shù)據(jù)通常所具有的4V特性,還具有制造領(lǐng)域數(shù)據(jù)所具有的特征。數(shù)據(jù)體量大(Volume)指大數(shù)據(jù)的規(guī)模之大。智能制造系統(tǒng)產(chǎn)生的數(shù)據(jù)量通常非常龐大,包括生產(chǎn)過(guò)程中的傳感器數(shù)據(jù)、設(shè)備運(yùn)行數(shù)據(jù)、產(chǎn)品質(zhì)量數(shù)據(jù)等。數(shù)據(jù)多樣性(Variety)指數(shù)據(jù)的種類(lèi)和多樣性。智能制造系統(tǒng)中的數(shù)據(jù)可能來(lái)自不同的來(lái)源,包括結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)。流轉(zhuǎn)速度快(Velocity)指數(shù)據(jù)產(chǎn)生、傳輸和處理的速度。在智能制造系統(tǒng)中,數(shù)據(jù)的產(chǎn)生和更新通常是實(shí)時(shí)的,例如傳感器產(chǎn)生的實(shí)時(shí)數(shù)據(jù)、設(shè)備狀態(tài)的實(shí)時(shí)監(jiān)測(cè)等。價(jià)值密度低(Value)在智能制造系統(tǒng)中,雖然數(shù)據(jù)量龐大、流轉(zhuǎn)速度快、種類(lèi)多樣,但并不是所有數(shù)據(jù)都具有同等的價(jià)值。許多數(shù)據(jù)可能是噪聲數(shù)據(jù)或者對(duì)決策和優(yōu)化沒(méi)有直接的幫助。1工業(yè)大數(shù)據(jù)時(shí)序特性生產(chǎn)過(guò)程中的傳感器數(shù)據(jù)、設(shè)備運(yùn)行數(shù)據(jù)等都是隨著時(shí)間的推移而產(chǎn)生的。這種時(shí)序特性使得在處理制造業(yè)大數(shù)據(jù)時(shí)需要考慮數(shù)據(jù)的時(shí)間序列特征。智能制造系統(tǒng)中的大數(shù)據(jù)特征高維特性制造業(yè)大數(shù)據(jù)通常是高維度的,即數(shù)據(jù)具有大量的特征或?qū)傩浴_@種高維特性增加了數(shù)據(jù)分析和挖掘的復(fù)雜度,需要使用適當(dāng)?shù)臄?shù)據(jù)處理和分析技術(shù)來(lái)處理這些高維數(shù)據(jù)。多尺度特性制造業(yè)大數(shù)據(jù)可能同時(shí)包含不同時(shí)間尺度、空間尺度或粒度的信息,需要同時(shí)考慮不同尺度的數(shù)據(jù)特征進(jìn)行分析和建模。高噪特性制造業(yè)大數(shù)據(jù)通常具有較高的噪聲水平,即數(shù)據(jù)中可能包含大量的隨機(jī)或異常值。在處理制造業(yè)大數(shù)據(jù)時(shí)需要采用適當(dāng)?shù)脑肼曁幚砑夹g(shù),以提高數(shù)據(jù)質(zhì)量和分析的準(zhǔn)確性。強(qiáng)關(guān)聯(lián)性制造業(yè)大數(shù)據(jù)中的不同數(shù)據(jù)項(xiàng)往往之間存在著較強(qiáng)的相關(guān)性或關(guān)聯(lián)性,通過(guò)挖掘數(shù)據(jù)之間的關(guān)聯(lián)關(guān)系,可以發(fā)現(xiàn)隱藏在數(shù)據(jù)背后的規(guī)律和信息,為生產(chǎn)優(yōu)化和決策提供更有力的支持。工業(yè)大數(shù)據(jù)按照來(lái)源分類(lèi)(1)內(nèi)部大數(shù)據(jù):來(lái)自于企業(yè)內(nèi)部各個(gè)部門(mén)和系統(tǒng)的數(shù)據(jù),包括產(chǎn)品大數(shù)據(jù)(設(shè)計(jì)、仿真、工藝、加工、維護(hù)數(shù)據(jù)等)、運(yùn)營(yíng)大數(shù)據(jù)(設(shè)備、營(yíng)銷(xiāo)、財(cái)務(wù)、生產(chǎn)、質(zhì)量、庫(kù)存、標(biāo)準(zhǔn)等數(shù)據(jù))、價(jià)值鏈大數(shù)據(jù)(客戶(hù)、供應(yīng)商、合作伙伴等數(shù)據(jù))等。(2)外部大數(shù)據(jù):來(lái)自于外部環(huán)境和市場(chǎng)的數(shù)據(jù),包括供應(yīng)鏈數(shù)據(jù)、市場(chǎng)銷(xiāo)售數(shù)據(jù)、競(jìng)爭(zhēng)對(duì)手?jǐn)?shù)據(jù)等。智能制造系統(tǒng)中的大數(shù)據(jù)分類(lèi)工業(yè)大數(shù)據(jù)按照存儲(chǔ)形式分類(lèi)(1)結(jié)構(gòu)化數(shù)據(jù):具有明確定義和固定格式的數(shù)據(jù),通常存儲(chǔ)在關(guān)系數(shù)據(jù)庫(kù)中,以二維邏輯表格的形式進(jìn)行存儲(chǔ)。易于處理和分析,如生產(chǎn)訂單數(shù)據(jù)、零部件清單數(shù)據(jù)等。A(2)半結(jié)構(gòu)化數(shù)據(jù):部分具有結(jié)構(gòu)化特征但不完全符合固定格式的數(shù)據(jù),通常以文本、日志文件等形式存在,如設(shè)備維護(hù)日志、生產(chǎn)報(bào)告等。B(3)非結(jié)構(gòu)化數(shù)據(jù):沒(méi)有明確定義和固定格式的數(shù)據(jù),通常以文本、圖像、視頻等形式存在,存儲(chǔ)于非結(jié)構(gòu)化Web數(shù)據(jù)庫(kù)中。難以直接處理和分析,如生產(chǎn)現(xiàn)場(chǎng)圖片、產(chǎn)品設(shè)計(jì)文檔等。C智能制造系統(tǒng)中的大數(shù)據(jù)分類(lèi)工業(yè)大數(shù)據(jù)按照維度分類(lèi)1(1)時(shí)間維度:數(shù)據(jù)按照時(shí)間軸進(jìn)行分類(lèi),包括實(shí)時(shí)數(shù)據(jù)、歷史數(shù)據(jù)等。2(2)空間維度:數(shù)據(jù)按照空間位置或范圍進(jìn)行分類(lèi),包括不同生產(chǎn)車(chē)間、不同設(shè)備等。4(4)層次維度:數(shù)據(jù)按照不同層次或粒度進(jìn)行分類(lèi),包括產(chǎn)品層次、生產(chǎn)過(guò)程層次等。3(3)業(yè)務(wù)維度:數(shù)據(jù)按照業(yè)務(wù)過(guò)程或功能進(jìn)行分類(lèi),包括生產(chǎn)過(guò)程數(shù)據(jù)、質(zhì)量管理數(shù)據(jù)、供應(yīng)鏈數(shù)據(jù)等。02PARTTWO數(shù)據(jù)驅(qū)動(dòng)建模技術(shù)路線(xiàn)數(shù)據(jù)驅(qū)動(dòng)建模技術(shù)路線(xiàn)數(shù)據(jù)驅(qū)動(dòng)建模概述數(shù)據(jù)驅(qū)動(dòng)模型基于數(shù)據(jù)分析和機(jī)器學(xué)習(xí),針對(duì)復(fù)雜、難以觀測(cè)和隨機(jī)性強(qiáng)的應(yīng)用場(chǎng)景。它利用大數(shù)據(jù)訓(xùn)練和優(yōu)化,挖掘隱藏規(guī)律和模式,實(shí)現(xiàn)系統(tǒng)建模和預(yù)測(cè)。在制造業(yè)中,數(shù)據(jù)驅(qū)動(dòng)建模有廣泛應(yīng)用。企業(yè)可通過(guò)收集和分析生產(chǎn)線(xiàn)數(shù)據(jù),建立模型預(yù)測(cè)設(shè)備故障、優(yōu)化生產(chǎn)調(diào)度、改進(jìn)質(zhì)量控制,提高效率和降低成本。同時(shí),數(shù)據(jù)驅(qū)動(dòng)建模也用于供應(yīng)鏈管理,如優(yōu)化庫(kù)存管理、降低物流成本,確保供應(yīng)鏈穩(wěn)定可靠。數(shù)據(jù)驅(qū)動(dòng)建模技術(shù)路線(xiàn)數(shù)據(jù)驅(qū)動(dòng)建模的一般流程數(shù)據(jù)驅(qū)動(dòng)建模技術(shù)以數(shù)據(jù)處理分析技術(shù)和數(shù)據(jù)建模技術(shù)為基礎(chǔ),因此數(shù)據(jù)驅(qū)動(dòng)建模的一般流程也圍繞著數(shù)據(jù)處理與模型構(gòu)建展開(kāi)數(shù)據(jù)驅(qū)動(dòng)建模的一般流程2數(shù)據(jù)驅(qū)動(dòng)建模技術(shù)路線(xiàn)問(wèn)題定義和目標(biāo)確定在進(jìn)行建模之前,首先應(yīng)充分、正確地理解背景和需求,確定需要解決的問(wèn)題或目標(biāo),并明確建模的目的和預(yù)期結(jié)果。數(shù)據(jù)驅(qū)動(dòng)建模的一般流程數(shù)據(jù)收集與預(yù)處理收集與問(wèn)題和目標(biāo)相關(guān)的數(shù)據(jù),并對(duì)收集到的數(shù)據(jù)進(jìn)行預(yù)處理,包括處理缺失值、異常值、重復(fù)值,進(jìn)行數(shù)據(jù)轉(zhuǎn)換、歸一化、標(biāo)準(zhǔn)化等操作,以確保數(shù)據(jù)質(zhì)量和可用性。模型選擇與訓(xùn)練根據(jù)建模的目的和數(shù)據(jù)的結(jié)構(gòu)等特點(diǎn),選擇合適的建模方法,如統(tǒng)計(jì)模型、機(jī)器學(xué)習(xí)模型、深度學(xué)習(xí)模型等,并利用訓(xùn)練數(shù)據(jù)對(duì)模型進(jìn)行訓(xùn)練。數(shù)據(jù)驅(qū)動(dòng)建模技術(shù)路線(xiàn)數(shù)據(jù)驅(qū)動(dòng)建模的一般流程模型評(píng)估使用評(píng)估數(shù)據(jù)或交叉驗(yàn)證等方法對(duì)訓(xùn)練好的模型進(jìn)行評(píng)估,評(píng)估模型的性能和泛化能力,檢驗(yàn)?zāi)P褪欠襁_(dá)到預(yù)期的效果。模型調(diào)優(yōu)與優(yōu)化根據(jù)評(píng)估結(jié)果,對(duì)模型進(jìn)行調(diào)優(yōu)和優(yōu)化,可能包括調(diào)整模型參數(shù)、改進(jìn)特征選取、調(diào)整模型結(jié)構(gòu)等,以進(jìn)一步提高模型的性能,與建模目標(biāo)相匹配。模型發(fā)布與應(yīng)用將訓(xùn)練好的模型發(fā)布應(yīng)用到實(shí)際環(huán)境中,用于實(shí)際問(wèn)題的解決和決策支持,并監(jiān)控模型的性能和表現(xiàn)。持續(xù)監(jiān)測(cè)與更新在系統(tǒng)運(yùn)行過(guò)程中,需要對(duì)發(fā)布的模型進(jìn)行持續(xù)性監(jiān)測(cè)和更新,根據(jù)實(shí)際情況對(duì)模型進(jìn)行調(diào)整和改進(jìn),以確保模型持續(xù)有效地解決實(shí)際問(wèn)題。數(shù)據(jù)驅(qū)動(dòng)建模技術(shù)路線(xiàn)數(shù)據(jù)驅(qū)動(dòng)建模的分類(lèi)監(jiān)督方式監(jiān)督學(xué)習(xí)無(wú)監(jiān)督學(xué)習(xí)半監(jiān)督學(xué)習(xí)強(qiáng)化學(xué)習(xí)典型任務(wù)分類(lèi)回歸聚類(lèi)降維關(guān)聯(lián)規(guī)則挖掘分類(lèi)最優(yōu)策略典型算法邏輯回歸、支持向量機(jī)線(xiàn)性回歸、嶺回歸K均值、DBSCAN主成分分析、線(xiàn)性判別分析Apriori算法、PCY算法半監(jiān)督支持向量機(jī)Q學(xué)習(xí)、DQN、PPO數(shù)據(jù)標(biāo)簽有有無(wú)無(wú)無(wú)有(少量)無(wú)數(shù)據(jù)x有有有有有有無(wú)數(shù)據(jù)f(x)有有無(wú)無(wú)無(wú)有(少量)無(wú)典型應(yīng)用場(chǎng)景質(zhì)量水平分類(lèi)、故障識(shí)別時(shí)間序列預(yù)測(cè)、需求預(yù)測(cè)異常檢測(cè)、故障分析工業(yè)大數(shù)據(jù)簡(jiǎn)化與規(guī)約采購(gòu)與庫(kù)存控制、客戶(hù)需求分析分類(lèi)、聚類(lèi)\生成等任務(wù)場(chǎng)景生產(chǎn)調(diào)度、路徑規(guī)劃、控制策略按監(jiān)督方式分類(lèi)的數(shù)據(jù)驅(qū)動(dòng)建模方法03PARTTHREE數(shù)據(jù)預(yù)處理技術(shù)數(shù)據(jù)預(yù)處理技術(shù)由于制造業(yè)中數(shù)據(jù)體量大、來(lái)源多樣,原始數(shù)據(jù)集通常存在數(shù)據(jù)噪聲、數(shù)據(jù)冗余、數(shù)據(jù)缺失、數(shù)據(jù)不一致等問(wèn)題,而在數(shù)據(jù)驅(qū)動(dòng)建模、數(shù)據(jù)分析、數(shù)據(jù)挖掘等下游應(yīng)用中,數(shù)據(jù)的質(zhì)量是決定分析與模型效果的主要因素之一。數(shù)據(jù)預(yù)處理的主要任務(wù)可以概括為四個(gè)內(nèi)容,即數(shù)據(jù)清洗、數(shù)據(jù)集成、數(shù)據(jù)轉(zhuǎn)換、數(shù)據(jù)規(guī)約。數(shù)據(jù)預(yù)處理技術(shù)數(shù)據(jù)清洗數(shù)據(jù)清洗是識(shí)別并處理數(shù)據(jù)集中不準(zhǔn)確、不完整或不合理數(shù)據(jù)的過(guò)程,數(shù)據(jù)清洗通常包括缺失值、異常值、重復(fù)項(xiàng)、錯(cuò)誤值的處理。由于重復(fù)項(xiàng)和錯(cuò)誤值的處理方法比較簡(jiǎn)便,故本節(jié)將主要介紹缺失值的處理。數(shù)據(jù)預(yù)處理技術(shù)缺失數(shù)據(jù)的類(lèi)型No.31)完全隨機(jī)缺失(MissingCompletelyAtRandom,MCAR):數(shù)據(jù)的缺失是隨機(jī)的,數(shù)據(jù)的缺失不依賴(lài)于任何不完全變量或完全變量。2)隨機(jī)缺失(MissingAtRandom,MAR):數(shù)據(jù)的缺失不是完全隨機(jī)的,缺失數(shù)據(jù)發(fā)生的概率與其他完全變量是有關(guān)的,而與未觀察到的數(shù)據(jù)的特征是無(wú)關(guān)的,即數(shù)據(jù)是否缺失取決于另外一個(gè)顯性屬性。3)完全非隨機(jī)缺失(MissingNotAtRandom,MNAR):不完全變量中數(shù)據(jù)的缺失依賴(lài)于不完全變量本身,這種缺失是不可忽略的,數(shù)據(jù)缺失與自身的值有關(guān)。No.2No.1數(shù)據(jù)預(yù)處理技術(shù)缺失數(shù)據(jù)處理方法處理缺失數(shù)據(jù)的方法通常包括刪除和插補(bǔ)兩種。刪除會(huì)造成更多的數(shù)據(jù)損失,但如果所搜集到的數(shù)據(jù)量很大,而缺失數(shù)據(jù)的占比較小時(shí),可以直接刪除這些數(shù)據(jù)。插補(bǔ)將缺失的數(shù)據(jù)補(bǔ)全,以恢復(fù)缺失的信息,但不準(zhǔn)確的插補(bǔ)會(huì)在數(shù)據(jù)集中引入錯(cuò)誤信息,因此插補(bǔ)的準(zhǔn)確性非常關(guān)鍵。基于統(tǒng)計(jì)的插補(bǔ):使用缺失屬性取值的均值、眾數(shù)、中位數(shù)等填充缺失值。基于插值的插補(bǔ):利用已知數(shù)據(jù)建立合適的插值函數(shù)f(x),缺失值由對(duì)應(yīng)點(diǎn)xi對(duì)應(yīng)函數(shù)值f(xi)近似替代。基于回歸的插補(bǔ):建立缺失數(shù)據(jù)的屬性與其它可觀測(cè)數(shù)據(jù)的屬性之間的回歸模型來(lái)預(yù)測(cè)缺失的屬性值。多重插補(bǔ):使用模型估計(jì)和重復(fù)模擬來(lái)生成一組完整的數(shù)據(jù)集。每個(gè)數(shù)據(jù)集中的缺失數(shù)據(jù)會(huì)通過(guò)估計(jì)模型的方法進(jìn)行填補(bǔ)。基于深度學(xué)習(xí)的插補(bǔ):隨著深度學(xué)習(xí)的發(fā)展,許多深度學(xué)習(xí)模型也可應(yīng)用于缺失數(shù)據(jù)插補(bǔ)。數(shù)據(jù)預(yù)處理技術(shù)數(shù)據(jù)集成制造業(yè)數(shù)據(jù)分析與挖掘所需要的數(shù)據(jù)往往來(lái)源于不同數(shù)據(jù)源,數(shù)據(jù)集成就是將來(lái)自不同數(shù)據(jù)源的數(shù)據(jù)合并到一個(gè)一致的、統(tǒng)一的數(shù)據(jù)存儲(chǔ)中。這個(gè)過(guò)程確保了數(shù)據(jù)的一致性和可用性,節(jié)省了數(shù)據(jù)管理時(shí)間和資源,為后續(xù)的分析與使用提供了可靠的基礎(chǔ)。數(shù)據(jù)預(yù)處理技術(shù)數(shù)據(jù)集成的方法(1)手工集成:手工集成是最基礎(chǔ)的方法,通常涉及人工編寫(xiě)代碼或使用電子表格軟件將不同數(shù)據(jù)源的數(shù)據(jù)手動(dòng)整合在一起。這種方法適用于數(shù)據(jù)量較小、結(jié)構(gòu)簡(jiǎn)單的情況,但對(duì)于大規(guī)模、復(fù)雜的數(shù)據(jù)集成則效率低下且易出錯(cuò)。(2)數(shù)據(jù)庫(kù)集成:數(shù)據(jù)庫(kù)集成利用數(shù)據(jù)庫(kù)管理系統(tǒng)的功能,通過(guò)建立鏈接、導(dǎo)入數(shù)據(jù)、執(zhí)行查詢(xún)等方式實(shí)現(xiàn)數(shù)據(jù)集成。這種方法適用于大規(guī)模數(shù)據(jù)的集成,可以利用數(shù)據(jù)庫(kù)系統(tǒng)的優(yōu)化功能提高效率。數(shù)據(jù)預(yù)處理技術(shù)實(shí)體識(shí)別問(wèn)題在數(shù)據(jù)集成過(guò)程中,實(shí)體識(shí)別是一項(xiàng)重要的任務(wù)。通過(guò)實(shí)體識(shí)別,可以確保不同數(shù)據(jù)源中的相同實(shí)體被正確地整合和對(duì)應(yīng),從而提高數(shù)據(jù)的一致性和準(zhǔn)確性。實(shí)體識(shí)別中,常見(jiàn)的矛盾形式如下:同名異義例如,數(shù)據(jù)源A、B中的屬性ID分別描述的是產(chǎn)品編號(hào)和訂單編號(hào),即屬性ID對(duì)應(yīng)的是不同的實(shí)體。異名同義例如,數(shù)據(jù)源A中的屬性sales_dt和數(shù)據(jù)源B中的sale_date都是描述銷(xiāo)售日期的,即指向同一個(gè)實(shí)體。單位不統(tǒng)一檢測(cè)和解決這些矛盾就是實(shí)體識(shí)別的任務(wù)。通常,數(shù)據(jù)庫(kù)和數(shù)據(jù)倉(cāng)庫(kù)通常使用元數(shù)據(jù)——關(guān)于數(shù)據(jù)的數(shù)據(jù),來(lái)支持?jǐn)?shù)據(jù)集成。數(shù)據(jù)集成中的關(guān)鍵問(wèn)題數(shù)據(jù)預(yù)處理技術(shù)冗余識(shí)別問(wèn)題冗余識(shí)別是另一個(gè)重要的數(shù)據(jù)集成任務(wù),它涉及識(shí)別和刪除重復(fù)的、冗余的數(shù)據(jù)。在數(shù)據(jù)集成過(guò)程中,常常會(huì)出現(xiàn)來(lái)自不同數(shù)據(jù)源的重復(fù)信息,如果不加以處理,這些冗余數(shù)據(jù)會(huì)導(dǎo)致數(shù)據(jù)存儲(chǔ)浪費(fèi)和分析結(jié)果不準(zhǔn)確。通過(guò)冗余識(shí)別可以提高數(shù)據(jù)存儲(chǔ)的效率,并確保數(shù)據(jù)集成的質(zhì)量。數(shù)據(jù)集成中的關(guān)鍵問(wèn)題數(shù)據(jù)預(yù)處理技術(shù)數(shù)據(jù)轉(zhuǎn)換在數(shù)據(jù)的預(yù)處理中,數(shù)據(jù)轉(zhuǎn)換又叫做數(shù)據(jù)變換,是將來(lái)源于多數(shù)據(jù)源的不同范圍、不同量綱的數(shù)據(jù)進(jìn)行統(tǒng)一規(guī)范化處理,變換成適應(yīng)于數(shù)據(jù)挖掘需求的形式。主要操作有規(guī)范化和離散化。規(guī)范化數(shù)據(jù)規(guī)范化又被稱(chēng)為數(shù)據(jù)標(biāo)準(zhǔn)化或數(shù)據(jù)歸一化,是將數(shù)據(jù)按照比例進(jìn)行縮放,使之落入一個(gè)特定的范圍。數(shù)據(jù)規(guī)范化可以減弱模型訓(xùn)練過(guò)程中的振蕩現(xiàn)象。常用的數(shù)據(jù)規(guī)范化方法有最大-最小規(guī)范化、Z-Score標(biāo)準(zhǔn)化和Log變換。離散化數(shù)據(jù)離散化是指將連續(xù)的數(shù)據(jù)進(jìn)行分段,使處理之后的數(shù)據(jù)值域分布將從連續(xù)屬性變?yōu)殡x散屬性。常見(jiàn)實(shí)現(xiàn)針對(duì)連續(xù)數(shù)據(jù)離散化的方法有:分位數(shù)法、等頻法、等寬法、聚類(lèi)法、卡方過(guò)濾等。數(shù)據(jù)預(yù)處理技術(shù)數(shù)據(jù)規(guī)約數(shù)據(jù)規(guī)約旨在減少數(shù)據(jù)集的大小,同時(shí)保留關(guān)鍵信息。通過(guò)數(shù)據(jù)規(guī)約,可以大大降低數(shù)據(jù)分析的復(fù)雜度,提高算法的效率和性能。在機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘任務(wù)中,數(shù)據(jù)規(guī)約主要包括特征選擇和數(shù)據(jù)降維兩種手段。特征選擇數(shù)據(jù)模型特征維度高,計(jì)算復(fù)雜。非所有特征對(duì)預(yù)測(cè)有效,需去除不必要特征以降低復(fù)雜度。特征選擇旨在選取最相關(guān)、具代表性的特征子集,避免全特征訓(xùn)練。合適選擇能縮小特征集,減少運(yùn)算時(shí)間,提高模型精度、有效性,降低過(guò)擬合風(fēng)險(xiǎn),增強(qiáng)泛化能力。特征選擇方法分三類(lèi):過(guò)濾法、包裝法、嵌入法。數(shù)據(jù)降維數(shù)據(jù)降維是減少數(shù)據(jù)集維度并保留信息的技術(shù)。與特征選擇不同,它通過(guò)特征間的關(guān)聯(lián)和整合,用少量新特征描述多特征,降低維度。其作用有:簡(jiǎn)化數(shù)據(jù)分析,通過(guò)映射到低維空間便于可視化和理解;減少計(jì)算開(kāi)銷(xiāo),降低數(shù)據(jù)集維度以節(jié)省資源;去除冗余信息,使數(shù)據(jù)更精簡(jiǎn)。常見(jiàn)方法包括主成分分析、線(xiàn)性判別分析、t-分布鄰域嵌入等。04PARTFOUR回歸分析與關(guān)聯(lián)分析回歸分析與關(guān)聯(lián)分析回歸分析在制造業(yè)大數(shù)據(jù)分析中,回歸分析是一種預(yù)測(cè)性的建模技術(shù),是對(duì)輸入變量(自變量)與輸出變量(因變量)之間的變化關(guān)系的建模。通常被用于預(yù)測(cè)分析、時(shí)間序列模型以及變量間因果關(guān)系挖掘等。根據(jù)模型的形式,可將回歸模型分類(lèi)為線(xiàn)性回歸與非線(xiàn)性回歸兩種?;貧w分析與關(guān)聯(lián)分析一元線(xiàn)性回歸一元線(xiàn)性回歸分析涉及一個(gè)因變量y和一個(gè)自變量x,是最簡(jiǎn)單的回歸形式。若有訓(xùn)練集包含(x1,y1),(x2,y2),…,(xm,ym)共m個(gè)數(shù)據(jù)點(diǎn),則使用x的線(xiàn)性函數(shù)對(duì)y進(jìn)行建模:式中,系數(shù)w0和w1可以通過(guò)計(jì)算訓(xùn)練模型f(x)與真實(shí)值y之間的誤差來(lái)實(shí)現(xiàn),即對(duì)應(yīng)于訓(xùn)練出來(lái)的模型f(x)和真實(shí)值y之間的歐幾里得距離或稱(chēng)歐氏距離(Euclideandistance)最小時(shí),稱(chēng)之為函數(shù)收斂。以上模型求解方法稱(chēng)為最小二乘法。在線(xiàn)性回歸中,最小二乘法就是試圖找到一條直線(xiàn),使所有樣本到直線(xiàn)的歐氏距離之和最小。最小二乘法中,回歸系數(shù)可由下式進(jìn)行估計(jì):回歸分析與關(guān)聯(lián)分析多元線(xiàn)性回歸與非線(xiàn)性回歸在一些場(chǎng)景中,因變量y可能與多個(gè)自變量有關(guān),這種問(wèn)題稱(chēng)為多元線(xiàn)性回歸。作為一元線(xiàn)性回歸的擴(kuò)展,多元線(xiàn)性回歸問(wèn)題同樣可以使用最小二乘法的思路進(jìn)行求解。與線(xiàn)性回歸相對(duì)的是非線(xiàn)性回歸,能夠描述更復(fù)雜的變量間非線(xiàn)性關(guān)系。對(duì)模型進(jìn)行線(xiàn)性基展開(kāi),可以使線(xiàn)性模型適用于非線(xiàn)性回歸,基函數(shù)類(lèi)型可以是多項(xiàng)式(泰勒展開(kāi))、分段樣條平滑、三角多項(xiàng)式(傅里葉展開(kāi))等,這類(lèi)非線(xiàn)性模型屬于參數(shù)模型?;貧w分析與關(guān)聯(lián)分析回歸模型的評(píng)價(jià)指標(biāo)在回歸任務(wù)中,使用真實(shí)值與預(yù)測(cè)值之間的差距來(lái)衡量模型的誤差。通常使用的指標(biāo)有平均絕對(duì)誤差(MeanAbsoluteError,MAE)、均方誤差(MeanSquareError,MSE)、均方根誤差(RootMeanSquareError,RMSE)和平均絕對(duì)百分比誤差(MeanAbsolutePercentageError,MAPE)等,其中用得最為廣泛的是MAE和MSE。設(shè)(xi,yi)是數(shù)據(jù)集中第i個(gè)樣本(i=1,2,…,m),f(x)是經(jīng)過(guò)訓(xùn)練的回歸模型,對(duì)自變量xi,模型的預(yù)測(cè)值為f(xi)。4回歸分析與關(guān)聯(lián)分析平均絕對(duì)誤差(MAE)MAE用來(lái)衡量預(yù)測(cè)值與真實(shí)值之間的平均絕對(duì)誤差回歸模型的評(píng)價(jià)指標(biāo)設(shè)(xi,yi)是數(shù)據(jù)集中第i個(gè)樣本(i=1,2,…,m),f(x)是經(jīng)過(guò)訓(xùn)練的回歸模型,對(duì)自變量xi,模型的預(yù)測(cè)值為f(xi)。均方誤差(MSE)MSE用來(lái)衡量預(yù)測(cè)值與真實(shí)值之間的誤差平方回歸分析與關(guān)聯(lián)分析關(guān)聯(lián)分析關(guān)聯(lián)分析,也叫關(guān)聯(lián)規(guī)則挖掘,屬于無(wú)監(jiān)督算法的一種,用于從數(shù)據(jù)中挖掘潛在的關(guān)聯(lián)關(guān)系,從而描述某些事物或?qū)傩酝瑫r(shí)出現(xiàn)的規(guī)律和模式,是一種描述性的而非預(yù)測(cè)性的方法。關(guān)聯(lián)分析的最終目標(biāo)是在數(shù)據(jù)集中找到強(qiáng)關(guān)聯(lián)規(guī)則,即擁有較高支持度和置信度的規(guī)則。在工業(yè)場(chǎng)景中,關(guān)聯(lián)規(guī)則常用于市場(chǎng)分銷(xiāo)、挖掘故障現(xiàn)象相關(guān)的故障原因并對(duì)可能關(guān)聯(lián)故障的部件進(jìn)行檢修排查等?;貧w分析與關(guān)聯(lián)分析項(xiàng)集(Itemset)設(shè)ij(j=1,2,…,m)為一個(gè)項(xiàng)目,項(xiàng)目的集合I={i1,i2,…,im}稱(chēng)為項(xiàng)集。項(xiàng)集中項(xiàng)目的個(gè)數(shù)稱(chēng)為項(xiàng)集的長(zhǎng)度,包含k個(gè)項(xiàng)目的項(xiàng)集稱(chēng)為k項(xiàng)集,例如I={面包,麥片,牛奶}為一個(gè)3項(xiàng)集。關(guān)聯(lián)規(guī)則(AssociationRules)關(guān)聯(lián)規(guī)則一般表示為X→Y的形式,左側(cè)項(xiàng)集X為先決條件,右側(cè)項(xiàng)集Y為關(guān)聯(lián)結(jié)果,用來(lái)表示數(shù)據(jù)內(nèi)的隱含關(guān)聯(lián)關(guān)系。例如,超市里購(gòu)買(mǎi)面包和麥片的顧客大概率也會(huì)購(gòu)買(mǎi)牛奶,{面包,麥片}→{牛奶}即為一個(gè)關(guān)聯(lián)規(guī)則。關(guān)聯(lián)規(guī)則可靠性和可用性由支持度、置信度和提升度來(lái)度量。關(guān)聯(lián)分析4回歸分析與關(guān)聯(lián)分析支持度(Support)規(guī)則的支持度是指在項(xiàng)集中同時(shí)含有X和Y的概率,即X和Y同時(shí)發(fā)生的概率。支持度用來(lái)衡量關(guān)聯(lián)規(guī)則的可用性,如果關(guān)聯(lián)規(guī)則的支持度較低,那么可以認(rèn)為它對(duì)于決策指導(dǎo)是無(wú)意義的。最小支持度(Minsup,MinimumSupport)是人為設(shè)定的閾值,用來(lái)剔除掉支持度小于此值的無(wú)意義規(guī)則。相應(yīng)地,滿(mǎn)足條件Support(T)>Minsup的項(xiàng)集T,被稱(chēng)為頻繁項(xiàng)集(FrequentItemset)。關(guān)聯(lián)分析置信度(Confident)規(guī)則的置信度表示在關(guān)聯(lián)規(guī)則的先決條件X發(fā)生的條件下,關(guān)聯(lián)結(jié)果Y發(fā)生的概率,即含有X的項(xiàng)集中,同時(shí)含有Y的可能性。置信度用來(lái)衡量關(guān)聯(lián)規(guī)則的可靠性。與支持度類(lèi)似,可以通過(guò)設(shè)置最小置信度閾值(MinimumConfidence,Mincon)來(lái)對(duì)關(guān)聯(lián)規(guī)則進(jìn)行進(jìn)一步篩選。提升度(Lift)提升度表示的是X的出現(xiàn)對(duì)于Y出現(xiàn)的影響,即在Y自身出現(xiàn)可能性P(Y)的基礎(chǔ)上,X的出現(xiàn)對(duì)于Y的出現(xiàn)P(Y|X)的提升程度。提升度同樣用于衡量關(guān)聯(lián)規(guī)則的可靠性。當(dāng)Lift值為1時(shí)表示X與Y相互獨(dú)立,X的出現(xiàn)對(duì)Y出現(xiàn)的可能性沒(méi)有提升作用,而其值越大(>1)則表明X的出現(xiàn)對(duì)Y出現(xiàn)的提升程度越大,即表明關(guān)聯(lián)性越強(qiáng)。回歸分析與關(guān)聯(lián)分析Apriori算法Apriori算法是一種基于頻繁項(xiàng)集的關(guān)聯(lián)分析算法,通過(guò)對(duì)頻繁項(xiàng)集的層級(jí)迭代搜索來(lái)挖掘關(guān)聯(lián)關(guān)系。該算法基于兩條先驗(yàn)性質(zhì):性質(zhì)1如果X是頻繁項(xiàng)集,則X的所有子集都是頻繁項(xiàng)集。性質(zhì)2如果X不是頻繁項(xiàng)集,則X的所有超集都不是頻繁項(xiàng)集。關(guān)聯(lián)分析
Apriori算法先驗(yàn)性質(zhì)圖示假設(shè)項(xiàng)集{a,
b}是頻繁項(xiàng)集,即a、b同時(shí)出現(xiàn)在一條記錄的次數(shù)大于等于最小支持度Minsup,則它的子集{a},出現(xiàn)次數(shù)必定大于等于Minsup,即它的子集都是頻繁項(xiàng)集;假設(shè)項(xiàng)集8k4iwyk不是頻繁項(xiàng)集,即A出現(xiàn)的次數(shù)小于Minsup,則它的任何超集如{c,
d}出現(xiàn)的次數(shù)必定小于Minsup,即其超集必定也不是頻繁項(xiàng)集。4回歸分析與關(guān)聯(lián)分析Apriori算法基于這兩條性質(zhì),Apriori算法使用逐層搜索的迭代方式,k項(xiàng)集用于搜索(k+1)項(xiàng)集。首先,找出所有頻繁1項(xiàng)集的集合C1,然后用C1生成候選2項(xiàng)集的集合C2,最后,通過(guò)探查C2來(lái)形成頻繁2項(xiàng)集的集合L2。以此類(lèi)推,使用Lk-1尋找Lk。如此迭代,直至不能找到頻繁k項(xiàng)集為止。在使用頻繁(k-1)項(xiàng)集的集合Lk-1尋找頻繁k項(xiàng)集的集合Lk時(shí)分兩個(gè)過(guò)程:連接步和剪枝步?;貧w分析與關(guān)聯(lián)分析連接步Lk-1與其自身進(jìn)行連接,產(chǎn)生候選k項(xiàng)集的集合Ck。需要注意的是,Lk-1中兩個(gè)元素可以執(zhí)行連接操作的前提是它們所包含的項(xiàng)中只有一個(gè)項(xiàng)是不同的,其余(k-2)個(gè)元素都必須相同。例如:項(xiàng)集{I1,I2,I3}與{I1,I3,I4}有兩項(xiàng)都是相同的,只有一個(gè)元素不同,因此連接之后產(chǎn)生的項(xiàng)集是{I1,I2,I3,I4}。反之,項(xiàng)集{I1,I2,I3}與{I1,I4,I5}只有1個(gè)共同的項(xiàng)集,另外兩個(gè)元素都是不同的,不能進(jìn)行連接操作。Apriori算法關(guān)聯(lián)分析剪枝步候選k項(xiàng)集的集合Ck中的元素并不一定都是頻繁項(xiàng)集,但所有的頻繁k項(xiàng)集一定包含在Ck中,所以,Ck是Lk的超集。根據(jù)性質(zhì)2,可以知道:如果一個(gè)(k-1)項(xiàng)集是非頻繁的,那么它的超集也一定是非頻繁的。因此,如果一個(gè)候選k項(xiàng)集Ck的(k-1)項(xiàng)子集不在Lk-1中,那么該候選k項(xiàng)集也不可能是頻繁的,可以直接從Ck中刪除?;貧w分析與關(guān)聯(lián)分析設(shè)定最小支持度Minsup;計(jì)算1項(xiàng)集的支持度,篩選出頻繁1項(xiàng)集;排列組合出2項(xiàng)集,計(jì)算出2項(xiàng)集的支持度,篩選出頻繁2項(xiàng)集;通過(guò)連接和剪枝計(jì)算出3項(xiàng)集,計(jì)算出3項(xiàng)集的支持度,篩選出頻繁3項(xiàng)集;依次類(lèi)推處理k項(xiàng)集,直到?jīng)]有頻繁集出現(xiàn)。Apriori算法關(guān)聯(lián)分析Apriori算法的一般步驟:05PARTFIVE分類(lèi)建模與模型集成分類(lèi)建模與模型集成分類(lèi)建模概述分類(lèi)建模是理解分析制造數(shù)據(jù)的機(jī)器學(xué)習(xí)技術(shù),屬于有監(jiān)督學(xué)習(xí)。它通過(guò)將生產(chǎn)數(shù)據(jù)樣本分類(lèi)為不同標(biāo)簽,用于產(chǎn)品質(zhì)量檢測(cè)、設(shè)備維護(hù)等。分類(lèi)模型通過(guò)訓(xùn)練數(shù)據(jù)集預(yù)測(cè)新數(shù)據(jù)類(lèi)別,經(jīng)評(píng)估確定準(zhǔn)確性。常見(jiàn)模型有邏輯回歸、支持向量機(jī)、決策樹(shù)等。分類(lèi)問(wèn)題與分類(lèi)模型分類(lèi)性能評(píng)價(jià)指標(biāo)評(píng)價(jià)分類(lèi)模型性能的指標(biāo)對(duì)于評(píng)估模型的準(zhǔn)確性和穩(wěn)定性至關(guān)重要。常用的評(píng)價(jià)指標(biāo)包括正確率、錯(cuò)誤率、精確率、召回率、F值等。以二分類(lèi)問(wèn)題為例,將樣本依據(jù)真實(shí)的類(lèi)別和分類(lèi)器的預(yù)測(cè)列別進(jìn)行組合,使用True、False表示預(yù)測(cè)結(jié)果的正確與錯(cuò)誤,Positive、Negative表示樣本實(shí)際的正例與反例,可分為四種情況:TP:將正例預(yù)測(cè)為正例的樣本數(shù);FN:將正例預(yù)測(cè)為反例的樣本數(shù);FP:將反例預(yù)測(cè)為正例的樣本數(shù);TN:將反例預(yù)測(cè)為反例的樣本數(shù);實(shí)際類(lèi)別預(yù)測(cè)結(jié)果正例反例正例TPFN反例FPTN分類(lèi)建模與模型集成分類(lèi)建模概述正確率也叫準(zhǔn)確率,表示分類(lèi)正確的樣本數(shù)占總樣本數(shù)的比例錯(cuò)誤率指分類(lèi)錯(cuò)誤的樣本數(shù)占總樣本數(shù)的比例精確率,也叫查準(zhǔn)率、預(yù)測(cè)命中率等,表示所有預(yù)測(cè)為正例的樣本中實(shí)際是正例的樣本數(shù)所占的比例召回率,也叫查全率,表示所有實(shí)際正例的樣本中預(yù)測(cè)為正例的樣本數(shù)所占的比例F值綜合考慮了精確率和召回率,是基于精確率和召回率的調(diào)和平均,是一個(gè)綜合性能評(píng)價(jià)指標(biāo),能適應(yīng)不同場(chǎng)景下對(duì)精確率和召回率的不同重視程度除了以上指標(biāo)之外,還有ROC曲線(xiàn)和AUC值等可以用于評(píng)價(jià)二分類(lèi)問(wèn)題的性能分類(lèi)建模與模型集成邏輯回歸邏輯回歸實(shí)際上是一種分類(lèi)算法,主要用于解決二分類(lèi)問(wèn)題。邏輯回歸通過(guò)將輸入特征進(jìn)行線(xiàn)性組合并通過(guò)一個(gè)邏輯函數(shù)轉(zhuǎn)換為概率值,再根據(jù)概率值進(jìn)行分類(lèi)預(yù)測(cè)。因此,對(duì)于每一組輸入,需要將線(xiàn)性回歸結(jié)果再經(jīng)過(guò)一個(gè)邏輯函數(shù)(Sigmoid函數(shù)),得到預(yù)測(cè)值y。常用分類(lèi)算法支持向量機(jī)支持向量機(jī)是一種二分類(lèi)模型,其核心思想是在特征空間中找到一個(gè)最優(yōu)的超平面,使得兩個(gè)類(lèi)別之間的間隔最大化,從而實(shí)現(xiàn)對(duì)數(shù)據(jù)的分類(lèi)。分類(lèi)學(xué)習(xí)最基本的想法就是基于訓(xùn)練集D在特征空間中找到一個(gè)最佳劃分超平面將正負(fù)樣本分開(kāi),而SVM算法解決的就是如何找到最佳超平面的問(wèn)題。分類(lèi)建模與模型集成常用分類(lèi)算法決策樹(shù)決策樹(shù)是一種樹(shù)形結(jié)構(gòu)的分類(lèi)模型,通過(guò)對(duì)輸入數(shù)據(jù)集進(jìn)行遞歸分割來(lái)構(gòu)建一棵樹(shù),從而實(shí)現(xiàn)對(duì)數(shù)據(jù)的分類(lèi)。在決策樹(shù)從上到下遍歷的過(guò)程中,在每個(gè)節(jié)點(diǎn)都會(huì)遇到測(cè)試,每個(gè)節(jié)點(diǎn)上測(cè)試結(jié)果的不同導(dǎo)致不同的分支,最后到達(dá)一個(gè)葉節(jié)點(diǎn),整個(gè)過(guò)程就是利用決策樹(shù)進(jìn)行分類(lèi)的過(guò)程。決策樹(shù)基本結(jié)構(gòu)分類(lèi)建模與模型集成模型集成方法Bagging(BootstrapAggregating,引導(dǎo)聚集)Bagging通過(guò)對(duì)訓(xùn)練數(shù)據(jù)集進(jìn)行自助采樣(bootstrapsampling),然后訓(xùn)練多個(gè)基分類(lèi)器,最后通過(guò)投票或平均的方式融合多個(gè)基分類(lèi)器的預(yù)測(cè)結(jié)果,從而降低模型的方差,提高模型的泛化能力。模型集成是通過(guò)組合使用多種基分類(lèi)器的預(yù)測(cè)結(jié)果來(lái)獲得更好的分類(lèi)性能的方法,故也被稱(chēng)為“多分類(lèi)器系統(tǒng)”。常用的模型集成方法包括Bagging、Boosting、Stacking三種。分類(lèi)建模與模型集成Boosting(提升)弱學(xué)習(xí)器(weaklearner)通常指泛化性能略?xún)?yōu)于隨機(jī)猜測(cè)的學(xué)習(xí)器,例如在二分類(lèi)問(wèn)題上精度略高于50%的分類(lèi)器。而B(niǎo)oosting是一種能夠?qū)⑷鯇W(xué)習(xí)器提升為強(qiáng)學(xué)習(xí)器的方法。其核心思想是通過(guò)順序訓(xùn)練多個(gè)基分類(lèi)器,每個(gè)基分類(lèi)器都嘗試修正前一個(gè)分類(lèi)器的錯(cuò)誤,從而逐步提高整體模型的性能。Boosting算法的代表包括AdaBoost、GradientBoosting和XGBoost等。模型集成方法分類(lèi)建模與模型集成Stacking(堆疊)當(dāng)訓(xùn)練數(shù)據(jù)很多時(shí),可以用Stacking(堆疊)集成方法。Stacking的核心思想是將多個(gè)基分類(lèi)器的預(yù)測(cè)結(jié)果作為新的特征,初始樣本的標(biāo)記仍被當(dāng)作樣例標(biāo)記,然后訓(xùn)練一個(gè)元分類(lèi)器(也稱(chēng)為組合分類(lèi)器)來(lái)獲得最終的預(yù)測(cè)結(jié)果。Stacking方法可以充分利用不同基分類(lèi)器的優(yōu)勢(shì),從而獲得更加準(zhǔn)確和穩(wěn)健的分類(lèi)效果。模型集成方法06PARTSIX時(shí)間序列建模與預(yù)測(cè)時(shí)間序列建模與預(yù)測(cè)時(shí)間序列的基本概念時(shí)間序列是指按照時(shí)間順序排列的一系列觀測(cè)值或數(shù)據(jù)點(diǎn),它們通常反映了某一現(xiàn)象或變量隨時(shí)間變化的規(guī)律。時(shí)間序列分解時(shí)間序列數(shù)據(jù)通常包括三個(gè)主要組成成分,即趨勢(shì)、季節(jié)性和隨機(jī)波動(dòng)(1)趨勢(shì)(Trend):趨勢(shì)描述的是時(shí)間序列的長(zhǎng)期走勢(shì),描述的是在一定時(shí)間內(nèi)的單調(diào)性,可能表現(xiàn)為上升、下降或保持穩(wěn)定(2)季節(jié)性(Seasonality):季節(jié)性是指時(shí)間序列在固定時(shí)間內(nèi)發(fā)生的規(guī)律性波動(dòng),通常與特定時(shí)間周期(如一年、一個(gè)季度、一個(gè)月、一周等)相關(guān)(3)隨機(jī)波動(dòng)(RandomNoise):隨機(jī)波動(dòng)是指時(shí)間序列中的不可預(yù)測(cè)的隨機(jī)變化。時(shí)間序列建模與預(yù)測(cè)時(shí)間序列預(yù)測(cè)時(shí)間序列在時(shí)間維度上通常存在著相互依存相互影響的關(guān)系,這也是進(jìn)行時(shí)間序列建模和預(yù)測(cè)的前提假設(shè)。時(shí)間序列預(yù)測(cè)是利用獲得的數(shù)據(jù)按時(shí)間順序排成序列,分析其變化方向和程度,從而對(duì)未來(lái)若干時(shí)期可能達(dá)到的水平進(jìn)行推測(cè)。其基本思想是將時(shí)間序列作為一個(gè)隨機(jī)變量的一個(gè)樣本,用概率統(tǒng)計(jì)的方法盡可能減少偶然因素的影響。時(shí)間序列預(yù)測(cè)誤差的度量指標(biāo)常使用真實(shí)值與預(yù)測(cè)值之間的差距來(lái)衡量模型的誤差。通常使用的指標(biāo)有平均絕對(duì)誤差(MAE)、均方誤差(MSE)、均方根誤差(RMSE)和平均絕對(duì)百分比誤差(MAPE)等。時(shí)間序列建模與預(yù)測(cè)時(shí)間序列的平穩(wěn)性平穩(wěn)與非平穩(wěn)是時(shí)間序列分析中一個(gè)非常重要的概念,它直接影響到對(duì)時(shí)間序列進(jìn)行處理的方法,經(jīng)典時(shí)間序列模型主要針對(duì)平穩(wěn)時(shí)間序列,并建立起的一套識(shí)別、估計(jì)和檢驗(yàn)的方法,非平穩(wěn)時(shí)間序列通常需要采用其他的分析方法和手段。因此在時(shí)間序列分析中區(qū)分時(shí)間序列的平穩(wěn)性和非平穩(wěn)性顯得尤為重要。平穩(wěn)性是指時(shí)間序列的內(nèi)在模式不隨時(shí)間變化而發(fā)生顯著變化,因此,具有明顯趨勢(shì)性和季節(jié)性的時(shí)間序列都不是平穩(wěn)時(shí)間序列。平穩(wěn)時(shí)間序列通常具有較好的預(yù)測(cè)性能,因?yàn)樗鼈兊慕y(tǒng)計(jì)特性在時(shí)間上保持穩(wěn)定,從而有望延續(xù)過(guò)去的行為進(jìn)行準(zhǔn)確的預(yù)測(cè)。根據(jù)限制條件的嚴(yán)格程度,平穩(wěn)時(shí)間序列分為嚴(yán)平穩(wěn)時(shí)間序列和寬平穩(wěn)時(shí)間序列。6時(shí)間序列建模與預(yù)測(cè)嚴(yán)平穩(wěn)嚴(yán)平穩(wěn)(strictlystationary)是一種條件比較苛刻的平穩(wěn)性定義,只有當(dāng)序列所有的統(tǒng)計(jì)性質(zhì)都不會(huì)隨著時(shí)間的推移而發(fā)生變化時(shí),該序列才能被認(rèn)為平穩(wěn)。時(shí)間序列的平穩(wěn)性寬平穩(wěn)寬平穩(wěn)(weakstationary)是使用序列的特征統(tǒng)計(jì)量來(lái)定義的一種平穩(wěn)性。若能保證序列低階(二階)矩平穩(wěn),就能保證序列的主要性質(zhì)近似穩(wěn)定。平穩(wěn)性檢驗(yàn)是時(shí)間序列分析的基本假設(shè),對(duì)于時(shí)間序列的建模和預(yù)測(cè)非常重要。序列的平穩(wěn)性檢驗(yàn)主要分為兩類(lèi)方法:一種是根據(jù)時(shí)序圖的特征做出判斷的圖檢驗(yàn)方法,另一種是基于統(tǒng)計(jì)檢驗(yàn)的方法,如DF檢驗(yàn)、ADF檢驗(yàn)等。當(dāng)時(shí)間序列不平穩(wěn)時(shí)(存在趨勢(shì)及周期性),可以通過(guò)差分(differencing)使序列平穩(wěn),在一定程度上消除時(shí)間及周期趨勢(shì)所造成的不平穩(wěn)。時(shí)間序列建模與預(yù)測(cè)時(shí)間序列的自相關(guān)性時(shí)間序列的自相關(guān)性是指時(shí)間序列數(shù)據(jù)中的觀測(cè)值與其自身過(guò)去或未來(lái)的觀測(cè)值之間的統(tǒng)計(jì)依賴(lài)關(guān)系。自相關(guān)性是衡量時(shí)間序列數(shù)據(jù)點(diǎn)在不同時(shí)間點(diǎn)上的相關(guān)性強(qiáng)度和方向的一種指標(biāo)。通過(guò)了解時(shí)間序列的自相關(guān)性,我們可以揭示數(shù)據(jù)中的內(nèi)在結(jié)構(gòu)和周期性,并據(jù)此建立更準(zhǔn)確的預(yù)測(cè)模型。時(shí)間序列建模與預(yù)測(cè)時(shí)間序列預(yù)測(cè)的應(yīng)用場(chǎng)景在制造業(yè)中,時(shí)間序列分析被廣泛應(yīng)用于多個(gè)方面。例如,通過(guò)分析生產(chǎn)線(xiàn)上的產(chǎn)量時(shí)間序列數(shù)據(jù),可以預(yù)測(cè)未來(lái)的產(chǎn)能需求,從而合理安排生產(chǎn)計(jì)劃和資源配置。此外,時(shí)間序列分析還可以用于預(yù)測(cè)設(shè)備故障的發(fā)生,實(shí)現(xiàn)預(yù)防性維護(hù),提高設(shè)備的可靠性和生產(chǎn)效率。同時(shí),市場(chǎng)需求預(yù)測(cè)也是時(shí)間序列分析在制造業(yè)中的重要應(yīng)用之一,它有助于企業(yè)準(zhǔn)確把握市場(chǎng)動(dòng)態(tài),制定合理的銷(xiāo)售策略。通過(guò)對(duì)這些時(shí)間序列數(shù)據(jù)進(jìn)行分析,可以揭示出生產(chǎn)過(guò)程中的內(nèi)在規(guī)律和趨勢(shì),為生產(chǎn)決策和優(yōu)化提供有力支持。6時(shí)間序列建模與預(yù)測(cè)樸素預(yù)測(cè)法(NaiveForecast)樸素預(yù)測(cè)法基于時(shí)間序列在短期內(nèi)具有穩(wěn)定性的假設(shè),其核心思想在于假定時(shí)間序列的當(dāng)前值對(duì)未來(lái)值具有直接的影響,因此將當(dāng)前觀測(cè)值直接作為未來(lái)時(shí)刻的預(yù)測(cè)值。這種方法不需要復(fù)雜的計(jì)算或模型擬合,因此非常容易實(shí)現(xiàn)。經(jīng)典時(shí)間序列模型移動(dòng)平均模型(MA)移動(dòng)平均模型通過(guò)計(jì)算一段時(shí)間內(nèi)的平均值來(lái)預(yù)測(cè)下一個(gè)時(shí)間點(diǎn)的值。移動(dòng)平均可以平滑時(shí)間序列中的隨機(jī)波動(dòng),并揭示出長(zhǎng)期的趨勢(shì)或周期性變化。移動(dòng)平均模型可以分為簡(jiǎn)單移動(dòng)平均(SMA)和加權(quán)移動(dòng)平均(WMA)兩種。6時(shí)間序列建模與預(yù)測(cè)經(jīng)典時(shí)間序列模型自回歸模型(AR)自回歸模型假設(shè)時(shí)間序列的當(dāng)前時(shí)刻的觀測(cè)值是其自身過(guò)去值的線(xiàn)性組合。通過(guò)擬合自回歸系數(shù),模型能夠捕捉序列中的自相關(guān)性,從而進(jìn)行未來(lái)值的預(yù)測(cè)。自回歸模型適用于具有明顯自相關(guān)性的時(shí)間序列數(shù)據(jù),可以捕捉時(shí)間序列的動(dòng)態(tài)變化,但在處理非平穩(wěn)數(shù)據(jù)或存在復(fù)雜依賴(lài)關(guān)系的數(shù)據(jù)時(shí)可能受到限制。自回歸移動(dòng)平均模型(ARMA)自回歸移動(dòng)平均模型(ARMA)結(jié)合了自回歸(AR)和移動(dòng)平均(MA)的特性,通過(guò)同時(shí)考慮時(shí)間序列的自相關(guān)性和誤差項(xiàng)的移動(dòng)平均來(lái)增強(qiáng)預(yù)測(cè)能力。ARMA模型能夠同時(shí)捕捉序列中的短期和長(zhǎng)期依賴(lài)關(guān)系,但要求數(shù)據(jù)必須是平穩(wěn)的。對(duì)于非平穩(wěn)數(shù)據(jù),通常需要先進(jìn)行差分處理以使其滿(mǎn)足平穩(wěn)性要求。時(shí)間序列建模與預(yù)測(cè)長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)LSTM是RNN的變體,擅長(zhǎng)處理具有長(zhǎng)期依賴(lài)的時(shí)間序列數(shù)據(jù),捕捉復(fù)雜模式和趨勢(shì)以實(shí)現(xiàn)精準(zhǔn)預(yù)測(cè)。其核心是引入門(mén)控機(jī)制,通過(guò)輸入門(mén)、遺忘門(mén)和輸出門(mén)控制信息流動(dòng),解決RNN的長(zhǎng)序列梯度問(wèn)題。使用LSTM進(jìn)行時(shí)間序列預(yù)測(cè)需預(yù)處理數(shù)據(jù)、構(gòu)建模型、訓(xùn)練和評(píng)估,并根據(jù)任務(wù)調(diào)整參數(shù)。也可結(jié)合其他技術(shù)提高預(yù)測(cè)準(zhǔn)確性和穩(wěn)定性。先進(jìn)時(shí)間序列建模技術(shù)時(shí)間序列建模與預(yù)測(cè)門(mén)控循環(huán)單元(GRU)GRU是處理時(shí)間序列數(shù)據(jù)的循環(huán)神經(jīng)網(wǎng)絡(luò)變體。它旨在解決長(zhǎng)期依賴(lài)問(wèn)題,結(jié)構(gòu)相對(duì)簡(jiǎn)單,包含更新門(mén)和重置門(mén)兩個(gè)主要部分。重置門(mén):決定是否忽略歷史輸入并重置隱藏狀態(tài)。接近0時(shí),歷史輸入影響最小化;接近1時(shí),產(chǎn)生較大影響。02更新門(mén):決定當(dāng)前隱藏狀態(tài)的信息保留量和新信息的加入量。接近0時(shí),隱藏狀態(tài)不更新;接近1時(shí),完全更新。01GRU計(jì)算效率高,適合處理大規(guī)模序列數(shù)據(jù)。但在復(fù)雜預(yù)測(cè)任務(wù)中,LSTM可能表現(xiàn)更佳。03先進(jìn)時(shí)間序列建模技術(shù)時(shí)間序列建模與預(yù)測(cè)時(shí)序卷積網(wǎng)絡(luò)(TCN)時(shí)序卷積網(wǎng)絡(luò)(TCN)是卷積神經(jīng)網(wǎng)絡(luò)在時(shí)間序列預(yù)測(cè)中的變體。與RNN和LSTM相比,TCN在時(shí)間序列預(yù)測(cè)、語(yǔ)音識(shí)別、自然語(yǔ)言處理中表現(xiàn)優(yōu)異。TCN主要由一維卷積層和因果卷積層組成,分別用于提取局部特征和避免未來(lái)信息泄露。TCN具有固定感受野,能捕獲長(zhǎng)期依賴(lài)關(guān)系,并利用硬件并行加速處理長(zhǎng)序列數(shù)據(jù)。但處理變長(zhǎng)序列時(shí)可能需要更復(fù)雜的結(jié)構(gòu)或策略。先進(jìn)時(shí)間序列建模技術(shù)07PARTSEVEN深度學(xué)習(xí)深度學(xué)習(xí)深度學(xué)習(xí)概述深度學(xué)習(xí)正與智能制造深度融合,成效顯著。其核心在于通過(guò)多層次非線(xiàn)性變換發(fā)現(xiàn)數(shù)據(jù)規(guī)律。在智能制造中,深度學(xué)習(xí)可應(yīng)用于數(shù)據(jù)分析與決策,如視覺(jué)技術(shù)輔助的自動(dòng)化質(zhì)檢、分揀,提升效率和質(zhì)量。深度學(xué)習(xí)特點(diǎn)為端到端訓(xùn)練,優(yōu)化系統(tǒng)性能。正經(jīng)歷由參數(shù)模型向無(wú)參數(shù)模型轉(zhuǎn)變,犧牲可解釋性。深度學(xué)習(xí)是智能制造感知分析與決策的關(guān)鍵技術(shù),通過(guò)處理復(fù)雜數(shù)據(jù),支持制造系統(tǒng)優(yōu)化。隨著技術(shù)發(fā)展,深度學(xué)習(xí)將推動(dòng)智能制造更智能化、高效化。深度學(xué)習(xí)人工神經(jīng)網(wǎng)絡(luò)深度學(xué)習(xí)基于人工神經(jīng)網(wǎng)絡(luò)(ANN),具有大規(guī)模、復(fù)雜學(xué)習(xí)及信息處理功能。ANN結(jié)構(gòu)受人類(lèi)神經(jīng)系統(tǒng)啟發(fā),由多神經(jīng)元層次結(jié)構(gòu)組成。神經(jīng)元接收輸入,經(jīng)函數(shù)變換后產(chǎn)生輸出。神經(jīng)元間連接代表權(quán)重,偏置項(xiàng)θ控制輸出閾值。激活函數(shù)對(duì)線(xiàn)性變換結(jié)果進(jìn)行非線(xiàn)性映射,得到神經(jīng)元輸出值。單個(gè)人工神經(jīng)元節(jié)點(diǎn)圖示深度學(xué)習(xí)人工神經(jīng)網(wǎng)絡(luò)把多個(gè)神經(jīng)元按一定的層次結(jié)構(gòu)連接起來(lái),就得到神經(jīng)網(wǎng)絡(luò)。神經(jīng)網(wǎng)絡(luò)通常包括輸入層、隱藏層和輸出層,其中隱藏層可以為多層。輸入層神經(jīng)元只接收輸入,不進(jìn)行函數(shù)處理,而隱藏層與輸出層則包含功能神經(jīng)元。神經(jīng)網(wǎng)絡(luò)訓(xùn)練過(guò)程中就是通過(guò)調(diào)整連接權(quán)重來(lái)實(shí)現(xiàn)學(xué)習(xí)和模式識(shí)別。深度學(xué)習(xí)BP神經(jīng)網(wǎng)絡(luò)BP神經(jīng)網(wǎng)絡(luò)通過(guò)誤差逆?zhèn)鞑ニ惴ㄓ?xùn)練多層前饋網(wǎng)絡(luò)。通過(guò)調(diào)整神經(jīng)元間的連接權(quán)值,網(wǎng)絡(luò)能將輸入信息轉(zhuǎn)化為期望輸出。反向傳播基于實(shí)際輸出與期望輸出的差值,逐層反傳以決定權(quán)值調(diào)整。以一個(gè)簡(jiǎn)單的3層BP網(wǎng)絡(luò)模型為例,其具有M個(gè)輸入節(jié)點(diǎn)、q個(gè)隱藏層節(jié)點(diǎn)和L個(gè)輸出節(jié)點(diǎn)。輸入層與隱藏層的連接權(quán)值為wij,表示輸入層第j個(gè)節(jié)點(diǎn)到隱藏層第i個(gè)節(jié)點(diǎn)之間的權(quán)值,i=1,…,q,j=1,…,M。隱藏層到輸出層的連接權(quán)值為wki,表示兩個(gè)節(jié)點(diǎn)之間的權(quán)值,k=1,…,L。隱藏層每個(gè)單元的輸出閾值為θi,表示隱藏層第i個(gè)節(jié)點(diǎn)的閾值。輸出層輸出閾值為ak,表示輸出層第k個(gè)節(jié)點(diǎn)的閾值;隱藏層和輸出層的激活函數(shù)分別為Ф(x)和Ψ(x)。網(wǎng)絡(luò)結(jié)構(gòu)示意深度學(xué)習(xí)激活函數(shù)(activationfunction)激活函數(shù)是人工神經(jīng)網(wǎng)絡(luò)中的一種非線(xiàn)性函數(shù),用于在神經(jīng)元中引入非線(xiàn)性特性以增強(qiáng)網(wǎng)絡(luò)的表達(dá)能力。不同的激活函數(shù),會(huì)使神經(jīng)元具有不同的信息處理特性,常用的激活函數(shù)包括Sigmoid函數(shù)、Tanh函數(shù)、ReLU函數(shù)、Softmax函數(shù)等,它們?cè)诓煌瑘?chǎng)景下具有不同的優(yōu)勢(shì)和適用性。8本章小結(jié)智能制造系統(tǒng)與工業(yè)大數(shù)據(jù),本章從智能制造和工業(yè)大數(shù)據(jù)的關(guān)聯(lián)出發(fā),概述了智能制造系統(tǒng)的概念和特征,并強(qiáng)調(diào)了工業(yè)大數(shù)據(jù)在其中的作用。數(shù)據(jù)驅(qū)動(dòng)建模技術(shù),介紹了數(shù)據(jù)驅(qū)動(dòng)建模的流程和方法,包括監(jiān)督、無(wú)監(jiān)督、半監(jiān)督和強(qiáng)化學(xué)習(xí)等,旨在幫助讀者理解不同建模方法的適用性。數(shù)據(jù)預(yù)處理技術(shù),詳細(xì)講解了數(shù)據(jù)清洗、集成、轉(zhuǎn)換和規(guī)約等預(yù)處理步驟,以及相應(yīng)的技術(shù)工具,以提高數(shù)據(jù)質(zhì)量和建模效果?;貧w與關(guān)聯(lián)分析,通過(guò)介紹回歸模型和關(guān)聯(lián)規(guī)則的基本概念,以及Apriori和FP-growth等算法,讓讀者掌握數(shù)據(jù)挖掘和模式識(shí)別的技術(shù)。分類(lèi)建模與模型集成,介紹了分類(lèi)問(wèn)題的概述、評(píng)價(jià)指標(biāo)和常用算法,如邏輯回歸、支持向量機(jī)、決策樹(shù)等,以及模型集成方法,以提高分類(lèi)模型的準(zhǔn)確性和穩(wěn)定性。時(shí)間序列建模與深度學(xué)習(xí),講解了時(shí)間序列的基本概念、ARIMA和LSTM等模型,以及深度學(xué)習(xí)在制造系統(tǒng)大數(shù)據(jù)分析中的應(yīng)用前景和常用模型。項(xiàng)目單元本章的項(xiàng)目單元實(shí)踐主題為【訂單需求預(yù)測(cè)】,精準(zhǔn)的訂單需求預(yù)測(cè)有助于實(shí)現(xiàn)精益化的庫(kù)存管理,有效降低企業(yè)的庫(kù)存水平及資金占用程度,并進(jìn)而輔助提升制造系統(tǒng)的生產(chǎn)調(diào)度能力,該項(xiàng)目單元實(shí)踐內(nèi)容主題為時(shí)間序列預(yù)測(cè)問(wèn)題。時(shí)序數(shù)據(jù)是被測(cè)量對(duì)象上按特定時(shí)間(一般固定周期)持續(xù)測(cè)量得到的數(shù)值序列。而時(shí)序預(yù)測(cè)是根據(jù)一定長(zhǎng)度歷史時(shí)序,預(yù)測(cè)將來(lái)一步到多步的時(shí)間點(diǎn)的時(shí)序數(shù)值。考慮到產(chǎn)品銷(xiāo)售量一般存在一定周期性與總體趨勢(shì)規(guī)律,可以通過(guò)挖掘訂單數(shù)據(jù)中蘊(yùn)含的信息來(lái)進(jìn)行未來(lái)的產(chǎn)品銷(xiāo)量預(yù)測(cè)。具體實(shí)踐指導(dǎo)請(qǐng)掃描二維碼查看。本章習(xí)題3-1對(duì)比其他領(lǐng)域的大數(shù)據(jù),智能制造領(lǐng)域的大數(shù)據(jù)有哪些獨(dú)特的特征?
3-2請(qǐng)結(jié)合具體實(shí)例進(jìn)行說(shuō)明工業(yè)大數(shù)據(jù)如何促進(jìn)智能制造的發(fā)展以及工業(yè)大數(shù)據(jù)在智能制造中面臨哪些挑戰(zhàn)及解決策略。
3-3無(wú)監(jiān)督學(xué)習(xí)、半監(jiān)督學(xué)習(xí)和監(jiān)督學(xué)習(xí)有何本質(zhì)的差異?并討論其適用場(chǎng)景和典型算法。
3-4在監(jiān)督學(xué)習(xí)建模方法中,為什么需要?jiǎng)澐钟?xùn)練集和測(cè)試集?這兩個(gè)數(shù)據(jù)集各自的作用是什么?
3-5在特征選擇階段,過(guò)濾式和包裹式方法各有什么優(yōu)缺點(diǎn)?在實(shí)際應(yīng)用中,如何選擇合適的特征選擇方法?
3-6在關(guān)聯(lián)分析中,支持度和置信度是兩個(gè)重要的指標(biāo)。請(qǐng)解釋支持度和置信度的含義,并說(shuō)明它們?cè)陉P(guān)聯(lián)規(guī)則挖掘中的作用。
3-7在數(shù)據(jù)預(yù)處理中,為什么需要對(duì)數(shù)據(jù)進(jìn)行歸一化或標(biāo)準(zhǔn)化?這兩種方法有何區(qū)別?本章習(xí)題3-8在分類(lèi)問(wèn)題中,決策樹(shù)算法是如何選擇最優(yōu)特征進(jìn)行節(jié)點(diǎn)分裂的?信息增益和基尼指數(shù)有什么不同?3-9為什么模型集成方法通常比單個(gè)模型表現(xiàn)更好?3-10在時(shí)間序列預(yù)測(cè)中,為什么平穩(wěn)性是一個(gè)重要的特性?如果時(shí)間序列數(shù)據(jù)不平穩(wěn),可能會(huì)導(dǎo)致什么樣的問(wèn)題?3-11在時(shí)間序列建模中,為什么需要對(duì)數(shù)據(jù)進(jìn)行分解?分解后的趨勢(shì)、季節(jié)性和殘差分量各自表示了什么信息?3-12人工神經(jīng)網(wǎng)絡(luò)中,設(shè)置偏置θ的作用是什么?3-13在深度學(xué)習(xí)模型中,反向傳播算法是如何更新模型參數(shù)的?為什么需要梯度下降來(lái)優(yōu)化模型?3-14在選擇激活函數(shù)時(shí),應(yīng)該考慮哪些因素?不同的激活函數(shù)對(duì)神經(jīng)網(wǎng)絡(luò)有何影響?謝謝第4章制造系統(tǒng)分析優(yōu)化決策技術(shù)CONTENTS啟發(fā)式優(yōu)化算法強(qiáng)化學(xué)習(xí)算法目錄決策技術(shù)概述建模與優(yōu)化01PARTONE決策技術(shù)概述決策技術(shù)概述從心理學(xué)看,決策是決策者根據(jù)個(gè)人經(jīng)驗(yàn)和參考因素,在可選方案中推理出最終決定的認(rèn)知過(guò)程。決策者需權(quán)衡風(fēng)險(xiǎn)和收益以最大化收益。隨著制造智能化,決策技術(shù)融合了運(yùn)籌學(xué)、人工智能、機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘等技術(shù),形成了適應(yīng)智能制造的智能決策技術(shù),適用于復(fù)雜和不確定環(huán)境。在制造系統(tǒng)中,決策技術(shù)是企業(yè)通過(guò)科學(xué)手段選擇最佳方案的過(guò)程。決策過(guò)程涵蓋采購(gòu)、生產(chǎn)、營(yíng)銷(xiāo)和預(yù)算四大領(lǐng)域,本文重點(diǎn)分析生產(chǎn)決策。決策技術(shù)概述決策技術(shù)的類(lèi)型決策分類(lèi)為結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化決策。(1)結(jié)構(gòu)化決策:涉及清晰定義的環(huán)境和規(guī)則,可通過(guò)模型和計(jì)算機(jī)語(yǔ)言處理。(2)半結(jié)構(gòu)化決策:面對(duì)不確定數(shù)據(jù),存在規(guī)則但方案非最優(yōu),如預(yù)算制定和市場(chǎng)策略。(3)非結(jié)構(gòu)化決策:過(guò)程復(fù)雜,缺乏固定規(guī)則,依賴(lài)決策者主觀因素。決策技術(shù)分類(lèi)科學(xué)決策遵循科學(xué)理論、思維方式和程序,技術(shù)包括多目標(biāo)決策、模糊決策、智能決策等,智能決策支持系統(tǒng)為其應(yīng)用手段。決策技術(shù)概述決策技術(shù)的類(lèi)型(1)多目標(biāo)決策:多目標(biāo)決策是選擇和優(yōu)化多個(gè)相互矛盾的目標(biāo)的方法。在社會(huì)經(jīng)濟(jì)系統(tǒng)中,常面臨多目標(biāo)決策問(wèn)題,如生產(chǎn)過(guò)程的組織決策需考慮產(chǎn)量、質(zhì)量和成本。這些目標(biāo)間的矛盾使決策復(fù)雜。(2)模糊決策:模糊決策是在模糊環(huán)境下進(jìn)行決策的數(shù)學(xué)方法。實(shí)際決策多為模糊決策,涉及面廣。常用技術(shù)包括模糊排序、模糊尋優(yōu)和模糊對(duì)策。(3)智能決策:智能決策是人工智能與制造業(yè)的結(jié)合,通過(guò)深度數(shù)據(jù)分析輔助決策。例如,在計(jì)算機(jī)顯示屏檢測(cè)方面,利用機(jī)器視覺(jué)和算法替代人工判斷。在排產(chǎn)方面,利用系統(tǒng)實(shí)現(xiàn)訂單與物料的匹配計(jì)算,得出最優(yōu)交付計(jì)劃。深度學(xué)習(xí)和知識(shí)圖譜是智能決策的主要技術(shù)方向。決策技術(shù)概述決策技術(shù)的理論常用的智能決策技術(shù)包括層次分析法、灰色理論、遺傳算法、博弈決策和深度學(xué)習(xí)等方法,以下分別對(duì)各個(gè)方法的原理進(jìn)行簡(jiǎn)要介紹。(1)層次分析法(AHP):由T.L.Saaty等人在20世紀(jì)70年代提出,通過(guò)模擬人類(lèi)對(duì)問(wèn)題的理解,將復(fù)雜的多目標(biāo)決策問(wèn)題分解為多個(gè)層次或目標(biāo),并使用模糊量化方法計(jì)算層次重要性及總體排序,以?xún)?yōu)選出最佳方案。層次分析法的結(jié)構(gòu)決策技術(shù)概述決策技術(shù)的理論(2)灰色系統(tǒng)理論:灰色系統(tǒng)理論處理信息不明確、存在不確定性的決策問(wèn)題。由鄧聚龍教授于1982年提出,定義信息缺失、結(jié)構(gòu)或行為模式不明確的系統(tǒng)為灰色系統(tǒng)?;疑P(guān)聯(lián)分析為其常用方法。在決策中,確定特征參考序列和比較序列,無(wú)量綱化處理,計(jì)算灰色關(guān)聯(lián)系數(shù)和關(guān)聯(lián)度,排序確定影響最大的變量,選擇最優(yōu)值?;疑碚摳攀鰣D決策技術(shù)概述決策技術(shù)的理論(3)智能優(yōu)化算法:傳統(tǒng)運(yùn)籌學(xué)和啟發(fā)式方法在處理復(fù)雜生產(chǎn)調(diào)度問(wèn)題時(shí)受限。自上世紀(jì)80年代,人工智能理念引入生產(chǎn)調(diào)度,推動(dòng)高效智能優(yōu)化算法的發(fā)展。(4)博弈決策:博弈論,亦稱(chēng)為博弈決策,探討理性決策者在沖突與合作情境中的行為。博弈決策研究在相互具有競(jìng)爭(zhēng)和對(duì)抗的體系中,使己方得到最有利結(jié)果,并探索其最優(yōu)策略。(5)深度學(xué)習(xí):深度學(xué)習(xí)是由Hinton及其團(tuán)隊(duì)在2006年提出的多層神經(jīng)網(wǎng)絡(luò)技術(shù)。它通過(guò)組合基礎(chǔ)特征來(lái)形成更高層次的抽象特征表示,從而揭示數(shù)據(jù)中的分布式特征。深度學(xué)習(xí)的常見(jiàn)形式包括卷積神經(jīng)網(wǎng)絡(luò)(CNN)、深度信念網(wǎng)絡(luò)(DBN)和堆疊自編碼器等。決策技術(shù)概述決策技術(shù)的分析過(guò)程和方法在實(shí)際的生產(chǎn)、工程和科研活動(dòng)中,經(jīng)常遇到需要對(duì)多個(gè)目標(biāo)進(jìn)行綜合評(píng)估并做出決策的情形。如在生產(chǎn)調(diào)度中,需同時(shí)考慮減少在制品數(shù)量、提高設(shè)備使用效率及達(dá)到一定的生產(chǎn)率等目標(biāo)。這些目標(biāo)間可能存在矛盾,因此必須綜合考慮所有指標(biāo),以實(shí)現(xiàn)最合理的決策。決策系統(tǒng)由決策者和決策對(duì)象組成,它們構(gòu)成了一個(gè)包含矛盾和對(duì)立的統(tǒng)一體。在這個(gè)系統(tǒng)中,信息的交換是決策不可或缺的基礎(chǔ),同時(shí)決策技術(shù)、方法和最終的決策結(jié)果(如行動(dòng)方針、原則和方案)也是核心組成部分。一個(gè)決策問(wèn)題可以通過(guò)以下五元組數(shù)學(xué)模型來(lái)描述決策技術(shù)概述決策技術(shù)的分析過(guò)程和方法(1)決策目標(biāo)Z:代表決策者追求的具體目標(biāo),可以是單個(gè)目標(biāo)或者多個(gè)目標(biāo)。用決策準(zhǔn)則或最優(yōu)值Z表示。(2)環(huán)境狀態(tài)??={??}:采取某種決策方案時(shí),決策環(huán)境客觀存在的各種狀態(tài)。環(huán)境狀態(tài)可以是確定的、不確定的或隨機(jī)的,也可以是離散的或隨機(jī)的。如果系統(tǒng)所處各種可能的狀態(tài)是可知的,用所有狀態(tài)構(gòu)成的集合??={??}表示;如果只能獲得系統(tǒng)各種狀態(tài)出現(xiàn)的可能性大小,用狀態(tài)轉(zhuǎn)變概率??(??)來(lái)表示。(3)決策準(zhǔn)則:決策準(zhǔn)則為實(shí)現(xiàn)決策目標(biāo)而選擇行動(dòng)方案所依據(jù)的價(jià)值標(biāo)準(zhǔn)和行為標(biāo)準(zhǔn)。一般來(lái)說(shuō),決策準(zhǔn)則依賴(lài)于決策者的價(jià)值傾向和決策風(fēng)格。(4)行動(dòng)方案??{??}:行動(dòng)方案是實(shí)現(xiàn)決策目標(biāo)所采取的具體措施和手段,要有多個(gè)備選方案。所有方案構(gòu)成的集合稱(chēng)為方案集,用??={??}表示,??表示方案,是決策變量。決策技術(shù)概述決策技術(shù)的分析過(guò)程和方法(4)行動(dòng)方案??{??}:行動(dòng)方案是實(shí)現(xiàn)決策目標(biāo)所采取的具體措施和手段,要有多個(gè)備選方案。所有方案構(gòu)成的集合稱(chēng)為方案集,用??={??}表示,??表示方案,是決策變量。(5)決策結(jié)果??(??,??):決策結(jié)果是采取某種行動(dòng)方案在不同環(huán)境狀態(tài)下所出現(xiàn)的結(jié)果。能估算出系統(tǒng)在不同狀態(tài)下的結(jié)果或效益,用受益值、損失值或效用值??(??,??)表示,它是狀態(tài)變量??和決策變量a的函數(shù)。決策問(wèn)題通常比較復(fù)雜,須采用抽象辦法,找出參與決策過(guò)程各變量之間的約束關(guān)系建立數(shù)學(xué)模型。決策技術(shù)概述制造系統(tǒng)中的決策問(wèn)題新一代人工智能引領(lǐng)智能制造,結(jié)合互聯(lián)網(wǎng)、大數(shù)據(jù)和云計(jì)算,實(shí)現(xiàn)高效協(xié)作制造,快速響應(yīng)客戶(hù)需求,為智能制造各環(huán)節(jié)注入活力。本章聚焦智能制造決策問(wèn)題,涉及在少量或無(wú)人干預(yù)下,將生產(chǎn)系統(tǒng)的感知、決策、協(xié)同和執(zhí)行能力結(jié)合,通過(guò)自我決策和控制功能完成制造目標(biāo)。制造系統(tǒng)決策問(wèn)題分類(lèi)決策技術(shù)概述制造系統(tǒng)中的決策問(wèn)題根據(jù)制造過(guò)程分類(lèi),制造系統(tǒng)中的決策問(wèn)題可分為設(shè)備級(jí)決策、產(chǎn)線(xiàn)級(jí)決策和系統(tǒng)級(jí)決策三個(gè)層面。(1)設(shè)備級(jí)決策:通過(guò)物理硬件和嵌入式系統(tǒng),實(shí)現(xiàn)設(shè)備內(nèi)“感知-分析-決策-執(zhí)行”閉環(huán),優(yōu)化資源配置。(2)產(chǎn)線(xiàn)級(jí)決策:多個(gè)設(shè)備級(jí)單元通過(guò)工業(yè)網(wǎng)絡(luò)實(shí)現(xiàn)互聯(lián)、互通、互操作,提升制造資源優(yōu)化配置的廣度和精度?;诂F(xiàn)場(chǎng)感知、信息交互和實(shí)時(shí)分析,實(shí)現(xiàn)局部制造資源的自組織、自配置、自決策和自?xún)?yōu)化。(3)系統(tǒng)級(jí)決策:在產(chǎn)線(xiàn)基礎(chǔ)上,通過(guò)智能服務(wù)平臺(tái),實(shí)現(xiàn)不同制造單元間的協(xié)同優(yōu)化,整合產(chǎn)品生命周期全流程和企業(yè)全系統(tǒng)。決策技術(shù)概述制造系統(tǒng)中的決策問(wèn)題2)生產(chǎn)管理決策:通過(guò)集成工業(yè)軟件、構(gòu)建云平臺(tái)管理生產(chǎn)數(shù)據(jù),實(shí)現(xiàn)無(wú)縫信息通信。實(shí)時(shí)處理分析數(shù)據(jù),實(shí)現(xiàn)智能決策,使生產(chǎn)資源有序可控。A3)智能調(diào)度決策:生產(chǎn)調(diào)度是生產(chǎn)管理的核心,涉及訂單管理、瓶頸資源識(shí)別、優(yōu)先級(jí)排序等。智能調(diào)度利用先進(jìn)模型和算法提取數(shù)據(jù),實(shí)現(xiàn)實(shí)時(shí)、可靠的調(diào)度與執(zhí)行。B4)人機(jī)協(xié)作決策:工業(yè)4.0時(shí)代,人類(lèi)與機(jī)器協(xié)同工作。智能機(jī)器通過(guò)認(rèn)知技術(shù)輔助人類(lèi)工作。未來(lái),“人在回路”模式需設(shè)計(jì)高級(jí)機(jī)器學(xué)習(xí)模型,確保人機(jī)有效交互和信任關(guān)系。C1)設(shè)備管理決策:智能制造系統(tǒng)通過(guò)不同方式連接傳感器、智能硬件等,形成智能網(wǎng)絡(luò),構(gòu)建設(shè)備決策平臺(tái)。實(shí)現(xiàn)實(shí)時(shí)優(yōu)化控制和配置決策,最優(yōu)整合利用各類(lèi)信息資源。D根據(jù)具體問(wèn)題分類(lèi),智能制造中的決策問(wèn)題可以大致分為以下幾類(lèi)02PARTTWO建模與優(yōu)化建模與優(yōu)化在建立制造系統(tǒng)前,必須對(duì)系統(tǒng)的各個(gè)方面進(jìn)行建模分析以減少?zèng)Q策風(fēng)險(xiǎn)。通過(guò)計(jì)算機(jī)建模和仿真分析,可以在規(guī)劃、設(shè)計(jì)階段就對(duì)制造系統(tǒng)的靜動(dòng)態(tài)性能進(jìn)行充分的預(yù)測(cè),以盡早發(fā)現(xiàn)系統(tǒng)布局、配置及調(diào)度控制策略方面的問(wèn)題,從而更快、更好地進(jìn)行系統(tǒng)設(shè)計(jì)決策。由于制造系統(tǒng)的復(fù)雜性,僅采用某一類(lèi)模型往往不足以全面描述系統(tǒng)的特征和運(yùn)行狀況,在建模中必須對(duì)系統(tǒng)中某些元素進(jìn)行一些假定,在給定的某種狀態(tài)下分析其規(guī)律與行為特征??傮w上說(shuō),制造系統(tǒng)建模包含以下幾個(gè)步驟:首先是對(duì)產(chǎn)品或零部件的制造需求進(jìn)行全局性的考慮;然后再考慮一些基本的設(shè)計(jì),如制造設(shè)備的種類(lèi)、功能、制造能力、物料傳輸系統(tǒng)的類(lèi)型和存儲(chǔ)系統(tǒng)的類(lèi)型等,同時(shí)還要考慮計(jì)算機(jī)和數(shù)據(jù)處理系統(tǒng)的層次性和相互關(guān)系;最后考慮細(xì)節(jié)方面的設(shè)計(jì),如機(jī)器加工的精度、工具轉(zhuǎn)換系統(tǒng)、物料的填充、運(yùn)輸裝置和托盤(pán)的數(shù)量、存儲(chǔ)容量以及整體的生產(chǎn)轉(zhuǎn)換策略等。建模與優(yōu)化在目前已有的制造系統(tǒng)研究中,運(yùn)用較多的建模方法有離散事件動(dòng)態(tài)系統(tǒng)(discreteeventdynamicsystem,DEDS)建模方法數(shù)學(xué)規(guī)劃(mathematicalprogramming,MP)方法多智能體系統(tǒng)(multi-agentsystem,MAS)建模方法等建模與優(yōu)化基于離散事件動(dòng)態(tài)系統(tǒng)的建模方法離散事件動(dòng)態(tài)系統(tǒng)(DEDS)指狀態(tài)變化僅發(fā)生在離散事件點(diǎn)的系統(tǒng)。DEDS狀態(tài)演化由事件驅(qū)動(dòng),變化方式跳躍,事件與狀態(tài)空間具非線(xiàn)性特征。自80年代起,DEDS建模方法發(fā)展迅速。兩種典型建模方法:馬爾可夫鏈和排隊(duì)論。建模與優(yōu)化馬爾可夫過(guò)程在制造系統(tǒng)中,許多變量如零件到達(dá)間隔、故障發(fā)生間隔和排除時(shí)間具有隨機(jī)性和無(wú)記憶性。無(wú)記憶性意味著隨機(jī)過(guò)程在t時(shí)刻的狀態(tài)與其歷史無(wú)關(guān),僅由當(dāng)前狀態(tài)決定,即馬爾可夫特性。這種性質(zhì)常見(jiàn)于幾何和指數(shù)隨機(jī)變量,可用馬爾可夫過(guò)程模型描述其變化規(guī)律。(1)無(wú)記憶性質(zhì)的隨機(jī)變量:滿(mǎn)足無(wú)記憶性質(zhì)的隨機(jī)變量有兩類(lèi),一類(lèi)是服從幾何分布的幾何隨機(jī)變量;另一類(lèi)是服從(負(fù))指數(shù)分布的指數(shù)隨機(jī)變量。幾何隨機(jī)變量X是一個(gè)離散變量,它描述獨(dú)立重復(fù)伯努利(Bernoulli)試驗(yàn)中獲得第一次成功所需要的試驗(yàn)數(shù)目,取值范圍是集合1,2,3,...。隨機(jī)變量??的概率函數(shù)為:式中,??為每次試驗(yàn)取得成功的概率;k為首次成功時(shí)試驗(yàn)的次數(shù)?;陔x散事件動(dòng)態(tài)系統(tǒng)的建模方法建模與優(yōu)化馬爾可夫過(guò)程幾何隨機(jī)變量??的均值為??(??)=1/??,這意味著平均而言,需要1/??次獨(dú)立的伯努利試驗(yàn)才能取得第一次成功??紤]如下公式:式中,??(??=??+??|??>??)表示在隨機(jī)變量X大于m的條件下,X等于??+??的概率。等式反映了幾何隨機(jī)變量??的無(wú)記憶性質(zhì),即X的取值與過(guò)去的試驗(yàn)次數(shù)無(wú)關(guān)。指數(shù)隨機(jī)變量X是一個(gè)連續(xù)變量。一般地,一個(gè)帶有參數(shù)λ(λ>0)的指數(shù)隨機(jī)變量??的概率密度函數(shù)為:對(duì)于服從指數(shù)分布的隨機(jī)變量??,有基于離散事件動(dòng)態(tài)系統(tǒng)的建模方法建模與優(yōu)化馬爾可夫過(guò)程(2)隨機(jī)過(guò)程:一個(gè)隨機(jī)過(guò)程是隨機(jī)變量??(??):??∈??的集合。集合T稱(chēng)為過(guò)程的參數(shù)集,??∈??一般作為時(shí)間參數(shù)。??(??)是對(duì)于每一個(gè)??∈??的隨機(jī)變量,它的取值叫做隨機(jī)過(guò)程在參數(shù)??的狀態(tài)。??(??)的所有取值集合稱(chēng)為狀態(tài)空間,記為S。按照參數(shù)集和狀態(tài)空間的可數(shù)或連續(xù)性質(zhì),可以把隨機(jī)過(guò)程分為四種類(lèi)型:離散時(shí)間、離散狀態(tài)空間;離散時(shí)間、連續(xù)狀態(tài)空間;連續(xù)時(shí)間、離散狀態(tài)空間;連續(xù)時(shí)間、連續(xù)狀態(tài)空間。(3)馬爾可夫鏈的基本概念:馬爾可夫鏈可以按其是否具有連續(xù)性分為兩種:一種是離散時(shí)間馬爾可夫鏈(discretetimeMarkovchain,DTMC),它屬于一種離散時(shí)間、離散狀態(tài)空間的隨機(jī)過(guò)程,其狀態(tài)空間可數(shù):另一種是連續(xù)時(shí)間的馬爾可夫鏈(continuoustimeMarkovchain,CTMC,它屬于一種連續(xù)時(shí)間、離散狀態(tài)空間的隨機(jī)過(guò)程,其狀態(tài)空間仍然可數(shù)?;陔x散事件動(dòng)態(tài)系統(tǒng)的建模方法建模與優(yōu)化狀態(tài)駐留時(shí)間是是指在馬爾科夫鏈中,從對(duì)于DTMC的一個(gè)狀態(tài)??(??),它的狀態(tài)逗留時(shí)間??(??)表示DTMC在轉(zhuǎn)移至另一狀態(tài)之前處在狀態(tài)??(??)的時(shí)間步。狀態(tài)駐留時(shí)間是檢驗(yàn)隨機(jī)過(guò)程是否屬于馬爾可夫過(guò)程的重要標(biāo)志。為此,可以采用以下幾種方法:1)檢查一個(gè)隨機(jī)過(guò)程是否滿(mǎn)足馬爾可夫特性。2)狀態(tài)駐留的時(shí)間分布是否是無(wú)記憶的。3)過(guò)程從一個(gè)狀態(tài)到另一個(gè)狀態(tài)的概率是否僅依賴(lài)于原狀態(tài)和目的狀態(tài)。由馬爾可夫特性可知,對(duì)于離散時(shí)間馬爾可夫鏈(DTMC),駐留時(shí)間必定是滿(mǎn)足幾何分布的隨機(jī)變量。同DTMC一樣,連續(xù)時(shí)間馬爾可夫鏈滿(mǎn)足下面的馬爾可夫性質(zhì):馬爾可夫過(guò)程基于離散事件動(dòng)態(tài)系統(tǒng)的建模方法建模與優(yōu)化基本的排隊(duì)論模型排隊(duì)論,又稱(chēng)為隨機(jī)服務(wù)系統(tǒng)理論。一個(gè)排隊(duì)可以看成是一個(gè)系統(tǒng),該系統(tǒng)包含三個(gè)基本組成部分:到達(dá)過(guò)程、排隊(duì)規(guī)則和服務(wù)機(jī)構(gòu)?;陔x散事件動(dòng)態(tài)系統(tǒng)的建模方法排隊(duì)模型建模與優(yōu)化基本的排隊(duì)論模型基于離散事件動(dòng)態(tài)系統(tǒng)的建模方法衡量某個(gè)排隊(duì)系統(tǒng)優(yōu)劣性的一個(gè)重要指標(biāo)就是隊(duì)列長(zhǎng)度。t時(shí)刻的隊(duì)列長(zhǎng)度定義為
另外一個(gè)指標(biāo)是顧客j在排隊(duì)系統(tǒng)中的逗留時(shí)間
常用性能指標(biāo)還包括:平均顧客數(shù)、平均等待隊(duì)列長(zhǎng)度、平均服務(wù)顧客數(shù)、服務(wù)機(jī)構(gòu)利用率、顧客平均逗留時(shí)間、隊(duì)列中平均等待時(shí)間。建模與優(yōu)化在制造系統(tǒng)中,如果盲目增添設(shè)備的數(shù)量,就會(huì)增加投資成本或發(fā)生空閑浪費(fèi),但是如果服務(wù)設(shè)備太少,隊(duì)長(zhǎng)就會(huì)很長(zhǎng)。因此在對(duì)制造系統(tǒng)的性能進(jìn)行分析時(shí),常常通過(guò)以上參數(shù)計(jì)算諸如等待零件數(shù)、機(jī)床利用率、零件通過(guò)時(shí)間、生產(chǎn)率等來(lái)考察目前的設(shè)備狀況是否合理,并據(jù)此研究今后的改進(jìn)對(duì)策,以期提高服務(wù)質(zhì)量,降低成本。常見(jiàn)的排隊(duì)模型一般采用Kendall分類(lèi)法M/M/C表示,其中第一個(gè)字母“M”表示顧客按參數(shù)為??的泊松(Poisson)分布規(guī)律隨機(jī)進(jìn)隊(duì),第二個(gè)字母“M”表示服務(wù)臺(tái)按參數(shù)為??的負(fù)指數(shù)分布隨機(jī)地為顧客服務(wù)的時(shí)間,第三個(gè)數(shù)字“C”表示服務(wù)臺(tái)的數(shù)量為C。其中??和??分別是上面提到的顧客的到達(dá)率和服務(wù)臺(tái)的服務(wù)率。該模型常見(jiàn)的有三種類(lèi)型:標(biāo)準(zhǔn)的??/??/??模型??/??/??/∞/∞)、系統(tǒng)容量有限(??/??/??/∞/∞)、顧客源有限(??/??/??/∞/∞)。基本的排隊(duì)論模型基于離散事件動(dòng)態(tài)系統(tǒng)的建模方法建模與優(yōu)化排隊(duì)網(wǎng)絡(luò)模型基本的排隊(duì)模型針對(duì)單一服務(wù)。然而,現(xiàn)實(shí)中排隊(duì)系統(tǒng)常包含多種服務(wù),如不同機(jī)床用于零件加工。這類(lèi)具有兩種以上服務(wù)的排隊(duì)系統(tǒng)稱(chēng)為排隊(duì)網(wǎng)絡(luò),由多個(gè)服務(wù)中心組成。顧客進(jìn)入系統(tǒng),在服務(wù)中心接受服務(wù)后按規(guī)律轉(zhuǎn)移到下一個(gè)中心,直到完成所有服務(wù)后離開(kāi)系統(tǒng)。利用排隊(duì)網(wǎng)絡(luò)模型可以研究離散事件動(dòng)態(tài)系統(tǒng)的主要性能指標(biāo),如系統(tǒng)中各排隊(duì)的隊(duì)長(zhǎng)的概率分布、系統(tǒng)的輸出率、設(shè)備的利用率等,此外還可研究系統(tǒng)的規(guī)劃和控制?;陔x散事件動(dòng)態(tài)系統(tǒng)的建模方法制造系統(tǒng)排隊(duì)模型示例建模與優(yōu)化基于數(shù)學(xué)規(guī)劃的建模方法數(shù)學(xué)規(guī)劃是運(yùn)籌學(xué)的一個(gè)重要分支,被廣泛應(yīng)用于工業(yè)生產(chǎn)、商業(yè)、軍事乃至日常生活中。根據(jù)其具體特征,可以將數(shù)學(xué)規(guī)劃分為以下幾類(lèi):(1)線(xiàn)性規(guī)劃模型(目標(biāo)函數(shù)和約束條件都是線(xiàn)性函數(shù)的優(yōu)化問(wèn)題)(2)非線(xiàn)性規(guī)劃模型(目標(biāo)函數(shù)或者約束條件是非線(xiàn)性的函數(shù))(3)數(shù)規(guī)劃(決策變量是整數(shù)值的規(guī)劃問(wèn)題)(4)多目標(biāo)規(guī)劃(具有多個(gè)目標(biāo)函數(shù)的規(guī)劃問(wèn)題)(5)目標(biāo)規(guī)劃(具有不同優(yōu)先級(jí)的目標(biāo)和偏差的規(guī)劃問(wèn)題)(6)動(dòng)態(tài)規(guī)劃(求解多階段決策問(wèn)題的最優(yōu)化方法)建模與優(yōu)化基于數(shù)學(xué)規(guī)劃的建模方法數(shù)學(xué)規(guī)劃的一般形式為:數(shù)學(xué)規(guī)劃在制造系統(tǒng)的建模中有廣泛的應(yīng)用,既可以應(yīng)用到系統(tǒng)設(shè)計(jì)和能力規(guī)劃等戰(zhàn)略決策方面,也可以應(yīng)用到生產(chǎn)計(jì)劃等操作性決策與優(yōu)化方面。本章分別從這兩個(gè)方面對(duì)制造系統(tǒng)中數(shù)學(xué)規(guī)劃建模方法進(jìn)行概括性說(shuō)明。建模與優(yōu)化制造系統(tǒng)能力規(guī)劃問(wèn)題建模
基于數(shù)學(xué)規(guī)劃的建模方法建模與優(yōu)化根據(jù)以上定義,設(shè)備更換的最優(yōu)決策模型如下:
制造系統(tǒng)能力規(guī)劃問(wèn)題建模基于數(shù)學(xué)規(guī)劃的建模方法
建模與優(yōu)化制造系統(tǒng)生產(chǎn)計(jì)劃問(wèn)題建?;跀?shù)學(xué)規(guī)劃的建模方法生產(chǎn)批量問(wèn)題是指在給定一系列不同種類(lèi)工件的制造訂單、每類(lèi)工件所需工具以及加工時(shí)間的情況下,通過(guò)適當(dāng)?shù)哪繕?biāo)和機(jī)器以及工具的能力來(lái)確定未來(lái)一段時(shí)間內(nèi)需要立即加工的工件。在確定生產(chǎn)批量之后,下一步就是負(fù)荷問(wèn)題,即以最優(yōu)方式將不同種類(lèi)的工具和工件的加工工序分派到各個(gè)機(jī)器上??梢钥闯?,生產(chǎn)批量問(wèn)題和負(fù)荷問(wèn)題不是完全獨(dú)立的,因?yàn)樗鼈兌际艿揭恍┕餐募s束,如機(jī)器和刀具的生產(chǎn)能力等,因此這兩個(gè)問(wèn)題可以同時(shí)求解,也可以按順序求解。下面我們用0-1整數(shù)規(guī)劃來(lái)對(duì)一個(gè)制造系統(tǒng)的生產(chǎn)批量問(wèn)題進(jìn)行建模。生產(chǎn)批量問(wèn)題可以表示成以下的0-1整數(shù)規(guī)劃問(wèn)題建模與優(yōu)化制造系統(tǒng)生產(chǎn)計(jì)劃問(wèn)題建?;跀?shù)學(xué)規(guī)劃的建模方法
建模與優(yōu)化基于多智能體系統(tǒng)的建模方法智能體定義多樣,有的學(xué)者稱(chēng)其為“能動(dòng)的對(duì)象”,即具有封裝性、自我控制和自動(dòng)執(zhí)行能力的實(shí)體。另有學(xué)者定義智能體為“在環(huán)境中自動(dòng)完成任務(wù)的計(jì)算系統(tǒng)”。還有學(xué)者強(qiáng)調(diào)智能體是“具有自動(dòng)性和計(jì)算能力的實(shí)體,能感知并影響環(huán)境”。綜合定義,智能體應(yīng)具有以下特征:(1)自動(dòng)性,即能夠獨(dú)立地工作,不需要連續(xù)的人工干預(yù)。(2)相互作用性,即各個(gè)智能體之間能夠相互影響和作用,同時(shí)智能體也能夠和環(huán)境相互作用。(3)智能性,即智能體在不同的環(huán)境下應(yīng)被設(shè)計(jì)為具有不同的功能。(4)柔性,即智能體的設(shè)計(jì)必須考慮在不同的環(huán)境下能夠有效地工作這一需求。作為制造系統(tǒng)的一種類(lèi)型,制造系統(tǒng)中存在多種性質(zhì)不同的物流活動(dòng)和信息流活動(dòng)。因此,可以從各個(gè)不同的功能活動(dòng)出發(fā),用多智能體系統(tǒng)對(duì)其進(jìn)行建模分析。這方面已有的研究主要集中在基于多智能體系統(tǒng)的分布式控制系統(tǒng)和生產(chǎn)調(diào)度系統(tǒng)等方面,下面主要介紹這兩種多智能體系統(tǒng)建模方法。建模與優(yōu)化多智能體分布式控制系統(tǒng)要使得一個(gè)制造系統(tǒng)有效地運(yùn)行,各個(gè)智能體之間必須實(shí)現(xiàn)有效的通信。工件智能體可以看成是一個(gè)具有管理性質(zhì)的智能體,因此它是整個(gè)多智能體系統(tǒng)之間通信的主要驅(qū)動(dòng)者;機(jī)器智能體和工件智能體之間通信的主要內(nèi)容是機(jī)器根據(jù)自身當(dāng)前的狀態(tài)提出一個(gè)加工的請(qǐng)求,然后由工件智能體進(jìn)行確認(rèn)并將工件提供給最優(yōu)的機(jī)器;運(yùn)輸智能體主要是讀取工件智能體和機(jī)器智能體的當(dāng)前狀態(tài)或數(shù)據(jù),然后進(jìn)行相應(yīng)的運(yùn)輸控制;裝載智能體是通過(guò)與工件智能體通信來(lái)確定所裝載工件的歸屬性?;诙嘀悄荏w系統(tǒng)的建模方法基于多智能體的車(chē)間分布式控制系統(tǒng)建模與優(yōu)化多智能體生產(chǎn)調(diào)度系統(tǒng)生產(chǎn)調(diào)度的局限與多智能體技術(shù)的引入生產(chǎn)調(diào)度被視為組合優(yōu)化問(wèn)題,應(yīng)用受限。自80年代,人工智能及多智能體系統(tǒng)技術(shù)成為重要研究方向,尤其在處理不確定和動(dòng)態(tài)調(diào)度上。多智能體技術(shù)的特點(diǎn)-分布式系統(tǒng)替代集中式系統(tǒng)。-多智能體協(xié)商,實(shí)時(shí)性強(qiáng),適合動(dòng)態(tài)調(diào)度。-多種方法并行計(jì)算,替代單一方法。多智能體系統(tǒng)的制造系統(tǒng)動(dòng)態(tài)調(diào)度方法每個(gè)智能體對(duì)應(yīng)一個(gè)生產(chǎn)中心,分為三層:靜態(tài)知識(shí)層、專(zhuān)業(yè)知識(shí)層和通信層。基于多智能體系統(tǒng)的建模方法建模與優(yōu)化多智能體生產(chǎn)調(diào)度系統(tǒng)多智能體系統(tǒng)的定義與優(yōu)勢(shì)多智能體系統(tǒng)是基于局部概念模型的分布式人工智能系統(tǒng),智能體間既有協(xié)作也有競(jìng)爭(zhēng)。適合處理復(fù)雜任務(wù),尤其適合生產(chǎn)調(diào)度與制造系統(tǒng)優(yōu)化,也適用于中小企業(yè)供應(yīng)鏈設(shè)計(jì)。當(dāng)前挑戰(zhàn)與限制多智能體系統(tǒng)設(shè)計(jì)尚無(wú)統(tǒng)一標(biāo)準(zhǔn),需大量工作。需與其他建模方法結(jié)合,特別是數(shù)學(xué)規(guī)劃方法?;诙嘀悄荏w系統(tǒng)的建模方法03PARTTHREE啟發(fā)式算法啟發(fā)式優(yōu)化算法優(yōu)化是探索最優(yōu)解的工程數(shù)學(xué)問(wèn)題。傳統(tǒng)方法如動(dòng)態(tài)規(guī)劃、共軛梯度法等面對(duì)復(fù)雜問(wèn)題時(shí)效率低。啟發(fā)式算法則無(wú)需深入分析,通過(guò)迭代運(yùn)算快速搜索優(yōu)化,但解可能非全局最優(yōu)。元啟發(fā)式算法借鑒自然界現(xiàn)象,如遺傳算法(GA)模擬生物進(jìn)化,模擬退火算法(SA)模擬固體退火,粒子群算法(PSO)模擬飛鳥(niǎo)集群,蟻群算法(ACO)受螞蟻行為啟發(fā)。啟發(fā)式算法的一般流程框架啟發(fā)式優(yōu)化算法啟發(fā)式優(yōu)化算法廣泛用于路徑規(guī)劃、車(chē)間調(diào)度、任務(wù)分配、資源管理和能源系統(tǒng)等領(lǐng)域。名稱(chēng)英文全稱(chēng)縮寫(xiě)提出時(shí)間遺傳算法geneticalgorithmGA1975模擬退火算法simulatedannealingSA1983粒子群算法particleswarmoptimizationPSO1995經(jīng)典的啟發(fā)式算法啟發(fā)式優(yōu)化算法遺傳算法(GA)基于達(dá)爾文和孟德?tīng)柕睦碚?,模擬生物遺傳和進(jìn)化機(jī)制。1975年由Holland教授提出,GA在搜索中自動(dòng)獲取和積累知識(shí),自適應(yīng)控制搜索,逐步進(jìn)化至最優(yōu)解。遵循優(yōu)勝劣汰原則,通過(guò)選擇、交叉、變異等操作,使新個(gè)體比原個(gè)體更優(yōu)。GA為常用智能優(yōu)化算法,原理簡(jiǎn)單,具有并行性和全局搜索能力,通用性強(qiáng),適合各類(lèi)問(wèn)題。遺傳算法啟發(fā)式優(yōu)化算法具體流程如下:步驟1:隨機(jī)初始化種群。設(shè)置代數(shù)計(jì)數(shù)器,初始為??=0,最大進(jìn)化代數(shù)為G,隨機(jī)生成NP個(gè)體作為初始種群??(0)。步驟2:根據(jù)目標(biāo)函數(shù)??(??),進(jìn)行個(gè)體評(píng)價(jià),計(jì)算??(??)中各個(gè)體的適應(yīng)度。步驟3:進(jìn)行選擇運(yùn)算。使用選擇算子,并根據(jù)個(gè)體的適應(yīng)度,按照定的規(guī)則或方法,選擇一些優(yōu)良個(gè)體遺傳到下一代群體。步驟4:進(jìn)行交叉運(yùn)算。將交叉算子作用于群體,對(duì)選中的成對(duì)個(gè)體以某一概率交換它們之間的部分染色體,產(chǎn)生新的個(gè)體。步驟5:進(jìn)行變異運(yùn)算。將變異算子作用于群體,對(duì)選中的個(gè)體,以某一概率改變某一個(gè)或某一些基因值改為其他等位基因。群體??(??)經(jīng)過(guò)選擇、交叉和變異運(yùn)算之后得到下一代群體??(??+1)。計(jì)算其適應(yīng)度值,并根據(jù)適應(yīng)度值進(jìn)行排序,準(zhǔn)備進(jìn)行下一次遺傳操作。步驟6:判斷終止條件。若??≤??,則??=??+1,轉(zhuǎn)到步驟2。若??>??則此進(jìn)化過(guò)程中所得到的具有最大適應(yīng)度的個(gè)體作為最優(yōu)解輸出,終止計(jì)算。遺傳算法啟發(fā)式優(yōu)化算法遺傳算法求解Job-shop調(diào)度問(wèn)題
啟發(fā)式優(yōu)化算法遺傳算法求解Job-shop調(diào)度問(wèn)題
啟發(fā)式優(yōu)化算法遺傳算法求解Job-shop調(diào)度問(wèn)題
啟發(fā)式優(yōu)化算法遺傳算法求解Job-shop調(diào)度問(wèn)題
遺傳算法變異操作啟發(fā)式優(yōu)化算法模擬退火算法模擬退火算法(SA)概述SA思想由Metropolis在1953年提出,1983年由Kirkpatrick等人引入組合優(yōu)化領(lǐng)域,現(xiàn)已廣泛應(yīng)用。SA是局部搜索算法的擴(kuò)展,理論上為全局最優(yōu)算法。SA基于MonteCarlo迭代求解策略,模擬固體物質(zhì)物理退火過(guò)程,通過(guò)溫度參數(shù)下降,在解空間中隨機(jī)搜索全局最優(yōu)解。SA的解對(duì)應(yīng)于物理退火中的粒子狀態(tài),最優(yōu)解即能量最低態(tài)。啟發(fā)式優(yōu)化算法算法流程模擬退火算法的解相當(dāng)于物理退火中的粒子狀態(tài),最優(yōu)解對(duì)應(yīng)能量最低態(tài)。Metropolis采樣過(guò)程相當(dāng)于等溫過(guò)程,控制參數(shù)T的下降對(duì)應(yīng)冷卻過(guò)程。SA從當(dāng)前解產(chǎn)生一個(gè)位于解空間的新解并計(jì)算新舊解所對(duì)應(yīng)的目標(biāo)函數(shù)差。利用接受準(zhǔn)則來(lái)判斷新解是否被接受,若ΔT<0則接受"s'"作為新的當(dāng)前解S,否則以概率exp(-ΔT/T)接受"s'"作為新的當(dāng)前解S。當(dāng)新解被確定接受時(shí),用新解代替當(dāng)前解。減小控制參數(shù)T的值,重復(fù)執(zhí)行Metropolis算法,就可以在控制參數(shù)T趨于0時(shí),最終求得組合優(yōu)化問(wèn)題的整體最優(yōu)解。模擬退火算法啟發(fā)式優(yōu)化算法模擬退火算法解決設(shè)備配備優(yōu)化問(wèn)題
啟發(fā)式優(yōu)化算法模擬退火算法解決設(shè)備配備優(yōu)化問(wèn)題
啟發(fā)式優(yōu)化算法模擬退火算法解決設(shè)備配備優(yōu)化問(wèn)題模擬退火算法求解流程:
啟發(fā)式優(yōu)化算法算法介紹粒子群算法是J.Kennedy和R.Eberhart于1995年提出的群智能算法,模擬鳥(niǎo)類(lèi)覓食行為。算法將鳥(niǎo)類(lèi)飛行空間視為搜索空間,鳥(niǎo)視為僅有速度和位置的粒子,代表問(wèn)題解。算法無(wú)需梯度信息,參數(shù)少,易實(shí)現(xiàn),適用于實(shí)際優(yōu)化問(wèn)題。粒子群算法啟發(fā)式優(yōu)化算法算法流程粒子群算法
03PARTFOUR強(qiáng)化學(xué)習(xí)算法強(qiáng)化學(xué)習(xí)算法強(qiáng)化學(xué)習(xí)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度離婚案件審理與訴訟離婚合同對(duì)比分析3篇
- 家庭辦公環(huán)境下的孩子學(xué)習(xí)空間設(shè)計(jì)
- 辦公文化中的德育元素挖掘與實(shí)踐
- 二零二五年度木材貨物運(yùn)輸合同匯編及環(huán)保要求
- 二零二五年度房產(chǎn)過(guò)戶(hù)與離婚后房產(chǎn)分割執(zhí)行服務(wù)合同3篇
- 2025年度廢棄塑料清運(yùn)與環(huán)保處理合作協(xié)議3篇
- 2024版合同管理與招投標(biāo)決策技巧對(duì)比分析3篇
- 二零二五年度農(nóng)業(yè)項(xiàng)目履約擔(dān)保函范本3篇
- 學(xué)校社會(huì)實(shí)踐活動(dòng)與學(xué)生綜合素質(zhì)提升
- 二零二五年度新能源車(chē)充電設(shè)施建設(shè)合同范本2篇
- 人教版七年級(jí)下冊(cè)數(shù)學(xué)全冊(cè)完整版課件
- 初中生物人教七年級(jí)上冊(cè)(2023年更新) 生物圈中的綠色植物18 開(kāi)花和結(jié)果
- 水電解質(zhì)及酸堿平衡的業(yè)務(wù)學(xué)習(xí)
- 統(tǒng)編版一年級(jí)語(yǔ)文上冊(cè) 第5單元教材解讀 PPT
- CSCEC8XN-SP-安全總監(jiān)項(xiàng)目實(shí)操手冊(cè)
- 口腔衛(wèi)生保健知識(shí)講座班會(huì)全文PPT
- 成都市產(chǎn)業(yè)園區(qū)物業(yè)服務(wù)等級(jí)劃分二級(jí)標(biāo)準(zhǔn)整理版
- 最新監(jiān)督學(xué)模擬試卷及答案解析
- ASCO7000系列GROUP5控制盤(pán)使用手冊(cè)
- 污水處理廠(chǎng)關(guān)鍵部位施工監(jiān)理控制要點(diǎn)
- 財(cái)政投資評(píng)審中心工作流程
評(píng)論
0/150
提交評(píng)論