版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
工業(yè)互聯(lián)網(wǎng)預(yù)測性維護(hù)—決策樹決策樹決策樹:從根節(jié)點(diǎn)開始一步步走到葉子節(jié)點(diǎn)(決策)所有的數(shù)據(jù)最終都會(huì)落在葉子節(jié)點(diǎn),既可以做分類也可以做回歸樹模型Age<15Is
male?YNYN決策樹根節(jié)點(diǎn):第一個(gè)選擇點(diǎn)非葉子節(jié)點(diǎn)與分支:中間過程葉子結(jié)點(diǎn):最終的決策結(jié)果樹的組成決策樹訓(xùn)練階段:從給定的訓(xùn)練集構(gòu)造出來一棵樹(從跟節(jié)點(diǎn)開始選擇特征如何進(jìn)行特征切分)測試階段:根據(jù)構(gòu)造出來的樹模型從上到下去走一遍就好了一旦構(gòu)造好了決策樹,那么分類或者預(yù)測任務(wù)就很簡單了,只需要走一遍就可以了,那么難點(diǎn)就在于如何構(gòu)造出來一顆樹,這就沒那么容易了,需要考慮的問題還有很多的!決策樹的訓(xùn)練與測試決策樹問題:根節(jié)點(diǎn)的選擇該用哪個(gè)特征呢?接下來呢?如何切分呢?想象一下:我們的目標(biāo)應(yīng)該是根節(jié)點(diǎn)就像一個(gè)老大似的能更好的切分?jǐn)?shù)據(jù)(分類的效果更好),根節(jié)點(diǎn)下面的節(jié)點(diǎn)自然就是二當(dāng)家了。目標(biāo):通過一種衡量標(biāo)準(zhǔn),來計(jì)算通過不同特征進(jìn)行分支選擇后的分類情況,找出來最好的那個(gè)當(dāng)成根節(jié)點(diǎn),以此類推。如何切分特征(選擇節(jié)點(diǎn))決策樹熵:熵是表示隨機(jī)變量不確定性的度量(解釋:說白了就是物體內(nèi)部的混亂程度,比如雜貨市場里面什么都有那肯定混亂呀,專賣店里面只賣一個(gè)牌子的那就穩(wěn)定多啦)衡量標(biāo)準(zhǔn)-熵公式:
舉個(gè)例子:
A集合[1,1,1,1,1,1,1,1,2,2]
B集合[1,2,3,4,5,6,7,8,9,1]顯然A集合的熵值要低,因?yàn)锳里面只有兩種類別,相對(duì)穩(wěn)定一些而B中類別太多了,熵值就會(huì)大很多。(在分類任務(wù)中我們希望通過節(jié)點(diǎn)分支后數(shù)據(jù)類別的熵值大還是小呢?)決策樹熵:不確定性越大,得到的值也就越大
當(dāng)p=0或p=1時(shí),H(p)=0,隨機(jī)變量完全沒有不確定性
當(dāng)p=0.5時(shí),H(p)=1,此時(shí)隨機(jī)變量的不確定性最大衡量標(biāo)準(zhǔn)-熵信息增益:表示特征X使得類Y的不確定性減少的程度(分類后的專一性,希望分類后的結(jié)果是同類在一起如何決策一個(gè)節(jié)點(diǎn)的選擇呢?決策樹數(shù)據(jù):14天打球情況特征:4種環(huán)境變化目標(biāo):構(gòu)造決策樹決策樹構(gòu)造實(shí)例決策樹劃分方式:4種問題:誰當(dāng)根節(jié)點(diǎn)依據(jù):信息增益決策樹構(gòu)造實(shí)例決策樹決策樹構(gòu)造實(shí)例在歷史數(shù)據(jù)中(14天)有9天打球,5天不打球,所以此時(shí)的熵應(yīng)為4個(gè)特征逐一分析,先從outlook特征開始:Outlook=sunny時(shí),熵值為0.971Outlook=overcast時(shí),值為0Outlook=rainy時(shí),熵值為0.971決策樹決策樹構(gòu)造實(shí)例根據(jù)數(shù)據(jù)統(tǒng)計(jì),outlook取值分別為sunny,overcast,rainy的概率分別為:5/14,4/14,5/14熵值計(jì)算:5/14*0.971+4/14*0+5/14*0.971=0.693gain(temperature)=0.029gain(humidity)=0.152gain(windy)=0.048信息增益:系統(tǒng)的熵值從原始的0.940下降到了0.693,增益為0.247同樣的方式可以計(jì)算出其他特征的信息增益,那么我們選擇最大的那個(gè)就可以,相當(dāng)于是遍歷了一遍特征,找出來了大當(dāng)家,然后再其余的特征中選擇信息增益最大的,以此類推。決策樹決策樹算法ID3:信息增益C4.5:信息增益率CART:使用GINI系數(shù)來做衡量標(biāo)準(zhǔn)和熵的衡量標(biāo)準(zhǔn)類似,計(jì)算方式不相同決策樹連續(xù)值怎么辦?選取連續(xù)值的分界點(diǎn)決策樹決策樹剪枝策略決策樹決策樹剪枝策略結(jié)構(gòu)化數(shù)據(jù)與時(shí)間序列數(shù)據(jù)時(shí)間序列定義:時(shí)間序列是按照一定的時(shí)間間隔排列的一組數(shù)據(jù),其時(shí)間間隔可以是任意的時(shí)間單位,如小時(shí)、日、周月等。比如,每天某產(chǎn)品的用戶數(shù)量,每個(gè)月的銷售額,這些數(shù)據(jù)形成了以一定時(shí)間間隔的數(shù)據(jù)。通過對(duì)這些時(shí)間序列的分析,從中發(fā)現(xiàn)和揭示現(xiàn)象發(fā)展變化的規(guī)律,并將這些知識(shí)和信息用于預(yù)測。比如銷售量是上升還是下降,銷售量是否與季節(jié)有關(guān),是否可以通過現(xiàn)有的數(shù)據(jù)預(yù)測未來一年的銷售額是多少等。時(shí)間序列數(shù)據(jù)的組成要素時(shí)間序列由兩個(gè)組成要素構(gòu)成:1、第一個(gè)要素是時(shí)間要素(時(shí)間戳);2、第二個(gè)要素是數(shù)值要素。時(shí)間序列根據(jù)時(shí)間和數(shù)值性質(zhì)的不同,可以分為時(shí)期時(shí)間序列和時(shí)點(diǎn)時(shí)間序列。上圖為某商品店的銷售額時(shí)間序列,就是時(shí)期時(shí)間序列,統(tǒng)計(jì)的是每一年,在一年時(shí)間內(nèi)該商品店的銷售總額上圖為某制造工廠的動(dòng)能部門,表格數(shù)據(jù)表示鍋爐的分時(shí)溫度數(shù)據(jù)。每隔一個(gè)小時(shí),系統(tǒng)自動(dòng)記錄一次鍋爐的實(shí)時(shí)溫度??梢园l(fā)現(xiàn),這里的溫度數(shù)據(jù)是某個(gè)時(shí)間點(diǎn)的實(shí)時(shí)數(shù)據(jù),所以該時(shí)間序列為時(shí)點(diǎn)時(shí)間序列。時(shí)間序列可以反映某個(gè)現(xiàn)象的發(fā)展變化狀態(tài)。通過對(duì)時(shí)間序列的分析,可以反映現(xiàn)象發(fā)展變化的趨勢和規(guī)律,再通過對(duì)影響時(shí)間序列的各種因素進(jìn)行測定,可以進(jìn)一步解釋現(xiàn)象變化的內(nèi)在原因,為預(yù)測和決策提供可靠的數(shù)據(jù)支持。
時(shí)間序列分析因?yàn)闀r(shí)間序列是某個(gè)指標(biāo)數(shù)值長期變化的數(shù)值表現(xiàn),所以時(shí)間序列數(shù)值變化背后必然蘊(yùn)含著數(shù)值變換的規(guī)律性,這些規(guī)律性就是時(shí)間序列分析的切入點(diǎn)。一般情況下,時(shí)間序列的數(shù)值變化規(guī)律有以下四種:長期變動(dòng)趨勢、季節(jié)變動(dòng)規(guī)律、周期變動(dòng)規(guī)律和不規(guī)則變動(dòng)。長期趨勢
長期趨勢指的是統(tǒng)計(jì)指標(biāo)在相當(dāng)長的一段時(shí)間內(nèi),受到長期趨勢影響因素的影響,表現(xiàn)出持續(xù)上升或持續(xù)下降的趨勢,通常用字母T表示。例如,隨著國家經(jīng)濟(jì)的發(fā)展,人均收入將逐漸提升;隨著科學(xué)技術(shù)的發(fā)生,勞動(dòng)生產(chǎn)率也不斷提高。季節(jié)變動(dòng)
季節(jié)變動(dòng)是指由于季節(jié)的轉(zhuǎn)變使得指標(biāo)數(shù)值發(fā)生周期性變動(dòng)。由此可見,指標(biāo)數(shù)值的季節(jié)變動(dòng)是以年為周期的,一般以月、季、周為時(shí)間單位,不能以年作單位,通常用S表示。引起季節(jié)變動(dòng)的因素有自然因素,也有人為因素。例如,蔬菜食品價(jià)格,棉衣銷售量都會(huì)隨著季節(jié)氣溫的變化而周期變化;每年的長假(五一、十一、春節(jié))都會(huì)引起出行人數(shù)的大量增加。循環(huán)變動(dòng)
循環(huán)變動(dòng)與季節(jié)變動(dòng)的周期不同,循環(huán)變動(dòng)通常以若干年為周期,在曲線圖上表現(xiàn)為波浪式的周期變動(dòng)。這種周期變動(dòng)的特征變現(xiàn)為增加和減少交替出現(xiàn)。最典型的周期案例就是市場經(jīng)濟(jì)的商業(yè)周期。不規(guī)則變動(dòng)
不規(guī)則變動(dòng)是由某些隨機(jī)因素導(dǎo)致的數(shù)值變化,這些因素的作用是不可預(yù)知和沒有規(guī)律性的,因此對(duì)數(shù)值的變化影響變形為不規(guī)則變動(dòng)。時(shí)間序列數(shù)據(jù)操作時(shí)間序列數(shù)據(jù)對(duì)時(shí)間戳的操作是一個(gè)重要的主題,它涉及到如何處理、轉(zhuǎn)換、分析和可視化時(shí)間序列數(shù)據(jù)。如何創(chuàng)建時(shí)間戳對(duì)象:可以使用datetime模塊中的datetime類來創(chuàng)建時(shí)間戳對(duì)象,例如:fromdatetimeimportdatetime#創(chuàng)建一個(gè)指定的時(shí)間戳對(duì)象ts=datetime(2023,11,21,10,8,6)print(ts)#輸出:2023-11-2110:08:06時(shí)間序列數(shù)據(jù)操作如何從字符串解析時(shí)間戳:可以使用datetime模塊中的strptime函數(shù)來從字符串解析時(shí)間戳,例如:fromdatetimeimportdatetime#從字符串解析時(shí)間戳ts=datetime.strptime("2023-11-2110:08:06","%Y-%m-%d%H:%M:%S")print(ts)strptime函數(shù)是datetime模塊中的一個(gè)函數(shù),它的意思是stringparsetime,即從字符串解析時(shí)間。它的用法是:datetime.strptime(string,format)其中,string是要解析的字符串,format是指定字符串的格式,例如"%Y-%m-%d%H:%M:%S"表示年-月-日時(shí):分:秒。這個(gè)函數(shù)會(huì)返回一個(gè)datetime對(duì)象,表示解析出的時(shí)間戳。例如:fromdatetimeimportdatetime#從字符串解析時(shí)間戳ts=datetime.strptime("2023-11-2110:08:06","%Y-%m-%d%H:%M:%S")print(ts)#輸出:2023-11-2110:08:06時(shí)間序列數(shù)據(jù)操作如何獲取時(shí)間戳的屬性:可以使用datetime模塊中的屬性來獲取時(shí)間戳的年、月、日、時(shí)、分、秒、微秒、星期等信息,例如:fromdatetimeimportdatetime#創(chuàng)建一個(gè)時(shí)間戳對(duì)象ts=datetime(2023,11,21,10,8,6)#獲取時(shí)間戳的屬性print(ts.year)#輸出:2023print(ts.month)#輸出:11print(ts.day)#輸出:21print(ts.hour)#輸出:10print(ts.minute)#輸出:8print(ts.second)#輸出:6print(ts.microsecond)#輸出:0print(ts.weekday())#輸出:1,表示星期二時(shí)間序列數(shù)據(jù)操作如何對(duì)時(shí)間戳進(jìn)行算術(shù)運(yùn)算:可以使用datetime模塊中的timedelta類來對(duì)時(shí)間戳進(jìn)行加減運(yùn)算,例如:fromdatetimeimportdatetime,timedelta#創(chuàng)建一個(gè)時(shí)間戳對(duì)象ts=datetime(2023,11,21,10,8,6)#對(duì)時(shí)間戳進(jìn)行加減運(yùn)算ts_add=ts+timedelta(days=1,hours=2,minutes=30)#加上一天兩小時(shí)半print(ts_add)#輸出:2023-11-2212:38:06ts_sub=ts-timedelta(weeks=2,seconds=10)#減去兩周十秒print(ts_sub)#輸出:2023-11-0709:57:56時(shí)間序列數(shù)據(jù)操作如何將時(shí)間戳轉(zhuǎn)換為不同的時(shí)區(qū):可以使用pytz模塊中的timezone函數(shù)來將時(shí)間戳轉(zhuǎn)換為不同的時(shí)區(qū),例如:Pythonfromdatetimeimportdatetimeimportpytz#創(chuàng)建一個(gè)時(shí)間戳對(duì)象ts=datetime(2023,11,21,10,8,6)#將時(shí)間戳轉(zhuǎn)換為不同的時(shí)區(qū)ts_utc=ts.astimezone(pytz.timezone("UTC"))#轉(zhuǎn)換為UTC時(shí)區(qū)print(ts_utc)#輸出:2023-11-2102:08:06+00:00ts_ny=ts.astimezone(pytz.timezone("America/New_York"))#轉(zhuǎn)換為紐約時(shí)區(qū)print(ts_ny)#輸出:2023-11-2021:08:06-05:00時(shí)間序列數(shù)據(jù)操作如何比較兩個(gè)時(shí)間戳的大?。嚎梢允褂帽容^運(yùn)算符(<,>,==,!=,<=,>=)來比較兩個(gè)時(shí)間戳的大小,例如:fromdatetimeimportdatetime#創(chuàng)建兩個(gè)時(shí)間戳對(duì)象ts1=datetime(2023,11,21,10,8,6)ts2=datetime(2023,11,22,12,38,6)#比較兩個(gè)時(shí)間戳的大小print(ts1<ts2)#輸出:Trueprint(ts1==ts2)#輸出:False時(shí)間序列數(shù)據(jù)操作如何獲取兩個(gè)時(shí)間戳之間的時(shí)間差:可以使用減法運(yùn)算符(-)來獲取兩個(gè)時(shí)間戳之間的時(shí)間差,返回一個(gè)timedelta對(duì)象,表示兩個(gè)時(shí)間戳相差的天數(shù)、秒數(shù)和微秒數(shù),例如:fromdatetimeimportdatetime#創(chuàng)建兩個(gè)時(shí)間戳對(duì)象ts1=datetime(2023,11,21,10,8,6)ts2=datetime(2023,11,22,12,38,6)#獲取兩個(gè)時(shí)間戳之間的時(shí)間差td=ts2-ts1print(td)#輸出:1day,2:30:00print(td.days)#輸出:1print(td.seconds)#輸出:9000print(td.microseconds)#輸出:0時(shí)間序列數(shù)據(jù)操作如何將時(shí)間戳轉(zhuǎn)換為其他格式:可以使用datetime模塊中的isoformat()方法、ctime()方法或strftime()方法來將時(shí)間戳轉(zhuǎn)換為其他格式,例如:fromdatetimeimportdatetime#創(chuàng)建一個(gè)時(shí)間戳對(duì)象ts=datetime(2023,11,21,10,8,6)#將時(shí)間戳轉(zhuǎn)換為ISO8601格式iso=ts.isoformat()print(iso)#輸出:2023-11-21T10:08:06#將時(shí)間戳轉(zhuǎn)換為C語言格式ct=ts.ctime()print(ct)#輸出:TueNov2110:08:062023#將時(shí)間戳轉(zhuǎn)換為自定義格式custom=ts.strftime("%A,%B%d,%Y%I:%M:%S%p")print(custom)#輸出:Tuesday,November21,202310:08:06AM時(shí)間序列數(shù)據(jù)操作對(duì)時(shí)間戳進(jìn)行提取,拆分出年月日時(shí)分秒等數(shù)據(jù)。需要用到以下函數(shù):to_datatime函數(shù),它是Pandas庫中的一個(gè)函數(shù),用于將字符串或其他可轉(zhuǎn)換為日期時(shí)間的對(duì)象轉(zhuǎn)換為Pandas的Timestamp對(duì)象或DatetimeIndex。to_datetime函數(shù)的語法如下:pandas.to_datetime(arg,format=None,errors='raise',dayfirst=False,yearfirst=False,utc=None,box=True,exact=True,unit=None,infer_datetime_format=False,origin='unix',cache=False)參數(shù)說明:arg:要轉(zhuǎn)換為日期時(shí)間的對(duì)象,可以是字符串、整數(shù)、浮點(diǎn)數(shù)、列表、Series、DataFrame等。format:可選參數(shù),用于指定輸入的日期時(shí)間字符串的格式。如果未指定,函數(shù)將嘗試自動(dòng)解析日期時(shí)間字符串。errors:可選參數(shù),用于指定錯(cuò)誤處理方式。默認(rèn)值為'raise',表示遇到錯(cuò)誤時(shí)拋出異常;'coerce'表示將無效的日期時(shí)間值設(shè)置為NaT(NotaTime);'ignore'表示忽略錯(cuò)誤,保留原始值。其他參數(shù):用于進(jìn)一步控制日期時(shí)間轉(zhuǎn)換的行為,例如時(shí)區(qū)處理、性能優(yōu)化等。importpandasaspd#示例日期時(shí)間字符串datetime_str='12/30/202321:20'#將字符串轉(zhuǎn)換為Pandas的Timestamp對(duì)象timestamp=pd.to_datetime(datetime_str,format='%m/%d/%Y%H:%M')print(timestamp)時(shí)間序列數(shù)據(jù)重采樣時(shí)間序列數(shù)據(jù)重采樣是處理時(shí)序數(shù)據(jù)的一項(xiàng)基本技術(shù)。它是關(guān)于將時(shí)間序列數(shù)據(jù)從一個(gè)頻率轉(zhuǎn)換到另一個(gè)頻率,它可以更改數(shù)據(jù)的時(shí)間間隔。把數(shù)據(jù)從低頻變?yōu)楦哳l稱為升采樣,把數(shù)據(jù)從高頻變?yōu)榈皖l稱為降采樣。年月日時(shí)分秒1年=12月=365日=525,600分=31,536,000
秒時(shí)間序列數(shù)據(jù)重采樣重采樣的作用是可以幫助我們更好的理解數(shù)據(jù),幫助我們分析。時(shí)間序列數(shù)據(jù)重采樣resample()這個(gè)函數(shù)主要是用來對(duì)時(shí)間序列做頻率轉(zhuǎn)換,函數(shù)原型如下:DataFrame.resample(rule,how=None,axis=0,fill_method=None,closed=None,label=None,convention='start',kind=None,loffset=None,limit=None,base=0,on=None,level=None)參數(shù)說明freq表示重采樣頻率,例如‘M’、‘5min’,Second(15)fill_method=None升采樣時(shí)如何插值,比如‘ffill’、‘bfill’等closed=‘right’在降采樣時(shí),各時(shí)間段的哪一段是閉合的,‘right’或‘left’,默認(rèn)‘right’label=‘right’在降采樣時(shí),如何設(shè)置聚合值的標(biāo)簽,例如,9:30-9:35會(huì)被標(biāo)記成9:30還是9:35,默認(rèn)9:35時(shí)間序列數(shù)據(jù)重采樣importpandasaspdindex=pd.date_range('1/1/2023',periods=9,freq='T’)series=pd.Series(range(9),index=index)seriesseries.resample('3T').sum()series.resample('3T',label='right').sum()series.resample('3T',label='right',closed='right').sum()時(shí)間序列數(shù)據(jù)圖像顯示——重采樣前importpandasaspdimportmatplotlib.pyplotaspltpowerConsum=pd.read_csv('./TetuanCitypowerconsumption.csv’powerConsum['DateTime']=pd.to_datetime(powerConsum['DateTime'],format='%m/%d/%Y%H:%M')x=powerConsum['DateTime']y=powerConsum['Zone1PowerConsumption’])plt.plot(x,y)時(shí)間序列數(shù)據(jù)圖像顯示——重采樣后importpandasaspdimportmatplotlib.pyplotaspltimportpandasaspdimportmatplotlib.pyplotaspltpowerConsum=pd.read_csv('./TetuanCitypowerconsumption.csv’powerConsum['DateTime']=pd.to_datetime(powerConsum['DateTime'],format='%m/%d/%Y%H:%M')x=powerConsum['DateTime']y=powerConsum['Zone1PowerConsumption’])plt.plot(x,y)##################powerConsum.set_index('DateTime',inplace=True)weekData=powerConsum.resample('D').sum()x=weekData.indexy=weekData['Zone1PowerConsumption']plt.plot(x,y)ARIMA模型介紹ARIMA(自回歸差分移動(dòng)平均模型,AutoregressiveIntegratedMovingAverage)是一種常用的時(shí)間序列分析模型,用于預(yù)測和分析具有時(shí)間依賴性的數(shù)據(jù)。ARIMA模型結(jié)合了自回歸(AR)、差分(I)和移動(dòng)平均(MA)的概念。ARIMA模型的核心思想是將時(shí)間序列數(shù)據(jù)轉(zhuǎn)化為平穩(wěn)時(shí)間序列,然后通過對(duì)平穩(wěn)序列的自回歸和移動(dòng)平均進(jìn)行建模,從而進(jìn)行預(yù)測和分析。ARIMA模型構(gòu)成ARIMA模型由三部分構(gòu)成,分別是自回歸模型(AR)、差分過程(I)和移動(dòng)平均模型(MA)。AR(自回歸)指的是使用過去時(shí)間點(diǎn)的觀測值來預(yù)測當(dāng)前時(shí)間點(diǎn)的觀測值。ARIMA模型中的AR部分表示為AR(p),其中p是使用的過去觀測值的數(shù)量。MA(移動(dòng)平均)指的是使用過去時(shí)間點(diǎn)的誤差項(xiàng)(觀測值與預(yù)測值之間的差異)來預(yù)測當(dāng)前時(shí)間點(diǎn)的觀測值。ARIMA模型中的MA部分表示為MA(q),其中q是使用的誤差項(xiàng)的數(shù)量。I(差分)指的是對(duì)時(shí)間序列進(jìn)行差分運(yùn)算,以使其趨于平穩(wěn)。差分可以通過減去前一個(gè)時(shí)間點(diǎn)的觀測值來實(shí)現(xiàn)。ARIMA模型中的I部分表示為I(d),其中d是進(jìn)行的差分次數(shù)。ARIMA模型應(yīng)用場景ARIMA模型是一種經(jīng)典的時(shí)間序列分析方法,可以應(yīng)用于各種領(lǐng)域,例如經(jīng)濟(jì)學(xué)、金融學(xué)、氣象學(xué)等,用于預(yù)測和分析具有時(shí)間依賴性的數(shù)據(jù)。然而,ARIMA模型假設(shè)時(shí)間序列的模式是穩(wěn)定的,并且不適用于非線性、非平穩(wěn)的數(shù)據(jù)。在實(shí)際應(yīng)用中,人們還使用其他更復(fù)雜的模型來處理這些情況?;貧w算法與預(yù)測一元線性回歸多項(xiàng)式回歸
因此,我們可以用回歸算法進(jìn)行預(yù)測:step1:建立模型step2:將數(shù)據(jù)分為訓(xùn)練集,測試集step3:用訓(xùn)練集對(duì)模型進(jìn)行訓(xùn)練Step4:用測試集驗(yàn)證模型效果Step5:對(duì)新數(shù)據(jù)進(jìn)行預(yù)測預(yù)測算法介紹在工業(yè)維護(hù)場景中,可以使用多種算法來進(jìn)行預(yù)測和故障檢測。機(jī)器學(xué)習(xí)算法:①邏輯回歸(LogisticRegression):用于二分類問題,可以預(yù)測設(shè)備是否會(huì)發(fā)生故障。②決策樹(DecisionTrees):可以用于故障原因分析和設(shè)備維護(hù)決策。③隨機(jī)森林(RandomForest):基于多個(gè)決策樹的集成算法,可以用于故障檢測和設(shè)備維護(hù)優(yōu)化。④支持向量機(jī)(SupportVectorMachines):用于分類和回歸問題,可以用于預(yù)測設(shè)備狀態(tài)和故障概率。⑤神經(jīng)網(wǎng)絡(luò)(NeuralNetworks):可以用于復(fù)雜的預(yù)測和故障檢測任務(wù),如循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)和卷積神經(jīng)網(wǎng)絡(luò)(CNN)。預(yù)測算法介紹2.時(shí)間序列分析算法:①自回歸移動(dòng)平均模型(ARIMA):用于對(duì)時(shí)間序列數(shù)據(jù)進(jìn)行建模和預(yù)測,適用于設(shè)備故障時(shí)間序列數(shù)據(jù)分析。②季節(jié)性分解(SeasonalDecompositionofTimeSeries,STL):用于分解時(shí)間序列數(shù)據(jù)的趨勢、季節(jié)性和殘差成分,幫助發(fā)現(xiàn)異常和故障模式。③長短期記憶網(wǎng)絡(luò)(LongShort-TermMemory,LSTM):一種適用于時(shí)間序列數(shù)據(jù)的循環(huán)神經(jīng)網(wǎng)絡(luò),可以用于預(yù)測設(shè)備故障和異常檢測。神經(jīng)網(wǎng)絡(luò)算法——簡介神經(jīng)網(wǎng)絡(luò)算法——結(jié)構(gòu)神經(jīng)網(wǎng)絡(luò)算法——流程BP神經(jīng)網(wǎng)絡(luò)簡要來說,BP神經(jīng)網(wǎng)絡(luò)就是以研究對(duì)象的特征值為輸入,通過神經(jīng)元和激活函數(shù)得到輸出的算法。該神經(jīng)網(wǎng)絡(luò)算法最重要的特征是反向傳播(backpropagation
)。BP神經(jīng)網(wǎng)絡(luò)BP神經(jīng)網(wǎng)絡(luò)的訓(xùn)練過程BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練的對(duì)象是各特征值的權(quán)重,通過調(diào)整各特征值權(quán)重,來完成某一特定問題的數(shù)學(xué)模型刻畫。例如:房價(jià)問題。房價(jià)城市地段大小品質(zhì)BP神經(jīng)網(wǎng)絡(luò)BP神經(jīng)網(wǎng)絡(luò)的訓(xùn)練過程在房價(jià)問題,每一個(gè)因素(特征值)都會(huì)對(duì)最終房價(jià)產(chǎn)生影響。但是不同因素(特征值)的變化對(duì)房價(jià)產(chǎn)生影響的效果是不同的。(正向、負(fù)向;平穩(wěn)、激烈)BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練的過程實(shí)際上是一個(gè)試錯(cuò)的過程。為了找到各影響因素(特征值)對(duì)房價(jià)產(chǎn)生影響的程度(權(quán)重),BP神經(jīng)網(wǎng)絡(luò)通過設(shè)置訓(xùn)練集和初始值,得到一個(gè)推理出來的結(jié)果。BP神經(jīng)網(wǎng)絡(luò)BP神經(jīng)網(wǎng)絡(luò)的訓(xùn)練過程之反向傳播訓(xùn)練集除了包含特征值外還包括實(shí)際輸出(真實(shí)房價(jià))。通過推理房價(jià)與真實(shí)房價(jià)相減得到誤差。誤差作為調(diào)整權(quán)重的依據(jù)進(jìn)行反向傳播,調(diào)整各權(quán)重。調(diào)整權(quán)重之后再進(jìn)行正向傳播得到誤差,誤差再反向傳播…最終達(dá)到的效果是誤差為零或者在可接受范圍內(nèi)且不再變化。BP神經(jīng)網(wǎng)絡(luò)的驗(yàn)證過程在BP神經(jīng)網(wǎng)絡(luò)中各權(quán)重調(diào)整完畢,利用測試集對(duì)該神經(jīng)網(wǎng)絡(luò)模型進(jìn)行測試,驗(yàn)證其性能。測試集同樣包括特征值和真實(shí)結(jié)果。通過進(jìn)行輸入特征值得到的推理結(jié)果與真實(shí)結(jié)果的比較,驗(yàn)證模型性能。BP神經(jīng)網(wǎng)絡(luò)BP神經(jīng)網(wǎng)絡(luò)中的數(shù)學(xué)知識(shí)——損失函數(shù)BP神經(jīng)網(wǎng)絡(luò)的核心是尋找一系列的權(quán)重使得真實(shí)值與推理值之間的誤差最小。在數(shù)學(xué)的范疇中,就是用損失函數(shù)來度量誤差最小。常見的均方差損失函數(shù)表示為:,損失函數(shù)取得最小值,就表明推理效果最好。BP神經(jīng)網(wǎng)絡(luò)BP神經(jīng)網(wǎng)絡(luò)中的數(shù)學(xué)知識(shí)——梯度下降法給定一元函數(shù)f(x),求f(x)的最小值(或最大值)解析法:對(duì)可導(dǎo)函數(shù),求導(dǎo),求駐點(diǎn),比較駐點(diǎn)處的函數(shù)值。數(shù)值解法:(爬山法)1)賦初值x=x0;2)隨機(jī)生成增量?x;3)若f(x+?x)<f(x),則x←x+?x;4
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年湖北電力建設(shè)第一工程公司招聘筆試參考題庫含答案解析
- 2025年度個(gè)人信用擔(dān)保裝修借款合同范本3篇
- 2025年個(gè)人金融理財(cái)產(chǎn)品投資合同4篇
- 2025年度油氣輸送鋼管租賃合作合同2篇
- 2025年度個(gè)人農(nóng)田科技種植項(xiàng)目合作協(xié)議4篇
- 2025版二手房免稅托管與租賃一體化服務(wù)合同
- 2025版協(xié)議離婚全程法律服務(wù)及婚姻財(cái)產(chǎn)分割合同3篇
- 2025年度二零二五年度鋼廠廢鋼再生產(chǎn)品銷售合同2篇
- 2025版新能源電池生產(chǎn)承包經(jīng)營合同示范文本3篇
- 2025-2030全球叉車機(jī)器人行業(yè)調(diào)研及趨勢分析報(bào)告
- (完整版)高考英語詞匯3500詞(精校版)
- 通信電子線路(哈爾濱工程大學(xué))智慧樹知到課后章節(jié)答案2023年下哈爾濱工程大學(xué)
- 《公路勘測細(xì)則》(C10-2007 )【可編輯】
- 皮膚惡性黑色素瘤-疾病研究白皮書
- 從心理學(xué)看現(xiàn)代家庭教育課件
- C語言程序設(shè)計(jì)PPT(第7版)高職完整全套教學(xué)課件
- 頭頸外科臨床診療指南2021版
- 大國重器北斗系統(tǒng)
- 網(wǎng)球運(yùn)動(dòng)知識(shí)教育PPT模板
- 防火墻漏洞掃描基礎(chǔ)知識(shí)
- 運(yùn)動(dòng)技能學(xué)習(xí)PPT
評(píng)論
0/150
提交評(píng)論