基于多元回歸的爐齡問題的實(shí)現(xiàn)_第1頁
基于多元回歸的爐齡問題的實(shí)現(xiàn)_第2頁
基于多元回歸的爐齡問題的實(shí)現(xiàn)_第3頁
基于多元回歸的爐齡問題的實(shí)現(xiàn)_第4頁
基于多元回歸的爐齡問題的實(shí)現(xiàn)_第5頁
已閱讀5頁,還剩22頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、精選優(yōu)質(zhì)文檔-傾情為你奉上題目:基于多元回歸的爐齡問題的實(shí)現(xiàn)成員信息:姓名班級(jí)學(xué)號(hào)張隊(duì)長隊(duì)員&答辯人日期:2019年12月30日摘要工業(yè)生產(chǎn)在生產(chǎn)出產(chǎn)品的同時(shí),也生產(chǎn)出大量關(guān)于生產(chǎn)過程的信息。應(yīng)充分利用這些信息并在此基礎(chǔ)上尋求如何才能使生產(chǎn)得到進(jìn)一步改善的方法。因?yàn)殇撹F生產(chǎn)過程特別復(fù)雜,出現(xiàn)的因素特別多,各因素間又相互牽連1。因此找出某一時(shí)期影響某一實(shí)際問題的最主要原因,提供優(yōu)化決策,不僅對(duì)生產(chǎn)技術(shù)管理有很 大的參考價(jià)值,而且也有助于積累經(jīng)驗(yàn),還對(duì)機(jī)理性問題的研究具有啟發(fā)和促進(jìn)作用。現(xiàn)有某鋼鐵公司煉鋼轉(zhuǎn)爐的爐齡按30天爐/天煉鋼規(guī)模,大約一個(gè)月就需等爐一次進(jìn)行檢修。為了減少消耗,廠家通

2、過實(shí)際測(cè)定,得到33組數(shù)據(jù)。要求對(duì)爐齡進(jìn)行預(yù)測(cè)和分析。 本文針對(duì)此問題,進(jìn)行分析并建立合適的數(shù)學(xué)模型,為解決爐齡問題提供方案。針對(duì)問題一,分析各個(gè)因素橫向之間以及各個(gè)因素縱向內(nèi)部數(shù)據(jù)之間的關(guān)系,采用灰度預(yù)測(cè)模型,將缺失的數(shù)據(jù)進(jìn)行補(bǔ)全。針對(duì)問題二,通過主成分分析法找出與影響爐齡的主要因素,剔除對(duì)爐齡影響較小的因素。建立以多個(gè)影響因素為自變量和以爐齡為因變量的多元線性回歸模型,并且建立了支持向量機(jī)的回歸模型。針對(duì)問題三,對(duì)于多元線性回歸模型,主要考慮其預(yù)測(cè)的殘差來分析模型的可靠性,模型預(yù)測(cè)殘差的分布越?jīng)]有趨勢(shì),表示回歸的結(jié)果越是可靠,所以多元線性回歸模型對(duì)本問題有一定的適用性。對(duì)于支持向量機(jī)回歸模

3、型,將其與BP神經(jīng)網(wǎng)絡(luò)進(jìn)行對(duì)比,發(fā)現(xiàn)其性能明顯優(yōu)于BP神經(jīng)網(wǎng)絡(luò)。針對(duì)問題四,分析找出對(duì)轉(zhuǎn)爐壽命影響較大的因素為噴補(bǔ)料量、煉鋼時(shí)間和渣中含鐵量,并將設(shè)計(jì)延長爐齡方案時(shí)重點(diǎn)放在這三個(gè)因素。關(guān)鍵詞:轉(zhuǎn)爐爐齡 灰度預(yù)測(cè) 多元線性型回歸 支持向量機(jī)目錄一、問題重述1.1問題背景自1952和1953年氧氣頂吹轉(zhuǎn)爐煉鋼在奧地利的鋼鐵股份公司林茨鋼廠與砂冶公司多納維茨鋼廠先后建成投產(chǎn)。轉(zhuǎn)爐煉鋼以其生產(chǎn)率高、品種多、質(zhì)量好、熱效率高、原材料適應(yīng)性好、消耗低、成本低、基建投資少、建設(shè)速度快等優(yōu)點(diǎn),被國內(nèi)外鋼鐵冶煉行業(yè)廣泛采用,成為現(xiàn)代煉鋼的主要方法之一。轉(zhuǎn)爐爐齡是煉鋼車間的一項(xiàng)綜合性技術(shù)經(jīng)濟(jì)指標(biāo)。爐齡的離低直接影

4、響轉(zhuǎn)爐鋼產(chǎn)及耐火材料消耗和成本等指標(biāo)。因此,爐齡的提高對(duì)于技經(jīng)指標(biāo)的改善和煉鋼成本的降低具有十分重要的意義2。1.2問題的提出某鋼鐵公司煉鋼轉(zhuǎn)爐的爐齡按30天爐/天煉鋼規(guī)模,大約一個(gè)月就需等爐一次進(jìn)行檢修。為了減少消耗,廠家通過實(shí)際測(cè)定,得到下表所示的數(shù)據(jù),其中x1為噴補(bǔ)料量、x2為吹爐時(shí)間、x3為煉鋼時(shí)間、x4為鋼水中含錳量、x5為渣中含鐵量、x6為作業(yè)率、目標(biāo)變量 y 為爐齡(煉鋼爐次/爐)。要求完成如下四問:問題1:由于某種原因,造成個(gè)別數(shù)據(jù)缺失,試對(duì)這些缺失數(shù)據(jù)(表中用表示)進(jìn)行補(bǔ)全。問題2:試根據(jù)附表數(shù)據(jù)建立爐齡的預(yù)測(cè)模型。問題3:采用適當(dāng)?shù)闹笜?biāo)和方法對(duì)第2問建立的模型,和第1問修正

5、數(shù)據(jù)之后的改進(jìn)模型進(jìn)行可靠性分析,說明模型對(duì)實(shí)際問題的適用性。問題4:為鋼鐵公司提出延長爐齡的方案。二、問題的分析此問題屬于多元回歸問題?;貧w問題是建立因變量 Y 與自變量 X 之間關(guān)系的模型。我們需要利用數(shù)據(jù)統(tǒng)計(jì)原理,對(duì)大量統(tǒng)計(jì)數(shù)據(jù)進(jìn)行數(shù)學(xué)處理,并確定因變量與某些自變量的相關(guān)關(guān)系,建立一個(gè)相關(guān)性較好的回歸方程(函數(shù)表達(dá)式),并加以外推,用于預(yù)測(cè)今后的因變量的變化。根據(jù)因變量和自變量的個(gè)數(shù)分為:一元回歸分析和多元回歸分析。此問題屬于多元回歸。三、基本假設(shè)1. 所得數(shù)據(jù)可靠準(zhǔn)確,不包含人為誤差。2. 爐齡的影響因素只有噴補(bǔ)料量、吹爐時(shí)間、煉鋼時(shí)間、鋼水中含錳量、渣中含鐵量、作業(yè)率六個(gè)因素。四、符

6、號(hào)說明符號(hào)說明單位x1噴補(bǔ)料量x2吹爐時(shí)間x3煉鋼時(shí)間x4鋼水中含錳量x5渣中含鐵量x6作業(yè)率y爐齡煉鋼爐次/爐(k)序列的級(jí)比bj信息貢獻(xiàn)率Q殘差平方和K(xi,xj)= (xi) (xj) 核函數(shù)表1:符號(hào)說明五、問題一的模型建立與求解5.1問題的分析問題一首先要求我們根據(jù)一項(xiàng)已知的數(shù)據(jù),對(duì)個(gè)別數(shù)據(jù)缺失,試這些缺失數(shù)據(jù)(表中用表示)進(jìn)行補(bǔ)全。由附表可以看出,給出的數(shù)據(jù)是一些離散的,規(guī)律性不強(qiáng)的數(shù)據(jù),此時(shí)我們采用灰色預(yù)測(cè)的方法對(duì)其進(jìn)行補(bǔ)全。灰色系統(tǒng)理論認(rèn)為,盡管客觀表象復(fù)雜,但總是有整體功能的,因此必然蘊(yùn)含某種內(nèi)在規(guī)律。關(guān)鍵在于如何選擇適當(dāng)?shù)姆绞饺ネ诰蚝屠盟?。灰色系統(tǒng)是通過對(duì)原始數(shù)據(jù)的整理

7、來尋求其變化規(guī)律的,這是一種就數(shù)據(jù)尋求數(shù)據(jù)的現(xiàn)實(shí)規(guī)律的途徑,即為灰色序列的生成。一切灰色序列都能通過某種生成弱化其隨機(jī)性,顯現(xiàn)其規(guī)律性。灰色預(yù)測(cè)的主要特點(diǎn)是模型使用的不是原始數(shù)據(jù)序列,而是生成的數(shù)據(jù)序列。其核心體系是灰色模型(Grey Model,簡稱GM),即對(duì)原始數(shù)據(jù)作累加生成(或其它方法生成)得到近似的指數(shù)規(guī)律再進(jìn)行建模的方法。5.2 模型的建立與求解5.2.1數(shù)據(jù)的檢驗(yàn)與處理首先,為了保證建模方法的可行性,需要對(duì)已知數(shù)據(jù)列作必要的檢驗(yàn)處理。設(shè)參考數(shù)據(jù)為x(0)=(x(0)(1),x(0)(2),x(0)(n),計(jì)算序列的級(jí)比:k=x0k-1x0k k=2,3,n (5.1)如果所有的級(jí)

8、比(k)都落在可容覆蓋=(e-2n+1,e2n+2)內(nèi),則序列x(0)可以作為模型GM(1,1)的數(shù)據(jù)進(jìn)行灰色預(yù)測(cè)。如果所有的級(jí)比(k)都落在可容覆蓋=(e-2n+1,e2n+2)內(nèi),則序列x(0)可以作為模型GM(1,1)的數(shù)據(jù)進(jìn)行灰色預(yù)測(cè)。否則,需要對(duì)序列x(0)做必要的變換處理,使其落入可容覆蓋內(nèi)。即取適當(dāng)?shù)某?shù)c,作平移變換:y(0)(k)=x(0)(k)+c,k=1,2,n (5.2)使序列y(0)=(y(0)(1),y(0)(2),y(0)(n)的級(jí)比:yk=y0k-1y0k k=2,3,n (5.3)5.2.2建立模型1.已知參考數(shù)據(jù)列x(0)=(x(0)(1),x(0)(2),

9、x(0)(n) (5.4)進(jìn)行1次累加生成序列:x(1)=(x(1)(1),x(1)(2),x(1)(n)=(x(0)(1),x(0)(1)+x(0)(2),x(0)(1)+x(0)(n)(5.5)其中x(1)(k)=i=1kx(0)(i)(k=1,2,n)。x(1)的均值生成序列:z(1)=(z(1)(2),z(1)(3),z(1)(n)(5.6)其中z(1)(k)=0.5x(1)(k)+0.5x(1)(k-1),k=2,3,n。2.建立灰微分方程x0k+az1k=b k=2,3,n(5.7)相應(yīng)的白化微分方程為:dx(1)dt+ax(1)(t)=b (5.8)記u=a,bT,Y=x(0)(

10、2),x(0)(3),x(0)(n)T,B=-z(1)(2)1-z(1)(3)1-z(1)(n)1,則由最小二乘法,求得使J(u)=(Y-Bu)T(Y-Bu)達(dá)到最小值的u的估計(jì)值u=a,bT=(BTB)-1BTY于是求解方程(5-8)得:x1k+1=x01-bae-ak+ba k=0,1,n-1, (5.9)5.2.3 模型求解1.對(duì)于x4(鋼水中含錳量),先選取前19個(gè)數(shù)據(jù)對(duì)第20個(gè)數(shù)據(jù)進(jìn)行的級(jí)比圖1:殘差(k),發(fā)現(xiàn)不滿足級(jí)比要求。多次測(cè)試后,選擇:x(0)=(50,44,46,46,48,45,42,40)此時(shí)級(jí)比滿足要求。由此補(bǔ)全所缺失的值:502.對(duì)于x6(作業(yè)率),先選取前19個(gè)

11、數(shù)據(jù)對(duì)第27個(gè)數(shù)據(jù)進(jìn)行的級(jí)比(k),發(fā)現(xiàn)不滿足級(jí)比要求。多次測(cè)試后,選擇: x(0)=(35,33.3,37.9,42.9)圖2:殘差此時(shí)級(jí)比、殘差滿足要求。由此補(bǔ)全所缺失的值:37.777.3.對(duì)于 y(爐齡),先選取前25各數(shù)據(jù)對(duì)第27個(gè)數(shù)據(jù)進(jìn)行的級(jí)比(k),發(fā)現(xiàn)不滿足級(jí)比要求。多次測(cè)試后,選擇x(0)=(832,1076,1376,914 )此時(shí)級(jí)比滿足要求。由此補(bǔ)全所缺失的值:1366.5。圖3:殘差補(bǔ)全后的數(shù)據(jù)如下:序號(hào)x1x2x3x4x5x6y200.215520.240.25016.841.71098280.243617.737.24516.237.771105300.19717

12、.335.94613.857.41366.5表2:應(yīng)補(bǔ)全的數(shù)據(jù)六、問題二的模型建立與求解6.1問題的分析問題二要求根據(jù)附表數(shù)據(jù)建立爐齡的預(yù)測(cè)模型。由表中數(shù)據(jù)可以看出,我們需要找出多個(gè)變量間是否相關(guān)、相關(guān)方向與強(qiáng)度,并建立數(shù)學(xué)模型以便觀察特定變量。對(duì)此我們采用回歸分析的方法。回歸分析(Regression Analysis)是一種統(tǒng)計(jì)學(xué)上分析數(shù)據(jù)的方法,回歸分析是建立因變量Y(或稱依變量,反因變量)與自變量X(或稱獨(dú)變量,解釋變量)之間關(guān)系的模型。在建立模型前,由于自變量過多,可先對(duì)自變量進(jìn)行主成分分析。然后可先建立多元線性回歸模型來觀察。6.2 模型的建立與求解6.2.1數(shù)據(jù)的處理主成分分析的

13、主要目的是希望用較少的變量去解釋原來資料中的大部分變異,將我們手中許多相關(guān)性很高的變量轉(zhuǎn)化成彼此相互獨(dú)立或不相關(guān)的變量。通常是選出比原始變量個(gè)數(shù)少,能解釋大部分資料中的變異的幾個(gè)新變量,即所謂主成分,并用以解釋資料的綜合性指標(biāo)。由此可見,主成分分析實(shí)際上是一種降維方法。1.主成分分析法的步驟如下(1)對(duì)原始數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理假設(shè)進(jìn)行主成分分析的指標(biāo)變量有m個(gè),分別為x1,x2,xm,共有n個(gè)評(píng)價(jià)對(duì)象,第i個(gè)評(píng)價(jià)對(duì)象的第j個(gè)指標(biāo)的取值為aij。將各指標(biāo)值aij轉(zhuǎn)換成標(biāo)準(zhǔn)化指標(biāo)值aij,aij=aij-jsj (i=1,2,n;j=1,2,m)(6.1)其中j=1ni=1naij,sj=1n-1i

14、=1n(aij-j)2,(j=1,2,m),即j,sj為第j個(gè)指標(biāo)的樣本均值和樣本標(biāo)準(zhǔn)差。對(duì)應(yīng)地有,xj=xj-jsj (j=1,2,m) (6.2)(2)計(jì)算相關(guān)系數(shù)矩陣R相關(guān)系數(shù)矩陣R=(rij)m×mrij=k=1nakiakjn-1 ,(i,j=1,2,m),(6.3)式中rii=1,rij=rji,rij是第i個(gè)指標(biāo)與第j個(gè)指標(biāo)的相關(guān)系數(shù)。(3)計(jì)算特征值和特征向量計(jì)算相關(guān)系數(shù)矩陣R的特征值12m0,及對(duì)應(yīng)的特征向量u1,u2, ,um,其中uj=u1j,u2j,umjT,由特征向量組成m個(gè)新的指標(biāo)變量y1=u11x1+u21x2+um1xmy2=u12x1+u22x2+u

15、m2xmym=u1mx1+u2mx2+ummxm式中y1是第1主成分,y2是第2主成分,ym是第m主成分。(4)選擇p(pm)個(gè)主成分,計(jì)算綜合評(píng)價(jià)值)計(jì)算特征值j(j=1,2,m)的信息貢獻(xiàn)率和累積貢獻(xiàn)率。稱bj=jk=1mk (j=1,2,m)(6.4)為主成分yj的信息貢獻(xiàn)率,p=k=1pkk=1mk (6.5)為主成分y1,y2,yp的累積貢獻(xiàn)率,當(dāng)p接近于1(一般取p=0.85,0.90,0.95)時(shí),則選擇前p個(gè)指標(biāo)變量y1,y2,yp作為p個(gè)主成分,代替原來m個(gè)指標(biāo)變量,從而可對(duì)p個(gè)主成分進(jìn)行綜合分析。)計(jì)算綜合得分Z=j=1pbjyj (6.6)其中bj為第j個(gè)主成分的信息貢獻(xiàn)

16、率,根據(jù)綜合得分值就可進(jìn)行評(píng)價(jià)。2.主成分分析法的結(jié)果分析如下:圖4:各成分貢獻(xiàn)率由結(jié)果可知,x1(噴補(bǔ)料量)、x2(吹爐時(shí)間)、x3(煉鋼時(shí)間)、x4(鋼水中含錳量)、x5(渣中含鐵量)和x6(作業(yè)率)的貢獻(xiàn)率分別為30.3143,25.7442,19.7510,14.1698,7.6058, 2.4148。因此前五個(gè)主成分的貢獻(xiàn)率已達(dá)97.5852%,實(shí)際應(yīng)用中可只取前五個(gè)成分。6.2.2建立模型1.多元線性回歸預(yù)測(cè)模型(1)建立的模型為&y=0+1x1+mxm+,&N(0,2), (6.1)式中0,1,m,2都是與x1,x2,xm無關(guān)的未知參數(shù),其中0,1,m稱為回歸系數(shù)

17、?,F(xiàn)得到n個(gè)獨(dú)立觀測(cè)數(shù)據(jù)bi,ai1,aim,其中bi為y的觀察值,ai1,aim分別為的觀察值,i=1,n,n>m,由(7.1)得&bi=0+1ai1+maim+i,&iN(0,2),i=1,n. (6.2)記:X=1a11a1m1an1anmY=b1bn (6.3)=1,nT=0,1,mT(6.1)即可表示為&Y=X+,&N(0,2En), (6.4)其中En為n階單位矩陣。(2)參數(shù)估計(jì)模型(6.1)中的參數(shù)0,1,m用最小二乘法估計(jì),即應(yīng)選取估計(jì)值j,使當(dāng)j=j,j=0,1,m時(shí),誤差平方和Q=i=1ni2=i=1n(bi-bi)2=i=1n(bi

18、-0-1ai1-maim)2 (6.5)達(dá)到最小。為此,令:Qj=0,j=0,1,2,n,&Q0=-2i=1n(bi-0-1ai1-maim)=0,&Qj=-2i=1n(bi-0-1ai1-maim)aij=0,j=1,2,m. (6.6)經(jīng)整理化為以下正規(guī)方程組:&0n+1i=1nai1+2i=1nai2+mi=1naim=i=1nbi,&0i=1nai1+1i=1nai12+2i=1nai1ai2+mi=1nai1aim=i=1nai1bi,& &0i=1naim+1i=1naimai1+2i=1naimai2+mi=1naim2=i=1na

19、imbi, (6.7)正規(guī)方程組的矩陣形式為XTX=XTY (6.8)當(dāng)矩陣X列滿秩時(shí),XTX為可逆方陣,式(7.8)的解為=(XTX)-1XTY. (6.9)將代回原模型得到y(tǒng)的估計(jì)值y=0+1x1+mxm (6.10)而這組數(shù)據(jù)的擬合值為bi=0+1ai1+maim(i=1,n),記Y=X=b1,bnT,擬合誤差e=Y-Y稱為殘差,可作為隨機(jī)誤差的估計(jì), Q=i=1nei2=i=1n(bi-bi)2 (6.11)稱Q為殘差平方和。(3)模型求解通過計(jì)算(MATLAB程序參考了文獻(xiàn)7),得到:y =3527.1+1005.8*x1-24.335*x2-58.476x3-0.x4-6.7537

20、x5+0.5902x6。得到真實(shí)值和擬合值的結(jié)果如圖:圖5:真實(shí)值和擬合值結(jié)果殘差的置信區(qū)間如下圖所示:圖6:殘差的置信區(qū)間復(fù)相關(guān)系數(shù)R為0.6相關(guān)關(guān)系不成立。同時(shí),系數(shù)95置信區(qū)間bint包含零點(diǎn),可認(rèn)為在95置信度下,相應(yīng)變量對(duì)y影響不顯著,尋找異常點(diǎn),考慮改進(jìn)模型。圖7:去除異常點(diǎn)發(fā)現(xiàn)3個(gè)異常點(diǎn): 10、12、29。從原始數(shù)據(jù)中將其剔除后,重新做多元線性回歸,擬合結(jié)果如圖:圖8:去除異常點(diǎn),真實(shí)值和擬合值結(jié)果此時(shí)計(jì)算得:R = 0.803,相關(guān)關(guān)系成立。同時(shí)F值有了較大的提升。此時(shí),得到y(tǒng)=0+1x1+6x6+,中的值為:2387.0891,1508.4431,11.9415,-42.6

21、046,1.9757,-25.5838,0.4669。同時(shí)6為0.4,驗(yàn)證了主成分分析的結(jié)果。除此之外,我們還建立了支持向量機(jī)的回歸預(yù)測(cè)模型,下面介紹如下。2.支持向量機(jī)的回歸預(yù)測(cè)模型3,4,8,9支持向量機(jī)(support vector machines,SVM)是一種基于結(jié)構(gòu)風(fēng)險(xiǎn)最小化原理 的機(jī)器學(xué)習(xí)技術(shù),能較好地解決小樣本、非線性、高維數(shù)和局部極小點(diǎn)等問題5。(1)模型建立設(shè)含有i 個(gè)數(shù)據(jù)的集合為 (xi,xj)| i=1,2l ,其中xi Rd 是第i個(gè)訓(xùn)練樣本的輸入列向量,xi=x1x2, xi T, yiR為對(duì)應(yīng)的輸出值。 設(shè)在高維特征空間中建立的線性回歸函數(shù)為 f(x)= xi+

22、b。其中,(x)為非線性映射函數(shù),表示權(quán)重,b表示偏差。 引入松弛因子 i , *i ,原問題轉(zhuǎn)化為:引入松弛因子 i , *i ,原問題轉(zhuǎn)化為:min122+Ci=1l(i+*i)s.t.&yi-w(xi)-b+i,&(xi)-yi+i, i=1,2li0,i*0 (6.12)式中: 表示不敏感損失系數(shù);C為懲罰因子,C越大表 示對(duì)訓(xùn)練誤差大于的樣本懲罰越大, 規(guī)定了回歸函數(shù)的誤差要求,越小表示回歸函數(shù)的誤差越小。 上述模型對(duì)應(yīng)的對(duì)偶形式:max -12i=1lj=1l(i-*i)(j-*i)K(xi,xj)-j=1l(i+*i)+i=1l(i+*i)yis.t.&

23、j=1li-*i=0,& 0iC0iiC (6.13)其中: K(xi,xj)= (xi) (xj) 為核函數(shù),本文選取應(yīng)用廣泛、 精度較高的RBF核函數(shù),其表達(dá)式為K(xi,xj)=exp(-|xi-xj|22) (6.14)通過(3)得最優(yōu)解=12l,*=*1*2*l,并根據(jù)此求出權(quán)重*和b*,最后得出支持向量機(jī)得回歸函數(shù)f(x)=w*(x)+b*=i=1l(-*)(xi)(x)+b*=i=1l(-*)K(xi,x)+b*(6.15)(2)模型求解先將附表中的數(shù)據(jù)去除缺失行,利用余下的數(shù)據(jù)建立回歸模型。通過多次計(jì)算及參數(shù)選擇(MATLAB程序參考了文獻(xiàn)5-6),得出計(jì)算過程中的的最

24、優(yōu)訓(xùn)練集和測(cè)試集樣本的預(yù)測(cè)仿真效果見下圖。圖9:訓(xùn)練集預(yù)測(cè)結(jié)果對(duì)比圖10:測(cè)試集預(yù)測(cè)結(jié)果對(duì)比從兩圖可以看出,訓(xùn)練集和測(cè)試集的均方誤差分別為0.和 0.,決 定 系 數(shù) 分 別 達(dá) 到 0.99981 和 0.92449。這表明利用六個(gè)自變量和一個(gè)因變量所建立的SVR 回歸模型具有非常好的泛化能力。此時(shí)選擇的訓(xùn)練集為27個(gè),測(cè)試集為3個(gè)。七、問題三的求解7.1問題的分析問題三有以下兩個(gè)要求:a. 采用適當(dāng)?shù)闹笜?biāo)和方法對(duì)第2問建立的模型進(jìn)行評(píng)價(jià)和分析;b. 對(duì)利用第1問修正數(shù)據(jù)之后的改進(jìn)模型進(jìn)行可靠性分析,說明模型對(duì)實(shí)際問題的適用性。7.2 問題的求解7.2.1 多元線性回歸預(yù)測(cè)模型根據(jù)問題1,補(bǔ)

25、全后的數(shù)據(jù)見附表,利用補(bǔ)全后的數(shù)據(jù)進(jìn)行回歸分析,步驟同6.2.2。此時(shí),得到y(tǒng)=0+1x1+6x6+,中的值為:2458.792,1647.034,40.609,-56.875,2.282,-31.774,1.086。圖11:真實(shí)值和擬合值結(jié)果回歸模型的可靠性分析主要考慮其預(yù)測(cè)的殘差,由其原理可知,模型預(yù)測(cè)殘差的分布越?jīng)]有趨勢(shì),就表示回歸的結(jié)果越是可靠。圖12:殘差分布圖由殘差的分布圖可知,每個(gè)點(diǎn)代表一個(gè)殘差,在途中可以看到殘差點(diǎn)的分布是非常分散的。所以該模型的可靠性具有一定的顯著性,對(duì)本問題有一定的適用性。7.2.2 支持向量機(jī)的回歸預(yù)測(cè)模型為了對(duì)比SVR 回歸模型的性能,這里將之與BP神經(jīng)

26、網(wǎng)絡(luò)對(duì)比。與圖1和圖2對(duì)應(yīng)的訓(xùn)練集和測(cè)試集相同,建立的BP神經(jīng)網(wǎng)絡(luò)6對(duì)測(cè)試集的預(yù)測(cè)結(jié)果如圖所示:圖13:BP神經(jīng)網(wǎng)絡(luò)測(cè)試集預(yù)測(cè)結(jié)果對(duì)比不難發(fā)現(xiàn),SVR 回歸模型的性能要明顯優(yōu)于BP神經(jīng)網(wǎng)絡(luò)。八、問題四的求解8.1問題的分析問題四要求為鋼鐵公司提出延長爐齡的方案。對(duì)于此問題我們需要分析六個(gè)自變量中哪個(gè)對(duì)因變量的影響更大。8.2 問題的求解根據(jù)問題作以下考慮:自變量變動(dòng)一個(gè)單位,因變量變動(dòng)多少個(gè)單位。單從此方面來說,如果系數(shù)很小,比如0.00001這種,我們說雖然具有統(tǒng)計(jì)上的顯著性,但是沒有經(jīng)濟(jì)的顯著性。由本文“六、問題二的模型建立與求解”知,x1,x2,x3,x4,x5,x6的系數(shù)分別為1508

27、.4431,11.9415,-42.6046,1.9757,-25.5838,0.4669??芍獂1,x3,x5對(duì)爐齡影響較大。據(jù)此建議鋼鐵公司設(shè)計(jì)延長爐齡方案時(shí)應(yīng)該把重點(diǎn)放在關(guān)注噴補(bǔ)料量、煉鋼時(shí)間和渣中含鐵量三方面提出改進(jìn)措施。九、參考文獻(xiàn)1劉蘇杭.提高臥式轉(zhuǎn)爐爐齡的方法和措施探究J.湖北農(nóng)機(jī)化,2018(05):52.2文灝,區(qū)勇銘.轉(zhuǎn)爐爐齡影響因素的探討J.南方鋼鐵,1996(04):13-15.3薛磊, 吳煒.一種基于支持向量回歸的多層原油分層產(chǎn)能貢獻(xiàn)預(yù)測(cè)模型J.石油化工高等學(xué)校學(xué)報(bào), 2006, 19 (4) :88-92. 4徐飛, 徐衛(wèi)亞.基于支持向量機(jī)-馬爾可夫鏈的位移時(shí)序預(yù)測(cè)

28、J.巖土力學(xué), 2010, 31 (3) :944-948.5 蔡煜東.遺傳程序設(shè)計(jì)用于工業(yè)調(diào)優(yōu)煉鋼轉(zhuǎn)爐爐齡預(yù)測(cè)J.自動(dòng) 化學(xué)報(bào),1997,23(1):51-546 7司守奎, 孫璽菁. 數(shù)學(xué)建模算法與應(yīng)用M. 2011.8陳劍勇, 蘇浩益.結(jié)合支持向量機(jī)和馬爾可夫鏈算法的中長期電力負(fù)荷預(yù)測(cè)模型J.南方電網(wǎng)技術(shù), 2012, 6 (1) :54-58. 9李丹玲,陳平雁,周鳳麒.基于線性-支持向量回歸機(jī)的異常數(shù)據(jù)檢測(cè)J.數(shù)理統(tǒng)計(jì)與管理,2011,30(01):59-63.附錄: 1、附表:序號(hào)x1x2x3x4x5x6y10.292218.541.4581883.3103020.267218.4

29、41511891.7100630.268517.738.65217.378.9100040.183518.941.81812.847.270250.23481839.45117.457.4108760.138618.940.53912.822.590070.208318.339.86417.152.670880.41818.8416416.426.7122390.10318.439.22012.335803100.489319.341.44919.131.3715110.205819404018.841.2784120.092517.938.75014.366.7535130.18541940

30、.8442128.6949140.196318.137.24615.3631012150.100818.2374616.833.9716160.270218.939.54820.231.3858170.146519.138.64517.828.1826180.13531938.64216.739.71015190.224418.837.74017.449861200.215520.240.24616.841.71098210.031620.941.24817.452.6580220.049120.340.65619.735573230.148719.439.54218.333.3832240.

31、244518.236.64115.237.91076250.222218.4374013.742.91376260.129818.437.24517.244.3914270.2318.437.14722.921.6861280.243617.737.24516.237.7771105290.280418.337.54617.320.31013300.19717.335.94613.857.41366.5310.18416.235.34316.644.81039320.167917.134.64320.337.31502330.152417.6365114.236.711282、源碼(1)灰度預(yù)

32、測(cè)1. clc,clear  2. x0=load('mydatax.txt'); %注意這里為列向量  3. n=length(x0);  4. lamda=x0(1:n-1)./x0(2:n)  %計(jì)算級(jí)比  5. range=minmax(lamda')  %計(jì)算級(jí)比的范圍  6. x1=cumsum(x0);  %累加運(yùn)算  7. B=-0.5*(x1(1:n-1)+x1(2

33、:n),ones(n-1,1);  8. Y=x0(2:n);  9. u=BY  %擬合參數(shù)u(1)=a,u(2)=b  10. x=dsolve('Dx+a*x=b','x(0)=x0'); %求微分方程的符號(hào)解  11. x=subs(x,'a','b','x0',u(1),u(2),x0(1); %代入估計(jì)參數(shù)值和初始值  12. yuce1=subs(x,'t

34、',0:n-1); %求已知數(shù)據(jù)的預(yù)測(cè)值  13. y=vpa(x,6)   %其中的6表示顯示6位數(shù)字  14. yuce=x0(1),diff(yuce1)  %差分運(yùn)算,還原數(shù)據(jù)  15. epsilon=x0'-yuce    %計(jì)算殘差  16. delta=abs(epsilon./x0')  %計(jì)算相對(duì)誤差  17. rho=1-(1-0.

35、5*u(1)/(1+0.5*u(1)*lamda'  %計(jì)算級(jí)比偏差值,u(1)=a  (2)主成分分析1. clc,clear  2. gj=load('mydatax.txt');   %把原始數(shù)據(jù)保存在純文本文件  3. gj=zscore(gj); %數(shù)據(jù)標(biāo)準(zhǔn)化  4. r=corrcoef(gj);  %計(jì)算相關(guān)系數(shù)矩陣  5. %下面利用相關(guān)系數(shù)矩陣進(jìn)行主成分分析,x的列為r的特征

36、向量,即主成分的系數(shù)  6. x,y,z=pcacov(r) %y為r的特征值,z為各個(gè)主成分的貢獻(xiàn)率  7. f=repmat(sign(sum(x),size(x,1),1); %構(gòu)造與x同維數(shù)的元素為±1的矩陣  8. x=x.*f %修改特征向量的正負(fù)號(hào),每個(gè)特征向量乘以所有分量和的符號(hào)函數(shù)值  9. num=6;  %num為選取的主成分的個(gè)數(shù)  10. df=gj*x(:,1:num);  %計(jì)算各個(gè)主成

37、分的得分  11. tf=df*z(1:num)/100; %計(jì)算綜合得分  12. stf,ind=sort(tf,'descend');  %把得分按照從高到低的次序排列  13. stf=stf', ind=ind'  14. bar(z)  15. title('各個(gè)主成分的貢獻(xiàn)率')  16. xlabel('各個(gè)主成分')  17. ylab

38、el('貢獻(xiàn)率');  (3)多元線性回歸1. clc, clear  2. x = load('reallx.txt');%提取x的觀察值  3. y = load('really.txt');%提取因變量y的觀察值  4. Y=nonzeros(y); %去掉y后面的0,并變成列向量  5. n=length(Y); %樣本點(diǎn)的個(gè)數(shù)  6. N 

39、= 1:n;%標(biāo)記樣本點(diǎn)  7. X=ones(n,1),x; %構(gòu)造多元線性回歸分析的數(shù)據(jù)矩陣X  8. beta,betaint,r,rint,st=regress(Y,X)  %計(jì)算回歸系數(shù)和統(tǒng)計(jì)量等,st的第2個(gè)分量就是F統(tǒng)計(jì)量,下面根據(jù)統(tǒng)計(jì)量的表達(dá)式重新計(jì)算的結(jié)果和這里是一樣的。  9. q=sum(r.2)   %計(jì)算殘差平方和  10. ybar=mean(Y)  %計(jì)算y的觀察值的平均值  

40、11. yhat=X*beta  %計(jì)算y的估計(jì)值  12. u=sum(yhat-ybar).2);   %計(jì)算回歸平方和  13. MM  = size(x);  14. m=MM(2);    %變量的個(gè)數(shù),擬合參數(shù)的個(gè)數(shù)為m+1  15. F=u/m/(q/(n-m-1);  %計(jì)算F統(tǒng)計(jì)量的值,自由度為樣本點(diǎn)的個(gè)數(shù)減擬合參數(shù)的個(gè)數(shù)  16. fw1

41、=finv(0.025,m,n-m-1); %計(jì)算上alpha/2分位數(shù)  17. fw2=finv(0.975,m,n-m-1); %計(jì)算上1-alpha/2分位數(shù)  18. c=diag(inv(X'*X)   %計(jì)算c(j,j)的值  19. t=beta./sqrt(c)/sqrt(q/(n-m-1);  %計(jì)算t統(tǒng)計(jì)量的值  20. tfw=tinv(0.975,n-m-1)   %計(jì)算t分布的上a

42、lpha/2分位數(shù)  21. save xydata Y x  %把Y和x123保存到mat文件xydata中,供問題(3)的二次模型使用  22. PY = beta(1)+beta(2)*x(:,1)+beta(3)*x(:,2)+beta(4)*x(:,3)+beta(5)*x(:,4)+beta(6)*x(:,5)+beta(7)*x(:,6); %計(jì)算擬合值  23. % 二次模型  24. % load&

43、#160;xydata  25. % rstool(x,Y)  26. % 模型相關(guān)數(shù)據(jù)  27. R = sqrt(u/(u+q);%復(fù)相關(guān)系數(shù)  28. figure(1)  29. plot(N,rint(:,1),N,rint(:,2);  30. xlabel('殘差的置信區(qū)間')  31. figure(2)  32. % rcoplot(r,rint);&#

44、160; 33. plot(r,'o')  34. legend('殘差值')  35. xlabel('樣本編號(hào)')  36. % 擬合值真實(shí)值對(duì)比  37. figure(3)  38. plot(N,y,'r-*',N,PY,'b:o')  39. legend('真實(shí)值','擬合值')  40. xlabel('

45、;樣本編號(hào)')  41. ylabel('爐齡')  (4)支持向量機(jī)的回歸1. % I. 清空環(huán)境變量  2. clc  3. clear all  4. % II. 導(dǎo)入數(shù)據(jù)  5. %load concrete_data.mat  6. attributes = load('attributes2.txt');  

46、;7. strength = load('strength2.txt');  8. %  9. % 1. 隨機(jī)產(chǎn)生訓(xùn)練集和測(cè)試集  10. n = randperm(size(attributes,2);  11. %  12. % 2. 訓(xùn)練集  13. xl = input('輸入訓(xùn)練集的個(gè)數(shù)(小于30)');  14.

47、p_train = attributes(:,n(1:xl)'  15. t_train = strength(:,n(1:xl)'  16. %  17. % 3. 測(cè)試集  18. cs = xl+1;  19. p_test = attributes(:,n(cs:end)'  20. t_test = strength(:,n

48、(cs:end)'  21. % III. 數(shù)據(jù)歸一化  22. %  23. % 1. 訓(xùn)練集  24. pn_train,inputps = mapminmax(p_train');%歸一化(mapminmax)  25. pn_train = pn_train'  26. pn_test = mapminmax('apply',p_

49、test',inputps);  27. pn_test = pn_test'  28. %  29. % 2. 測(cè)試集  30. tn_train,outputps = mapminmax(t_train');  31. tn_train = tn_train'  32. tn_test = mapminmax('apply',

50、t_test',outputps);  33. tn_test = tn_test'  34. % IV. SVM模型創(chuàng)建/訓(xùn)練  35. %  36. %1. 尋找最佳c參數(shù)/g參數(shù)  37. %c,g = meshgrid(0:3:120,500:3:620);(-10:0.5:10,-10:0.5:10)  38. c,g = meshgrid(0:4:120,50

51、0:4:620);  39. m,n = size(c);  40. cg = zeros(m,n);  41. eps = 10(-4);  42. v = 5;  43. bestc = 0;  44. bestg = 0;  45. % bestc = 96.568;  46. %&

52、#160;bestg = 557.80999;  47. error = Inf;  48. for i = 1:m  49.     for j = 1:n  50.         cmd = '-v ',num2str(v),' 

53、-t 2',' -c ',num2str(2c(i,j),' -g ',num2str(2g(i,j) ),' -s 3 -p 0.1'  51.         cg(i,j) = svmtrain(tn_train,pn_train,cmd);  52.    

54、0;    if cg(i,j) < error  53.             error = cg(i,j);  54.             bestc = 2c(i,j); 

55、0;55.             bestg = 2g(i,j);  56.         end  57.         if abs(cg(i,j) - error) <= eps &

56、amp;& bestc > 2c(i,j)  58.             error = cg(i,j);  59.             bestc = 2c(i,j);  60.   &

57、#160;         bestg = 2g(i,j);  61.         end  62.     end  63. end  64. % bestc = 96  65. % bestg = 557  66. %  67. % 2. 創(chuàng)建/訓(xùn)練SVM    68. cmd = ' -t 2',' -c ',num2str(bestc),' -g ',

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論