第十章相關(guān)與回歸體育統(tǒng)計學(xué)_第1頁
第十章相關(guān)與回歸體育統(tǒng)計學(xué)_第2頁
第十章相關(guān)與回歸體育統(tǒng)計學(xué)_第3頁
第十章相關(guān)與回歸體育統(tǒng)計學(xué)_第4頁
第十章相關(guān)與回歸體育統(tǒng)計學(xué)_第5頁
已閱讀5頁,還剩50頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

第十章相關(guān)與回歸第一節(jié)直線相關(guān)及相關(guān)系數(shù)的顯著性檢驗一、變量之間的兩種關(guān)系(一)函數(shù)關(guān)系它反映著現(xiàn)象之間存在著嚴(yán)格的依存關(guān)系。在這種關(guān)系中,對于某一變量的每一個數(shù)值,都有另一變量的確定的值與之對應(yīng)。例如:圓面積對于圓半徑的依存關(guān)系可用一個確定的公式A=R2反映出來。函數(shù)關(guān)系是確定性的關(guān)系。這種變量的表現(xiàn),都是非隨機變量。(二)相關(guān)關(guān)系相關(guān)關(guān)系是對隨機變量而言的。這種關(guān)系的主要特征是:某一現(xiàn)象的標(biāo)志與另外的標(biāo)志之間存在著一定的依存關(guān)系,但它們不是確定的和嚴(yán)格依存的。在這種關(guān)系中,對于某項標(biāo)志的每一個數(shù)值,可以有另外標(biāo)志的若干個數(shù)值與之相適應(yīng),這延緩數(shù)值之間表現(xiàn)出一定的波動性,但又總是圍繞著它們的平均值遵循一定的規(guī)律而變動。例如:1.一般地,身高相同者,體重不一定相同;而身高不同者,體重卻有可能相同。對應(yīng)于同一身高的人們,其體重或大或小,不全相同,而是在所有這些體重的平均值周圍波動。2.速跑(單位:秒)與跳遠(單位:米)的關(guān)系一例:30米跑3.73.63.53.93.53.6跳遠5.305.555.655.105.255.50由表中看到,30米跑成績相同的人,跳遠成績并不相同。但人們知道,速度與跳遠的關(guān)系確實是很密切的,可是此時不能用一種確定的數(shù)學(xué)公式來反映這兩個變量間的相互關(guān)系。類似情形在體育中是大量存在的,如速度與撐桿跳高,體重與投擲項目的成績,等等。當(dāng)研究的兩個事物或現(xiàn)象之間,既存在著密切的數(shù)量關(guān)系,又不象函數(shù)關(guān)系那樣,能以一個變量的值精確地求出另一個變量的數(shù)值,這類變量之間的關(guān)系稱為相關(guān)關(guān)系,簡稱相關(guān)。函數(shù)關(guān)系與相關(guān)關(guān)系在一定條件下可以互相轉(zhuǎn)化。如:因為誤差的存在,函數(shù)關(guān)系在實際中常以相關(guān)關(guān)系表現(xiàn)出來。而當(dāng)人們對某些事物的規(guī)律了解得更深刻、更準(zhǔn)確時,相關(guān)關(guān)系也可以轉(zhuǎn)化為函數(shù)關(guān)系。二、相關(guān)系數(shù)的意義相關(guān)系數(shù)是表示兩個變量之間直線關(guān)系的密切程度和相關(guān)方向的一種統(tǒng)計指標(biāo),用符號r表示(總體間的相關(guān)系數(shù)用表示)。相關(guān)系數(shù)沒有單位。其取值范圍為-1≤r≤1即|r|≤1。當(dāng)變量之間的直線關(guān)系越密切,則|r|越接近于1;當(dāng)變量之間的直線關(guān)系越不密切,|r|越接近于0。(一)若兩個變量同時趨向同一方向變化,即當(dāng)X增加(或減少),Y相應(yīng)增加(或減少),則稱之為正相關(guān)。此時,0<r<1。若此時又有各點都在一條直線上,則稱為完全正相關(guān),r=1。圖10—1正相關(guān)(二)若兩個變量的變化方向相反,即當(dāng)X增加(或減少)時,Y卻減少(或增加),則稱為負(fù)相關(guān),此時-1<r<0。若此時各點都在一條直線上,則稱為完全負(fù)相關(guān),r=-1。(三)當(dāng)X與Y無關(guān)時,Y(或X)的值不受X(或Y)值變化的影響。此時r=0,稱為無相關(guān)或零相關(guān)。圖10—2負(fù)相關(guān)圖10-3零相關(guān)(r=0)的部分情形零相關(guān)可能是兩變量間確實沒有關(guān)系;也可能表明兩變量間不存在線性關(guān)系但有其他某種關(guān)系。另一種特例,雖然各點密集于一條直線,但呈水平或垂直散布,則仍為零相關(guān)。正r=1完全相關(guān)負(fù)r=-1線性相關(guān)正0<r<1相關(guān)關(guān)系非完全相關(guān)負(fù)-1<r<0曲線相關(guān)r=0非線性相關(guān)完全無關(guān)r=0三、相關(guān)系數(shù)的計算這里興介紹用積差法求相關(guān)系數(shù)。這是由原始數(shù)據(jù)計算相關(guān)系數(shù)的方法,讀者也可仿此法用簡化值計算。定義r====(10—1)式中:Lxx==為X的離均差平方和;Lyy==為y的離均差平方和;Lxy==為x、y的離均差積和。公式(10—1)的幾個式子等價,實際應(yīng)用進可根據(jù)具體情況選用任一個即可。但最好先將Lxx,Lyy,Lxy計算出來備用。例10—1測得某年級10名學(xué)生的引體向上和30秒俯臥撐成績?nèi)纾ū?0—1)中,計算二者的相關(guān)系數(shù)。表10—1本例相關(guān)系數(shù)計算表編號引體向上(X)30秒俯臥撐(Y)X2Y2X·Y1572549352611361216638106410080477494949510141001961406693681547111412119615485725493595625363010754925357090530902678解:(1)列相關(guān)系數(shù)計算表,如(表10—1)。(2)計算相關(guān)系數(shù):Lxx==530-=40Lyy==902-=92Lxy==678-=48∴r==≈0.791例10—2測知7名學(xué)生左手和右手的肌肉力量(千克)如(表10—2)中,求左、右手力量指標(biāo)的相關(guān)系數(shù)。表10—27名學(xué)生左、右手力量指標(biāo)相關(guān)系數(shù)計算表編號左手力量X右手力量YX2Y2XY113.814.2190.44201.64195.96214.214.9201.64222.01211.58312.114.0146.41196169.4413.015.4169237.16200.2514.616.0213.16256233.6617.418.1302.76327.61314.94715.917.2252.81295.84273.48101109.81476.221736.261599.16解:(1)列相關(guān)系數(shù)計算表,并求得=101,=109.8,=1476.22,=1736.26,=1599.16(2)計算相關(guān)系數(shù):Lxx==1476.22-≈18.9343Lyy==1736.26-≈13.9686Lxy==1599.16-≈14.9029∴r==≈0.916線性相關(guān)系數(shù)計算程序一、程序功能本程序能夠根據(jù)輸入的m人隨機變量(x1,x2,……,xm)的觀測值(xk1,xk2,……,xkm),k=1,2,……,n。求出這m個隨機變量兩兩間的線性相關(guān)系數(shù)。二、程序中使用的主要符號說明N:觀測數(shù)據(jù)的組數(shù);C:變量的個數(shù);R:線性相關(guān)系數(shù);W:“一”的個數(shù)(制表用虛線的長度)。三、程序所依據(jù)的理論計算公式四、程序名稱:Q0JXG5REMQ0JXG10INPUT“n,c,w------”;N,C,W20OPTIOBASE130DIMA(N,C),R(C,C),B(C),C(C),D(C,C)40FORI=1TON:FORJ=1TOC50READA(I,J):NEXTJ:NEXTI60FORK=1TOC70B(K)=0:C(K)=080NEXTK90FORI=1TOC:FORJ=1TON100B(I)=B(I)+A(J,I)110C(I)=C(I)+A(J,I)^2120NEXTJ:NEXTI130FORI=1TOC:FOR=K+1TOC140D(I,J)=0:R(I,J)=0150NEXTJ:NEXTI160FORK=1TOC:FORI=K+1TOC:FORJ=1TON170D(K,I)=D(K,I)+A(J,K)*A(J,I)180NEXTJ:NEXTI:NEXTK190FORK=1TOC:FORI=K+1TOC:FORJ=1TON200R(K,I)=(D(K,I)-B(I)*B(K)/N)/SQR((C(K)-B(K)^2/N)*(C(I)-B(I)^2/N))210NEXTJ:NEXTI:NEXTK220GOSUB300:PRINT230PRINTSPC(5)“R”SPC(5);240FORI=2TOC:PRINTI:SPC(10);250NEXTI:PRINT:GOSUB300260FORK=1TOC:PRINTSPC(5)K;270FORI=K+1TOC:PRINTTAB(12*(I-1);R(K,I);280NEXTI:PRINT;NEXTK290GOSUB300:GOTO320300FORI=0TOW:PRINT“-”310NEXTI:PRINT:RETURN320END五、例題試求出上例中的身高、足長、小腿長兩兩間的線性相關(guān)系數(shù)。解:在程序中使用DATA語句,按(xk1,xk2,xk3),k=1,2,……,10的方式輸入數(shù)據(jù)資料:330DATA21,33,140,20,32,133,20,30,130,19,29,131,21,32,137340DATA20,31,133,19,32,135,21,33,138,20,31,139,21,34,141RUNn,c,w------10,3,40R231.716354.6787372.8109613四、相關(guān)系數(shù)的顯著性檢驗(一)檢驗的基本原理根據(jù)隨機抽樣得到的樣本資料去計算相關(guān)系數(shù),與計算其他統(tǒng)計量一樣,存在著抽樣誤差的影響。在理論上講,若從不存在相關(guān)關(guān)系的總體(=0)中隨機抽樣并且沒有抽樣誤差,則應(yīng)有r=0。但實際中由于存在著抽樣誤差,所以常抽到r≠0的樣本。同理,r≠0也并不能說明有≠0。因此,不能簡單地由|r|的大小去對隨機變量x、y之間線性關(guān)系的密切程度作出判斷。實際上造成r與之差的原因有二:1.r≠0的樣本確實是從=0的總體中抽得,此時r與=0之差僅僅是由抽樣誤差所致,沒有本質(zhì)的差別;2.r≠0的樣本來自某個≠0的總體,此時顯然r與=0的差別是本質(zhì)性的。為了分清差別是由哪種原因造成的,必須要對r進行顯著檢驗。檢驗的無效假設(shè)為H0:=0(即總體中不存在相關(guān)關(guān)系)(1)若檢驗結(jié)果知P(H0)>,認(rèn)為r與=0的差別無顯著意義,即相關(guān)系數(shù)r無顯著性。此時,即使|r|值較大,也不能認(rèn)為隨機變量x、y是相關(guān)的。(2)若檢驗結(jié)果知P(H0)≤,拒絕H0,認(rèn)為r與=0的差別有顯著意義,即相關(guān)系數(shù)r顯著。此時,即使|r|值較小,也能認(rèn)為隨機變量x、y相關(guān)的。只有通過顯著性檢驗得知r顯著,才可根據(jù)|r|值的大小去說明變量x、y相互關(guān)系的密切程度??傊?,“|r|值較大”和“x、y相關(guān)”絕不是一回事,要加以注意?。ǘz驗方法1.檢驗檢驗統(tǒng)計量的公式tr=,其中相關(guān)系數(shù)的標(biāo)準(zhǔn)誤Sr=,在H0:=0時,有tr=(10—2)自由度n′=n-2。例10—3在例10.1中計算得到相關(guān)系數(shù)r=0.791,試檢驗r是否顯著。解:(1)無效假設(shè)H0:=0(2)計算tr值:tr===3.657(3)選取=0.05,進行雙側(cè)檢驗,自由度n′=n-2=10-2=8,查t值表(書后附表2)得t0.05(8)=0.306(4)結(jié)論:∵tr>t0.05(8)∴p<0.05,拒絕H0,認(rèn)為總體相關(guān)系數(shù)≠0,即r顯著。這說明r=0.791不象是由抽樣誤差造成的,而是來自≠0的總體之中。2.查表法為使檢驗簡便,統(tǒng)計學(xué)家根據(jù)t分布表求出r的5%和1%的臨界水平概率P值,表左邊第一列為自由度n′=n-2。計算出相關(guān)系數(shù)r并查出臨界值后,可作如下比較判斷:若|r|≥,則r顯著;若|r|<,則r不顯著。例10—4在例10.1中算得r=0.791,用雙側(cè)檢驗并取=0.05,n′=n-2=10-2=8,查表得知t0.05(8)=0.632。∵r=0.791>t0.05(8)=0.632∴相關(guān)系數(shù)r顯著。明顯用查表法要快捷得多,建議多采用此法。查表時要注意:是用單側(cè)檢驗,還是雙側(cè)檢驗決定于統(tǒng)計設(shè)計之時,而不是在算出r之后。學(xué)生氏T分布檢驗計算程序一、程序功能對于統(tǒng)計檢驗,在不知道其標(biāo)準(zhǔn)差的情況下,可以用T分布檢驗來檢驗正態(tài)分布總體的均值。應(yīng)用本程序時如按程序所問輸入(三種功能的)功能選擇、樣本個數(shù)、元素個數(shù)和每個元素值,則程序能自動計算出T值、自由度數(shù)及其T分布的右尾值(檢驗水平)。使用者將右尾值與檢驗的顯著性水平比較,則可得出檢驗的結(jié)果。二、程序中使用的主要符號說明T:WHICHHTPOTHESIS程序功能選擇(共三種);R(I):NRMBEROFELEMENTS元素數(shù);M:MALUEOFMEAN均值;ABS(A):T-MALUE所求的T值;B:DEGREESOFFREEDOM所求的自由度數(shù);X:RIGHTTAILVALUE 右尾值。三、程序所依據(jù)的主要理論計算公式學(xué)生氏T分布檢驗法。四、程序名稱:STUDENT′S-T.TES5REMSTUDENT′ST---TESTPROGRAM10PRINT“STUDENT′ST---TESTPROGRAM”20PRINT30DIMP(20,2),V(12)40DIMR(2),M(2),D(2)50PRINT“Test1:Mean=x”60PRINT“Test2:Mean=mean,Standard,deviation=Standarddeviation”70PRINT“Test3:Mean=mean,Standard,deviation<>Standarddeviation”80INPUT“whichhypothesis=” ;T90PRINT“whichhypothesis=”T100PRINT110FORI=1TOSGN(T-1)+1120V(I)=0130D(I)=0140PRINT“Sample”;I;“:”150INPUT“Numberofelements=”,U155R(I)=U160PRINT“Numberofelements=”;R(I)170FORJ=1TOR(I)180PRINT“elements”;J;182INPUTG185P(J,I)=G190PRINT“Elements”;J,P(J,I)200V(I)=V(I)+P(J,I)210D(I)=D(I)+P(J,I)^2220NEXTJ230M(I)=V(I)/R(I)240V(I)=(D(I)-V(I)^2/R(I)/(R(I)-1)255NEXTI260PRINT270IFT=2THEN340280IFT=3THEN380300INPUT“Valueofmean=”,M305PRINT“Valueofmean=”;M310A=(M(1)-M)*SQR(R(1)/V(1))320B=R(1)-1330GOTO420340A=(M(1)-M(2))/SQR(1/R(1)+1/R(2))350B=R(1)+R(2)-2360A=A/SQR(((R(1)-1)*V(1)+(R(2)-1)*V(2))/B)370GOTO420380A=(M(1)-M(2))/SQR(V(1)/R(1)+V(2)/R(2))390B=(V(1)/R(1)+V(2)/R(2))^2400B=B/((V(1)/R(1)^2(R(1)+V(2)/R(2))^2/(R(2)+1))-2)410B=INT(B+.5)420PRINT430PRITN“T—Value=”;ABS(A)440PRITN“Degreesoffreedom=”;B450T=ABS(A)460D=B470X=1480Y=1490T=T^2500IFT<1THEN550510S=Y520R=D530Z=T540GOTO580550S=D560R=Y570Z=1/T580J=2/(9*S)590K=2/(9*R)600L=ABS((1-K)*Z^1/3)-1+J)/SQR(K*Z^(2/3)+J)610IFR<4THEN650620X=.5/(1+L*(.196854+L*(.115194+L*(.000344+L*.019527))))^4630X=INT(X*10000+.5)/10000640GOTO620650L=L*(1+.08+L^4/R^3)660GOTO620670IFT>=1THEN690680X=1-X690PRINT“Righttailvalue=”;X700END五、例題(一)設(shè)某運動員的200米跑的成績服從正態(tài)分布。其中抽測6次的成績(單位:秒)如下:24.7,23.5,22.2,23.0,24.4,22.6。能否認(rèn)為該運動員200米跑的成績?yōu)?3.2秒?(取顯著性水平=0.05)解:無效假設(shè)H0:=23.2秒RUNSTUDENT′ST---TESTPROGRAMTest1:Mean=xTest2:Mean=Mean,Standarddeviation=StandarddeviationTest3:Mean=Mean,Standarddeviation<>StandarddeviationWhichhypothesis=1Sample1:Numberofelements=6Elements124.7Elements223.5Elements322.2Elements423Elements524.4Elements622.6Valueofmean=23.2T---Value=.492869Degreesoffreedom=5Righttailvalue=.6584∵右尾值=0.6584大于值∴=23.2秒的假設(shè)未被否定。即可用23.2秒作為該運動員200米跑成績的代表。(二)采用兩種試驗方法進行同一種試驗,分別獲得試驗數(shù)據(jù)如下:A1613121510nA=5B879657nB=5試用T檢驗法檢驗這兩種方法獲得的試驗數(shù)據(jù)是否有顯著性差異?(總體的未知,=0.05)解:無效假設(shè)H0:=RUNSTUDENT′ST---TESTPROGRAMTest1:Mean=xTest2:Mean=Mean,Standarddeviation=StandarddeviationTest3:Mean=Mean,Standarddeviation<>StandarddeviationWhichhypothesis=2Sample1:Numberofelements=5Elements116Elements213Elements312Elements415Elements510Sample2:Numberofelements=6Elements18Elements27Elements39Elements46Elements55Elements67T--Value=5.3634Degreesoffreedom=9Righttailvalue=.003∵右尾值=0.003小于值∴=的假設(shè)未被否定。即這兩種實驗方法獲得的試驗數(shù)據(jù)有顯著性差異。(三)下列資料為兩家電影公司的體育紀(jì)錄影片放映時間:公司名稱時間(分)公司Ⅰ102869810992公司Ⅱ81165971349287114試檢驗公司Ⅰ與公司Ⅱ的體育紀(jì)錄影片的平均放映時間是否有顯著性差異?(兩總體的方差不等,=0.05)解:無效假設(shè)H0:Ⅰ=ⅡRUNSTUDENT′ST---TESTPROGRAMTest1:Mean=xTest2:Mean=Mean,Standarddeviation=StandarddeviationTest3:Mean=Mean,Standarddeviation<>StandarddeviationWhichhypothesis=3Sample1:Numberofelements=5Elements1102Elements286Elements398Elements4109Elements592Sample2:Numberofelements=7Elements181Elements2165Elements397Elements4134Elements592Elements687Elements7114∵右尾值=0.3232小于值∴Ⅰ=Ⅱ的假設(shè)未被否定。即這兩家電影公司的體育紀(jì)錄影片的平均放映時間沒有顯著性差異。第二節(jié)一元線性回歸分析一、一元線性回歸的意義經(jīng)過相關(guān)分析后,確認(rèn)為兩個變量之間具有較密切的直線相關(guān)關(guān)系時,期望著能找到兩個變量之間存在的數(shù)量關(guān)系,即找到一個最適宜的數(shù)學(xué)表達式,用函數(shù)關(guān)系來描述兩變量的關(guān)系。這就要借助于回歸分析的方法。(一)回歸分析方法是一種處理變量的相關(guān)關(guān)系的方法它主要是把兩個或兩個以上變量之間的變動關(guān)系,加以模型化,求現(xiàn)回歸方程來,以便進行估計推算。兩個變量之間的回歸分析稱為一元回歸分析,三個以上變量之間的回歸分析稱為多元回歸分析?!盎貧w”一詞所表示的實質(zhì)意義是:任何變異的東西總有趨向平穩(wěn)、一般的勢頭。對于一組樣本觀察數(shù)據(jù)(x1,y1),(x2,y2),…………(xn,yn)來說,總有一個穩(wěn)定點在起作用,這個穩(wěn)定點就是n個樣本觀察值的幾何重心(,),而通過(,)點的穩(wěn)定軸線便稱為回歸線。(二)回歸分析主要解決以下幾方面的問題1.分析一組數(shù)據(jù),確定個變量之間是否存在相關(guān)關(guān)系;如果存在的話,找出它們之間最合適的數(shù)學(xué)關(guān)系式,即回歸方程。2.對變量關(guān)系式中的參數(shù)進行估計和統(tǒng)計檢驗,分析影響因素與預(yù)測目標(biāo)之間的關(guān)系強弱和影響程度,確定諸變量中哪些是主要影響因素,哪些是次要因素以及它們之間的關(guān)系。3.根據(jù)求得的回歸方程和自變量的值,預(yù)測因變量未來的取值,并分析預(yù)測結(jié)果的誤差范圍和精度。(三)要注意的問題一般地,有相關(guān)關(guān)系的變量都不是從屬的因果關(guān)系,即分不清誰是自變量,誰是因變量。而作回歸分析時,一定要先根據(jù)研究目的確定哪個是自變量。這里,要求因變量是隨機的,而自變量不是隨機的,是給定的數(shù)值。求出回歸方程后,也是將給定的自變更值代入方程中,去求得估計的因變量值,這個估計值不只是一個確定的數(shù)值,而是許多可能數(shù)值的平均數(shù)。因此,可以計算估計值的標(biāo)準(zhǔn)差。綜上所述,可知“相關(guān)”與“回歸”的區(qū)別主要在于:1.相關(guān)關(guān)系是互相的,是結(jié)等的,不是一種從屬的因果關(guān)系。我們只是去研究相關(guān)的密切程度。2.回歸分析是研究從屬的因果關(guān)系,有已知變量,依此推測未知變量。(一個是非隨機變量,一個是隨機變量。)(四)研究兩變量關(guān)系時的一般程序1.先根據(jù)n對數(shù)據(jù)在直角坐標(biāo)系xoy中作散點圖,由直觀上看無成直線分布的趨勢。2.若兩個變量只有直線相關(guān)關(guān)系時,需進一步由一個變量(自變量x)的值來推測另一個變量(因變量y)的值,這就需要作直線回歸分析。3.直線回歸的任務(wù)是建立描述兩變量之間關(guān)系的回歸方程。這個方程用=a+bx(10—3)表示,其中是y的估計值。方程=a+bx所表示的直線,是n個散點的一條擬合直線,稱為回歸直線。它是針對散點圖找出的一條能代表兩變量x與y之間關(guān)系的最佳直線。“配線”原則是:使各點與這條直線的縱向距離最近。由數(shù)學(xué)意義上說,即使離差y-的平方和達到最小。若令Q=,即稱之為剩余平方和。這樣,根據(jù)數(shù)學(xué)上的“最小二乘原理”,求回歸方程=a+bx的問題就歸結(jié)為求使Q=取得最小值時的a和b的問題了。在回歸方程=a+bx中,把b稱為回歸系數(shù)。因為b反映兩個變量x與y之間的數(shù)量關(guān)系。b可正可負(fù),與r的符號一致。a稱為截距。二、一元線性回歸方程的求法例10—5仍以例10—1的資料為例,說明求由引向上指標(biāo)x推測30秒俯臥撐y的回歸方程的具體步驟。(一)列計算表同表10—1。(二)求回歸系數(shù)bb===(10-4)本例:由上節(jié)已知Lxx=40,Lxy=48代入公式(10—4)得b===1.2(三)求截距aa=-b(10—5)本例:===7===9∴a=-b=9-1.2=0.6(四)列出回歸方程=0.6+1.2x注意:回歸方程=a+bx是根據(jù)x、y之間的相關(guān)關(guān)系建立的,不是確定性的函數(shù)關(guān)系,因此不可根據(jù)這個方程進行逆推由y求出x。要想由y推測x值必須另建立回歸方程。其中:=a′+b′y(10—6)b′=(10—7)a′=-b′(10—8)由上可推知r與b,b′之間的關(guān)系:b·b′=·==r2∴r=(10—9)公式(10—9)中,正、負(fù)的取舍決定于“r與b的符號是否一致”。在上例中,b=1.2,而b′===0.522∴r==≈0.791這與上節(jié)中求出的r一致。三、一元線性回歸方程的評價(一)回歸問題的方差分析直線回歸方程在一定程度上提示了兩個相關(guān)變量x,y之間的內(nèi)在規(guī)律,但一個回歸方程所揭示的規(guī)律性強不強?回歸效果如何?怎樣利用回歸方程由自變量x的取值預(yù)測因變量y的取值?預(yù)測的精度如何?等等,這些都需要進一步地分析。1.離差平方和的分解由于受x值變化的影響和受其他因素的影響,因變量y是有變異的,即y的值是有波動的。Y值的這種波動稱為變差,用觀測值y與其平均數(shù)的離均差y-來表示。全部n次觀測值的總變差由這些離均差的平方和Lyy=來表示,它稱為y的總離差平方和。(圖10—4)圖10—4總離差分解示意圖由(圖10—4)可知,每個觀測點的離差y-可分解成y-=(y-)+(-)把上式兩邊同時平方之后,對所有n點求和,有:==++2可證上式右邊最后一項=0,故=+(10—10)公式(10—10)右邊第二項是估計值離差的平方和,根據(jù)回歸方程=a+bx,可以把-[=b(x-)]看做是由于x的變化所引起的,因此反映了在y的總變差中由于x與y的直線回歸關(guān)系而引起的y的變化部分,稱之為回歸平方和,記作U=。公式(10—10)右邊第一項,是每個觀測點距回去歸直線的殘關(guān)匠平方和,它反映的是除了x對y的線性影響之外的一切因素(包括x對y的非直線關(guān)系的影響及觀測誤差等)對y的影響部分,稱為剩余平方和,記作Q=。故有Lyy=U+Q(10—11)在實際計算中,U及Q并不是由定義形式去計算的,由于已知回歸系數(shù)b,則:U===b2=b2Lxx=b··Lxx=bLxy(10—12)Q=Lyy-U=Lyy-bLxy(10—13)又:由U及Q的意義可知,U在總平方和Lyy中所占的比例越大,回歸效果越好。而===r2∴U=r2Lyy(10—14)Q=Lyy-U=(1-r2)Lyy(10—15)通過以上關(guān)系式,可看到|r|越大,回歸效果越好??蛇M一步理解相關(guān)系數(shù)的意義。2.自由度在回歸問題中:Lyy的自由度n′=n-1U的自由度n1′=k=1Q的自由度n2′=n-k-1=n-2n′=n1′+n2′(10—16)式中:k是自變量的個數(shù)。一元線性回歸中k=1。3.剩余標(biāo)準(zhǔn)差(估計標(biāo)準(zhǔn)誤差)剩余平方和Q除以它的自由度n-2所得之商的算術(shù)平方根為:Sy′=(10—17)Sy′稱為剩余標(biāo)準(zhǔn)差,它可以用來衡量所有隨機因素對y的一次觀測值的平均變化差的大小。Sy′的單位與Y的單位相同。Sy′越小,則所有觀察點越靠近回歸線;Sy′越大,則所有觀察點離回去歸線越遠??梢娺@一指標(biāo)從另一側(cè)面反映了線性關(guān)系的密切程度。以上這種把平方和與自由度進行分解的方法,稱為回歸問題的方差分析法。表10—3一元線性回歸的方差分析表變差來源平方和自由度均方F值回歸U=bLxy1U剩余Q=Lyy-bLxyn-2Q總計Lyy=U+Qn-1例10—6資料同例10—1,已求出回歸方程=0.6+1.2x,作回歸問題的方差分析。(=0.05)解:可作H0:回歸效果不顯著。已知Lxx=40,Lyy=92,Lxy=48,n=10,b=1.2∴Q=bLxy=1.2×48=57.6Q=Lyy-U=92-57.6=34.4n′=n-1=10-1=9n1′=1n2′=n-2=10-2=8表10—4本例的方差分析表變差來源平方和自由度均方F值回歸57.6757.613.395剩余34.484.3總計929取=0.05,n1′=1,n2′=8查知F0.05(1,8)=5.32∵F>F0.05(1,8)∴P(H0)<0.05,拒絕H0,說明回歸效果顯著。(二)根據(jù)回歸方程預(yù)測值運用=a+bx求得的并不是實際值,而是回歸估計值,通常稱為點估計。僅僅求出的實際意義并不大,因為隨著現(xiàn)實情況的變化和各種因素的影響,預(yù)測目標(biāo)的實際值總會同預(yù)測值有或大或小的偏移。所以,不僅要求出y的預(yù)測值,并且還應(yīng)知道實際的值可能偏離預(yù)測值的范圍,也就是要知道預(yù)測的精度如何?這樣的范圍常用區(qū)間的形式給出,稱為預(yù)測區(qū)間。一般地,對于某個確定的x=x0,實際對應(yīng)的Y值是在=a+bx附近波動的,且服從正態(tài)分布。它的平均數(shù)就是當(dāng)x=x0時回歸方程的相應(yīng)值0=a+bx0,其方差可用剩余方差Sy′來估計。于是,根據(jù)正態(tài)分布的性質(zhì),對于固定的x=x0,y的取值是以0為中心而對稱分布的,而且與剩余標(biāo)準(zhǔn)差Sy′之間有下關(guān)系:y值落在0±Sy′區(qū)間內(nèi)的概率約為68%y值落在0±1.96Sy′區(qū)間內(nèi)的概率約為95%y值落在0±2.58Sy′區(qū)間內(nèi)的概率約為99%由上可見,Sy′越小,則由回歸方程預(yù)y值就越精確。因此,Sy′是預(yù)測精確度的標(biāo)志。例10.7資料同例10.1:Sy′===2.07若已知x0=9,則預(yù)測y值:0=0.6+1.2×9=11.4預(yù)測的95%置信區(qū)間是0±1.96Sy′=11.4±1.96×2.07=即(7.3,15.5)。由此可預(yù)測與x0=9對應(yīng)的全部y值落在區(qū)間(73.3,15.5)之內(nèi)的概率約是95%。注意:用回歸方程作預(yù)測的適用范圍一般僅局限于原來自變量變動的范圍,而不能隨意外推?。ㄋ模⑾嚓P(guān)與回去歸在實際應(yīng)用時應(yīng)注意的問題(一)當(dāng)目的在于確定兩個變量之間關(guān)系的性質(zhì)(例如確定它們之間是否有線性關(guān)系),以便對給定的x值預(yù)測最可能的y值時,回歸分析是一種較好的技術(shù)。但如果只對估計兩個變量之間關(guān)系的強度感興趣。那么用相關(guān)分析就夠了。(二)相關(guān)系數(shù)的顯著性水平與相關(guān)的密切程度雖然有聯(lián)系,但絕不是一回事。顯著性達到0.05,只說明有95%的可能存在相關(guān),有5%的可能估計不準(zhǔn),不存在相關(guān)。不能誤認(rèn)為顯著性水平越高,相關(guān)系數(shù)就越大,或線性關(guān)系就越密切。(三)對于不存在相互聯(lián)系的事物,不要勉強做出沒有意義的相關(guān)和回歸。例如人的年齡秘樹的樹齡,也可能可以作出“正相關(guān)”的情況,但沒有實際意義。(四)只有在相關(guān)系數(shù)r顯著且|r|較大時,計算回歸方程才具有一定的實用意義?;貧w分析的計算中以數(shù)據(jù)為依據(jù)。田賽成績越好數(shù)值越大,但徑賽成績越好數(shù)值(時間數(shù))越小,故兩者往往呈負(fù)相關(guān)。因此在計算回歸方程時,相關(guān)系數(shù)按負(fù)值代入。(五)相關(guān)分析要求X和Y皆為連續(xù)隨機變量:但回歸分析的應(yīng)用范圍較廣,它不要求兩個變量都是隨機變量。人們常常是“控制”了一個變量,這個被控制的變量即是自變量。(六)回歸推測方程式只適用于樣本數(shù)據(jù)的最大值和最小值兩極的范圍內(nèi)?!巴馔啤钡淖龇?,有可能帶來危險的后果。因為在某個區(qū)間之內(nèi),兩個變量之間的關(guān)系可以是線性關(guān)系,但在這一區(qū)間之則它只能對總體提供有限的代表性。而把這一樣本的結(jié)果擴展到它所代表的區(qū)間之外,就有可能導(dǎo)致錯誤的結(jié)論。如(圖10—5)所示,便是一種可能的外推陷井。圖10—5線性回歸中應(yīng)用外推可能導(dǎo)致錯誤之一例第三節(jié)二元線性回歸分析介紹先簡單回顧一元回歸分析的大致內(nèi)容:(1)數(shù)學(xué)模型:y=+x+-總體中的相關(guān)系數(shù); -誤差,一般服從正態(tài)分布。給出一組觀測數(shù)據(jù)(x1,y1),(x2,y2),………,(xn,yn),有y1=+x1+1,y2=+x2+2,………,yn=+xn+n,其中:1,2,………,n~N(0,)(2)建立回歸方程:=a+bx用最小二乘法(使Q取最小值)求出a,b即,的估計值。b==a=-b(3)回歸方程檢驗H0:=0(假設(shè)總體中相關(guān)系數(shù)為0)因為若=0,則y為常數(shù);若≠0,則x與y有線性關(guān)系。所以檢驗回歸方程顯著性一般檢驗是否等于0?檢驗統(tǒng)計量(方差分析):F=~F(1,n-2)重要的平方和分解公式:Lyy=U+Q①若F>(臨界值),則否定H0,說明≠0,x與y之間有線性關(guān)系。圖10—6②若F>,則可接受H0,或可說是“相容”的。(4)相關(guān)系數(shù)r=(5)預(yù)測問題Sy′=并利用正態(tài)分布的理論。以上所述的兩個變量,其中因變量y只與一個自變量x有關(guān)。但在客觀現(xiàn)象當(dāng)中,各事物之間的聯(lián)系和制約是廣泛的、相互的,一個事物的變化是受許多因素影響的。為了分析研究這諸多因素(xi)相互間的關(guān)系,以及對某一事物(y)的關(guān)系,數(shù)理統(tǒng)計給出了“多元分析”的方法。多元分析方法是科學(xué)研究中常用的統(tǒng)計方法。它比單因素分析更能揭示事物的本質(zhì)和內(nèi)在的聯(lián)系。但由于多元分析方法較復(fù)雜,而且計算量大,所以多用計算機計算。至于實際應(yīng)用,關(guān)鍵是掌握處理方法和操作計算機的技術(shù)。因為大部分多元分析方法都已有計算機計算程序。這將為實際計算帶來方便并節(jié)省大量時間。由于課時限制等原因,這里只介紹“二元線性回歸分析”的基本內(nèi)容。研究兩個變量與一個因變量的線性相關(guān)關(guān)系的統(tǒng)計方法稱為二元性回歸分析方法。二元線性回歸的原理與一元線性回歸相同,只是在計算等方面有復(fù)雜許多。今后若能把二元線性回歸的理論和方法進一步推廣,就可解決多元線性回歸的問題了。一、求二元線性回歸方程二元線性回歸方程的一般形式是=b0+b1x1+b2x2(10—18)求b0,b1,b2之值的原則是應(yīng)用最小二乘法,求使剩余平方和Q=達到最小值時的b0,b1,b2之值。即解方程組=0=0(i=1,2)得其解為b0,b1,b2的估計值。我們課上的具體求法是解正規(guī)方程:(10—19)求得b0,b1,b2的值。公式(10—19)中:Lij=Lji==-()()(10—20)(i,j=1,2)Liy==-()()(10—21)(i=1,2)由公式(10—19),可得:b1=(10—22)b2=(10—23)常數(shù)項b0=-b1-b2(10—24)式中:=,=,=例10—8下面(表10—5)給出大約同樣身高的13名男子的收縮壓(y)和體重(x1)、年齡(x2)的數(shù)據(jù),試分析收縮壓與體重、年齡之間的線性回歸關(guān)系。表10—5體例具體數(shù)據(jù)表體重X1152183171165158161149158170153164190185年齡X250202030305060504055404020收縮壓Y120141124126117125123125132123132155147解:n=13,根據(jù)所給數(shù)據(jù)計算可得:=2159,=166.077=505,=38.864 =1964,=130.308=360639,=21925=82335,=222228=282921,=65135代入公式(10—20)及(10—21)計算得L11=2078.92,L22=2307.69L12=L21=-1533.85L1y=1586.69,L2y=-65.066再代入公式(10—22)、(10—23)、(10—24),解得b1=1.077,b2=0.425,b0=-65.066故得y關(guān)于x1,x2的線性回歸方程為:=-65.066+1.077x1+0.425x2二、回歸方程效果的檢驗與一元的情形類似,我們有平方和分解公式Lyy=U+Q(10—25)其中:Lyy=U==b1L1y+b2L2y(10—26)Q==Lyy-U(10—27)表10—6K元線性回歸的方差分析表變差來源平方和自由度均方F值回歸U=K剩余Q=Lyy-Un-k-1總計Lyy=n-1對于例10—8:Lyy=-=222228-=1486.77L1y=1586.69,L2y=-670.39b1=1.077,b2=0.425n′=13-1=12,n1′=2,n2′=13-3=10U=b1L1y+b2L2y=1.077×1586.69+0.425×(-670.39)=1423.95Q=Lyy-U=1486.77-1423.95=62.82表10—7本例方差分析表變差來源平方和自由度均方F值回歸1423.952711.975113.34剩余62.82106.282總計1486.7712取=0.05,查知F0.05(2,10)=4.10∵F>F0.05(2,10)∴P<0.05,拒絕H0,因而回歸方程的回歸效果顯著。三、求復(fù)相關(guān)系數(shù)復(fù)相關(guān)系數(shù)R==(10—28)用其表示y與x1、x2的線性關(guān)系的密切程度。注意:0≤R≤1在例10—8中:R==≈0.979這表示13個點與所配回歸平面是很接近的。為了了解各變量兩兩之間的相互關(guān)系,還可求“偏相關(guān)系數(shù)”,這里從略。四、回歸方程的精度的估計精度用剩余標(biāo)準(zhǔn)差來衡量:=(10—29)在例10—8中:==≈2.506同一元情形類似,可用及正態(tài)分布理論在理論在預(yù)測問題中去求100(1-)%的置信區(qū)間。多元線性回歸分析計算程序一、程序功能在實際問題中,影響一個事物(y)的因素常常不止一個,而是多個。研究因變量與自變量x1,x2,……,xn之間是定量線性關(guān)系的問題稱為多元線性回歸問題。由于許多多元非線性回歸問題可以化為多元線性回歸問題,所以本程序有較廣泛的應(yīng)用。例如變量y與另外n個變量x1,x2,……,xn之間有線性關(guān)系,它的第p次試驗數(shù)據(jù)是(yp;xp1,xp2,……,xpn),只要輸入這些實驗數(shù)據(jù),本程序就是能自動計算出確定的關(guān)系表達式y(tǒng)=a+b1x1+b2x2+……+bnxn并對回歸方程進行顯著性檢驗。二、程序中使用的主要符號說明P:自變量個數(shù);N:觀測數(shù)據(jù)的組數(shù);U:回歸平方和:Q:剩余平方和;F:回歸方程顯著性檢驗統(tǒng)計量;F1(P):存放回歸系數(shù)顯著性檢驗統(tǒng)計量。三、程序甩依據(jù)的理論計算數(shù)學(xué)模型設(shè)變量y與另外N個變量x1,x2,……,xN有線性關(guān)系,它的第p次試驗數(shù)據(jù)(yp;xp1,xp2,……,xpN);P=1,2,……,N。則有y1=0+1x11+2x12+……+Nx1N+1y2=0+1x21+2x22+……+Nx2N+2………ym=0+1xm1+2xm2+……+NxmN+m其中0,1,2,……,N是N+1個待估計參數(shù);x1,x2,……,xN是N個可精確測量或可控一般變量1,2,……,m是m個相互獨立且服從同一正態(tài)分布的隨機變量。程序中對參數(shù)第采用最小二乘法估計。四、程序名稱:DYHG1REMDYHG5INPUT“p,n........”,P,N10DIMA(N,P+1),S(P+1,P+1),R(P,P+1),X(P+1),S1(P+1),B(P),F(xiàn)1(P)15FORI=1TON16FORJ=1TOP+117READA(I,J)18NEXTJ19NEXTI20FORJ=1TOP+125FORI=1TON30X(J)=X(J)+A(I,J)35NEXTI40X(J)=X(J)/N45FORI=1TON50A(I,J)=A(I,J)-X(J)55NEXTI60NEXTJ65FORI=1TOP+170FORJ=1TOP+175FORK=1TON80X(I,J)=S(I,J)+A(K,I)*A(K,J)85NEXTK90NEXTJ95NEXTIFORI=1TOP+1S1(I)=SQR(S(I,J))NEXTIFORI=1TOPFORJ=1TOP+1R(I,J)=S(I,J)/(S1(I)*S1(J))NEXTJNEXTIFORK=1TOP145L=R(K,K)FORJ=1TOP+1R(K,J)=R(K,J)/LNEXTJFORI=1TOPY=R(I,K)FORJ=1TOP+1IFI=KANDJ=KTHENR(I,J)=1/L185IFI<>KANDJ=KTHENR(I,J),=-R(I,J)/L186IFI<>KANDJ<>KTHENR(I,J),=R(I,J)-Y*R(K,J)NEXTJNEXTINEXTKPRINTTAB(5);“HENRESULOFCALXULATION”FORI=1TOPB(I)=R(I,P+1)*S1(P+1)/S1(I)NEXTIB(0)=X(P+1)FORI=1TOPB(0)=B(0)-X(I)*B(I)235U=U+S(P+1,I)*B(I)NEXTIQ=S(P+1,P+1)-UF=U*(N-P-1)/(Q*P)FORJ=1TOPF1(J)=B(J)*B(J)*(N-P-1)/(Q*R(J,J))PRINT“F1(”;J;“)=”;F1(J)NEXTJPRINT“Y=”;B(0);FORI=1TOPIFB(I)<0THENPRINTB(I);“X”;I;IFB(I)<0THENPRINT“+”;B(I);“X”;I;NEXTI:PRNITPRITN“U=”;U,“Q=”;Q,“F=”;F287END五、例題10名女中學(xué)生測得體重x1(千克),胸圍x1(厘米),胸圍的呼吸差x1(厘米)有肺活量y(毫升)如下表所示,試作前三項指標(biāo)與肺活量的多元雙重性回歸分析。編號x1x2x3y135690.71600240742.52600340642.02100442743.02650537721.12400645681.52200743784.32750837662.01600944703.227501042653.02500解:在程序中使用DATA語句按行輸入數(shù)據(jù)資料:DATA35,69,0.7,1600,40,74,2.5,2600,40,64,2.0,2100,42,74,3.0,2650,37,72,1.1,2400310DAT45,68,1.5,2200,43,78,4.3,2750,37,66,2.0,1600,44,70,3.2,2750,42,65,3.0,2500RUNP,N………3,10THERESULTOFCALCULATIONF1(1)=.0286093F1(2)=.0148721F1(3)=.0649199Y=-3035.54+60.9318X1+37.8083X2+101.379X3U=1.25011E+06Q=445141F=5.61669逐步回歸分析計算程序一、程序功能變量y與n個自變量x1,x2,……,xn之間有線性關(guān)系,它的第p次觀測數(shù)據(jù)是(yp;xp1,xp2,……,xpn),只要輸入這些實驗數(shù)據(jù),本程序就能自動計算出其最優(yōu)回歸方程y=a+(已引入的i)并同時計算出復(fù)相關(guān)系數(shù)(已引入的回歸方程的所有變量對y的相關(guān)系數(shù))和剩余標(biāo)準(zhǔn)差供使用者參考。二、程序中使用的主要符號說明P:自變量的個數(shù);N:觀測數(shù)據(jù)的組數(shù);T1:控制參數(shù)(一般取0.001~0.0001);F1:引入自變量時統(tǒng)計量F的臨界值;X(P+1):存放自變量和因變量的平均數(shù);S(P+1):存放自變量和因變量的標(biāo)準(zhǔn)差;R(P+1,P+1):存放相關(guān)矩陣;Vi:第i個自變量的貢獻值;F3:引入自變量的統(tǒng)計量F值;F4:剔除自變量的統(tǒng)計量F值;S1:剩余標(biāo)準(zhǔn)差;R1:復(fù)相關(guān)系數(shù)。三、程序依據(jù)的主要理論計算方法從一個自變量開始,把對因變量作用顯著的自變量逐個地引入回歸方程的逐步回歸分析方法。四、程序名稱: ZBHG1RENZBHG5INPUT“P,N,T1,F(xiàn)1,F(xiàn)2,------”,P,N,T1,F(xiàn)1,F(xiàn)210DIMA(N,P+1),R(P+1,P+1),X(P+1),B(P),W(P+1),Q(P)12FORK=1TOP:Q(K)=K:NEXTK15FORI=1TON16FORJ=1TOP+117READA(I,J)18NEXTJ19NRXTI20FORI=1TOP+1:S=025FORJ=1TON28X(I)=X(I)+A(J,I)30NEXTJ35X(I)=X(I)/N:PRINT“X(”;I;“)=”;X(I),39FORJ=1TON40A(J,I)=A(J,I)-X(I):S=S+A(J,I)^250NEXTJ:PRINT“S(”;I;“)=”;SQR(S/(N-1)55NEXTI60FORI=1TOP+165FORJ=1TOP+170FORK=1TON75R(I,J)=R(I,J)+A(K,I)*A(K,J)80NEXTK85NEXTJ90NEXTI95FORI=1TOP+1100W(I)=SQR(R(I,J))105NEXTI110FORI=1TOP+1115FORJ=1TOP+1120R(K,J)=R(K,J)/(W(I)*W(J))121PRINT“R(:”I;“,”;J;“)=”;R(I,J)125NEXTJ130NEXTI135FORI=1TOP+1140R(I,J)=1145NEXTI150M=N-1155V1=1E+35:V2=0:N2=0160B=0170IFT1>=R(I,J)THEN190175V=R(I,P+1)*R(P+1,I)/R(I,J)176PRINT“V”;I;“=”;V177IFV<0THEN185178IFV=0THEN190180IFV<=0THEN190182V2=V:N2=1183GOTO190185B(I)=W(P+1)*R(I,P+1)/W(I)186IFABS(V1)<=ABS(V)THEN190187V1=V:N1=I190NEXTI195B(0)=X(P+1)200FORI=1TOP205B(0)=B(0)-B(I)*X(I)210NEXTI215R1=SQR(1-R(P+1,P+1))220F3=V2*(M-1)/(R(P+1,P+1)-V2)225F4=ABS(V1)*M/R(P+1,P+1)227PRINT“F3=”;F3,“F4=”;F4230IFF4>=F2THEN233231K=N1:M=M+1:IFQ(N1)=N1THENQ(N1)=0232GOTO250233IFF3<=F1THEN240234M=M-1:K=N2235GOTO250240GOTO315250L=R(K,K)255FORJ=1TOP+1260R(K,J)=R(K,J)/L265NEXTJ270FORI=1TOP+1275Y=R(I,K)280FORJ=1TOP+1285IFI=KANDJ=KTHENR(I,J)=1/L290IFI<>KANDJ=KTHENR(I,J)=-R(I,J)295IFI<>KANDJ<>KTHENR(I,J)=R(I,J)-Y*(K,J)300NEXTJ305NEXTI310GOTO155315S1=W(P+1)*SQR(R(P+1,P+1)/M)320PRINT“S1=”;S1325PRINT“R1=”;R1345FORI=1TOP346IFI=Q(I)THEN348347B(0)=B(0)+B(I)*X(I)348NEXTI349PRINT“Y=”;B(0);350FORI=1TOP351IFI<>Q(I)ORB(I)=0THEN360355IFB(I)>0THENLPRIHT“+”;B(I);“X”;I;357IFB(I)<0THENPRINTB(I);“X”;I;360NEXTI380END五、例題根據(jù)上例的數(shù)據(jù)資料,試作前三項指標(biāo)與肺活量的逐步回歸分析。解:在程序中使用DATA語句,按行輸入數(shù)據(jù):400DATA35,69,0.7,1600,40,74,2.5,2600,40,64,2.1,2100,42,74,3.0,2650410DATA37,72,1.1,2400,45,68,1.5,2200,43,78,4.3,2750,37,66,2.0,1600420DATA44,70,3.2,2750,42,65,3.0,2500RUNP,N,T1,F(xiàn)1,F(xiàn)2------3,10,0.001,1,1X(1)=40.5S(1)=3.30824X(2)=40.5S(2)=4.49691X(3)=40.5S(3)=1.08444X(4)=40.5S(4)=434.006R(1,1)=1R(1,2)=.171781R(1,3)=.641102R(1,4)=.694543R(2,1)=.171781R(2,2)=1R(2,3)=.439741R(2,4)=.586387R(3,1)=.641102R(3,2)=.439741R(3,3)=1R(3,4)=.725708R(4,1)=.694543R(4,2)=.586387R(4,3)=.725708R(4,4)=1V1=.482391V2=.34385V3=.5266521F3=8.90089F4=9E+35V1=.0892616V2=.0885538V3=-.526652F3=1.6268F4=8090089V1=-.0892616V2=+.12237V3=-.133523F3=2.80541F4=1.6268V1=-.123078V2=-.12237V3=-.031098F3=0F4=.712941V1=-.363336V2=-.224795V3=.031098F3=.712941F4=5.37395S1=266.296R1=.840943Y=-4187.42+80.2707X1+46.4493X2N階回歸分析程序一、程序功能N階回歸又稱多項式回歸,是非線性回歸分析中常用的一種重要方法。在非線性回歸分析中,比較困難的問題是選擇合適的擬合曲線的類型。若一時選擇不到合適的曲線類型,就可用在數(shù)學(xué)分析中講到的“有相當(dāng)廣泛的一類曲線可以用多項式去逼近。”這種思想運用到回歸分析中即所謂多項式(N階)回歸。用其可以處理相當(dāng)一類非線性的問題。因而在回歸分析中占有重要的地位。本程序能由輸入的各實驗點值(x,y)和選取的階數(shù)D撲克動計算出回歸方程的各項系數(shù)值,并同時打印出相關(guān)系數(shù)和估計標(biāo)準(zhǔn)差供使用者參考。二、程序中使用的主要符號說明D:DEGREEOFEQUATION方程的階數(shù);N:KNOWNPOINTNUMBERS已知實驗點數(shù);R(J+1,D+2):DEGREEOFCOEFFICIENTXp的系數(shù)(p=1,2……M);SQR(J):COEFFICIENTOFCRRELATION相關(guān)系數(shù);SQR(Z/I):STANDARDERROROFESTIMATE估計標(biāo)準(zhǔn)差;X:INTERPOLATION插值(即根據(jù)已解出的回歸方程來進行插值預(yù)報)。三、程序所依據(jù)的理論計算數(shù)學(xué)模型若變量y與x的關(guān)系是P次多項式,且在Xa處對y觀察的隨機誤差a(a=1,2……,N)服從正態(tài)分布,則有ya=0+1xa2+3xa3+……+pxap,a=1,2,……N。四、程序名稱:N-ORDER.REG5REMN--ORDERREGRESSIONPROGRAM10PRINT“N--ORDERREGRESSIONPROGRAM”20PRINT25INPUT“K,N---”,D,N30DIMA(N),R(7,8),T(9)50PRINT“Deg

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論