版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
SPSS如何進行線性回歸分析操作瀏覽:3113更新:2014-03-1310:11本節(jié)內(nèi)容主要介紹如何確定并建立線性回歸方程。包括只有一個自變量的一元線性回歸和和含有多個自變量的多元線性回歸。為了確保所建立的回歸方程符合線性標準,在進行回歸分析之前,我們往往需要對因變量與自變量進行線性檢驗。也就是類似于相關(guān)分析一章中講過的借助于散點圖對變量間的關(guān)系進行粗略的線性檢驗,這里不再重復(fù)。另外,通過散點圖還可以發(fā)現(xiàn)數(shù)據(jù)中的奇異值,對散點圖中表示的可能的奇異值需要認真檢查這一數(shù)據(jù)的合理性。一、一元線性回歸分析用SPSS進行回歸分析,實例操作如下:1.單擊主菜單Analyze/Regression/Linear...,進入設(shè)置對話框如圖7-9所示。從左邊變量表列中把因變量y選入到因變量(Dependent)框中,把自變量x選入到自變量(Independent)框中。在方法即Method—項上請注意保持系統(tǒng)默認的選項Enter,選擇該項表示要求系統(tǒng)在建立回歸方程時把所選中的全部自變量都保留在方程中。所以該方法可命名為強制進入法(在多元回歸分析中再具體介紹這一選項的應(yīng)用)。具體如下圖所示:2.請單擊Statistics...按鈕可以選擇需要輸出的一些統(tǒng)計量。如RegressionCoefficients(回歸系數(shù))中的Estimates,可以輸出回歸系數(shù)及相關(guān)統(tǒng)計量,包括回歸系數(shù)B、標準誤、標準化回歸系數(shù)BETA、T值及顯著性水平等。Modelfit項可輸出相關(guān)系數(shù)R,測定系數(shù)R2,調(diào)整系數(shù)、估計標準誤及方差分析表。上述兩項為默認選項,請注意保持選中。設(shè)置如圖7-10所示。設(shè)置完成后點擊Continue返回主對話框?;貧w方程建立后,除了需要對方程的顯著性進行檢驗外,還需要檢驗所建立的方程是否違反回歸分析的假定,為此需進行多項殘差分析。由于此部分內(nèi)容較復(fù)雜而且理論性較強,所以不在此詳細介紹,讀者如有興趣,可參閱有關(guān)資料。用戶在進行回歸分析時,還可以選擇是否輸出方程常數(shù)。單擊Options...按鈕,打開它的對話框,可以看到中間有一項Includeconstantinequation可選項。選中該項可輸出對常數(shù)的檢驗。在Options對話框中,還可以定義處理缺失值的方法和設(shè)置多元逐步回歸中變量進入和排除方程的準則,這里我們采用系統(tǒng)的默認設(shè)置/如圖7-11所示。設(shè)置完成后點擊Continue返回主對話框。在主對話框點擊OK得到程序運行結(jié)果。如題。我選擇的是線性回歸,得出了一堆表格和圖標。我做的是生物學(xué)方面的統(tǒng)計。我的目標是得出模擬方程,再根據(jù)已有的自變量來計算因變量。我是SPSS新手,而且我對逐步回歸也不了解。但由于工作原因,必須得到模擬方程。請高手告訴我我的這個統(tǒng)計符不符合線性關(guān)系,如果符合,怎么寫模擬方程,謝謝!以下是部分截圖分享到:2013-11-1619:52提問者米納x1,x2...x5是5個自變量,1個y因變量。系數(shù)a圖中是將x1與y建立一個線性回歸模型,常量為1.956E-6,sig.也即P值=1>0.05,無統(tǒng)計學(xué)意義,x1的斜率為-0.504,P=0.000v0.05,具有顯著意義,常量和斜率看非標準化系數(shù),得方程為y=-0.504x1+1.956E-6,這其實是個一元線性回歸方程;然后逐漸的加入x2,x3,x4,x5進行二元線性回歸,三元線性回歸等。一旦有一個變量,如x3的P值〉0.05也就說明這個變量對模型的建立無統(tǒng)計學(xué)意義,在多元線性回歸中也就可以無情的剔除掉。而由系數(shù)a圖可知,x1,x2,x3,x4,x5的斜率P值都是0.000<0.05,也就是說都有意義,5個變量一個也不能剔除,全保留,也即要5個變量都有的模型6了。由模型匯總圖也可知,模型1到6的調(diào)整R方是越來越大的,也即擬合的越來越好了。那么最終的線性方程就看模型6啦,常量0.002,x1斜率-0.860,x2斜率-0.713...后面看不到了。也即y=0.002-0.860x1-0.713x2…常量P值=0.974>0.05無顯著性意義,說明擬合的線過原點,也即常量值應(yīng)為0,但是否能改為0這個我也不確定,但0或0.002差別不會太大的。追問厲害,一看就是高手。不好意思,系數(shù)那個表里缺一塊,我現(xiàn)在補上,再把另外幾個表補上還有點問題想請指教。1.你說的那個常量為1.965E-6,這個E是什么意思?2?自變量一共有6個,從x1到x6,可能是我那個表缺一塊的原因吧,抱歉了。系數(shù)表缺的部分:其它表能否將最終的模擬方程式寫出來,不勝感激!回答1.965E-6是指1.965乘10的-6次方。已排除的變量表對應(yīng)系數(shù)a表,模型1對應(yīng)模型1,也即前一個表是進入,相對的后一個就排除。模型1進入了x1,排除的x2,x3,x4,x5,x6中的x2的P值<0.05還不能排除,還要進入分析,模型2,3等依次類推,一個也排除不掉。全部進入回歸方程。另,如果兩變量間存在共線性的話,是不能都進入回歸方程的。判斷依據(jù)為膨脹因子VIFV10,倒數(shù)即容差〉0.1,已排除變量圖上可知各變量間不存在共線性,都不用排除。常量P值〉0.05可以去掉,各變量的斜率選用模型6的標準系數(shù)。因而最終回歸方程為:y=-0.860x1-0.713x2-0.567x3-0.414x4-0.254x5-0.130x6回歸分析是處理兩個及兩個以上變量間線性依存關(guān)系的統(tǒng)計方法。在醫(yī)學(xué)領(lǐng)域中,此類問題很普遍,如人頭發(fā)中某種金屬元素的含量與血液中該元素的含量有關(guān)系,人的體表面積與身高、體重有關(guān)系;等等?;貧w分析就是用于說明這種依存變化的數(shù)學(xué)關(guān)系。第一節(jié)Linear過程主要功能調(diào)用此過程可完成二元或多元的線性回歸分析。在多元線性回歸分析中,用戶還可根據(jù)需要,選用不同篩選自變量的方法(如:逐步法、向前法、向后法,等)。實例操作[例8.1]某醫(yī)師測得10名3歲兒童的身高(cm)、體重<kg)和體表面積(cm2)資料如下。試用多元回歸方法確定以身高、體重為自變量,體表面積為應(yīng)變量的回歸方程。兒童編號體表面積(Y)身高(X)1體重(X)212345675.3825.2995.3585.2925.6026.0145.83088.087.688.589.087.789.588.811.011.812.012.313.113.714.486.10290.414.996.07590.615.2106.41191.216.0數(shù)據(jù)準備激活數(shù)據(jù)管理窗口,定義變量名:體表面積為Y,保留3位小數(shù);身高、體重分別為X1、X2,1位小數(shù)。輸入原始數(shù)據(jù),結(jié)果如圖8.1所示。圖8.1原始數(shù)據(jù)的輸入統(tǒng)計分析激活Statistics菜單選Regression中的Linear...項,彈出LinearRegression對話框(如圖8.2示)。從對話框左側(cè)的變量列表中選y點擊A鈕使之進入Dependent框,選xl、x2,點擊A鈕使之進入Indepentdent(s)框;在Method處下拉菜單,共有5個選項:Enter(全部入選法)、Stepwise(逐步法)、Remove(強制剔除法)、Backward(向后法)、Forward(向前法)。本例選用Enter法。點擊OK鈕即完成分析。用戶還可點擊Statistics...鈕選擇是否作變量的描述性統(tǒng)計、回歸方程應(yīng)變量的可信區(qū)間估計等分析;點擊Plots.??鈕選擇是否作變量分布圖(本例要求對標準化Y預(yù)測值作變量分布圖);點擊Save...鈕選擇對回歸分析的有關(guān)結(jié)果是否作保存(本例要求對根據(jù)所確定的回歸方程求得的未校正Y預(yù)測值和標準化Y預(yù)測值作保存);點擊Options...鈕選擇變量入選與剔除的a、B值和缺失值的處理方法。結(jié)果解釋在結(jié)果輸出窗口中將看到如下統(tǒng)計數(shù)據(jù)
2..X1MultipleR.94964RSquare.90181AdjustedRSquare.87376StandardError.14335AnalysisofVarianceDFSumofSquaresMeanSquareRegression21.32104.66052Residual7.14384.02055F=32.14499SignifF=.0003-VariablesintheEquation-VariableBSEBBetaTSigTXI.068701.074768.215256.919.3887X2.183756.056816.7576603.234.0144(Constant)-2.8564766.017776-.475.6495EndBlockNumber1Allrequestedvariablesentered.結(jié)果顯示,本例以XI、X2為自變量,Y為應(yīng)變量,采用全部入選法建立回歸方程?;貧w方程的復(fù)相關(guān)系數(shù)為0.94964,決定系數(shù)(即r2)為0.90181,經(jīng)方差分析,F(xiàn)=34.14499,P=0.0003,回歸方程有效。回歸方程為Y=0.0687101X1+0.183756X2-2.856476。本例要求按所建立的回歸方程計算Y預(yù)測值和標準化Y預(yù)測值(所謂標準化Y預(yù)測值是指將根據(jù)回歸方程求得的Y預(yù)測值轉(zhuǎn)化成按均數(shù)為0、標準差為1的標準正態(tài)分布的Y值)并將計算結(jié)果保存入原數(shù)據(jù)庫。系統(tǒng)將原始的X1、X2值代入方程求Y值預(yù)測值(即庫中pre_1欄)和標準化Y預(yù)測值(即庫中zpr_1欄),詳見圖8.3。圖8.3計算結(jié)果的保存本例還要求對標準化Y預(yù)測值作變量分布圖,系統(tǒng)將繪制的統(tǒng)計圖送向ChartCarousel窗口,雙擊該窗口可見下圖顯示結(jié)果。圖8.4對標準化Y預(yù)測值所作的正態(tài)分布圖第二節(jié)CurveEstimation過程主要功能調(diào)用此過程可完成下列有關(guān)曲線擬合的功能:1、Linear:擬合直線方程(實際上與Linear過程的二元直線回歸相同,即Y=b0+b1X);2、Quadratic:擬合二次方程(Y=b0+b1X+b2X2);3、Compound:擬合復(fù)合曲線模型(Y=b0Xb1X);4、Growth:擬合等比級數(shù)曲線模型(Y=e(b0+b1X));5、Logarithmic:擬合對數(shù)方程(Y=b0+b1lnX)6、Cubic:擬合三次方程(Y=b0+b1X+b2X2+b3X3);7、S:擬合S形曲線(Y=e(b0+b1/X));8、Exponential:擬合指數(shù)方程(Y=b0eb1X);9、Inverse:數(shù)據(jù)按Y=b0+b1/X進行變換;10、Power:擬合乘幕曲線模型(Y=b0Xb1);11、Logistic:擬合Logistic曲線模型(Y=1/(1/u+b0Xb1X)。實例操作[例8.2]某地1963年調(diào)查得兒童年齡(歲)X與錫克試驗陰性率(%)Y的資料如下,試擬合對數(shù)曲線。年齡(歲)錫克試驗陰性率(%)657.176.090.993.096.795.696.2數(shù)據(jù)準備激活數(shù)據(jù)管理窗口,定義變量名:錫克試驗陰性率為Y,年齡為X,輸入原始數(shù)據(jù)。統(tǒng)計分析激活Statistics菜單選Regression中的CurveEstimation...項,彈出CurveEstimation對話框(如圖8.5示)。從對話框左側(cè)的變量列表中選y,點擊A鈕使之進入Dependent框,選x,點擊A鈕使之進入Indepentdent(s)框;在Model框內(nèi)選擇所需的曲線模型,本例選擇Logarithmic模型(即對數(shù)曲線);選Plotmodels項要求繪制曲線擬合圖;點擊Save...鈕,彈出CurveEstimation:Save對話框,選擇Predictedvalue項,要求在原始數(shù)據(jù)庫中保存根據(jù)對數(shù)方程求出的Y預(yù)測值,點擊Continue鈕返回CurveEstimation對話框,再點擊OK鈕即可。8.2.2.3結(jié)果解釋在結(jié)果輸出窗口中將看到如下統(tǒng)計數(shù)據(jù)在以X為自變量、Y為應(yīng)變量,采用對數(shù)曲線擬合方法建立的方程,決定系數(shù)R2=0.913(接近于1),作擬合優(yōu)度檢驗,方差分析表明:F=52.32,P=0.001,擬合度很好,對數(shù)方程為:Y=61.3259+20.6704lnX。本例要求繪制曲線擬合圖,結(jié)果如圖8.6所示。圖8.6對數(shù)曲線擬合情形根據(jù)方程Y=61.3259+20.6704lnX,將原始數(shù)據(jù)X值代入,求得Y預(yù)測值(變量名為fit_l)存入數(shù)據(jù)庫中,參見圖8.7。圖8.7計算結(jié)果的保存第三節(jié)Logistic過程主要功能調(diào)用此過程可完成Logistic回歸的運算。所謂Logistic回歸,是指應(yīng)變量為二級計分或二類評定的回歸分析,這在醫(yī)學(xué)研究中經(jīng)常遇到,如:死亡與否(即生、死二類評定)的概率跟病人自身生理狀況和所患疾病的嚴重程度有關(guān);對某種疾病的易感性的概率(患病、不患病二類評定)與個體性別、年齡、免疫水平等有關(guān)。此類問題的解決均可借助邏輯回歸來完成。特別指出,本節(jié)介紹的Logistic過程,應(yīng)與日常所說的Logistic曲線模型(即S或倒S形曲線)相區(qū)別。用戶如果要擬合Logistic曲線模型,可調(diào)用本章第二節(jié)CurveEstimation過程,系統(tǒng)提供11種曲線模型,其中含有Logistic曲線模型(參見上節(jié))。在一般的多元回歸中,若以P(概率)為應(yīng)變量,則方程為P=bO+b1X1+b2X2+…+bkXk,但用該方程計算時,常會出現(xiàn)P〉1或P〈0的不合理情形。為此,對P作對數(shù)單位轉(zhuǎn)換,即logitP=ln(P/1-P),于是,可得到Logistic回歸方程為:
ebO+blXl+b2X2+…+bkXk1+eb°+blXl+b2X2+…+bkXk8.3.2實例操作[例8.3]某醫(yī)師研究男性胃癌患者發(fā)生術(shù)后院內(nèi)感染的影響因素,資料如下表,請通過Logistic回歸統(tǒng)計方法對主要影響因素進行分析。無5911有6.04無6422無9.16無3611有&48無4231有5.36無4842有4.65無5012有12.848.3.2.1數(shù)據(jù)準備激活數(shù)據(jù)管理窗口,定義變量名:術(shù)后感染為Y(字符變量,有輸入Y、無輸入N),年齡為XI,手術(shù)創(chuàng)傷程度為X2,營養(yǎng)狀態(tài)為X3,術(shù)前預(yù)防性抗菌為X4(字符變量,有輸入Y、無輸入N),白細胞數(shù)為X5,癌腫病理分度為X6。按要求輸入原始數(shù)據(jù)。統(tǒng)計分析激活Statistics菜單選Regression中的Logistic...項,彈出LogisticRegression對話框(如圖8.8示)。從對話框左側(cè)的變量列表中選y,點擊A鈕使之進入Dependent框,選xl、x2、x3、x4、x5和x6,點擊A鈕使之進入Covariates框;點擊Method處的下拉按鈕,系統(tǒng)提供7種方法:1、Enter:所有自變量強制進入回歸方程;2、Forward:Conditional:以假定參數(shù)為基礎(chǔ)作似然比概率檢驗,向前逐步選擇自變量;3、Forward:LR:以最大局部似然為基礎(chǔ)作似然比概率檢驗,向前逐步選擇自變量;4、Forward:Wald:作Wald概率統(tǒng)計法,向前逐步選擇自變量;5、Backward:Conditional:以假定參數(shù)為基礎(chǔ)作似然比概率檢驗,向后逐步選擇自變量;6、Backward:LR:以最大局部似然為基礎(chǔ)作似然比概率檢驗,向后逐步選擇自變量;7、Backward:Wald:作Wald概率統(tǒng)計法,向后逐步選擇自變量。本例選用Forward:Conditional法,以便選擇有主要作用的影響因素;點擊Options...鈕,彈出LogisticRegression:Options對話框,在Display框中選取Atlaststep項,要求只顯示最終計算結(jié)果,點擊Continue鈕返回LogisticRegression對話框,再點擊OK鈕即可。8.3.2.3結(jié)果解釋在結(jié)果輸出窗口中將看到如下統(tǒng)計數(shù)據(jù)
系統(tǒng)先對字符變量進行重新賦值,對于應(yīng)變量Y,回答是(Y)的賦值為0,回答否(X)的賦值為1;對于應(yīng)變量X4,回答是(Y)的賦值為-1,回答否(X)的賦值為1。
EndBlockNumber1PIN=.0500Limitsreached.EndBlockNumber1PIN=.0500Limitsreached.FinalEquationforBlock1Estimationterminatedatiterationnumber12becauseLogLikelihooddecreasedbylessthan.01percent.-2LogLikelihood3.819GoodnessofFit3.000Overall93.33%Overall93.33%canceChi-SquaredfSignifiModelChi-Square15.2762.0005Improvement6.7661.0093ClassificationTableforYPredictedynPercentCorrectyInObserved++——+yy14I1I80.00%+——+——+nnI0I10I100.00%+——+——+VariablesintheEquation結(jié)果表明,第一步自變量X3入選,方程分類能力達80.00%;第二步自變量X6入選,方程分類能力達93.33%(參見結(jié)果中的分類分析表);方程有效性經(jīng)x2檢驗,x2=15.276,P=0.0005。Logistic回歸的分類概率方程為:e123.4053-30.5171X3-10.2797X6P=——————————————1+e123.4053-30.5171X3-10.2797X6根據(jù)該方程,若一胃癌患者營養(yǎng)狀態(tài)評分(X3)為3,癌腫病理分度(X6)為9,則其P=4.5X10-2廷0,這意味著術(shù)后將發(fā)生院內(nèi)感染;另一胃癌患者營養(yǎng)狀態(tài)評分(X3)為1,癌腫病理分度(X6)為4,則其P=0.98105~l,這意味著術(shù)后將不會發(fā)生院內(nèi)感染。第四節(jié)Probit過程主要功能調(diào)用此過程可完成劑量-效應(yīng)關(guān)系的分析。通過概率單位使劑量-效應(yīng)的S型曲線關(guān)系轉(zhuǎn)化成直線,從而利用回歸方程推算各效應(yīng)水平的相應(yīng)劑量值。實例操作[例8.4]研究抗瘧藥環(huán)氯胍對小白鼠的毒性,試驗結(jié)果如下表所示。試計算環(huán)氯胍的半數(shù)致死劑量。數(shù)據(jù)準備激活數(shù)據(jù)管理窗口,定義變量名:劑量為DOSE、試驗動物數(shù)為OBSERVE、死亡動物數(shù)為DEATH。然后輸入原始數(shù)據(jù)。統(tǒng)計分析激活Statistics菜單選Regression中的Probit...項,彈出ProbitAnalysis對話框(如圖8.9示)。從對話框左側(cè)的變量列表中選death,點擊A鈕使之進入ResponseFrequency框;選observe,點擊A鈕使之進入TotalObserved框;選dose,點擊A鈕使之進入Covariate(s)框,并下拉Transform菜單,選Logbase10項(即要求對劑量進行以10為底的對數(shù)轉(zhuǎn)換)。系統(tǒng)在Model欄中提供兩種模型,一是概率單位模型(Probit),另一是比數(shù)比自然對數(shù)模型(Logit)。本例選用概率單位模型。點擊Options...鈕,彈出ProbitAnalysis:Options對話框,在NaturalResponseRate欄選Calculatefromdata項,要求計算各劑量組的實際反應(yīng)率。之后點擊Continue鈕返回ProbitAnalysis對話框,再點擊OK鈕即可。結(jié)果解釋在結(jié)果輸出窗口中將看到如下統(tǒng)計數(shù)據(jù):系統(tǒng)首先顯示,共有7組原始數(shù)據(jù)采概率單位模型進行分析?;貧w方程的各參數(shù)在經(jīng)過14次疊代運算后確定,即PROBIT=5.95215-4.66313X。該方程擬合優(yōu)度X2檢驗結(jié)果,X2=0.833,P=0.934,擬合良好。
MODELInformationONLYNormalSigmoidisrequested.NaturalResponseratetobeestimatedCONTROLgroupisnotprovided.Parameterestimatesconvergedafter14iterations.Optimalsolutionfound.ParameterEstimates(PROBITmodel:(PROBIT(p))=Intercept+BX):ErrorCoeff./S.E.DOSERegressionCoeff.Standard5.952152.39832ErrorCoeff./S.E.DOSERegressionCoeff.Standard5.952152.398322.481802.48180InterceptStandardInterceptStandardErrorIntercept/S.E.ErrorIntercept/S.E.-2.12017-4.663132.19942-2.12017-4.663132.19942EstimateofNaturalResponseRate=.000000withS.E.=.26448PearsonGoodness-of—FitChiSquare=.833DF=4EstimateofNaturalResponseRate=.000000withS.E.=.26448PearsonGoodness-of—FitChiSquare=.833DF=4P=.934接著,系統(tǒng)顯示劑量對數(shù)值(DOSE)、實際觀察例數(shù)(NumberofSubjects)、試驗動物反應(yīng)數(shù)(ObservedResponses)、預(yù)期反應(yīng)數(shù)(ExpectedResponses)、殘差(Residual)和效應(yīng)的概率(Prob)。之后,顯示各效應(yīng)概率水平的劑量值及其95%可信區(qū)間值,按本例要求,環(huán)氯胍的半數(shù)致死劑量(即Prob=0.50時)為6.07347,其95%可信區(qū)間為1.86305—7.54282。
.427.48745.7038.012.011.688.312.30757.6012.02.01.682.318.14016.485.0.0.171-.171.03413ConfidenceLimitsforEffectiveDOSE95%ConfidenceLimitsProbDOSELowerUpper.012.46942.027524.27407.022.74406.045344.54351.032.93394.062234.72430.043.08539.078954.86574.053.21433.095804.98445.063.32832.112945.08821.073.43158.130475.18134.083.52676.148455.26651.093.61561.166945.34550.103.69937.185975.41954.154.06733.290605.74092.204.38570.413956.01572.254.67862.560216.26792
.304.95831.734366.51010.355.23239.942616.75084.405.506461.192866.99754.455.785281.495297.25814.506.073471.863057.54282.556.376002.312997.86673.606.698862.865878.25522.657.049743.544388.75565.707.439434.363949.46545.757.884165.3068810.59748.80&410756.2906912.60617.859.069107.2151416.40564.909.97116&0941224.20725.9110.202168.2776026.73478.9210.459198.4689229.82525.9310.74928&6717733.68627.9411.082788.8912838.64769.9511.475809.1351145.27000.9611.955389.4157254.59759.9712.572529.7559068.85554.9813.4425010.2057793.92908.9914.9375110.92195153.73112最后,系統(tǒng)輸出以劑量對數(shù)值為自變量X、以概率單位為應(yīng)變量Y的回歸直線散點圖,從圖中各點的分布狀態(tài)亦可看出,回歸直線的擬合程度是很好的。圖8.10劑量-效應(yīng)關(guān)系回歸直線散點圖第五節(jié)Nonlinear過程主要功能調(diào)用此過程可完成非線性回歸的運算。所謂非線性回歸,即為曲線型的回歸分析一些曲線模型我們已在本章第二節(jié)中述及。但在醫(yī)學(xué)研究中經(jīng),還經(jīng)常會遇到除本章第二節(jié)中述及的曲線模型,對此,SPSS提供Nonlinear過程讓用戶根據(jù)實際需要,建立各種曲線模型以用于研究變量間的相互關(guān)系。在醫(yī)學(xué)中,如細菌繁殖與培養(yǎng)時間關(guān)系的研究即可借助Nonlinear過程完成。下面一些曲線模型是在論文中較常見的,提供給用戶應(yīng)用時作參考:模型名稱模型表達式Asympt.Regression1Y=bl+b2Xexp(b3x)Asympt.Regression2Y=bl-(b2X(b3x))DensityY=(bl+b2XX)(-l/b3)
DensityGaussexp(-b2XXGaussexp(-b2XX2))Gompertzexp(-b3XX))Johnson-SchumacherLogModifiedLog-LogisticMetcherlichLawofDim.Ret.Y=MichaelisMentenMorgan-Mercer-FlorinPeal-ReedXX+b4XX2+b5XX3)))RatioofCubicsXX3)/(b5XX3)RatioofQuadraticsRichardsX))(1/b4))VerhulstVonBertalanffyXX))(1/(1-b4))WeibullXb4)YieldDensityY=b1Xexp(-b2XY=b1Xexp(-b2/(X+b3))Y=(b1+b3XX)b2Y=b1-ln(1+b2Xexp(-b3XX))b1+b2Xexp(-b3XX)Y=b1XX/(X+b2)Y=(b1Xb2+b3XXb4)/(b2+Xb4)=b1/(1+b2Xexp(-(b3Y=(b1+b2XX+b3XX2+b4Y=(b1+b2XX+b3XX2)/(b4XX2)Y=b1/((1+b3Xexp(-b2XY=b1/(1+b3Xexp(-b2XX))Y=(b1(1-b4)-b2Xexp(-b3=b1-b2Xexp(-b3XY=(b1+b2XX+b3XX2)(-1)8.5.2實例操作[例8.5]選取某地某年壽命表中40-80歲各年齡組的尚存人數(shù)資料如下表請就該資料試擬合Gompertz曲線(Y=blXb2?3x))。
年齡組(歲)年齡簡化值(X)尚存人數(shù)(Y)404550556065707580012345678812777925876532728506756859911508003932528074數(shù)據(jù)準備激活數(shù)據(jù)管理窗口,定義變量名:年齡簡化值為X,尚存人數(shù)為Y。輸入原始數(shù)據(jù)。統(tǒng)計分析激活Statistics菜單選Regression中的Nonlinear...項,彈出NonlinearRegression對話框(如圖8.11示)。從對話框左側(cè)的變量列表中選y,點擊鈕使之進入Dependent框。由于SPSS系統(tǒng)尚無法智能地自動擬合用戶所需的曲線,故一方面要求用戶估計方程中常數(shù)項和各系數(shù)項進行疊代運算的起始值,另一方面要求用戶列出方程模型。對此,可首先點擊NonlinearRegression對話框的Parameters...鈕,彈出NonlinearRegression:Parameters對話框(圖8.12),在Name處定義系數(shù)名,在StartValue處輸入起始值(這項工作是十分重要的,否則系統(tǒng)可能無法運算,甚至?xí)虔B代次數(shù)過大導(dǎo)致SPSS系統(tǒng)的崩潰),本例定義bl=8500、b2=l、b3=1.5,每定義一個系數(shù),即點擊Add鈕加以確定;若在后面的運算中出錯,則還可修改系數(shù)項的起始值,修改后點擊Change鈕加以確定;然后點擊Continue鈕返回NonlinearRegression對話框。在ModelExpression處寫出曲線方程表達式,用戶可借助系統(tǒng)提供的數(shù)碼盤和函數(shù)列表寫出方程。本例要求計算根據(jù)回歸方程求出的預(yù)測值,可點擊Save鈕,在NonlinearRegression:SaveNewVariables對話框中選Predictedvalue項。最后點擊OK鈕即可。8.12系數(shù)項定義對話框結(jié)果解釋在結(jié)果輸出窗口中將看到如下統(tǒng)計數(shù)據(jù)
SSB1B2B31283271934638500.000001.000000001.500000001.11433343480080175.3427.7392405511.5000000021433343480080175.3427.7392405511.500000002.13.8505E+11194572.013.006502086-.216290772.2800135019.683185.8046.8429947971.198524303800135019.683185.8046.8429947971.198524303.11285737878881201.83221.015792671.429277913.2550558275.185774.2528.8504931971.214331274550558275.185774.2528.8504931971.214331274.1205793117.690637.3496.8594292121.252769325205793117.690637.3496.8594292121.252769325.149937888.6592251.6832.9059927001.33942536649937888.6592251.6832.9059927001.339425366.1438492814.383503.5809.9664210431.463656026.214165723.6591420.4568.9091126941.36083115714165723.6591420.4568.9091126941.360831157.18227661.24889440.0706.9234633151.3889894088227661.24889440.0706.9234633151.38898940&117416856.8685916.5498.9482999861.45005498&24600297.86688467.6768.9302963971.4079772494600297.86688467.6768.9302963971.407977249.12761649.68586538.9357.9437367071.44419408102761649.68586538.9357.9437367071.4441940810.1644830.076585633.9620.9497149171.4689666011644830.076585633.9620.9497149171.4689666011.1475140.368485680.9561.9493255671.4689804412475140.368485680.9561.9493255671.4689804412.1475135.426585679.2273.9493387131.46903683131.46903683475135.426585679.2273.94933871313.1475135.426285679.2477.9493385901.46903640Runstoppedafter30modelevaluationsand13derivativeevaluations.IterationshavebeenstoppedbecausetherelativereductionbetweensuccessiveresidualsumsofsquaresisatmostSSCON=1.000E—08NonlinearRegressionSummaryStatisticsDependentVariableYSourceSquareDFSumofSquaresMeanRegression09.2337121583327.6123738611Residual9.237716475135.426247918UncorrectedTotal937122058463.0(CorrectedTotal)82823635793.56Rsquared=1—ResidualSS/CorrectedSS=.99983Asymptotic95%AsymptoticConfidenceIntervalParameterEstimateStd.
經(jīng)30次疊代運算后,相鄰兩次的方程剩余均方差值不大于規(guī)定的1X10-8,滿足要求;回歸方程的決定系數(shù)R2=0.99983,Gompertz曲線方程為:Y=85679.247671X0.94933859(1.469036403X)本例要求計算預(yù)測值,系統(tǒng)將結(jié)果存入原始數(shù)據(jù)庫中(圖8.13),系統(tǒng)以pred_作為預(yù)測值的變量名。由結(jié)果可見,預(yù)測值與實際值十分接近。圖8.13原始數(shù)據(jù)及其預(yù)測值多元回歸分析在大多數(shù)的實際問題中,影響因變量的因素不是一個而是多個,我們稱這類回問題為多元回歸分析??梢越⒆兞縴與各自變量xj(j=1,2,3,...,n)之間的多元線性回歸模型:其中:b0是回歸常數(shù);bk(k=1,2,3,…,n)是回歸參數(shù);e是隨機誤差。多元回歸在病蟲預(yù)報中的應(yīng)用實例:某地區(qū)病蟲測報站用相關(guān)系數(shù)法選取了以下4個預(yù)報因子;x1為最多連續(xù)10天誘蛾量(頭);x2為4月上、中旬百束小谷草把累計落卵量(塊);x3為4月中旬降水量(毫米),x4為4月中旬雨日(天);預(yù)報一代粘蟲幼蟲發(fā)生量y(頭/m2)。分級別數(shù)值列成表2-1。預(yù)報量y:每平方米幼蟲0~10頭為1級,11~20頭為2級,21~40頭為3級,40頭以上為4級。預(yù)報因子:x1誘蛾量0~300頭為I級,301~600頭為2級,601~1000頭為3級,1000頭以上為4級;x2卵量0~150塊為1級,151~300塊為2級,301~550塊為3級,550塊以上為4級;x3降水量0~10毫米為1級,10.1~13.2毫米為2級,13.3~17.0毫米為3級,17.0毫米以上為4級;x4雨日0~2天為級,3~4天為2級,5天為3級,6天或6天以上為4級。表2-1X1x2x3x4y年蛾量級別卵量級別降水量級別雨日級別幼蟲密度級別19601022411214.31211011961300144030.111141196269936717.511191196318764675417.147455419654318011.9121111966422220101013119678063510311.82322831976115124020.612171
197171831460418.444245419728033630413.433226319735722280213.224216219742641330342.243219219751981165271.84532331976461214017.515328319777693640444.7432444197825516510101112數(shù)據(jù)保存在“DATA6-5SAV〃文件中。1)準備分析數(shù)據(jù)在SPSS數(shù)據(jù)編輯窗口中,創(chuàng)建''年份〃、''蛾量〃、“卵量〃、“降水量〃、“雨日〃和''幼蟲密度〃變量,并輸入數(shù)據(jù)。再創(chuàng)建蛾量、卵量、降水量、雨日和幼蟲密度的分級變量'x1〃、“x2”、“x3〃、“x4”和“y〃,它們對應(yīng)的分級數(shù)可以在SPSS數(shù)據(jù)編輯窗口中通過計算產(chǎn)生。編輯后的數(shù)據(jù)顯示如圖2-1。圖2-1或者打開已存在的數(shù)據(jù)文件“DATA6-5.SAV〃。2)啟動線性回歸過程單擊SPSS主菜單的“Analyze”下的“Regression”中“Linear”項,將打開如圖2-2所示的線性回歸過程窗口。圖2-2線性回歸對話窗口設(shè)置分析變量設(shè)置因變量:用鼠標選中左邊變量列表中的''幼蟲密度[y]〃變量,然后點擊“Dependent”欄左邊的向右拉按鈕,該變量就移至『'Dependent”因變量顯示欄里。設(shè)置自變量:將左邊變量列表中的“蛾量[x1]〃、“卵量[x2]〃、“降水量[x3]〃、“雨日[x4]〃變量,選移到“Independent(S)"自變量顯示欄里。設(shè)置控制變量:本例子中不使用控制變量,所以不選擇任何變量。選擇標簽變量:選擇“年份〃為標簽變量。選擇加權(quán)變量:本例子沒有加權(quán)變量,因此不作任何設(shè)置。回歸方式本例子中的4個預(yù)報因子變量是經(jīng)過相關(guān)系數(shù)法選取出來的,在回歸分析時不做篩選。因此在'Method〃框中選中“Enter〃選項,建立全回歸模型。5)設(shè)置輸出統(tǒng)計量單擊“Statistics〃按鈕,將打開如圖2-3所示的對話框。該對話框用于設(shè)置相關(guān)參數(shù)。其中各項的意義分別為圖2-3“Statistics"對話框①“RegressionCoefficients”回歸系數(shù)選項:“Estimates”輸出回歸系數(shù)和相關(guān)統(tǒng)計量“Confideneeinterval"回歸系數(shù)的95%置信區(qū)間“Covariancematrix”回歸系數(shù)的方差-協(xié)方差矩陣本例子選擇“Estimates〃輸出回歸系數(shù)和相關(guān)統(tǒng)計量。②“Residuals”殘差選項:“Durbin-Watson"Durbin-Watson檢驗“CasewisediagnoStic”輸出滿足選擇條件的觀測量的相關(guān)信息。選擇該項,下面兩項處于可選狀態(tài):“Outliersoutsidestandarddeviations"選擇標準化殘差的絕對值大于輸入值的觀測量;“Allcases〃選擇所有觀測量本例子都不選。③其它輸入選項“Modelfit〃輸出相關(guān)系數(shù)、相關(guān)系數(shù)平方、調(diào)整系數(shù)、估計標準誤、ANOVA表。“Rsquaredchange”輸出由于加入和剔除變量而引起的復(fù)相關(guān)系數(shù)平方的變化?!癉escriptives”輸出變量矩陣、標準差和相關(guān)系數(shù)單側(cè)顯著水平矩陣?!癙artandpartialcorrelation”相關(guān)系數(shù)和偏相關(guān)系數(shù)“Collinearitydiagnosties"顯示單個變量和共線性分析的公差。本例子選擇“Modelfit〃項。6)繪圖選項在主對話框單擊“Plots〃按鈕,將打開如圖2-4所示的對話框窗口。該對話框用于設(shè)置要繪制的圖形的參數(shù)。圖中的“X〃和“Y”框用于選擇X軸和Y軸相應(yīng)的變量。圖2-4“Plots”繪圖對話框窗口左上框中各項的意義分別為:“DEPENDNT”因變量。“ZPRED〃標準化預(yù)測值?!癦RESID〃標準化殘差?!癉RESID〃刪除殘差?!癆DJPRED〃調(diào)節(jié)預(yù)測值?!癝RESID”學(xué)生氏化殘差。“SDRESID”學(xué)生氏化刪除殘差?!癝tandardizedResidualPlots”設(shè)置各變量的標準化殘差圖形輸出。其中共包含兩個選項:“Histogram”用直方圖顯示標準化殘差?!癗ormalprobabilityplots”比較標準化殘差與正態(tài)殘差的分布示意圖?!癙roduceallpartialplot”偏殘差圖。對每一個自變量生成其殘差對因變量殘差的散點圖。本例子不作繪圖,不選擇。7)保存分析數(shù)據(jù)的選項在主對話框里單擊“Save!”鈕,將打開如圖2-5所示的對話框。圖2-5“Save”對話框①“PredictedValudS”測值欄選項:Unstandardized非標準化預(yù)測值。就會在當前數(shù)據(jù)文件中新添加一個以字符“PRE_”開頭命名的變量,存放根據(jù)回歸模型擬合的預(yù)測值。Standardized標準化預(yù)測值A(chǔ)djusted調(diào)整后預(yù)測值S.E.ofmeanpredictions預(yù)測值的標準誤。本例選中“Unstandardize非標準化預(yù)測值。②“Distance距?離欄選項:Mahalanobis:距離。Cook's”:Cc距離。Leveragevalues:杠桿值。③“PredictionInterva預(yù)測區(qū)間選項:Mean:區(qū)間的中心位置。Individual:觀測量上限和下限的預(yù)測區(qū)間。在當前數(shù)據(jù)文件中新添加一個以字符“LICI_”頭命名的變量,存放預(yù)測區(qū)間下限值;以字符“UICI_”開頭命名的變量,存放預(yù)測區(qū)間上限值。ConfidenceInterval:置信度。本例不選。“SavetoNewFile”保存為新文件:選中"Coefficientstatistics”項將回歸系數(shù)保存到指定的文件中。本例不選。“ExportmodelinformationtoXMLfile”導(dǎo)出統(tǒng)計
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 房地產(chǎn)市場報告 -2024年四季度青島寫字樓和零售市場報告
- 2025廣告公司采購合同
- 2025食品代理合同樣本
- 二零二五年度數(shù)字貨幣內(nèi)部股東股權(quán)轉(zhuǎn)讓合同模板3篇
- 二零二五年度農(nóng)業(yè)機械設(shè)備租賃與農(nóng)產(chǎn)品加工服務(wù)合同3篇
- 2025年度鄉(xiāng)村振興戰(zhàn)略下全新貧困戶幫扶合作協(xié)議3篇
- 二零二五年度車輛維修版服務(wù)合同3篇
- 二零二五年度全新私人合同:私人健身俱樂部及健身器材租賃服務(wù)協(xié)議2篇
- 二零二五年度企業(yè)個人業(yè)績目標對賭協(xié)議3篇
- 2025年度環(huán)保科技合伙人股權(quán)分配與綠色發(fā)展合同3篇
- 護士條例課件
- 結(jié)腸鏡檢查前腸道準備
- 創(chuàng)業(yè)基礎(chǔ)知識競賽題庫及答案
- (高清版)TDT 1063-2021 國土空間規(guī)劃城市體檢評估規(guī)程
- 國有企業(yè)股權(quán)轉(zhuǎn)讓規(guī)定
- 收費站一站一品方案
- 2024年保險考試-車險查勘定損員筆試歷年真題薈萃含答案
- 2024屆湖南省長沙市高三新高考適應(yīng)性考試生物試題(含答案解析)
- 2024年四川省普通高中學(xué)業(yè)水平考試(思想政治樣題)
- 精液的常規(guī)檢測課件
- 《青紗帳-甘蔗林》 課件 2024年高教版(2023)中職語文基礎(chǔ)模塊下冊
評論
0/150
提交評論