論文知識(shí)回歸分析_第1頁(yè)
論文知識(shí)回歸分析_第2頁(yè)
論文知識(shí)回歸分析_第3頁(yè)
論文知識(shí)回歸分析_第4頁(yè)
論文知識(shí)回歸分析_第5頁(yè)
已閱讀5頁(yè),還剩48頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、SPSS如何進(jìn)行線性回歸分析操作?瀏覽:3113?I?更新:2014-03-13 10:11本節(jié)內(nèi)容主要介紹如何確定并建立線性回歸方程。 包括只有一個(gè)自變量的一元線 性回歸和和含有多個(gè)自變量的多元線性回歸。為了確保所建立的回歸方程符合線 性標(biāo)準(zhǔn),在進(jìn)行回歸分析之前,我們往往需要對(duì)因變量與自變量進(jìn)行線性檢驗(yàn)。也就是類似于相關(guān)分析一章中講過(guò)的借助于散點(diǎn)圖對(duì)變量間的關(guān)系進(jìn)行粗略的 線性檢驗(yàn),這里不再重復(fù)。另外,通過(guò)散點(diǎn)圖還可以發(fā)現(xiàn)數(shù)據(jù)中的奇異值,對(duì)散 點(diǎn)圖中表示的可能的奇異值需要認(rèn)真檢查這一數(shù)據(jù)的合理性。一、一元線性回歸分析用SPSS進(jìn)行回歸分析,實(shí)例操作如下:?jiǎn)螕糁鞑藛?Analyze / Reg

2、ression / Linear ,進(jìn)入設(shè)置對(duì)話框如圖 7-9所示。從左邊變量表列中把因變量 y選入到因變量(Dependent )框中,把自 變量x選入到自變量(Independent )框中。在方法即 Method 一項(xiàng)上請(qǐng)注意 保持系統(tǒng)默認(rèn)的選項(xiàng)Enter ,選擇該項(xiàng)表示要求系統(tǒng)在建立回歸方程時(shí)把所選中 的全部自變量都保留在方程中。所以該方法可命名為強(qiáng)制進(jìn)入法(在多元回歸分析中再具體介紹這一選項(xiàng)的應(yīng)用)。具體如下圖所示:請(qǐng)單擊Statistics按鈕,可以選擇需要輸出的一些統(tǒng)計(jì)量。如RegressionCoefficients(回歸系數(shù))中的Estimates,可以輸出回歸系數(shù)及相關(guān)統(tǒng)計(jì)

3、量,包括回歸系數(shù)B、標(biāo)準(zhǔn)誤、標(biāo)準(zhǔn)化回歸系數(shù) BETA、T值及顯著性水平等。Model fit 項(xiàng)可輸出相關(guān)系數(shù)R,測(cè)定系數(shù)R2,調(diào)整系數(shù)、估計(jì)標(biāo)準(zhǔn)誤及方差分析表。上 述兩項(xiàng)為默認(rèn)選項(xiàng),請(qǐng)注意保持選中。設(shè)置如圖7-10所示。設(shè)置完成后點(diǎn)擊Continue返回主對(duì)話框?;貧w方程建立后,除了需要對(duì)方程的顯著性進(jìn)行檢驗(yàn)外, 還需要檢驗(yàn)所建立的方 程是否違反回歸分析的假定,為此需進(jìn)行多項(xiàng)殘差分析。由于此部分內(nèi)容較復(fù)雜 而且理論性較強(qiáng),所以不在此詳細(xì)介紹,讀者如有興趣,可參閱有關(guān)資料。用戶在進(jìn)行回歸分析時(shí),還可以選擇是否輸出方程常數(shù)。 單擊Options 按鈕,打開(kāi)它的對(duì)話框,可以看到中間有一項(xiàng)Inclu

4、de constant in equation可選項(xiàng)。選中該項(xiàng)可輸出對(duì)常數(shù)的檢驗(yàn)。在 Options對(duì)話框中,還可以定義處 理缺失值的方法和設(shè)置多元逐步回歸中變量進(jìn)入和排除方程的準(zhǔn)則,這里我們采用系統(tǒng)的默認(rèn)設(shè)置,如圖7-11所示。設(shè)置完成后點(diǎn)擊Continue返回主對(duì)話框。4.在主對(duì)話框點(diǎn)擊OK得到程序運(yùn)行結(jié)果如題。我選擇的是線性回歸,得出了一堆表格和圖標(biāo)。我做的是生物學(xué)方面的統(tǒng)計(jì)。我的目 標(biāo)是得出模擬方程,再根據(jù)已有的自變量來(lái)計(jì)算因變量。我是spss新手,而且我對(duì)逐步回歸也不了解。但由于工作原因,必須得到模擬方程。請(qǐng)高手告訴我我的這個(gè)統(tǒng)計(jì)符不符合線 性關(guān)系,如果符合,怎么寫(xiě)模擬方程,謝謝!以

5、下是部分截圖分享到:2013-11-16 19:52提問(wèn)者采納x1,x2.x5是5個(gè)自變量,1個(gè)y因變量。系數(shù)a圖中是將x1與y建立一個(gè)線性回歸模型,常量為1.956E-6 , sig.也即P 值=1 0.05,無(wú)統(tǒng)計(jì)學(xué)意義,x1的斜率為-0.504, P=0.0000.05也就說(shuō)明這個(gè)變量對(duì)模型的建立無(wú)統(tǒng)計(jì)學(xué)意 義,在多元線性回歸中也就可以無(wú)情的剔除掉。而由系數(shù) a圖可知,x1, x2,x3, x4,x5的斜率P值者B是0.0000.05無(wú)顯著性意義,說(shuō)明擬合的線過(guò)原點(diǎn),也即常量值應(yīng)為0, 但是否能改為0這個(gè)我也不確定,但0或0.002差別不會(huì)太大的。追問(wèn)厲害,一看就是高手。不好意思,系數(shù)那

6、個(gè)表里缺一塊, 我現(xiàn)在補(bǔ)上,再把另外幾個(gè)表補(bǔ)上。 還有點(diǎn)問(wèn)題想請(qǐng)指教。1.你說(shuō)的那個(gè)常量為1.965E-6 ,這個(gè)E是什么意思? 2.自變量一共 有6個(gè),從x1到x6,可能是我那個(gè)表缺一塊的原因吧,抱歉了。系數(shù)表缺的部分:其它表:能否將最終的模擬方程式寫(xiě)出來(lái),不勝感激!回答1.965E-6是指1.965乘10的-6次方。已排除的變量表對(duì)應(yīng)系數(shù)a表,模型1對(duì)應(yīng)模型1,也即前一個(gè)表是進(jìn)入,相對(duì)的后一個(gè)就排除。模型1進(jìn)入了 x1 ,排除的x2,x3,x4,x5,x6中的x2的P值0.05還不能排除,還要進(jìn)入分析,模型2, 3等依次類推,一個(gè)也排除不掉。全部進(jìn)入回歸方程。另,如果兩變量間存在共線性的話

7、,是不能都進(jìn)入回歸方程的。判斷依據(jù)為膨脹因子VIF10,倒數(shù)即容差0. 1,已排除變量圖上可知各變量間不存在共線性,都不用排除。常量P值0.05可以去掉,各變量的斜率選用模型6的標(biāo)準(zhǔn)系數(shù)。因而最終回歸方程為:y=-0.860 x1-0.713x2-0.567x3-0.414x4-0.254x5-0.130 x6回歸分析是處理兩個(gè)及兩個(gè)以上變量間線性依存關(guān)系的統(tǒng)計(jì)方法。在醫(yī)學(xué)領(lǐng)域中,此類問(wèn)題很普遍,如人頭發(fā)中某種金屬元素的含量與血液中該元素的含量有關(guān)系,人的體表面積與身高、體重有關(guān)系;等等?;貧w分析就是用于說(shuō)明這種依存變化的數(shù)學(xué)關(guān)系。第一節(jié) Linear 過(guò)程主要功能調(diào)用此過(guò)程可完成二元或多元的

8、線性回歸分析。在多元線性回歸分析中, 用戶還可根據(jù)需要,選用不同篩選自變量的方法(如:逐步法、向前法、向后法,等)。實(shí)例操作例8.1某醫(yī)師測(cè)得10名3歲兒童的身高(cm)、體重(kg)和體表面積(cm2)資料如下。試用多元回歸方法確定以身高、體重為自變量,體表面積為應(yīng)變量的回歸方程。兒童編號(hào)體表面!積(Y)身高(X)體重(X?)15.38288.011.025.29987.611.835.35888.512.045.29289.012.355.60287.713.166.01489.513.775.83088.814.486.10290.414.996.07590.615.2106.41191

9、.216.0數(shù)據(jù)準(zhǔn)備激活數(shù)據(jù)管理窗口,定義變量名:體表面積為Y,保留3位小數(shù);身高、體重分別為X1、X2 , 1位小數(shù)。輸入原始數(shù)據(jù),結(jié)果如圖 8.1所示。圖8.1原始數(shù)據(jù)的輸入統(tǒng)計(jì)分析激活 Statistics 菜單選 Regression 中的 Linear.項(xiàng),彈出 Linear Regression 對(duì)話框(如 圖8.2示)。從對(duì)話框左側(cè)的變量列表中選y,點(diǎn)擊?鈕使之進(jìn)入Dependent框,選x1、x2,點(diǎn)擊?鈕使之進(jìn)入Indepentdent(s)框;在 Method處下拉菜單,共有 5個(gè)選項(xiàng):Enter (全部 入選法)、Stepwise (逐步法)、 Remove (強(qiáng)制剔除法

10、)、 Backward (向后法)、 Forward (向前法)。本例選用Enter法。點(diǎn)擊OK鈕即完成分析。用戶還可點(diǎn)擊Statistics.鈕選擇是否作變量的描述性統(tǒng)計(jì)、回歸方程應(yīng)變量的可信區(qū)間 估計(jì)等分析;點(diǎn)擊 Plots.鈕選擇是否作變量分布圖(本例要求對(duì)標(biāo)準(zhǔn)化Y預(yù)測(cè)值作變量分布圖);點(diǎn)擊Save.鈕選擇對(duì)回歸分析的有關(guān)結(jié)果是否作保存(本例要求對(duì)根據(jù)所確定的回歸方程求得的未校正 Y預(yù)測(cè)值和標(biāo)準(zhǔn)化Y預(yù)測(cè)值作保存);點(diǎn)擊Options.鈕選擇變量入選與剔除的“、3值和缺失值的處理方法。結(jié)果解釋在結(jié)果輸出窗口中將看到如下統(tǒng)計(jì)數(shù)據(jù):Listwise Deletion of Mis

11、sing DataEquation Number 1Dependent Variable.Block Number1.Method:EnterX1X21.Variable(s) Entered on Step NumberX2X12.Multiple R.94964R Square.90181Adjusted R Square.87376Standard Error.14335Analysis of VarianceDFSum ofSquaresMean SquareRegression.6605221.32104Residual.020557.14384F =32.14499Signif F

12、 =.0003-Variables in the EquationVariableBSEBBetaTSig TX1.068701.074768.215256.919.3887X2.183756.056816.7576603.234.0144(Constant)-2.8564766.017776-.475.6495End Block Number 1 All requested variables entered.結(jié)果顯示,本例以 XI、X2為自變量,Y為應(yīng)變量,采用全部入選法建立回歸方程?;貧w方程的復(fù)相關(guān)系數(shù)為0.94964,決定系數(shù)(即r2)為0.90181 ,經(jīng)方差分析,F(xiàn)=34.1449

13、9,P=0.0003,回歸方程有效。回歸方程為 Y=0.0687101X1+0.183756X2-2.856476 。本例要求按所建立的回歸方程計(jì)算Y預(yù)測(cè)值和標(biāo)準(zhǔn)化 Y預(yù)測(cè)值(所謂標(biāo)準(zhǔn)化 Y預(yù)測(cè)值是指將根據(jù)回歸方程求得的Y預(yù)測(cè)值轉(zhuǎn)化成按均數(shù)為0、標(biāo)準(zhǔn)差為1的標(biāo)準(zhǔn)正態(tài)分布的 Y值)并將計(jì)算結(jié)果保存入原數(shù)據(jù)庫(kù)。系統(tǒng)將原始的X1、X2值代入方程求 Y值預(yù)測(cè)值(即庫(kù)中pre_1欄)和標(biāo)準(zhǔn)化 Y預(yù)測(cè)值(即庫(kù)中zpr_1欄),詳見(jiàn)圖8.3。圖8.3計(jì)算結(jié)果的保存本例還要求對(duì)標(biāo)準(zhǔn)化 Y預(yù)測(cè)值作變量分布圖,系統(tǒng)將繪制的統(tǒng)計(jì)圖送向ChartCarousel窗口,雙擊該窗口可見(jiàn)下圖顯示結(jié)果。圖8.4對(duì)標(biāo)準(zhǔn)化丫預(yù)測(cè)

14、值所作的正態(tài)分布圖第二節(jié) Curve Estimation 過(guò)程8.2.1 主要功能調(diào)用此過(guò)程可完成下列有關(guān)曲線擬合的功能:1、Linear :擬合直線方程(實(shí)際上與Linear過(guò)程的二元直線回歸相同,即Y = bo+biX);,、一122、Quadratic :擬合二次方程(Y = b o+ biX+b2X);X3、Compound擬合復(fù)合曲線模型( Y = b oxbi );(b0+b1X)4、 Growth :擬合等比級(jí)數(shù)曲線模型( Y = e );5、Logarithmic :擬合對(duì)數(shù)方程(Y = b o+bilnX )236、Cubic :擬合三次方程(Y = b o+ b iX+b

15、2X +b3X );7、S:擬合S形曲線(Y = e(b0+b1/X)b1X8、Exponential :擬合指數(shù)方程(Y = b 0 e );9、Inverse :數(shù)據(jù)按 Y = b 0+bX進(jìn)行變換; TOC o 1-5 h z (b110、Power:擬合乘哥曲線模型(Y = b 0X);,X11、Logistic :擬合 Logistic 曲線模型(Y = 1/ (1/u + b 0 xb1)。8.2.2實(shí)例操作例8.2某地1963年調(diào)查得兒童年齡(歲)X與錫克試驗(yàn)陰性率(為 Y的資料如下,試擬合對(duì)數(shù)曲線。數(shù)據(jù)準(zhǔn)備年齡(歲)錫克試驗(yàn)陰性率(為XY157.1276.0390

16、.9493.0596.7695.6796.2激活數(shù)據(jù)管理窗口,定義變量名:錫克試驗(yàn)陰性率為Y,年齡為X,輸入原始數(shù)據(jù)。統(tǒng)計(jì)分析激活 Statistics菜單選 Regression 中的 Curve Estimation. 項(xiàng),彈出 CurveEstimation 對(duì)話框(如圖8.5示)。從對(duì)話框左側(cè)的變量列表中選y,點(diǎn)擊?鈕使之進(jìn)入Dependent框,選x,點(diǎn)擊?鈕使之進(jìn)入Indepentdent(s) 框;在Model框內(nèi)選擇所需的曲線 模型,本例選擇Logarithmic 模型(即對(duì)數(shù)曲線);選Plot models項(xiàng)要求繪制曲線擬合圖; 點(diǎn)擊 Save.鈕,彈出 Cur

17、ve Estimation:Save對(duì)話框,選擇 Predicted value 項(xiàng),要求在原始數(shù)據(jù)庫(kù)中保存根據(jù)對(duì)數(shù)方程求出的丫預(yù)測(cè)值,點(diǎn)擊 Continue鈕返回Curve Estimation對(duì)話框,再點(diǎn)擊OK鈕即可。結(jié)果解釋在結(jié)果輸出窗口中將看到如下統(tǒng)計(jì)數(shù)據(jù):在以X為自變量、丫為應(yīng)變量,采用對(duì)數(shù)曲線擬合方法建立的方程,決定系 數(shù)F2=0.913 (接近于1),作擬合優(yōu)度檢驗(yàn),方差分析表明:F=52.32, P=0.001 ,擬合度很好,對(duì)數(shù)方程為:Y=61.3259+20.6704lnX 。本例要求繪制曲線擬合圖,結(jié)果如圖8.6所示。圖8.6對(duì)數(shù)曲線擬合情形Y預(yù)測(cè)值(變量名

18、為fit_1 )存入數(shù)據(jù)庫(kù)根據(jù)方程Y=61.3259+20.6704lnX ,將原始數(shù)據(jù)X值代入,求得中,參見(jiàn)圖8.7。圖8.7 計(jì)算結(jié)果的保存第三節(jié) Logistic 過(guò)程主要功能調(diào)用此過(guò)程可完成 Logistic 回歸的運(yùn)算。所謂Logistic 回歸,是指應(yīng)變量為二級(jí) 計(jì)分或二類評(píng)定的回歸分析,這在醫(yī)學(xué)研究中經(jīng)常遇到,如:死亡與否(即生、死二類評(píng)定)的概率跟病人自身生理狀況和所患疾病的嚴(yán)重程度有關(guān);對(duì)某種疾病的易感性的概率(患病、不患病二類評(píng)定)與個(gè)體性別、年齡、免疫水平等有關(guān)。此類問(wèn)題的解決均可借助邏輯回歸來(lái)完成。特別指出,本節(jié)介紹的Logistic 過(guò)程,應(yīng)與日常所說(shuō)的 Logist

19、ic 曲線模型(即S或倒S形曲線)相區(qū)別。用戶如果要擬合Logistic 曲線模型,可調(diào)用本章第二節(jié) CurveEstimation 過(guò)程,系統(tǒng)提供11種曲線模型,其中含有Logistic 曲線模型(參見(jiàn)上節(jié))。在一般的多元回歸中,若以P(概率)為應(yīng)變量,則方程為P=b0+b1X1+b2X2+- +bkXk,但用該方程計(jì)算時(shí),常會(huì)出現(xiàn)P1或P0的不合理情形。為此,對(duì)P作對(duì)數(shù)單位轉(zhuǎn)換,即logitP=ln(P/1-P) ,于是,可得到 Logistic 回歸方程為:b0+b1X1+b2X2+ +bkXkP = b0+b1X1+b2X2+ +bkXk 1+ e實(shí)例操作例8.3某醫(yī)師研究男性胃癌患者

20、發(fā)生術(shù)后院內(nèi)感染的影響因素,資料如下表,請(qǐng)通過(guò)Logistic 回歸統(tǒng)計(jì)方法對(duì)主要影響因素進(jìn)行分析。術(shù)后感染(有無(wú))Y年齡(歲)X1手木創(chuàng)傷 程度(5等級(jí))X2營(yíng)養(yǎng)狀 態(tài)(3等 級(jí))X3術(shù)前預(yù)防性 抗菌(啟尢)X4白細(xì)胞數(shù)(X 109/L)X5癌腫病理分 度(TNM導(dǎo)分總 和)X6有6942無(wú)5.69有7253無(wú)4.46無(wú)5732無(wú)9.74無(wú)4111有11.25無(wú)3211有10.45有6533有7.05無(wú)5832有3.16有5442無(wú)6.66有5522有7.97無(wú)5911有6.04無(wú)6422無(wú)9.16無(wú)3611有8.48無(wú)4231有5.36無(wú)4842有4.65無(wú)5012有12.84數(shù)據(jù)準(zhǔn)備激活

21、數(shù)據(jù)管理窗口,定義變量名:術(shù)后感染為Y (字符變量,有輸入丫、無(wú)輸入N), 年齡為X1,手術(shù)創(chuàng)傷程度為 X2,營(yíng)養(yǎng)X犬態(tài)為X3,術(shù)前預(yù)防性抗菌為 X4(字符變量,有輸入 丫、無(wú)車入ND ,白細(xì)胞數(shù)為 X5,癌腫病理分度為 X6。按要求輸入原始數(shù)據(jù)。統(tǒng)計(jì)分析激活 Statistics菜單選 Regression 中的 Logistic. 項(xiàng),彈出 LogisticRegression對(duì)話框(如圖8.8示)。從對(duì)話框左側(cè)的變量列表中選y,點(diǎn)擊?鈕使之進(jìn)入Dependent 框,選 x1、x2、x3、x4、x5 和 x6,點(diǎn)擊?鈕使之進(jìn)入 Covariates 框;點(diǎn)擊 Method 處的下拉按鈕,

22、系統(tǒng)提供7種方法:1、Enter :所有自變量強(qiáng)制進(jìn)入回歸方程;2、Forward: Conditional :以假定參數(shù)為基礎(chǔ)作似然比概率檢驗(yàn),向前逐 步選擇自變量;3、Forward: LR以最大局部似然為基礎(chǔ)作似然比概率檢驗(yàn),向前逐步選擇 自變量;4、Forward: Wald :作 Wald概率統(tǒng)計(jì)法,向前逐步選擇自變量;5、Backward: Conditional :以假定參數(shù)為基礎(chǔ)作似然比概率檢驗(yàn),向后逐 步選擇自變量;6、Backward: LR :以最大局部似然為基礎(chǔ)作似然比概率檢驗(yàn),向后逐步選 擇自變量;7、Backward: Wald :作 Wald概率統(tǒng)計(jì)法,向后逐步選

23、擇自變量。本例選用Forward: Conditional 法,以便選擇有主要作用的影響因素;點(diǎn)擊 Options 鈕,彈出 Logistic Regression:Options 對(duì)話框,在 Display 框中選取 At last step項(xiàng),要求只顯示最終計(jì)算結(jié)果,點(diǎn)擊 Continue鈕返回Logistic Regression 對(duì)話框, 再點(diǎn)擊OK鈕即可。結(jié)果解釋在結(jié)果輸出窗口中將看到如下統(tǒng)計(jì)數(shù)據(jù):OriginalValue y nDependent Variable Encoding:InternalValue01ParameterValueFreq Coding(1)X4n51.

24、000y10-1.000系統(tǒng)先對(duì)字符變量進(jìn)行重新賦值,對(duì)于應(yīng)變量Y,回答是(Y)的賦值為0,回答否(X)的賦值為1 ;對(duì)于應(yīng)變量X4,回答是(Y)的賦值為-1 ,回答否(X)的賦值為 1。Dependent Variable.YBeginning Block Number0.Initial Log Likelihood Function-2 Log Likelihood19.095425* Constant is included in the model.Beginning Block Number1.Method: Forward Stepwise (COND)orrectImprov.M

25、odelCStepChi-Sq.dfVariablesigChi-Sq.dfsigClass %18.510IN: X31.0048.5101.00480.0026.7661.00915.2762.00093.33IN: X6No more variables can be deleted or added.End Block Number 1PIN =.0500Limits reached.Final Equation for Block 1Estimation terminated at iteration number 12 because3.8193.000Log Likelihood

26、 decreased by less than .01 percent.-2 Log LikelihoodGoodness of FitChi-Square dfSignificance15.2762.00056.7661.0093Model Chi-SquareImprovementClassification Table for YPredictedynPercent Correcty|nObserved+yy|4|1|80.00%+nn|0|10|100.00%+Overall93.33%Variables in the EquationVariableSigBRS.E.Exp(B)Wa

27、lddfX384.0000-30.5171.0000298.0526.01051.91X641.0000-10.2797.0000107.9559.00911.92Constant123.40531155.1065.01141.9149結(jié)果表明,第一步自變量 X3入選,方程分類能力達(dá)80.00%;第二步自變量2X6入選,方程分類能力達(dá)93.33% (參見(jiàn)結(jié)果中的分類分析表);方程有效性經(jīng)x檢驗(yàn),X2 =15.276 , P=0.0005。Logistic回歸的分類概率方程為:123.4053-30.5171X3-10.2797X6 eP =123.4053-30.5171X3-10.2797X

28、6 1+ e根據(jù)該方程,若一胃癌患者營(yíng)養(yǎng)狀態(tài)評(píng)分(X3)為3,癌腫病理分度(X6)為9,則其P=4.5 X 10-27-0,這意味著術(shù)后將發(fā)生院內(nèi)感染; 另一胃癌患者營(yíng)養(yǎng)狀態(tài)評(píng)分 (X3) 為1,癌腫病理分度(X6)為4,則其P=0.98105=1,這意味著術(shù)后將不會(huì)發(fā)生院內(nèi)感染。第四節(jié) Probit過(guò)程8.4.1主要功能調(diào)用此過(guò)程可完成劑量-效應(yīng)關(guān)系的分析。通過(guò)概率單位使劑量-效應(yīng)的S型曲線關(guān)系轉(zhuǎn)化成直線,從而利用回歸方程推算各效應(yīng)水平的相應(yīng)劑量值。8.4.2實(shí)例操作例8.4研究抗瘧藥環(huán)氯月瓜對(duì)小白鼠的毒性,試驗(yàn)結(jié)果如下表所示。試計(jì)算環(huán)氯月瓜的半數(shù)致死劑量。劑量(mg/kg)動(dòng)物數(shù)死亡數(shù)12

29、559767191163417538124122350數(shù)據(jù)準(zhǔn)備激活數(shù)據(jù)管理窗口,定義變量名:劑量為 DOSE試驗(yàn)動(dòng)物數(shù)為 OBSERVE死亡動(dòng)物 數(shù)為DEATH然后輸入原始數(shù)據(jù)。統(tǒng)計(jì)分析激活 Statistics菜單選 Regression 中的 Probit. 項(xiàng),彈出 Probit Analysis 對(duì)話框(如圖8.9示)。從對(duì)話框左側(cè)的變量列表中選death,點(diǎn)擊?鈕使之進(jìn)入 ResponseFrequency框;選observe,點(diǎn)擊?鈕使之進(jìn)入 Total Observed框;選dose,點(diǎn)擊?鈕使之 進(jìn)入Covariate(s) 框,并下拉 Transform 菜單,選Log ba

30、se 10項(xiàng)(即要求對(duì)劑量進(jìn)行以 10為底的對(duì)數(shù)轉(zhuǎn)換)。系統(tǒng)在Model欄中提供兩種模型,一是概率單位模型(Probit ),另一是比數(shù)比自然對(duì)數(shù)模型(Logit )。本例選用概率單位模型。點(diǎn)擊 Options. 鈕,彈出 Probit Analysis:Options對(duì)話框,在 NaturalResponse Rate欄選Calculate from data 項(xiàng),要求計(jì)算各劑量組的實(shí)際反應(yīng)率。之后點(diǎn)擊 Continue鈕返回Probit Analysis對(duì)話框,再點(diǎn)擊 OK鈕即可。結(jié)果解釋在結(jié)果輸出窗口中將看到如下統(tǒng)計(jì)數(shù)據(jù):系統(tǒng)首先顯示,共有7組原始數(shù)據(jù)采概率單位模型進(jìn)行分析?;貧w方程的各

31、參數(shù)在經(jīng)過(guò)14次疊代運(yùn)算后確定,即PROBIT = 5.95215 - 4.66313X。該方程擬合優(yōu)度X2檢驗(yàn)結(jié)果,x 2 = 0.833 , P=0.934,擬合良好。DATA Information7 unweighted cases accepted.0 cases rejected because of missing data.0 cases are in the control group.0 cases rejected because LOG-transform cant be done.MODEL InformationONLY Normal Sigmoid is requ

32、ested.Natural Response rate to be estimatedCONTROL group is not provided.Parameter estimates converged after 14 iterations.Optimal solution found.Parameter Estimates (PROBIT model:(PROBIT(p)=Intercept + BX):ErrorCoeff./S.E.Regression Coeff.StandardDOSE2.481805.952152.39832ErrorIntercept/S.E.Intercep

33、tStandard-2.12017-4.663132.19942Estimate of Natural Response Rate =二.000000withS.E. = .26448PearsonGoodness-of-FitChi Square = .833DF = 4P = .934Since Goodness-of-Fit Chi square is NOT significant, no heterogeneity factor is used in the calculation of confidence limits.Covariance(below) and Correlat

34、ion(above) Matrices of Parameter EstimatesDOSE NAT RESPDOSE5.75192.82927NAT RESP.52601.06995接著,系統(tǒng)顯示劑量對(duì)數(shù)值(DOSE、實(shí)際觀察例數(shù)(Number of Subjects )、試驗(yàn)動(dòng)物反應(yīng)數(shù)(Observed Responses )、預(yù)期反應(yīng)數(shù)(Expected Responses )、殘差(Residual )和效應(yīng)的概率(Prob)。之后,顯示各效應(yīng)概率水平的劑量值及其95%1信區(qū)間值,按本例要求,環(huán)氯月瓜的半數(shù)致死劑量(即 Prob = 0.50 時(shí))為6.07347 ,其95%了 信區(qū)間

35、為 1.86305 7.54282。Observed and Expected FrequenciesNumber ofObservedExpectedDOSESubjectsResponsesResponsesResidualProb1.085.05.04.804.196.96082.957.06.05.917.083.84534.8519.011.012.221-1.221.64320.7834.017.016.573.427.48745.70.31238.0.3075712.011.688.6012.02.01.682.318.14016.471-.171.03413Co

36、nfidence Limits for Effective DOSE95% Confidence LimitsProbDOSELowerUpper.012.46942.027524.27407.022.74406.045344.54351.032.93394.062234.72430.043.08539.078954.86574.053.21433.095804.98445.063.32832.112945.08821.073.43158.130475.18134.083.52676.148455.26651.093.61561.166945.34550.103.69937.185975.41

37、954.154.06733.290605.74092.204.38570.413956.01572.254.67862.560216.26792.304.95831.734366.51010.355.23239.942616.75084.405.506461.192866.99754.455.785281.495297.25814.506.073471.863057.54282.556.376002.312997.86673.606.698862.865878.25522.657.049743.544388.75565.707.439434.363949.46545.757.884165.30

38、68810.59748.808.410756.2906912.60617.859.069107.2151416.40564.909.971168.0941224.20725.9110.202168.2776026.73478.9210.459198.4689229.82525.9310.749288.6717733.68627.9411.082788.8912838.64769.9511.475809.1351145.27000.9611.955389.4157254.59759.9712.572529.7559068.85554.9813.4425010.2057793.92908.9914

39、.9375110.92195153.73112最后,系統(tǒng)輸出以劑量對(duì)數(shù)值為自變量X、以概率單位為應(yīng)變量 Y的回歸直線散點(diǎn)圖,從圖中各點(diǎn)的分布狀態(tài)亦可看出,回歸直線的擬合程度是很好的。圖8.10劑量-效應(yīng)關(guān)系回歸直線散點(diǎn)圖第五節(jié) Nonlinear過(guò)程8.5.1主要功能調(diào)用此過(guò)程可完成非線性回歸的運(yùn)算。所謂非線性回歸,即為曲線型的回歸分析, 一些曲線模型我們已在本章第二節(jié)中述及。但在醫(yī)學(xué)研究中經(jīng),還經(jīng)常會(huì)遇到除本章第二節(jié)中述及的曲線模型,對(duì)此,SPS珊供Nonlinear過(guò)程讓用戶根據(jù)實(shí)際需要,建立各種曲線模型以用于研究變量間的相互關(guān)系。在醫(yī)學(xué)中,如細(xì)菌繁殖與培養(yǎng)時(shí)間關(guān)系的研究即可借助Nonli

40、near過(guò)程完成。下面一些曲線模型是在論文中較常見(jiàn)的,提供給用戶應(yīng)用時(shí)作參考:模型名稱模型表達(dá)式Asympt. Regression1Y = bl + b2x exp( b3X )Asympt. Regression2Y = b1 -( b2 x ( b3 X)DensityY = ( b1 + b2(-1/ b3 )Gaussexp( -b2XX 2)Gompertzexp( -b3XX )Johnson-SchumacherLog ModifiedLog-LogisticMetcherlich Law of Dim. Ret.Michaelis MentenMorgan-Mercer-Fl

41、orinPeal-ReedXX + b4 x X 2+ b5 x X 3 )Ratio of Cubics x X 3 )/( b5 XX3)Ratio of QuadraticsRichardsx ) (1/b4 )VerhulstVon BertalanffyXX )阿-b4)WeibullX b4 )Yield DensityY = bl x (1- b3 xY = b1 x exp(-b2 xY = b1 xexp(-b2 / ( X + b3)Y = ( b1 + b3 XX ) b2Y = b1-ln(1+ b2 x exp( -b3 x X )Y = b1 + b2 x exp(

42、 -b3 XX )Y = b1 XX /( X + b2 )Y = ( b1 x b2 + b3X X b4 )/( b2 + X b4 )Y = b1 /(1+ b2 x exp(-( b3Y = ( b1 + b2XX + b3XX 2 + b4Y = ( b1 + b2XX + b3X X2 )/( b4XX 2 )Y = b1 /(1+ b3xexp(- b2 xY = b1 /(1 + b3x exp(- b2XX )Y = ( b1 (1 - b4 )- b2 x exp( -b3Y = b1 - b2 x exp(- b3 xY = (b1 + b2 XX + b3 x X 2

43、)(-1)8.5.2 實(shí)例操作例8.5選取某地某年壽命表中40-80歲各年齡組的尚存人數(shù)資料如下表,請(qǐng)就該資料試擬合 Gompertz曲線(丫 = b1 x b2(b3x)。年齡組(歲)年齡簡(jiǎn)化值(X)尚存人數(shù)(Y)400812774517925850276532553728506046756865559911706508007573932580828074數(shù)據(jù)準(zhǔn)備激活數(shù)據(jù)管理窗口,定義變量名:年齡簡(jiǎn)化值為X,尚存人數(shù)為丫。輸入原始數(shù)據(jù)。統(tǒng)計(jì)分析激活 Statistics 菜單選 Regression 中的 Nonlinear. 項(xiàng),彈出 Nonlinear Regression對(duì)話框(如圖8

44、.11示)。從對(duì)話框左側(cè)的變量列表中選y,點(diǎn)擊?鈕使之進(jìn)入Dependent框。由于SPSS系統(tǒng)尚無(wú)法智能地自動(dòng)擬合用戶所需的曲線,故一方面要求用戶 估計(jì)方程中常數(shù)項(xiàng)和各系數(shù)項(xiàng)進(jìn)行疊代運(yùn)算的起始值,另一方面要求用戶列出方程模型。對(duì)此,可首先點(diǎn)擊 Nonlinear Regression對(duì)話中!的 Parameters. 鈕,彈出 NonlinearRegression: Parameters 對(duì)話框(圖 8.12),在 Name#定義系數(shù)名,在 Start Value 處輸 入起始值(這項(xiàng)工作是十分重要的,否則系統(tǒng)可能無(wú)法運(yùn)算,甚至?xí)虔B代次數(shù)過(guò)大導(dǎo)致 SPSS系統(tǒng)的崩潰),本例定義b1=85

45、00、b2=1、b3=1.5 ,每定義一個(gè)系數(shù),即點(diǎn)擊 Add鈕加以確定;若在后面的運(yùn)算中出錯(cuò),則還可修改系數(shù)項(xiàng)的起始值,修改后點(diǎn)擊Change鈕加以確定;然后點(diǎn)擊 Continue 鈕返回 Nonlinear Regression對(duì)話框。在 Model Expression 處寫(xiě)出曲線方程表達(dá)式,用戶可借助系統(tǒng)提供的數(shù)碼盤(pán)和函數(shù)列表寫(xiě)出方程。本例要求計(jì)算根 據(jù)回歸方程求出的預(yù)測(cè)值,可點(diǎn)擊 Save鈕,在 Nonlinear Regression:Save NewVariables 對(duì)話框中選Predicted value 項(xiàng)。最后點(diǎn)擊OK鈕即可。8.12 系數(shù)項(xiàng)定義對(duì)話框結(jié)果解釋在結(jié)果輸出窗

46、口中將看到如下統(tǒng)計(jì)數(shù)據(jù):Iteration ResidualSSB1B2B31283271934638500.000001.000000001.500000001.11433343480080175.3427.7392405511.5000000021433343480080175.3427.7392405511.500000002.13.8505E+11194572.013.006502086-.216290772.2800135019.683185.8046.8429947971.198524303800135019.683185.8046.8429947971.198524303.112

47、85737878881201.83221.015792671.429277913.2550558275.185774.2528.8504931971.214331274550558275.185774.2528.8504931971.214331274.1205793117.690637.3496.8594292121.252769325205793117.690637.3496.8594292121.252769325.149937888.6592251.6832.9059927001.33942536649937888.6592251.6832.9059927001.339425366.1

48、438492814.383503.5809.9664210431.463656026.21.3608311514165723.6591420.4568.90911269471.3608311514165723.6591420.4568.9091126947.11.388989408227661.24889440.0706.92346331581.388989408227661.24889440.0706.9234633158.11.4500549817416856.8685916.5498.9482999868.21.407977244600297.86688467.6768.93029639

49、791.407977244600297.86688467.6768.9302963979.11.444194082761649.68586538.9357.943736707101.444194082761649.68586538.9357.94373670710.11.46896660644830.076585633.9620.949714917111.46896660644830.076585633.9620.94971491711.11.46898044475140.368485680.9561.949325567121.46898044475140.368485680.9561.949

50、32556712.11.46903683475135.426585679.2273.94933871313475135.426585679.2273.9493387131.4690368313.1475135.426285679.2477.9493385901.46903640Run stopped after 30 model evaluations and 13 derivative evaluations.Iterations have been stopped because the relative reduction between successiveDependent Vari

51、able Yresidual sums of squares is at most SSCON = 1.000E-08Nonlinear Regression Summary StatisticsSourceDFSum of SquaresMeanSquareRegression37121583327.612373861109.2Residual475135.42624791837122058463.02823635793.569.23771Uncorrected Total(Corrected Total)R squared = 1 - Residual SS / Corrected SS

52、=.99983Asymptotic 95 %AsymptoticConfidence IntervalParameterEstimateStd.ErrorLowerUpperB185679.247671383.7636872084740.2117576618.283585B2.949338590.002336270.943621944.955055236B31.469036403.0089089761.4472369231.490835883Asymptotic Correlation Matrix of the Parameter EstimatesB1B2B3B11.0000-.9245-

53、.8880B2-.92451.0000.9902B3-.8880.99021.0000經(jīng)30次疊代運(yùn)算后,相鄰兩次的方程剩余均方差值不大于規(guī)定的1 x 10-8,滿足要求;回歸方程的決定系數(shù) R2 = 0.99983 , Gompertz曲線方程為:Y = 85679.247671 X 0.94933859(1.469036403X)本例要求計(jì)算預(yù)測(cè)值,系統(tǒng)將結(jié)果存入原始數(shù)據(jù)庫(kù)中(圖8.13),系統(tǒng)以pred_作為預(yù)測(cè)值的變量名。由結(jié)果可見(jiàn),預(yù)測(cè)值與實(shí)際值十分接近。圖8.13原始數(shù)據(jù)及其預(yù)測(cè)值多元回歸分析在大多數(shù)的實(shí)際問(wèn)題中,影響因變量的因素不是一個(gè)而是多個(gè),我們稱這類回問(wèn)題為多元回歸分析???/p>

54、以建立因 變量y與各自變量xj(j=1,2,3,n)之間的多元線性回歸模型:其中:b0是回歸常數(shù);bk(k=1,2,3,,n)是回歸參數(shù);e是隨機(jī)誤差。多元回歸在病蟲(chóng)預(yù)報(bào)中的應(yīng)用實(shí)例:某地區(qū)病蟲(chóng)測(cè)報(bào)站用相關(guān)系數(shù)法選取了以下4個(gè)預(yù)報(bào)因子;x1為最多連續(xù)10天誘蛾量(頭);x2為4月上、中旬百束小谷草把累計(jì)落卵量 (塊);x3為4月中旬降水量(毫米),x4為4月中旬雨日(天);預(yù)報(bào)一代粘蟲(chóng)幼蟲(chóng)發(fā) 生量y (頭/m2 )。分級(jí)別數(shù)值列成表 2-1 。預(yù)報(bào)量V:每平方米幼蟲(chóng) 010頭為1級(jí),1120 頭為2級(jí),2140 頭為3級(jí),40頭以上為4級(jí)。預(yù)報(bào)因子:x1誘蛾量0300 頭為l級(jí),301600

55、頭為2級(jí),6011000 頭為3級(jí),1000頭以上為4級(jí); x2卵量0150 塊為1級(jí),15l300 塊為2級(jí),301550 塊為3級(jí),550塊以上為4級(jí);x3降水量010.毫米為1級(jí),10.113.2 毫米為2級(jí),13.317.0 毫米為3級(jí),17.0毫米以上為4級(jí);x4雨日02 天為 級(jí),34天為2級(jí),5天為3級(jí),6天或6天以上為4級(jí)。表2-1x1x2x3x4y年蛾里級(jí)別卵量級(jí)別降水量級(jí)別雨日級(jí)別幼蟲(chóng)密度級(jí)別19601022411214.31211011961300144030.111141196269936717.511191196318764675417.147455419654318011.9121111966422220101013119678063510311.82322831976115124020.612171197

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論