spss教程第三章相關(guān)分析與回歸模型的建立與分析_第1頁(yè)
spss教程第三章相關(guān)分析與回歸模型的建立與分析_第2頁(yè)
spss教程第三章相關(guān)分析與回歸模型的建立與分析_第3頁(yè)
spss教程第三章相關(guān)分析與回歸模型的建立與分析_第4頁(yè)
spss教程第三章相關(guān)分析與回歸模型的建立與分析_第5頁(yè)
已閱讀5頁(yè),還剩29頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第三章相關(guān)分析與回歸模型的建立與分析相關(guān)分析和回歸分析是統(tǒng)計(jì)分析方法中最重要內(nèi)容之一,是多元統(tǒng)計(jì)分析方法的基礎(chǔ)。相關(guān)分析和回歸分析主要用于研究和分析變量之間的相關(guān)關(guān)系,在變量之間尋求合適的函數(shù)關(guān)系式,特別是線性表達(dá)式。本章主要內(nèi)容:1、對(duì)變量之間的相關(guān)關(guān)系進(jìn)行分析(Correlate)。其中包括簡(jiǎn)單相關(guān)分析TOC o 1-5 h z()和偏相關(guān)分析()。2、建立因變量和自變量之間回歸模型(),其中包括線性回歸分析()和曲線估計(jì)()。數(shù)據(jù)條件:參與分析的變量數(shù)據(jù)是數(shù)值型變量或有序變量。3.1相關(guān)分析在中,可以通過菜單進(jìn)行相關(guān)分析(),菜單如圖所示。圖相關(guān)分析菜單3.1.簡(jiǎn)1單相關(guān)分析兩個(gè)變量之間

2、的相關(guān)關(guān)系稱簡(jiǎn)單相關(guān)關(guān)系。有兩種方法可以反映簡(jiǎn)單相關(guān)關(guān)系。一是通過散點(diǎn)圖直觀地顯示變量之間關(guān)系,二是通過相關(guān)系數(shù)準(zhǔn)確地反映兩變量的關(guān)系程度。3.1.1散.點(diǎn)1圖軟件的繪圖命令集中在菜單。下面通過例題來介紹具體操作方法。例1數(shù)據(jù)庫(kù)中的變量表示山東省人均國(guó)內(nèi)生產(chǎn)總值,表示山東省城鎮(zhèn)居民的消費(fèi)額(資料來源:山東省200年統(tǒng)3計(jì)年鑒),現(xiàn)畫出散點(diǎn)圖來觀察兩個(gè)變量的關(guān)聯(lián)程度。具體操作步驟如下:首先打開數(shù)據(jù)-然后單擊打開散點(diǎn)圖對(duì)話框,如圖所示。然后選擇需要的散點(diǎn)圖,圖中的四個(gè)選項(xiàng)依次是:Simple簡(jiǎn)單散點(diǎn)圖Matrix矩陣散點(diǎn)圖Overlay重疊散點(diǎn)圖3-D三維散點(diǎn)圖圖3.2散點(diǎn)圖對(duì)話框如果只考慮兩個(gè)變

3、量,可選擇簡(jiǎn)單的散點(diǎn)圖,然后點(diǎn)擊,打開對(duì)話框如圖所示。-圖對(duì)話框選擇變量分別進(jìn)入X軸和Y軸,點(diǎn)擊0K后就可以得到散點(diǎn)圖,見圖3.4。從下面輸出的人均國(guó)內(nèi)生產(chǎn)總值與城鎮(zhèn)居民消費(fèi)額的散點(diǎn)圖3.4中可以粗略地看出,兩個(gè)變量之間有強(qiáng)正相關(guān)的線性關(guān)系。人均國(guó)內(nèi)生產(chǎn)總值(元)圖3.4散點(diǎn)圖3.1.1簡(jiǎn).單2相關(guān)分析操作簡(jiǎn)單相關(guān)分析是指兩個(gè)變量之間的相關(guān)分析,主要是指對(duì)兩變量之間的線性相關(guān)程度作出定量分析。仍然數(shù)據(jù)為例,說明居民收入與某商品的銷售量?jī)勺兞康南嚓P(guān)分析過程,具體操作如下:1打開數(shù)據(jù)庫(kù)后,單擊打開對(duì)話框,見圖所示。2S1BivariateCorrelationsVariables:OKIPaste

4、CancelHelpI、從左邊的變量框中選擇需要考察的兩個(gè)變量進(jìn)入框內(nèi),從欄內(nèi)選擇相關(guān)系數(shù)的種類,有相關(guān)系數(shù),d一致性系數(shù)和等級(jí)相關(guān)系數(shù)。從檢驗(yàn)欄內(nèi)選擇檢驗(yàn)方式,有雙尾檢驗(yàn)和單尾檢驗(yàn)兩種。3單擊計(jì)描述,見圖3按紐,選擇輸出項(xiàng)和缺失值的處理方式。本例中選擇輸出基本統(tǒng)所示。圖:對(duì)話框4單擊,可以得到相關(guān)分析的結(jié)果。從表()可以得到兩個(gè)變量的基本統(tǒng)計(jì)描述,從表中可以得到相關(guān)系數(shù)及對(duì)相關(guān)系數(shù)的檢驗(yàn)結(jié)果,由于尾概率就小于0.0,故1說明兩變量之間存在著顯著的線性相關(guān)性。表()基本統(tǒng)計(jì)描述DescriptiveStatisticsMeanStd.DeviationN城鎮(zhèn)居民消費(fèi)額(元)2582.28002

5、335.9638425人均國(guó)內(nèi)生產(chǎn)總值(元)3689.88003701.5079825表()相關(guān)系數(shù)檢驗(yàn)Correlations城鎮(zhèn)居民消費(fèi)額(元)人均國(guó)內(nèi)生產(chǎn)總值(元)城鎮(zhèn)居民消費(fèi)額(元)PearsonCorrelation1.998(*)Sig.(2-tailed)-.000N2525人均國(guó)內(nèi)生產(chǎn)總值(元)PearsonCorrelation.998(*)1Sig.(2-tailed).000-N2525*Correlationissignificantatthe0.01level(2-tailed).從表()中可以看到兩個(gè)變量相關(guān)性分析的結(jié)果:相關(guān)系數(shù)是9相關(guān)程度非常高,且假設(shè)檢驗(yàn)的P值

6、遠(yuǎn)遠(yuǎn)地小于,可以認(rèn)為居民收入與某產(chǎn)品的銷量存在線性正相關(guān)關(guān)系。偏2相關(guān)分析簡(jiǎn)單相關(guān)關(guān)系只反映兩個(gè)變量之間的關(guān)系,但如果因變量受到多個(gè)因素的影響時(shí),因變量與某一自變量之間的簡(jiǎn)單相關(guān)關(guān)系顯然受到其它相關(guān)因素的影響,不能真實(shí)地反映二者之間的關(guān)系,所以需要考察在其它因素的影響剔除后二者之間的相關(guān)程度,即偏相關(guān)分析。例2:為了考察火柴銷售量的影響因素,選擇煤氣戶數(shù)、卷煙銷量、蚊香銷量、打火石銷量作為影響因素,得數(shù)據(jù)表3.。2試求火柴銷售量與煤氣戶數(shù)的偏相關(guān)系數(shù).表3.2火柴銷量及影響因素表(見參考文獻(xiàn)1)年份火柴銷售量煤氣戶數(shù)卷煙銷量蚊香銷量打火石銷量(萬件)(萬戶)(百箱)(十萬盒)(百萬粒)6823

7、.6925.6823.610.14.186924.125.7723.4213.312.437022.7425.8822.099.496.57117.8427.4321.4311.0925.787218.2729.9524.9614.4828.167320.2933.5328.3716.9724.267422.6137.3142.5720.1630.187526.7141.1645.1626.3917.087631.1945.7352.4627.047.397730.550.5945.323.083.887829.6358.8246.824.4610.537929.6965.2851.1133.

8、8220.098029.2571.2553.2933.5721.228131.0573.3755.3639.5912.638232.2876.685448.4911.17解:根據(jù)數(shù)據(jù)表建立數(shù)據(jù)文件-求解火柴銷售量與煤氣戶數(shù)的偏相關(guān)系數(shù)具體操作如下:1首先打開數(shù)據(jù)文件-單擊,打開對(duì)話框,見圖所示?;鸩皲N量煤氣戶數(shù)打火石量蚊香銷量卷煙銷量2從左邊框內(nèi)選擇要考察的兩個(gè)變量進(jìn)入框內(nèi),其它客觀存在的變量作為控制變量進(jìn)入框內(nèi),如本例中考察煤氣戶數(shù)與火柴銷量的偏相關(guān)系數(shù)進(jìn)入框內(nèi),其它相關(guān)變量(除年份外)進(jìn)入框內(nèi)。3單擊按紐,打開對(duì)話框如圖所示。從欄中選擇輸出項(xiàng),有平均值及標(biāo)準(zhǔn)差,表示在輸出偏相關(guān)系數(shù)的同時(shí)輸

9、出變量間的簡(jiǎn)單相關(guān)系數(shù)。另外還有缺失值的處理方式。本例中選擇簡(jiǎn)單相關(guān)系數(shù)。圖對(duì)話框、選擇結(jié)束后,單擊得輸出結(jié)果,如表所示。表偏相關(guān)分析輸出表-PARTIALCORRELATIONCOEFFICIENTS-ZeroOrderPartials簡(jiǎn)單相關(guān)火柴銷量1.0000.8260-.4902.8083.8788(0)(13)(13)(13)(13)P=.P=.000P=.064P=.000P=.000煤氣戶數(shù).82601.0000-.0230.9489.9029(13)(0)(13)(13)(13)P=.000P=.P=.935P=.000P=.000打火石量-.4902-.02301.0000-

10、.0070-.0295(13)(13)(0)(13)(13)P=.064P=.935P=.P=.980P=.917蚊香銷量.8083.9489-.00701.0000.9030(13)(13)(13)(0)(13)P=.000P=.000P=.980P=.P=.000卷煙銷量.8788.9029-.0295.90301.0000(13)(13)(13)(13)(0)P=.000P=.000P=.917P=.000P=.(Coefficient/(D.F.)/2-tailedSignificance)isprintedifacoefficientcannotbecomputedPARTIALCO

11、RRELATIONCOEFFICIE(簡(jiǎn)單相關(guān)系數(shù)(自由度)(P值)NTS偏相關(guān)系數(shù)打火石量蚊香銷量卷煙銷量Controllingford控制變量)火柴銷量1.00006046(偏相關(guān)系數(shù))(0)(10)(自由度)P=.P=.037(P值)火柴銷量煤氣戶數(shù)煤氣戶數(shù).60461.0000(10)(0)P=.037P=.(Coefficient/(D.F.)/2-tailedSignificance)isprintedifacoefficientcannotbecomputed表中的上半部分是簡(jiǎn)單相關(guān)系數(shù),下半部分是偏相關(guān)系數(shù)。從表中可以看出,火柴銷量與煤氣戶數(shù)的簡(jiǎn)單相關(guān)系數(shù)為,自由度為,檢驗(yàn)的值

12、為0而偏相關(guān)系數(shù)為,自由度為,檢驗(yàn)的值為,表示煤氣戶數(shù)對(duì)火柴銷量的真實(shí)影響是顯著的。3.2線性回歸分析線性回歸是統(tǒng)計(jì)分析方法中最常用的方法之一。如果所研究的現(xiàn)象有若干個(gè)影響因素,且這些因素對(duì)現(xiàn)象的綜合影響是線性的,則可以使用線性回歸的方法建立現(xiàn)象(因變量)與影響因素(自變量)之間的線性函數(shù)關(guān)系式。由于多元線性回歸的計(jì)算量比較大,所以有必要應(yīng)用統(tǒng)計(jì)分析軟件實(shí)現(xiàn)。這一節(jié)將專門介紹軟件的線性回歸分析的操作方法,包括求回歸系數(shù),給出回歸模型的各項(xiàng)檢驗(yàn)統(tǒng)計(jì)量值及相應(yīng)的概率,對(duì)輸出結(jié)果的分析等相關(guān)內(nèi)容。3.2.線1性回歸模型假設(shè)條件與模型的各種檢驗(yàn)、線性回歸的假設(shè)理論1)正態(tài)性假設(shè):即所研究的變量均服從正

13、態(tài)分布;2)等方差假設(shè):即各變量總體的方差是相等的;3)獨(dú)立性假設(shè),即各變量之間是相互獨(dú)立的;()殘差項(xiàng)無自相關(guān)性,即誤差項(xiàng)之間互不相關(guān),)、線性回歸模型的檢驗(yàn)項(xiàng)目()回歸系數(shù)的檢驗(yàn)(檢驗(yàn))。()回歸方程的檢驗(yàn)(檢驗(yàn))。()擬合程度判定(可決系數(shù))。()檢驗(yàn)(殘差項(xiàng)是否自相關(guān))。()共線性檢驗(yàn)(多元線性回歸)。()殘差圖示分析(判斷異方差性和殘差序列自相關(guān))。.線2性回歸分析的具體步驟。如圖軟件中進(jìn)行線性回歸分析的選擇項(xiàng)為-所9示。下面通過例題介紹線性回歸分析的操作過程。分析功能菜單例仍然用例的數(shù)據(jù),考察火柴銷售量與各影響因素之間的相關(guān)關(guān)系,建立火柴銷售量對(duì)于相關(guān)因素煤氣戶數(shù)、卷煙銷量、蚊香銷

14、量、打火石銷量的線性回歸模型,通過對(duì)模型的分析,找出合適的線性回歸方程。解:建立線性回歸模型的具體操作步驟如下:1打開數(shù)據(jù)文件,單擊打開對(duì)話框如圖所示。2從左邊框中選擇因變量進(jìn)入框內(nèi),選擇一個(gè)或多個(gè)自變量進(jìn)入框內(nèi)。從框內(nèi)下拉式菜單中選擇回歸分析方法,有強(qiáng)行進(jìn)入法選消去法,向前選擇法,向后剔除法及逐步回歸法五種。本例中選擇逐步回歸法。圖對(duì)話框3單擊,打開:對(duì)話框,可以選擇輸出的統(tǒng)計(jì)量如圖所示。欄,回歸系數(shù)選項(xiàng)欄。系統(tǒng)默認(rèn)輸出回歸系數(shù)的相關(guān)統(tǒng)計(jì)量:包括回歸系數(shù),回歸系數(shù)標(biāo)準(zhǔn)誤、標(biāo)準(zhǔn)化回歸系數(shù)、回歸系數(shù)檢驗(yàn)統(tǒng)計(jì)量(值)及相應(yīng)的檢驗(yàn)統(tǒng)計(jì)量概率的值()。本例中只選擇此項(xiàng)。輸出每一個(gè)非標(biāo)準(zhǔn)化回歸系數(shù)的置信

15、區(qū)間。輸出協(xié)方差矩陣。與模型擬合及擬合效果有關(guān)的選擇項(xiàng)。是默認(rèn)項(xiàng)。能夠輸出復(fù)相關(guān)系數(shù)、及修正值,估計(jì)值的標(biāo)準(zhǔn)誤,方差分析表。引入或剔除一個(gè)變量時(shí),的變化?;窘y(tǒng)計(jì)描述。:相關(guān)系數(shù)及偏相關(guān)系數(shù)。,共線性診斷。主要對(duì)于多元回歸模型,分析各自變量的之間的共線性的統(tǒng)計(jì)量:包括容忍度和方差膨脹因子、特征值,條件指數(shù)等。本例中選擇上面所有的統(tǒng)計(jì)項(xiàng)。殘差欄:檢驗(yàn)奇異值診斷有兩個(gè)選項(xiàng):奇異值判據(jù),默認(rèn)項(xiàng)標(biāo)準(zhǔn)差三i輸出所有觀測(cè)量的殘差值。本例中選擇檢驗(yàn)及奇異值診斷,選擇標(biāo)準(zhǔn)差為2即置信度約為圖:4如果需要觀察圖形,可單擊按紐,打開:對(duì)話框如圖所示。在此對(duì)話框中可以選擇所需要的圖形。在左上角的源變量框中,選擇進(jìn)入

16、(或)軸變量框,選擇其它變量進(jìn)入(或)軸變量框,除因變量外,其客觀存在變量依次是:標(biāo)準(zhǔn)化預(yù)測(cè)值,標(biāo)準(zhǔn)化殘差,剔除殘差,修正后預(yù)測(cè)值,學(xué)生化殘差,學(xué)生化剔除殘差。欄,標(biāo)準(zhǔn)化殘差圖類型,有選擇項(xiàng):標(biāo)準(zhǔn)化殘差直方圖標(biāo)準(zhǔn)化殘差序列的正態(tài)分布概率圖依次繪制因變量和所有自變量的散布圖本例中選擇因變量與標(biāo)準(zhǔn)化殘差的殘差圖。5單擊按紐,打開可以從中選擇模型擬合判斷準(zhǔn)則對(duì)話框,如圖13。及缺失值的處理方式。欄,設(shè)置變量引入或剔除模型的判別標(biāo)準(zhǔn)。采用檢驗(yàn)的概率為判別依據(jù)。采用值作為檢驗(yàn)標(biāo)準(zhǔn)?;貧w方程中包括常數(shù)項(xiàng)。缺失值的處理方式。本例中選擇系統(tǒng)默認(rèn)項(xiàng)。6如果要保存預(yù)測(cè)值等數(shù)據(jù),可單擊按紐打開:對(duì)話框。選擇需要保存

17、的數(shù)據(jù)種類作為新變量存在數(shù)據(jù)編輯窗口。其中有預(yù)測(cè)值、殘差,預(yù)測(cè)區(qū)間等。本例中不做選擇。7當(dāng)所有選擇完成后,單擊得到分析結(jié)果。主要的分析結(jié)果見表。表3.4(a)ModelSummary(d)模型綜合分析表ModelRRSquareAdjustedRSquareStd.ErroroftheEstimateChangeStatistics變動(dòng)分析Durbin-WatsonRSquareChangeFChangedf1df2Sig.FChange1.879(a).772.7552.44047.77244.085113.0002.994(b).988.986.58304.216215.772112.00

18、03.997(c).994.993.41783.00612.365111.0052.066aPredictors:(Constant),卷煙銷量(萬箱)bPredictors:(Constant),卷煙銷量(萬箱),打火石銷量(百萬粒)cPredictors:(Constant),卷煙銷量(萬箱),打火石銷量(百萬粒),煤氣戶數(shù)(萬戶)dDependentVariable:火柴銷量(萬件)表()模型綜合分析中有模型的復(fù)相關(guān)系數(shù),樣本決定系數(shù),修正的可決系數(shù)R2,估計(jì)標(biāo)準(zhǔn)誤,模型變化導(dǎo)致的可決系數(shù)及值的變化,檢驗(yàn)值等。由上表中知模型的修正的可決系數(shù)為9其模型的擬合程度最好,值為顯然通過檢驗(yàn),說明

19、殘差項(xiàng)不存在一階自相關(guān)。表()方差分析表ANOVAdModelSofSaesdfMeanSareFSig.1egression262.5661262.56644.085.000aesidal77.427135.956Total339.993142egression335.9142167.957494.090.000besidal4.07912.340Total339.993143egression338.0733112.691645.483.000cesidal1.92011.175Total339.99314Predict。rs:(Constant)萬箱Predictors:(Constan

20、t)萬箱百萬粒Predictors:(Constant)萬箱百萬粒萬戶DependentVariable:萬件方差分析表()同時(shí)給出了個(gè)模型的方差分析表。其中模型的值最大,說明模型的回歸效果最顯著。表()回歸系數(shù)非標(biāo)準(zhǔn)化回歸系標(biāo)準(zhǔn)化回歸數(shù)Unstandardized系數(shù)Standardized檢驗(yàn)統(tǒng)計(jì)量P值相關(guān)系數(shù)共線性統(tǒng)計(jì)CollinearityModelCoefficientsCoefficientstSig.CorrelationsStatistics單相關(guān)容忍度方差膨Std.Zero-or偏相關(guān)Toleranc脹因子BErrorBetaderPartialParteVIF1(Const

21、ant)13.3921.9996.698.000卷煙銷量(萬箱).320.048.8796.640.000.879.879.8791.0001.0002(Constant)17.240.54531.647.000卷煙銷量(萬箱).315.012.86527.347.000.879.992.865.9991.001打火石銷量(百萬粒)-.243.017-.465-14.689.000-.490-.973-.464.9991.0013(Constant)17.420.39444.243.000卷煙銷量(萬箱).254.019.69813.228.000.879.970.300.1855.417打火

22、石銷量(百萬粒)-.243.012-.465-20.526.000-.490-.987-.465.9991.001煤氣戶數(shù)(萬戶).049.014.1853.516.005.826.727.080.1855.415aDependentVariable:火柴銷量(萬件)表()中的欄中,模型是先將卷煙銷量作為自變量進(jìn)入模型,模型將卷煙銷量與打火石銷量?jī)蓚€(gè)自變量進(jìn)入模型,模型3是將卷煙、打火石和煤氣戶數(shù)三個(gè)自變量進(jìn)入模型。第四個(gè)自變量蚊香銷量沒有通過檢驗(yàn)自動(dòng)剔除?;貧w系數(shù)表的輸出結(jié)果可以看出,回歸系數(shù)都通過檢驗(yàn),模型中自變量與因變量的偏相關(guān)系數(shù)都在0.以7上,說明進(jìn)入模型的自變量對(duì)因變量的影響都比較

23、顯著。由最后兩列的容忍度和方差膨脹因子的值來看,自變量之間不存在強(qiáng)烈的共線性。表()相關(guān)系數(shù)表Correlations火柴銷量(萬件)煤氣戶數(shù)(萬戶)卷煙銷量(萬箱)蚊香銷量(十萬盒)打火石銷量(百萬粒)PearsonCorrelation火柴銷量(萬件)1.000.826.879.808-.490煤氣戶數(shù)(萬戶).8261.000.903.949-.023卷煙銷量(萬箱).879.9031.000.903-.029蚊香銷量(十萬盒).808.949.9031.000-.007打火石銷量(百萬粒)-.490-.023-.029-.0071.000Sig.(1-tailed)火柴銷量(萬件)-.

24、000.000.000.032煤氣戶數(shù)(萬戶).000.000.000.468卷煙銷量(萬箱).000.000.000.458蚊香銷量(十萬盒).000.000.000.490打火石銷量(百萬粒).032.468.458.490.N火柴銷量(萬件)1515151515煤氣戶數(shù)(萬戶)1515151515卷煙銷量(萬箱)1515151515蚊香銷量(十萬盒)1515151515打火石銷量(百萬粒)1515151515相關(guān)分析表中表示的相關(guān)系數(shù)是全部變量(自變量與因變量)的兩兩變量之間的簡(jiǎn)單相關(guān)系數(shù)和相關(guān)性檢驗(yàn)。表()殘差統(tǒng)計(jì)esialstatistisiniaieanStd.eiatiorNPr

25、editedale17.927232.153225.98934.9140715esidal-.9332.9950.0000.3703715Std.Preditedale-1.6411.254.0001.00015Std.esidal-2.2332.381.000.88615a.eendentriaa:萬件殘差統(tǒng)計(jì)表()表示了預(yù)測(cè)值、殘差、標(biāo)準(zhǔn)化預(yù)測(cè)值和標(biāo)準(zhǔn)化殘差的特征值。其中包括預(yù)測(cè)值及殘差項(xiàng)的最小值和最大值、均值、標(biāo)準(zhǔn)誤和樣本容量。表()共線性診斷表:CollinearityDiagnosticsodelDienioiiienaleonditionndeVarianeeroportionon

26、tant萬箱百萬粒萬戶111z100(03032016184212z2100(010103221;3031284304636861331366z100(01000200226;3200014023064688401240401118321300aDependentVariale:萬件共線性診斷表中第二列是特征值,第三列是條件指數(shù),最后一列是方差比。最大的條件指數(shù)小于2,0說明自變量之間不存在比較強(qiáng)烈的共線性。表()奇異值表(標(biāo)準(zhǔn)化殘差值大于)CasewiseDiagnosticsaaebe-Stdeidil萬件redietedValeeidal12238126286014-2233310318

27、32-332aDependentVariable:萬件奇異值表()中依次是序號(hào),標(biāo)準(zhǔn)化殘差值,實(shí)際觀測(cè)值、預(yù)測(cè)值及殘差值。表中給出的兩個(gè)個(gè)體數(shù)據(jù)的標(biāo)準(zhǔn)化殘差(數(shù)據(jù)號(hào)為1和214超出了2。Scatterplot表()標(biāo)準(zhǔn)化殘差圖:DependentVariable:萬件16182022242628303234萬件由圖中可以看出,殘差圖中的點(diǎn)分布是隨機(jī)的,沒有出現(xiàn)趨勢(shì)性,所以回歸模型是有效的。最終得回歸模型為:j,17.42+0.254兀+0.049兀一0.243兀1243.3曲線估計(jì)上節(jié)介紹了線性回歸模型的分析和檢驗(yàn)方法。如果某對(duì)變量數(shù)據(jù)的散點(diǎn)圖不是直線,而是某種曲線的形式時(shí),可以利用曲線估計(jì)的

28、方法為數(shù)據(jù)尋求一條合適的曲線,也可用變量代換的方法將曲線方程變?yōu)橹本€方程,用線性回歸模型進(jìn)行分析和預(yù)測(cè)。提供了多種曲線方程。列出表如下:表3.可5化為線性方程的曲線方程函數(shù)名稱方程形式相應(yīng)的線性回歸方程線性函數(shù)v,b+bx01二次多項(xiàng)式v,b+bx+bx2012y,b+bx+bxx,x2012復(fù)合模型y,bbx01Iny,Inb+xInb01生長(zhǎng)曲線y,e(b0+bix)y,b+bxy,lny對(duì)數(shù)函數(shù)y,b+bInx01y,b+bxx,lnx01三次多項(xiàng)式y(tǒng),b+bx+bx2+bx30123y,b+bx+bx+bxxr,x2;x,x30123曲線y,e(b0+b1/x)y,b+bxy,lny;

29、x,1/x指數(shù)函數(shù)y,bebx丿01y,b+bxy,lny;b,lnb0100逆函數(shù)y,b+(b/x)01y,b+bxx,1/x01幕函數(shù)y,b(xb1)0y,b+bxy,lny;b,lnb0100 x,lnx邏輯曲線y,(1/u+bbx)-101y,b+bx01y,ln(1/y-1/u);b,lnb;b,lnb001這里以例題說明曲線擬合的具體操作方法。例4:表3.表6示的是全國(guó)199年0至200年2人均消費(fèi)支出與教育支出的統(tǒng)計(jì)數(shù)據(jù),試以人均消費(fèi)性支出為解釋變量,教育支出作為被解釋變量,擬合用一條合適的函數(shù)曲線。表3.6人均消費(fèi)支出與教育支出數(shù)據(jù)表(見參考文獻(xiàn)3)年份人均消費(fèi)性支出(元)教育

30、支出(兀)解:首先根據(jù)上表建立數(shù)據(jù)-作出人均消費(fèi)支出與教育支出的散點(diǎn)圖如下:人4均消費(fèi)與教育支出的散點(diǎn)圖圖由上面圖形可以看出,兩個(gè)變量的散點(diǎn)圖為增長(zhǎng)的曲線形式,故選擇合適的函數(shù)進(jìn)行曲線估計(jì)。具體操作如下:打開1單擊-對(duì)話框。如圖3.1所5示、選擇估計(jì)曲線:有多條曲線形式供選擇。根據(jù)散點(diǎn)圖,本例中選擇,和曲線進(jìn)行對(duì)比分析。、單擊按紐,打開對(duì)話框如圖所示。圖:對(duì)話框選擇需要保存到數(shù)據(jù)表中的項(xiàng)目。在欄中,復(fù)選項(xiàng)依次是:預(yù)測(cè)值、殘差、預(yù)測(cè)區(qū)間,可以在下方框中選擇置信度,默認(rèn)值為。本例中不作選擇。4、所有選擇完成后,單擊OK,得到輸出結(jié)果如表3.7.:Independent:X決定系數(shù)自由度F值P值回歸

31、系數(shù)DependentMthRsqd.f.FSigfb0b1b2YQUA.98710382.64.000252.698-.14752.5E-05YCOM.995112086.35.00020.95501.0004YPOW.95411229.58.0003.6E-051.8460表3.7曲線估計(jì)輸出表與曲線圖ObservedQuadraticCompoundPower年人均消費(fèi)性支出(元從表中可以看出,可決系數(shù)接近1的模型是證這三個(gè)模型對(duì)觀察值的擬合程度。下方選擇輸出方差分析表如表3.8所示:Display下面對(duì)以上三個(gè)模型進(jìn)一步分析。在主對(duì)話框的AMOVAtable,可得到方差分析表的詳細(xì)分析

32、結(jié)果表3.8曲線估計(jì)及方差分析表Dependentvariable.Y復(fù)相關(guān)指數(shù)MultipleR可決系數(shù)RSquareMethod.QUADRATI二次多項(xiàng)式.99353.98710修正的可決系數(shù)AdjustedRSquare.98452標(biāo)準(zhǔn)誤StandardError45.70690AnalysisofVariance:方差分析表自由度平方和均方DFSumofSquaresMeanSquareRegression21598766.0799383.00Residuals1020891.22089.12F(檢驗(yàn)統(tǒng)計(jì)量)382.64096SignifF(假設(shè)檢驗(yàn)P值).0000Variables

33、intheEquationDependentvariable.YMethod.COMPOUND復(fù)合函數(shù)變量回歸系數(shù)標(biāo)準(zhǔn)誤標(biāo)準(zhǔn)化系數(shù)T值P值VariableBSEBBetaTSigTX-.147527.025041-1.134958-5.892.0002X*22.46018091E-052.2722E-062.08579710.827.0000(Constant)252.69789057.7922484.373.0014VariablesintheEquationVariablesintheEquationListwiseDeletionofMissingDataMultipleR.99737R

34、Square.99476AdjustedRSquare.99428StandardError.09002AnalysisofVariance:SumofSquares16.905289.089131MeanSquare16.905289.008103DFRegression1Residuals11F=2086.35111SignifF=.0000VariablesintheEquationVariablesintheEquationVariablesintheEquationVariableBSEBBetaTSigTX1.0004209.1977E-062.711154108768.23.00

35、00(Constant)20.9550191.22613917.090.0000Dependentvariable.YMethod.POWER冪函數(shù)ListwiseDeletionofMissingDataMultipleR.97687RSquare.95428AdjustedRSquare.95012StandardError.26578AnalysisofVariance:VariablesintheEquationVariablesintheEquationDFSumofSquaresMeanSquareVariablesintheEquationVariablesintheEquationRegression16.21738716.217387VariablesintheEqua

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論