第5章自變量的選擇與逐步回歸_第1頁
第5章自變量的選擇與逐步回歸_第2頁
第5章自變量的選擇與逐步回歸_第3頁
第5章自變量的選擇與逐步回歸_第4頁
第5章自變量的選擇與逐步回歸_第5頁
已閱讀5頁,還剩55頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、第五章第五章 自變量的選擇與逐步回歸自變量的選擇與逐步回歸 5.1 自變量選擇對估計(jì)和預(yù)測的影響5.2 所有子集回歸5.3 逐步回歸5.4 本章小結(jié)與評注 第第5章章 自變量選擇與逐步回歸自變量選擇與逐步回歸 從20世紀(jì)60年代開始,關(guān)于回歸自變量的選擇成為統(tǒng)計(jì)學(xué)中研究的熱點(diǎn)問題。統(tǒng)計(jì)學(xué)家們提出了許多回歸選元的準(zhǔn)則,并提出了許多行之有效的選元方法。 本章從回歸選元對回歸參數(shù)估計(jì)和預(yù)測的影響開始,介紹自變量選擇常用的幾個(gè)準(zhǔn)則;扼要介紹所有子集回歸選元的幾個(gè)方法;詳細(xì)討論逐步回歸方法及其應(yīng)用。5.1 自變量選擇對估計(jì)和預(yù)測的影響自變量選擇對估計(jì)和預(yù)測的影響 一、全模型和選模型一、全模型和選模型 設(shè)

2、研究某一實(shí)際問題涉及到對因變量有影響的因素共有m個(gè),回歸模型為:y=0+1x1+2x2+mxm+ (5.1)稱為全回歸模型。 如果我們從所有可供選擇的m個(gè)變量中挑選出p個(gè),記為x1,x2,,xp,構(gòu)成的回歸模型為:y=0p+1px1+2px2+ppxp+p (5.2) 稱模型(5.2)式為選模型。5.1 自變量選擇對估計(jì)和預(yù)測的影響自變量選擇對估計(jì)和預(yù)測的影響 一、全模型和選模型一、全模型和選模型 模型選擇不當(dāng)會(huì)給參數(shù)估計(jì)和預(yù)測帶來什么影響?下面我們將分別給予討論。 為了方便,我們把模型(5.1)式的參數(shù)估計(jì)向量 和2的估計(jì)記為:y yx xx xx xm-1mmm)(mmssemn112把模

3、型(5.2)式的參數(shù)估計(jì)向量記為y yx xx xx xp-1ppp)(ppssepn1125.1 自變量選擇對估計(jì)和預(yù)測的影響自變量選擇對估計(jì)和預(yù)測的影響 二、自變量選擇對預(yù)測的影響二、自變量選擇對預(yù)測的影響 關(guān)于自變量選擇對預(yù)測的影響可以分成兩種情況:第一種情況是全模型正確而誤用了選模型;第二種情況是選模型正確而誤用了全模型式。 5.1 自變量選擇對估計(jì)和預(yù)測的影響自變量選擇對估計(jì)和預(yù)測的影響 (一)全模型正確而誤用選模型的情況(一)全模型正確而誤用選模型的情況5.1 自變量選擇對估計(jì)和預(yù)測的影響自變量選擇對估計(jì)和預(yù)測的影響 (一)全模型正確而誤用選模型的情況(一)全模型正確而誤用選模型的

4、情況5.1 自變量選擇對估計(jì)和預(yù)測的影響自變量選擇對估計(jì)和預(yù)測的影響 (一)全模型正確而誤用選模型的情況(一)全模型正確而誤用選模型的情況5.1 自變量選擇對估計(jì)和預(yù)測的影響自變量選擇對估計(jì)和預(yù)測的影響 (一)全模型正確而誤用選模型的情況(一)全模型正確而誤用選模型的情況5.1 自變量選擇對估計(jì)和預(yù)測的影響自變量選擇對估計(jì)和預(yù)測的影響 (一)全模型正確而誤用選模型的情況(一)全模型正確而誤用選模型的情況5.1 自變量選擇對估計(jì)和預(yù)測的影響自變量選擇對估計(jì)和預(yù)測的影響 (二)選模型正確而誤用全模型的情況(二)選模型正確而誤用全模型的情況5.1 自變量選擇對估計(jì)和預(yù)測的影響自變量選擇對估計(jì)和預(yù)測的

5、影響 (二)選模型正確而誤用全模型的情況(二)選模型正確而誤用全模型的情況5.1 自變量選擇對估計(jì)和預(yù)測的影響自變量選擇對估計(jì)和預(yù)測的影響 (二)選模型正確而誤用全模型的情況(二)選模型正確而誤用全模型的情況 上述結(jié)論告訴我們,一個(gè)好的回歸模型,并不是考慮的自變量越多越好。在建立回歸模型時(shí),選擇自變量的基本指導(dǎo)思想是“少而精”。哪怕我們丟掉了一些對因變量y還有些影響的自變量,由選模型估計(jì)的保留變量的回歸系數(shù)的方差,要比由全模型所估計(jì)的相應(yīng)變量的回歸系數(shù)的方差小。而且,對于所預(yù)測的因變量的方差來說也是如此。丟掉了一些對因變量y有影響的自變量后,所付出的代價(jià)是估計(jì)量產(chǎn)生了有偏性。然而,盡管估計(jì)量是

6、有偏的,但預(yù)測偏差的方差會(huì)下降。另外,如果保留下來的自變量有些對因變量無關(guān)緊要,那么,方程中包括這些變量會(huì)導(dǎo)致參數(shù)估計(jì)和預(yù)測的有偏性和精度降低。5.2 所有子集回歸所有子集回歸 一、所有子集的數(shù)目一、所有子集的數(shù)目mmmmmccc210 有m個(gè)可供選擇的變量x1,x2,,xm,由于每個(gè)自變量都有入選和不入選兩種情況,這樣y關(guān)于這些自變量的所有可能的回歸方程就有2m-1個(gè)。 從另一個(gè)角度看 5.2 所有子集回歸所有子集回歸 二、關(guān)于自變量選擇的幾個(gè)準(zhǔn)則二、關(guān)于自變量選擇的幾個(gè)準(zhǔn)則 從數(shù)據(jù)與模型擬合優(yōu)劣的直觀考慮出發(fā),認(rèn)為殘差平方和sse最小的回歸方程就是最好的。還曾用復(fù)相關(guān)系數(shù)r來衡量回歸擬合的

7、好壞。然而這兩種方法都有明顯的不足,這是因?yàn)椋?5.2 所有子集回歸所有子集回歸 準(zhǔn)則準(zhǔn)則1 自由度調(diào)整復(fù)相關(guān)系數(shù)達(dá)到最大自由度調(diào)整復(fù)相關(guān)系數(shù)達(dá)到最大 )1 (11122rpnnra5.2 所有子集回歸所有子集回歸 準(zhǔn)則準(zhǔn)則1 自由度調(diào)整復(fù)相關(guān)系數(shù)達(dá)到最大自由度調(diào)整復(fù)相關(guān)系數(shù)達(dá)到最大 從另外一個(gè)角度考慮回歸的擬合效果,回歸誤差項(xiàng)方差2的無偏估計(jì)為:ssepn112此無偏估計(jì)式中也加入了懲罰因子n-p-15.2 所有子集回歸所有子集回歸 準(zhǔn)則準(zhǔn)則1 自由度調(diào)整復(fù)相關(guān)系數(shù)達(dá)到最大自由度調(diào)整復(fù)相關(guān)系數(shù)達(dá)到最大2211sstnra5.2 所有子集回歸所有子集回歸 準(zhǔn)則準(zhǔn)則2 赤池信息量赤池信息量aic

8、達(dá)到最小達(dá)到最小 aic準(zhǔn)則是日本統(tǒng)計(jì)學(xué)家赤池(akaike)1974年根據(jù)極大似然估計(jì)原理提出的一種較為一般的模型選擇準(zhǔn)則,人們稱它為akaike信息量準(zhǔn)則 (akaike information criterion,簡記為aic)。aic準(zhǔn)則既可用來作回歸方程自變量的選擇,又可用于時(shí)間序列分析中自回歸模型的定階上。由于該方法的廣泛應(yīng)用,使得赤池乃至日本統(tǒng)計(jì)學(xué)家在世界的聲譽(yù)大增。5.2 所有子集回歸所有子集回歸 準(zhǔn)則準(zhǔn)則2 赤池信息量赤池信息量aic達(dá)到最小達(dá)到最小 設(shè)回歸模型的似然函數(shù)為l(,x), 的維數(shù)為p,x為樣本,在回歸分析中樣本為y=(y1,y2,yn),則aic定義為:5.2

9、所有子集回歸所有子集回歸 準(zhǔn)則準(zhǔn)則2 赤池信息量赤池信息量aic達(dá)到最小達(dá)到最小 假定回歸模型的隨機(jī)誤差項(xiàng)遵從正態(tài)分布,即 n(0,2)對數(shù)似然函數(shù)為ssennlll22max21)ln(2)2ln(2ln2)ln(2)2ln(2lnmaxnnssennl5.2 所有子集回歸所有子集回歸 準(zhǔn)則準(zhǔn)則2 赤池信息量赤池信息量aic達(dá)到最小達(dá)到最小 帶入公式中 這里似然函數(shù)中的未知參數(shù)個(gè)數(shù)為p+2,略去與p無關(guān)的常數(shù),得回歸模型的aic公式為aic=nln(sse)+2p 對每一個(gè)回歸子集計(jì)算aic,其中aic最小者所對應(yīng)的模型是“最優(yōu)”回歸模型5.2 所有子集回歸所有子集回歸 準(zhǔn)則準(zhǔn)則4 cp統(tǒng)計(jì)

10、量達(dá)到最小統(tǒng)計(jì)量達(dá)到最小 1964年馬勒斯 (mallows)從預(yù)測的角度提出一個(gè)可以用來選擇自變量的統(tǒng)計(jì)量cp統(tǒng)計(jì)量。根據(jù)性質(zhì)5,即使全模型正確,但仍有可能選模型有更小的預(yù)測誤差。cp正是根據(jù)這一原理提出來的。5.2 所有子集回歸所有子集回歸 準(zhǔn)則準(zhǔn)則4 cp統(tǒng)計(jì)量達(dá)到最小統(tǒng)計(jì)量達(dá)到最小 考慮在n個(gè)樣本點(diǎn)上,用選模型(5.2)式作回報(bào)預(yù)測時(shí),預(yù)測值與期望值的相對偏差平方和為:niimmiipppippniiippxxxxyeyj121101102122)(1 )(15.2 所有子集回歸所有子集回歸 準(zhǔn)則準(zhǔn)則4 cp統(tǒng)計(jì)量達(dá)到最小統(tǒng)計(jì)量達(dá)到最小 可以證明,jp的期望值是) 1(2)()(2pn

11、sseejepp略去無關(guān)的常數(shù)2,據(jù)此構(gòu)造出cp統(tǒng)計(jì)量為pnssessemnpnssecmppp2) 1( 225.2 所有子集回歸所有子集回歸 準(zhǔn)則準(zhǔn)則4 cp統(tǒng)計(jì)量達(dá)到最小 5.2 所有子集回歸所有子集回歸 例例5.1 y表示某種消費(fèi)品的銷售額,x1表示居民可支配收入,x2表示該類消費(fèi)品的價(jià)格指數(shù),x3表示其他消費(fèi)品平均價(jià)格指數(shù)。表5.1給出了某地區(qū)18年某種消費(fèi)品銷售情況資料,試建立該地區(qū)該消費(fèi)品銷售額預(yù)測方程。5.2 所有子集回歸所有子集回歸 序號序號x1(元)(元)x2(%)x3(%)(百萬元)(百萬元)181.285.087.07.8282.992.094.08.4383.291.

12、595.08.7485.992.995.59.0588.093.096.09.6699.996.097.010.37102.095.097.510.68105.395.697.010.99117.798.998.011.310126.4101.5101.212.311131.2102.0102.513.512148.0105.0104.014.213153.0106.0105.914.914161.0109.0109.515.915170.0112.0111.018.516174.0112.5112.019.517185.0113.0112.319.918189.0114.0113.020.5

13、表表5.15.2 所有子集回歸所有子集回歸 這個(gè)例子中,n=18,m=3,所有的自變量子集有2m-1=7個(gè),即有7個(gè)回歸子集。2ar自變量子集r2aiccpx10.97280.971140.064.134x20.95660.953948.4816.151x30.95080.947750.7420.452x1,x20.97470.971440.764.734x1,x30.97840.975537.932.005x2,x30.95760.951950.0917.461x1,x2,x30.98110.977137.522.000表5.25.2 所有子集回歸所有子集回歸 由表5.2的3項(xiàng)指標(biāo)均可看到x

14、1,x2,x3是“最優(yōu)”子集,x1,x3是“次優(yōu)”子集?;貧w方程分別為5.2 所有子集回歸所有子集回歸 三、用三、用sas軟件尋找最優(yōu)子集軟件尋找最優(yōu)子集 sas軟件共有三個(gè)基本窗口,分別為:(1)程序編輯窗(program editor),用來編輯程序。(2)日志窗(log),顯示已執(zhí)行的語句和系統(tǒng)信息,包括錯(cuò)誤信息。(3)輸出窗(output)顯示程序運(yùn)行結(jié)果。 用主菜單的window命令可以實(shí)現(xiàn)在三個(gè)窗口間的轉(zhuǎn)換。 5.2 所有子集回歸所有子集回歸 data data1;input x1-x12 y;cards;1.94 4.5 154.45 207.33 246.87 277.64 1

15、35.79 30.58 110.67 80.83 51.83 14.09 23840.33 6.49 133.16 127.29 120.17 114.88 81.21 14.05 35.7 16 27.1 2.93 202;proc reg;model y=x1-x12/selection=adjrsq;run;5.2 所有子集回歸所有子集回歸 以下是部分輸出結(jié)果: adjusted r-square variables in modeladjusted r-square variables in model r-square in r-square in 0.82985517 0.8638

16、8414 6 x3 x5 x8 x9 x10 x11 0.82985517 0.86388414 6 x3 x5 x8 x9 x10 x11 0.82692850 0.86731185 7 x3 x5 x6 x8 x9 x10 x11 0.82692850 0.86731185 7 x3 x5 x6 x8 x9 x10 x11 0.82487399 0.85989919 6 x3 x6 x8 x9 x10 x11 0.82487399 0.85989919 6 x3 x6 x8 x9 x10 x11 0.82366778 0.86481197 7 x3 x4 x5 x8 x9 x10 x11

17、0.82366778 0.86481197 7 x3 x4 x5 x8 x9 x10 x11 0.82343275 0.86463178 7 x3 x5 x8 x9 x10 x11 x12 0.82343275 0.86463178 7 x3 x5 x8 x9 x10 x11 x12 0.82311828 0.86439068 7 x3 x5 x7 x8 x9 x10 x11 0.82311828 0.86439068 7 x3 x5 x7 x8 x9 x10 x115.3 逐步回歸逐步回歸 一、問題的提出及逐步回歸的思想一、問題的提出及逐步回歸的思想 自變量的所有可能子集構(gòu)成2m-1個(gè)回歸方

18、程,當(dāng)可供選擇的自變量不太多時(shí),用前邊的方法可以求出一切可能的回歸方程,然后用幾個(gè)選元準(zhǔn)則去挑出“最好”的方程,但是當(dāng)自變量的個(gè)數(shù)較多時(shí),要求出所有可能的回歸方程是非常困難的。為此,人們提出了一些較為簡便、實(shí)用、快速的選擇“最優(yōu)”方程的方法。人們所給出的方法各有優(yōu)缺點(diǎn),至今還沒有絕對最優(yōu)的方法,目前常用的方法有“前進(jìn)法”、“后退法”、“逐步回歸法”,而逐步回歸法最受推崇。5.3 逐步回歸逐步回歸 一、問題的提出及逐步回歸的思想一、問題的提出及逐步回歸的思想 在后邊的討論中,無論我們從回歸方程中剔除某個(gè)自變量,還是給回歸方程增加某個(gè)自變量都要利用(3.42)式的偏f檢驗(yàn),這個(gè)偏f檢驗(yàn)與(3.40

19、)式的t檢驗(yàn)是等價(jià)的,f檢驗(yàn)的定義式的統(tǒng)計(jì)意義更為明了,并且容易推廣到對多個(gè)自變量的顯著性檢驗(yàn),因而采用f檢驗(yàn)。jjjjct ) 1/(1/)(pnssessrfjj5.3 逐步回歸逐步回歸 一、前進(jìn)法一、前進(jìn)法 5.3 逐步回歸逐步回歸 一、問題的提出及逐步回歸的思想一、問題的提出及逐步回歸的思想5.3 逐步回歸逐步回歸 一、問題的提出及逐步回歸的思想一、問題的提出及逐步回歸的思想 依上述方法接著做下去。直至所有未被引入方程的自變量的f值均小于f(1,n-p-1)時(shí)為止。這時(shí),得到的回歸方程就是最終確定的方程。 每步檢驗(yàn)中的臨界值f(1,n-p-1)與自變量數(shù)目p有關(guān),在用軟件計(jì)算時(shí),我們實(shí)

20、際使用的是顯著性p值(或記為sig)做檢驗(yàn)。5.3 逐步回歸逐步回歸 一、問題的提出及逐步回歸的思想一、問題的提出及逐步回歸的思想 例例5.4 5.4 對例3.1國際旅游外匯收入y對第三產(chǎn)業(yè)的12個(gè)變量做回歸的數(shù)據(jù),用前進(jìn)法做變量選擇,取顯著性水平進(jìn)=0.05。 首先進(jìn)入線性回歸對話框,將y與x1至x12分別選入各自的變量框,然后在method對話框中點(diǎn)選前進(jìn)法forward,點(diǎn)選options選項(xiàng)看到默認(rèn)的顯著性水平進(jìn)正是0.05。部分運(yùn)行結(jié)果如下:coefficients-209.535124.469-1.683.1036.9071.163.7415.938.000-96.142108.3

21、00-.888.38213.7912.1011.4796.564.000-2.520.682-.832-3.695.001-174.886108.984-1.605.12011.1522.3511.1964.744.000-2.034.685-.672-2.970.00610.7615.139.2602.094.046-228.815104.015-2.200.0378.7862.417.9423.635.001-3.261.832-1.077-3.919.00113.8644.965.3352.792.0102.8491.244.6472.290.030-140.625102.304-1.3

22、75.1813.9103.003.4191.302.205-1.997.927-.660-2.154.04118.4314.939.4463.732.0015.0901.4731.1573.455.002-7.4423.086-.551-2.411.024(constant)x7(constant)x7x4(constant)x7x4x10(constant)x7x4x10x3(constant)x7x4x10x3x11model12345bstd. errorunstandardizedcoefficientsbetastandardizedcoefficientstsig.5.3 逐步回歸

23、逐步回歸 5.3 逐步回歸逐步回歸 model summary.741.549.533455.9279.835.697.675380.4405.860.739.710359.3347.885.783.749334.0439.908.824.789306.8386model12345rr squareadjusted rsquarestd. errorof theestimate5.3 逐步回歸逐步回歸 anova7329802.217329802.235.261.0006028236.529207870.2213358039309305460.324652730.132.147.0004052

24、578.428144734.9413358039309871760.233290586.725.484.0003486278.627129121.4313358039301045682042614204.923.428.0002901218.926111585.3413358039301100429052200858.123.376.0002353748.22594149.9281335803930regressionresidualtotalregressionresidualtotalregressionresidualtotalregressionresidualtotalregress

25、ionresidualtotalmodel12345sum ofsquaresdfmeansquarefsig.5.3 逐步回歸逐步回歸 一、問題的提出及逐步回歸的思想一、問題的提出及逐步回歸的思想5.3 逐步回歸逐步回歸 二、后退法二、后退法5.3 逐步回歸逐步回歸 二、后退法二、后退法5.3 逐步回歸逐步回歸 二、后退法二、后退法 續(xù)例續(xù)例5.4 對例3.1國際旅游外匯收入y對第三產(chǎn)業(yè)的12個(gè)變量做回歸的數(shù)據(jù),用后退法做變量選擇,取顯著性水平出=0.10。 首先進(jìn)入線性回歸對話框,將y與x1至x12分別選入各自的變量框,然后在method對話框中點(diǎn)選后退法backward,點(diǎn)選option

26、s選項(xiàng)看到默認(rèn)的顯著性水平出正是0.10。部分運(yùn)行結(jié)果見表5.4:5.3 逐步回歸逐步回歸 二、后退法二、后退法coefficients unstandardized coefficients standardized coefficients t sig. model b std. error beta 8 (constant) -184.690 98.357 -1.878 0.0721 x3 4.325 0.873 0.9825 4.955 0.0000 x8 -20.188 7.089 -0.6813 -2.848 0.0087 x9 17.334 7.102 1.0377 2.441

27、0.0221 x10 11.644 6.450 0.2815 1.805 0.0831 x11 -12.998 3.558 -0.9625 -3.653 0.0012 5.3 逐步回歸逐步回歸 二、后退法二、后退法model summary.935.875.791304.8038.935.875.802296.7067.935.875.812289.3330.935.874.820282.8410.933.870.823281.0489.931.867.827277.6026.929.864.830275.2454.923.851.822281.7979model12345678rr squa

28、readjusted rsquarestd. errorof theestimate5.3 逐步回歸逐步回歸 二、后退法二、后退法anova1168574212973811.8710.482.0001672296.21892905.347133580393011685377111062307.012.067.0001672662.21988034.853133580393011683766101168376.613.957.0001674272.22083713.61213358039301167805991297562.116.220.0001679979.82179999.03913358

29、039301162029181452536.418.389.0001737747.22278988.51013358039301158558571655083.621.477.0001772453.42377063.19313358039301153979861923299.625.387.0001818241.02475760.04013358039301137278752274557.428.643.0001985251.82579410.0741335803930regressionresidualtotalregressionresidualtotalregressionresidua

30、ltotalregressionresidualtotalregressionresidualtotalregressionresidualtotalregressionresidualtotalregressionresidualtotalmodel12345678sum ofsquaresdfmeansquarefsig.5.3 逐步回歸逐步回歸 三、逐步回歸法三、逐步回歸法 逐步回歸的基本思想是“有進(jìn)有出”。具體做法是將變量一個(gè)一個(gè)引入,當(dāng)每引入一個(gè)自變量后,對已選入的變量要進(jìn)行逐個(gè)檢驗(yàn),當(dāng)原引入的變量由于后面變量的引入而變得不再顯著時(shí),要將其剔除。這個(gè)過程反復(fù)進(jìn)行,直到既無顯著的自變量

31、選入回歸方程,也無不顯著自變量從回歸方程中剔除為止。這樣就避免了前進(jìn)法和后退法各自的缺陷,保證了最后所得的回歸子集是“最優(yōu)”回歸子集。5.3 逐步回歸逐步回歸 三、逐步回歸法三、逐步回歸法 在逐步回歸中需要注意的一個(gè)問題是引入自變量和剔除自變量的顯著性水平值是不相同的,要求進(jìn)出否則可能產(chǎn)生“死循環(huán)”。也就是當(dāng)進(jìn)出時(shí),如果某個(gè)自變量的顯著性p值在進(jìn)與出之間,那末這個(gè)自變量將被引入、剔除、再引入、再剔除、,循環(huán)往復(fù),以至無窮。5.3 逐步回歸逐步回歸 三、逐步回歸法三、逐步回歸法 續(xù)例續(xù)例5.4 對例3.1國際旅游外匯收入y對第三產(chǎn)業(yè)的12個(gè)變量做回歸的數(shù)據(jù),用逐步回歸法做變量選擇,取顯著性水平進(jìn)

32、=0.05,出=0.10。 首先進(jìn)入線性回歸對話框,將y與x1至x12分別選入各自的變量框,然后在method對話框中點(diǎn)選逐步回歸法stepwise,點(diǎn)選options選項(xiàng)看到默認(rèn)的顯著性水平正是進(jìn)=0.05,出=0.10。部分運(yùn)行結(jié)果見表5.5: 5.3 逐步回歸逐步回歸 三、逐步回歸法三、逐步回歸法5.3 逐步回歸逐步回歸 model summary.741a.549.533455.9279.835b.697.675380.4405.860c.739.710359.3347.885d.783.749334.0439.908e.824.789306.8386.901f.812.783310.

33、9102.889g.791.768321.5075model1234567rr squareadjusted rsquarestd. errorof theestimatepredictors: (constant), x7a. predictors: (constant), x7, x4b. predictors: (constant), x7, x4, x10c. predictors: (constant), x7, x4, x10, x3d. predictors: (constant), x7, x4, x10, x3, x11e. predictors: (constant), x

34、4, x10, x3, x11f. predictors: (constant), x10, x3, x11g. 5.4 本章小結(jié)與評注本章小結(jié)與評注 一、逐步回歸實(shí)例分析一、逐步回歸實(shí)例分析 例例5.5 為了研究香港股市的變化規(guī)律,此例以恒生指數(shù)為例,建立回歸方程,分析影響股票價(jià)格趨勢變動(dòng)的因素。這里我們選了6個(gè)影響股票價(jià)格指數(shù)的經(jīng)濟(jì)變量: x1(百萬$) 成交額, x2九九金價(jià)($/兩), x3港匯指數(shù), x4人均生產(chǎn)總值(現(xiàn)價(jià)$), x5建筑業(yè)總開支(現(xiàn)價(jià)百萬$), x6房地產(chǎn)買賣金額(百萬$), x7優(yōu)惠利率(最低%)。 y為恒生指數(shù)。 5.3 逐步回歸逐步回歸 年份yx1x2x3x4

35、x5x6x71974172.911246681105.91018341101124291975352.9410335791107.4104143996126936.51976447.6713156607114.41313446891668161977404.026127714110.8150336876221314.751978409.512741991199.4173898636313534.751979619.7125633123191.42171512339435289.519801121.1795684276090.82707516623707521019811506.94105987

36、265186.331827199371259891619821105.79462302105125.335393247879946810.51983933.03371653030107.438823251128247810.519841008.54487872810106.64607924414549368.519851567.56758082649115.7478712297087135619861960.061231283031110.154372244031298846.519872884.883714063644105.86560230531153044519882556.721985

37、693690101.674917378612150335.255.3 逐步回歸逐步回歸 yx1x2x3x4x5x6x7y1.00000.91710.8841-0.04250.93820.87860.9372-0.0955x10.91711.00000.7375-0.12930.78420.69730.7817-0.1732x20.88410.73751.0000-0.10830.91950.94770.87470.1517x3-0.0425-0.1293-0.10831.00000.07250.0469-0.0952-0.4164x40.93820.78420.91950.07251.00000.96010.

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論