第3章雙線性模型：假設(shè)檢驗(yàn)

上傳人：3*** IP屬地：湖北上傳時(shí)間：2022-06-29 格式：PPTX 頁數(shù)：62 大?。?51.47KB 積分：28 舉報(bào) 版權(quán)申訴

已閱讀5頁，還剩57頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、第一部分第一部分線性回歸線性回歸模型模型Chp 3 雙變量模型：假設(shè)檢驗(yàn)雙變量模型：假設(shè)檢驗(yàn)主要內(nèi)容主要內(nèi)容n古典線性回歸模型的假定古典線性回歸模型的假定nOLS估計(jì)量及其性質(zhì)估計(jì)量及其性質(zhì)nOLS估計(jì)量的方差與標(biāo)準(zhǔn)誤估計(jì)量的方差與標(biāo)準(zhǔn)誤nOLS估計(jì)量的抽樣分布（概率分布）估計(jì)量的抽樣分布（概率分布）n假設(shè)檢驗(yàn)假設(shè)檢驗(yàn)n擬合優(yōu)度擬合優(yōu)度n正態(tài)性檢驗(yàn)正態(tài)性檢驗(yàn)n預(yù)測預(yù)測3.1 3.1 古典線性回歸模型古典線性回歸模型線性回歸模型的基本假設(shè)線性回歸模型的基本假設(shè)假設(shè)假設(shè)1. 回歸模型是參數(shù)線性的，但不一定是變量回歸模型是參數(shù)線性的，但不一定是變量線性；線性； Yi=B1+B2Xi+ui假設(shè)假設(shè)2

2、. 解釋變量解釋變量X與擾動(dòng)誤差項(xiàng)與擾動(dòng)誤差項(xiàng)u不相關(guān)。不相關(guān)。 Cov(X, u)=0 假設(shè)假設(shè)3. 給定給定Xi，擾動(dòng)項(xiàng)的期望或均值為零，即：，擾動(dòng)項(xiàng)的期望或均值為零，即：E(u|Xi)=0； PRF : E(Y|Xi)=B1+B2Xi擾動(dòng)項(xiàng)擾動(dòng)項(xiàng)ui的條件分布的條件分布假設(shè)假設(shè)4. ui的方差為常數(shù)，即同方差假定：的方差為常數(shù)，即同方差假定： Var(ui)= 2 PRF : Yi=B1+B2Xi同方差同方差PRF : Yi=B1+B2Xi異方差異方差假設(shè)假設(shè)5. 無自相關(guān)假定，即：無自相關(guān)假定，即： Cov(ui, uj)=0, i j由該假定可得，由該假定可得，Cov(Yi, Y

3、j)=0, i j ，即，即Y也不相也不相關(guān)。關(guān)。假設(shè)假設(shè)6. 回歸模型是正確設(shè)定的，即模型不存在設(shè)回歸模型是正確設(shè)定的，即模型不存在設(shè)定誤差（錯(cuò)誤）無自相關(guān)假定，即：定誤差（錯(cuò)誤）無自相關(guān)假定，即： Cov(ui, uj)=0, i j由該假定可得，由該假定可得，Cov(Yi, Yj)=0, i j ，即，即Y也不相關(guān)。也不相關(guān)。假設(shè)假設(shè)7. 隨機(jī)誤差項(xiàng)隨機(jī)誤差項(xiàng)ui具有零均值、同方差具有零均值、同方差( u2)的正態(tài)分布：的正態(tài)分布： ui N(0, u2)3.2 最小二乘估計(jì)量的方差與標(biāo)準(zhǔn)誤最小二乘估計(jì)量的方差與標(biāo)準(zhǔn)誤在估計(jì)的參數(shù)在估計(jì)的參數(shù)b0和和b1的方差表達(dá)式中，都含有隨的方差

4、表達(dá)式中，都含有隨機(jī)擾動(dòng)項(xiàng)機(jī)擾動(dòng)項(xiàng)u的方差的方差 2。由于由于 2實(shí)際上是未知的，因此，實(shí)際上是未知的，因此， b0和和b1的方差實(shí)的方差實(shí)際上無法計(jì)算，這就需要對(duì)其進(jìn)行估計(jì)。際上無法計(jì)算，這就需要對(duì)其進(jìn)行估計(jì)。 2又稱為總體方差。又稱為總體方差。2i22en 222iYn-2e 其其中中是是的的估估計(jì)計(jì)量量，是是殘殘差差平平方方和和，即即的的真真實(shí)實(shí)值值與與估估計(jì)計(jì)值值差差的的平平方方和和。稱稱為為自自由由度度，可可以以理理解解為為獨(dú)獨(dú)立立的的觀觀察察值值的的個(gè)個(gè)數(shù)數(shù)。由于隨機(jī)項(xiàng)由于隨機(jī)項(xiàng)ui不可觀測，只能從不可觀測，只能從ui的估計(jì)的估計(jì)殘差殘差ei出發(fā)，對(duì)總體方差進(jìn)行估計(jì)。出發(fā)，對(duì)總體

5、方差進(jìn)行估計(jì)。可以證明可以證明， 2的的最小二乘估計(jì)量最小二乘估計(jì)量為為它是關(guān)于它是關(guān)于 2的無偏估計(jì)量。的無偏估計(jì)量。 12bYb X（2.162.16）22iiix ybx （2.172.17）OLS（2.162.16）和和（2.172.17）的的估估計(jì)計(jì)量量的的方方差差和和標(biāo)標(biāo)準(zhǔn)準(zhǔn)誤誤為為12i2212ivar=bXbnx （）11sevarbb （）（）在隨機(jī)誤差項(xiàng)在隨機(jī)誤差項(xiàng)u u 的方差的方差 2估計(jì)出后，參數(shù)估計(jì)出后，參數(shù)b b1 1和和b b2 2的的方差方差和和標(biāo)準(zhǔn)差標(biāo)準(zhǔn)差的估計(jì)量分別是：的估計(jì)量分別是：22222ivar=bbx （）22sevarbb （）（

6、）2varsei 其其中中表表示示方方差差，表表示示標(biāo)標(biāo)準(zhǔn)準(zhǔn)誤誤，是是擾擾動(dòng)動(dòng)項(xiàng)項(xiàng) 的的方方差差。22OLS 一一旦旦知知道道了了，就就可可以以求求出出等等式式右右邊邊的的項(xiàng)項(xiàng)，從從而而求求出出的的方方差差和和標(biāo)標(biāo)準(zhǔn)準(zhǔn)誤誤。通通常常根根據(jù)據(jù)下下式式估估價(jià)價(jià)22i=2en 222i2RSSY) .iieYY 其其中中是是的的估估計(jì)計(jì)量量，是是殘殘差差平平方方和和（），即即的的真真實(shí)實(shí)值值與與估估計(jì)計(jì)值值差差的的平平方方和和， ( (n-2稱稱為為自自由由度度，可可以以理理解解為為獨(dú)獨(dú)立立的的觀觀察察值值的的個(gè)個(gè)數(shù)數(shù)。數(shù)學(xué)數(shù)學(xué)S.A.T一例的方差和標(biāo)準(zhǔn)誤一例的方差和標(biāo)準(zhǔn)誤數(shù)學(xué)數(shù)學(xué)S.A.T一

7、例小結(jié)一例小結(jié)數(shù)學(xué)數(shù)學(xué)S.A.T一例的估計(jì)函數(shù)為一例的估計(jì)函數(shù)為Y432.41380.0013(16.9061)(0.000245)iiXse 括號(hào)里的數(shù)字表示估計(jì)的標(biāo)準(zhǔn)誤。括號(hào)里的數(shù)字表示估計(jì)的標(biāo)準(zhǔn)誤。3.3 最小二乘估計(jì)量的性質(zhì)最小二乘估計(jì)量的性質(zhì) 當(dāng)模型參數(shù)估計(jì)出后，需考慮參數(shù)估計(jì)值的當(dāng)模型參數(shù)估計(jì)出后，需考慮參數(shù)估計(jì)值的精度，即是否能代表總體參數(shù)的真值，或者說需精度，即是否能代表總體參數(shù)的真值，或者說需考察參數(shù)估計(jì)量的統(tǒng)計(jì)性質(zhì)?？疾靺?shù)估計(jì)量的統(tǒng)計(jì)性質(zhì)。一個(gè)用于考察總體的估計(jì)量，可從如下幾個(gè)一個(gè)用于考察總體的估計(jì)量，可從如下幾個(gè)方面考察其優(yōu)劣性：方面考察其優(yōu)劣性：（1）線性性）線性

8、性，即它是否是另一隨機(jī)變量的線性，即它是否是另一隨機(jī)變量的線性函數(shù)；函數(shù)；1. 系數(shù)系數(shù)B0, B1的的OLS估計(jì)估計(jì)（2）無偏性）無偏性，即它的均值或期望值是否等于總，即它的均值或期望值是否等于總體的真實(shí)值；體的真實(shí)值；（3）有效性）有效性，即它是否在所有線性無偏估計(jì)量，即它是否在所有線性無偏估計(jì)量中具有最小方差。中具有最小方差。n 這三個(gè)準(zhǔn)則也稱作估計(jì)量的這三個(gè)準(zhǔn)則也稱作估計(jì)量的小樣本性質(zhì)小樣本性質(zhì)。擁有這類性質(zhì)的估計(jì)量稱為擁有這類性質(zhì)的估計(jì)量稱為最佳線性無偏估計(jì)最佳線性無偏估計(jì)量量（best liner unbiased estimator, BLUE）。）。（4）漸近無偏性）漸近無

9、偏性，即樣本容量趨于無窮大時(shí)，即樣本容量趨于無窮大時(shí)，是否它的均值序列趨于總體真值；是否它的均值序列趨于總體真值；（5）一致性）一致性，即樣本容量趨于無窮大時(shí)，它是，即樣本容量趨于無窮大時(shí)，它是否依概率收斂于總體的真值；否依概率收斂于總體的真值；（6）漸近有效性）漸近有效性，即樣本容量趨于無窮大時(shí)，即樣本容量趨于無窮大時(shí)，是否它在所有的一致估計(jì)量中具有最小的漸近方是否它在所有的一致估計(jì)量中具有最小的漸近方差。差。當(dāng)不滿足小樣本性質(zhì)時(shí)，需進(jìn)一步考察估計(jì)當(dāng)不滿足小樣本性質(zhì)時(shí)，需進(jìn)一步考察估計(jì)量的量的大樣本大樣本或或漸近性質(zhì)漸近性質(zhì)：高斯高斯馬爾可夫定理馬爾可夫定理(Gauss-Markov th

10、eorem) 在給定經(jīng)典線性回歸的假定下，在給定經(jīng)典線性回歸的假定下，最小最小二乘估計(jì)量二乘估計(jì)量是具有是具有最小方差最小方差的的線性線性無偏無偏估估計(jì)量。計(jì)量。蒙特卡洛試驗(yàn)蒙特卡洛試驗(yàn)OLSOLS估計(jì)量的無偏性可以通過蒙特卡洛試驗(yàn)驗(yàn)證。估計(jì)量的無偏性可以通過蒙特卡洛試驗(yàn)驗(yàn)證。假設(shè)有如下信息：假設(shè)有如下信息：與相應(yīng)的真實(shí)值1.5、2、4很接近，反復(fù)的應(yīng)用最小二乘法，平均的看，估計(jì)值將等于真實(shí)值。3.4 OLS3.4 OLS估計(jì)量的抽樣分布估計(jì)量的抽樣分布( (概率分布概率分布) )及及隨機(jī)干擾項(xiàng)方差的估計(jì)隨機(jī)干擾項(xiàng)方差的估計(jì) 12227(0,)iiiiiYBB XuuuN 假假設(shè)設(shè)在在總總體體

11、回回歸歸函函數(shù)數(shù)中中，誤誤差差項(xiàng)項(xiàng)服服從從均均值值為為0 0方方差差為為的的正正太太分分布布，即即這這一一假假設(shè)設(shè)的的理理論論基基礎(chǔ)礎(chǔ)是是統(tǒng)統(tǒng)計(jì)計(jì)學(xué)學(xué)中中的的中中心心極極限限定定理理。中心極限定理中心極限定理設(shè)隨機(jī)變量設(shè)隨機(jī)變量,21nXXX相互獨(dú)立，具有相同的分布相互獨(dú)立，具有相同的分布, ), 2 , 1(0)(,)(2kXDXEkknXnnXYnkkn/21記記則對(duì)于任意實(shí)數(shù)則對(duì)于任意實(shí)數(shù)x,x,有有)(21lim2/2xdtexYPxtnn02nXXX,21nkkX1nXnnXYnkkn/21中心極限定理表明中心極限定理表明：均值為：均值為，方差為，方差為的獨(dú)立同分布的隨機(jī)變量的獨(dú)立

12、同分布的隨機(jī)變量的和的和的標(biāo)準(zhǔn)化變量的分布函數(shù)，當(dāng)?shù)臉?biāo)準(zhǔn)化變量的分布函數(shù)，當(dāng)n n充分大時(shí)，有充分大時(shí)，有) 1 , 0(N近似地普通最小二乘估計(jì)量普通最小二乘估計(jì)量b1 、 b2分別是分別是Yi的線性組的線性組合，因此，合，因此， b1和和b2的概率分布取決于的概率分布取決于Y的分布的分布特征。特征。在在u是正態(tài)分布的假設(shè)下，是正態(tài)分布的假設(shè)下，Y是正態(tài)分布，則是正態(tài)分布，則b1 、 b2也服從正態(tài)分布，因此，也服從正態(tài)分布，因此，2221122221,iiiXbNBbNBnxx ，1、參數(shù)估計(jì)量、參數(shù)估計(jì)量b1和和b2概率分布概率分布b1和和b2的標(biāo)準(zhǔn)差的標(biāo)準(zhǔn)差1222222ibbiiXn

13、xx ，3.5 假設(shè)檢驗(yàn)假設(shè)檢驗(yàn)n回歸分析回歸分析是要通過樣本所估計(jì)的參數(shù)來代是要通過樣本所估計(jì)的參數(shù)來代替總體的真實(shí)參數(shù)，或者說是用樣本回歸替總體的真實(shí)參數(shù)，或者說是用樣本回歸線代替總體回歸線。線代替總體回歸線。n盡管從盡管從統(tǒng)計(jì)性質(zhì)統(tǒng)計(jì)性質(zhì)上已知，如果有足夠多的上已知，如果有足夠多的重復(fù)重復(fù) 抽樣，參數(shù)的估計(jì)值的期望（均值）抽樣，參數(shù)的估計(jì)值的期望（均值）就等于其總體的參數(shù)真值，但在一次抽樣就等于其總體的參數(shù)真值，但在一次抽樣中，估計(jì)值不一定就等于該真值。中，估計(jì)值不一定就等于該真值。n那么，在一次抽樣中，參數(shù)的估計(jì)值與那么，在一次抽樣中，參數(shù)的估計(jì)值與真值的差異有多大，是否顯著，這就需真

14、值的差異有多大，是否顯著，這就需要進(jìn)一步進(jìn)行要進(jìn)一步進(jìn)行統(tǒng)計(jì)檢驗(yàn)統(tǒng)計(jì)檢驗(yàn)。主要內(nèi)容有：。主要內(nèi)容有：參數(shù)的參數(shù)的區(qū)間估計(jì)區(qū)間估計(jì)；變量的變量的顯著性檢驗(yàn)顯著性檢驗(yàn)擬合優(yōu)度檢驗(yàn)擬合優(yōu)度檢驗(yàn)。2222(,)ibN Bx 2222222(0,1)()ibBbBZNse bx 對(duì)于一元線性回歸方程中的對(duì)于一元線性回歸方程中的b2，已經(jīng)知道它，已經(jīng)知道它服從分布服從分布2222tien 要要使使用用上上式式需需要要知知道道真真實(shí)實(shí)的的，而而是是未未知知，可可以以根根據(jù)據(jù)對(duì)對(duì)其其進(jìn)進(jìn)行行估估算算。如如果果用用代代替替，則則上上式式的的右右邊邊服服從從自自由由度度為為n-2n-2的的分分布布，而而不不是

15、是正正態(tài)態(tài)分分布布，即即在這種情況下用在這種情況下用t統(tǒng)計(jì)量代替統(tǒng)計(jì)量代替Z統(tǒng)計(jì)量進(jìn)行檢驗(yàn)。統(tǒng)計(jì)量進(jìn)行檢驗(yàn)。2222 (2)ibBtt nx 22ien 要判斷樣本參數(shù)的估計(jì)值在多大程度上可以要判斷樣本參數(shù)的估計(jì)值在多大程度上可以“近近似似”地替代總體參數(shù)的真值，往往需要通過構(gòu)造地替代總體參數(shù)的真值，往往需要通過構(gòu)造一個(gè)以樣本參數(shù)的估計(jì)值為中心的一個(gè)以樣本參數(shù)的估計(jì)值為中心的“區(qū)間區(qū)間”，來，來考察它以多大的可能性（概率）包含著真實(shí)的參考察它以多大的可能性（概率）包含著真實(shí)的參數(shù)值。這種方法就是參數(shù)檢驗(yàn)的數(shù)值。這種方法就是參數(shù)檢驗(yàn)的置信區(qū)間估計(jì)置信區(qū)間估計(jì)。（1 1）檢驗(yàn)檢驗(yàn) 置信區(qū)間置信區(qū)

16、間法法0212HB =0HB0 ：，：，如果存在這樣一個(gè)區(qū)間，如果存在這樣一個(gè)區(qū)間，稱之為稱之為置信區(qū)間置信區(qū)間（confidence interval）；）； 1- 稱為稱為置信系數(shù)置信系數(shù)（置信度置信度）（）（confidence coefficient），），稱為稱為顯著性水平顯著性水平（level of significance）；）；置信區(qū)間的端點(diǎn)稱為置信區(qū)間的端點(diǎn)稱為置信限置信限（confidence limit）或）或臨界臨界值值（critical values）。）。 1P bBb 要判斷估計(jì)的參數(shù)值要判斷估計(jì)的參數(shù)值b離真實(shí)的參數(shù)值離真實(shí)的參數(shù)值B有多有多“近近”，可預(yù)先

17、選擇一個(gè)概率，可預(yù)先選擇一個(gè)概率 (0 1) ，并求一，并求一個(gè)正數(shù)個(gè)正數(shù) ，使得隨機(jī)區(qū)間，使得隨機(jī)區(qū)間(b- , b+ )包含參數(shù)的直包含參數(shù)的直值的概率為值的概率為1- ，即：，即：在數(shù)學(xué)在數(shù)學(xué)S.A.T一例中，共有觀察值一例中，共有觀察值10個(gè)，自由個(gè)，自由度為度為n-2=8，假定顯著性水平為，假定顯著性水平為5%，查，查t分布表分布表得得P(-2.306t2.306P(-2.306t2.306）=0.95=0.95即即t值位于上、下限（值位于上、下限（-2.306,2.306）之間的概）之間的概率為率為95%，這個(gè)上、下限就是臨界，這個(gè)上、下限就是臨界t值，得值，得2222ibBx P

18、(-2.3062.306P(-2.3062.306）=0.95=0.952222222+iibxBbx P(-2.3062.306 P(-2.3062.306）=0.95=0.95整整理理得得2B95%上上式式給給出出了了的的一一個(gè)個(gè)的的置置信信區(qū)區(qū)間間。22=ix 在在數(shù)數(shù)學(xué)學(xué)分分?jǐn)?shù)數(shù)一一例例中中0.0002450.000245，于于是是可可求求得得置置信信區(qū)區(qū)間間為為222+bBb -2.306 -2.306（0.0002450.000245）2.3062.306（0.0002450.000245）20.000740.00187B0不不在在這這個(gè)個(gè)區(qū)區(qū)間間范范圍圍內(nèi)內(nèi)，因因此此拒拒絕絕零零

19、假假設(shè)設(shè)。表表明明收收入入與與數(shù)數(shù)學(xué)學(xué)分分?jǐn)?shù)數(shù)有有關(guān)關(guān)系系。（2 2）假設(shè)檢驗(yàn)的顯著性檢驗(yàn)）假設(shè)檢驗(yàn)的顯著性檢驗(yàn) 回歸分析是要判斷解釋變量回歸分析是要判斷解釋變量X是否是被解釋變量是否是被解釋變量Y的一個(gè)顯著性的影響因素。的一個(gè)顯著性的影響因素。在一元線性模型中，就是要判斷在一元線性模型中，就是要判斷X是否對(duì)是否對(duì)Y具有顯具有顯著的線性性影響。這就需要進(jìn)行變量的顯著性檢著的線性性影響。這就需要進(jìn)行變量的顯著性檢驗(yàn)。驗(yàn)。變量的顯著性檢驗(yàn)所應(yīng)用的方法是數(shù)理統(tǒng)計(jì)變量的顯著性檢驗(yàn)所應(yīng)用的方法是數(shù)理統(tǒng)計(jì)學(xué)中的學(xué)中的假設(shè)檢驗(yàn)假設(shè)檢驗(yàn)。計(jì)量經(jīng)濟(jì)學(xué)中，主要是針對(duì)變量的參數(shù)真值計(jì)量經(jīng)濟(jì)學(xué)中，主要是針對(duì)變量的

20、參數(shù)真值是否為零是否為零來進(jìn)行顯著性檢驗(yàn)的。來進(jìn)行顯著性檢驗(yàn)的。這種假設(shè)檢驗(yàn)方法涉及兩個(gè)重要概念檢驗(yàn)統(tǒng)這種假設(shè)檢驗(yàn)方法涉及兩個(gè)重要概念檢驗(yàn)統(tǒng)計(jì)量和零假設(shè)下檢驗(yàn)統(tǒng)計(jì)量的抽樣分布。其核心計(jì)量和零假設(shè)下檢驗(yàn)統(tǒng)計(jì)量的抽樣分布。其核心思想是根據(jù)從樣本數(shù)據(jù)求得到統(tǒng)計(jì)量的值決定接思想是根據(jù)從樣本數(shù)據(jù)求得到統(tǒng)計(jì)量的值決定接受或拒絕零假設(shè)。受或拒絕零假設(shè)。2222 (2)ibBtt nx 前前面面已已經(jīng)經(jīng)介介紹紹(2)tn 服服從從自自由由度度為為的的分分布布，如如果果令令*022HB =B：*22BB是是的的某某個(gè)個(gè)給給定定的的數(shù)數(shù)值值，則則根根據(jù)據(jù)樣樣本本數(shù)數(shù)據(jù)據(jù)求求得得*2222-=ibBtx 估估計(jì)

21、計(jì)值值假假設(shè)設(shè)值值（3.293.29）估估計(jì)計(jì)值值的的標(biāo)標(biāo)準(zhǔn)準(zhǔn)誤誤tn-2tt將將上上面面計(jì)計(jì)算算出出的的值值作作為為檢檢驗(yàn)驗(yàn)統(tǒng)統(tǒng)計(jì)計(jì)量量。服服從從自自由由度度為為（）的的分分布布。相相應(yīng)應(yīng)的的檢檢驗(yàn)驗(yàn)稱稱為為檢檢驗(yàn)驗(yàn)。n-2;%PP檢檢驗(yàn)驗(yàn)時(shí)時(shí)，需需要要知知道道：（1 1）對(duì)對(duì)于于雙雙變變量量模模型型，自自由由度度為為（2 2）常常用用的的顯顯著著性性水水平平有有1 1 ，5 5，1010，為為了了避避免免選選擇擇顯顯著著水水平平的的隨隨意意性性，通通常常求求出出值值如如果果值值充充分分小小，則則拒拒絕絕零零假假設(shè)設(shè)。（3 3）可可用用單單邊邊或或雙雙邊邊檢檢驗(yàn)驗(yàn)。0212

22、1. HB =0HB0 雙雙邊邊檢檢驗(yàn)驗(yàn)：，：，利利用用（3.293.29）得得S.A.T繼繼續(xù)續(xù)數(shù)數(shù)學(xué)學(xué)一一例例0.0013-0=5.43540.000245t 02122. HB0HB0.單單邊邊檢檢驗(yàn)驗(yàn)：，：數(shù)學(xué)分?jǐn)?shù)函數(shù)中系數(shù)為正的，因此實(shí)際中檢驗(yàn)是數(shù)學(xué)分?jǐn)?shù)函數(shù)中系數(shù)為正的，因此實(shí)際中檢驗(yàn)是單邊的。單邊的。T檢驗(yàn)的過程是相同的，只是犯第一類檢驗(yàn)的過程是相同的，只是犯第一類錯(cuò)誤的概率不是均勻的分布在錯(cuò)誤的概率不是均勻的分布在t分布的兩側(cè)，而是分布的兩側(cè)，而是集中于一側(cè)，左側(cè)或右側(cè)。集中于一側(cè)，左側(cè)或右側(cè)。3.6 3.6 擬合優(yōu)度檢驗(yàn)擬合優(yōu)度檢驗(yàn) 判定系數(shù)判定系數(shù)擬合優(yōu)度檢驗(yàn)擬合優(yōu)度檢驗(yàn)對(duì)樣

23、本回歸直線與樣本觀測對(duì)樣本回歸直線與樣本觀測值之間擬合程度的檢驗(yàn)。值之間擬合程度的檢驗(yàn)。度量擬合優(yōu)度的指標(biāo)：度量擬合優(yōu)度的指標(biāo)：判定系數(shù)判定系數(shù)（可決系數(shù)可決系數(shù)）R21 1、總離差平方和的分解、總離差平方和的分解已知由一組樣本觀測值（已知由一組樣本觀測值（Xi,Yi），），i i=1,2,n得得到如下樣本回歸直線到如下樣本回歸直線 01iiYbb XiiiYYe 前前面面講講過過 eiiiiYYYYYY對(duì)對(duì)上上式式進(jìn)進(jìn)行行恒恒等等變變化化（即即） eiiiiYYYYYY（即即）對(duì)對(duì)上上式式進(jìn)進(jìn)行行恒恒等等變變化化Yi的變異由X變異所解釋的部分未解釋的部分或殘差部分如果如果Yi=i 即

24、實(shí)際觀測值落在樣本回歸即實(shí)際觀測值落在樣本回歸“線線”上，則上，則擬合最好擬合最好。可認(rèn)為，可認(rèn)為，“離差離差”全部來自回歸線，而與全部來自回歸線，而與“殘差殘差”無關(guān)。無關(guān)。 iieYY iiyYY是樣本回歸擬合值與觀測值的平均是樣本回歸擬合值與觀測值的平均值之差，可認(rèn)為是由回歸直線解釋值之差，可認(rèn)為是由回歸直線解釋的部分；的部分；是實(shí)際觀測值與回歸擬合值之差，是實(shí)際觀測值與回歸擬合值之差，是回歸直線不能解釋的部分；是回歸直線不能解釋的部分；用小寫字母表示與均值的離差，得用小寫字母表示與均值的離差，得iiiyye =iiybx由由得得=iiiybxe 上式兩邊求和，經(jīng)過數(shù)學(xué)變換得上式兩邊

25、求和，經(jīng)過數(shù)學(xué)變換得對(duì)于所有樣本點(diǎn)，則需考慮這些點(diǎn)與樣本均對(duì)于所有樣本點(diǎn)，則需考慮這些點(diǎn)與樣本均值離差的平方和，值離差的平方和，可以證明可以證明：222=iiiybxe 或或者者TSS=ESS+RSS22)(YYyTSSii記記22)(YYyESSii22)(iiiYYeRSS總體平方和總體平方和（Total Sum of Squares）回歸平方和回歸平方和（Explained Sum of Squares）殘差平方和殘差平方和（Residual Sum of Squares ）Y的觀測值圍繞其均值的總離差的觀測值圍繞其均值的總離差(total variation)可分解為兩部分：一部分來

26、自回可分解為兩部分：一部分來自回歸線歸線(ESS)，另一部分則來自隨機(jī)因素，另一部分則來自隨機(jī)因素(RSS)。n在給定樣本中，在給定樣本中，TSS不變，不變，n如果實(shí)際觀測點(diǎn)離樣本回歸線越近，則如果實(shí)際觀測點(diǎn)離樣本回歸線越近，則ESS在在TSS中占的比重越大，因此中占的比重越大，因此n擬合優(yōu)度擬合優(yōu)度：回歸平方和：回歸平方和ESS/Y的總離差的總離差TSS2221=1iieESSRSSRTSSTSSy 2、可決系數(shù)、可決系數(shù)R2 2統(tǒng)計(jì)量統(tǒng)計(jì)量稱 R2 為（樣本）（樣本）可決系數(shù)可決系數(shù)或或判定系數(shù)判定系數(shù)（coefficient of determination)。可決系數(shù)可決系數(shù)的取值范圍取值范圍：0，1 R2越接近越接近1 1，說明實(shí)際觀測點(diǎn)離樣本線越近，說明實(shí)際觀測點(diǎn)離樣本線越近，擬合優(yōu)度越高擬合優(yōu)度越高。記：記：注：注：（1 1）可決系數(shù)可決系數(shù)是一個(gè)非負(fù)的統(tǒng)計(jì)量。是一個(gè)非負(fù)的統(tǒng)計(jì)量。（2 2）可決系數(shù)可決系數(shù)的取值范圍取值范圍：0，1。數(shù)學(xué)分?jǐn)?shù)一例中，數(shù)學(xué)分?jǐn)?shù)一例中，2222rXY()()()()iiiiXX YYrXXYYx yx

人人文庫> 全部分類> 教育資料 > 輔導(dǎo)培訓(xùn)

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

第3章雙線性模型：假設(shè)檢驗(yàn)

文檔簡介

溫馨提示

最新文檔

評(píng)論

第3章 雙線性模型：假設(shè)檢驗(yàn)

文檔簡介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔

第3章雙線性模型：假設(shè)檢驗(yàn)