一元線性模型_第1頁
一元線性模型_第2頁
一元線性模型_第3頁
一元線性模型_第4頁
一元線性模型_第5頁
已閱讀5頁,還剩18頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第二章一元線性回歸模型基本要求:1、了解相關(guān)與回歸的概念2、理解線性回歸模型的假定3、掌握普通最小二乘法4、理解最小二乘估計量的性質(zhì)5、會進行回歸模型的檢驗第一節(jié)一元線性回歸模型概述一、相關(guān)與回歸的基本概念(一)變量之間的關(guān)系各種經(jīng)濟變量之間的關(guān)系,一般可以分成兩類,即完全確定的關(guān)系和非確定性的依存關(guān)系。確定性關(guān)系或函數(shù)關(guān)系如果一個變量值能被一個或若干個其他變量值按某一規(guī)律唯一的確定,則這類變量之間就具有完全確定的關(guān)系。例如,當每噸水的價格為P元時,居民應(yīng)繳納的水費Y(元)與用水量X(噸)之間的關(guān)系可表示為Y=PX。非確定性關(guān)系如果變量之間既存在密切的數(shù)量關(guān)系,又不能由一個(或幾個)變量之值精確的求出另一個變量之值,但在大量統(tǒng)計資料的基礎(chǔ)上,可以判別這類變量之間的數(shù)量變化具有一定的規(guī)律性,也稱為統(tǒng)計相關(guān)關(guān)系。例如消費支出Y與可支配收入X之間有一定的關(guān)系,在一定范圍內(nèi),收入增加,在理論上可以估計出增加的消費支出額。但應(yīng)看到,可支配收入雖然是影響消費支出的重要因素,卻不是唯一的因素。因此,根據(jù)可支配收入并不能精確的求出消費支出,也就不能用精確的函數(shù)關(guān)系表達式來表示這兩個變量之間的關(guān)系。計量經(jīng)濟學(xué)就是研究變量間的非確定關(guān)系的,變量間的統(tǒng)計相關(guān)關(guān)系可以通過相關(guān)分析和回歸分析來研究。(二)相關(guān)分析1、涵義相關(guān)分析是通過對經(jīng)濟現(xiàn)象的依存關(guān)系的分析,找出現(xiàn)象間的相互依存的形式和相關(guān)程度,以及依存關(guān)系的變動規(guī)律。2、類型一一從變量間的依存形式看,可分為線性相關(guān)和非線性相關(guān)。線性相關(guān)反映變量間的依存關(guān)系可以近似的表示為一條直線;變量間的依存關(guān)系近似的表示為一條曲線則稱為非線性相關(guān)。3、指標從變量間的相關(guān)程度看,可以通過相關(guān)系數(shù)來度量。兩個變量之間的相關(guān)程度可以用簡單相關(guān)系數(shù)來衡量;多個變量之間的相關(guān)程度可以用復(fù)相關(guān)系數(shù)、偏相關(guān)系數(shù)等來衡量。(三)回歸分析回歸的定義回歸分析是研究某一被解釋變量(因變量)與另一個或多個解釋變量(自變量)間的依存關(guān)系,其目的在于根據(jù)已知的解釋變量值或固定的解釋變量值(重復(fù)抽樣)來估計和預(yù)測被解釋變量的總體平均值。在研究某一社會經(jīng)濟現(xiàn)象的發(fā)展變化規(guī)律時,所研究的現(xiàn)象或?qū)ο蠓Q為被解釋變量,它是分析的對象,把引起這一現(xiàn)象變化的因素稱為解釋變量,它是引起這一現(xiàn)象變化的原因。被解釋變量則反映了解釋變量變化的結(jié)果?;貧w模型的分類(1)按模型中自變量的多少,分為一元回歸模型和多元回歸模型。一元回歸模型是指只包含一個解釋變量的回歸模型多元回歸模型是指包含兩個或兩個以上解釋變量的回歸模型。(2)按模型中參數(shù)與被解釋變量之間是否線性,分為線性回歸模型和非線性回歸模型。對于“線性”的解釋:一種是就變量而言是線性的,即線性回歸模型是指解釋變量與被解釋變量之間呈線性關(guān)系;另一種是就參數(shù)而言是線性的,即線性回歸模型是指參數(shù)與被解釋變量之間呈線性關(guān)系;非線性回歸模型是指參數(shù)與被解釋變量之間呈非線性關(guān)系。就回歸模型而言,通?!熬€性”是就參數(shù)而言的。(3)按模型中方程數(shù)目的多少,分為單一方程模型和聯(lián)立方程模型。單一方程模型是指只包含一個方程的回歸模型;聯(lián)立方程模型是指包含兩個或兩個以上方程的回歸模型。相關(guān)與回歸的關(guān)系相關(guān)分析是回歸分析的基礎(chǔ)和前提,回歸分析則是相關(guān)分析的深入和繼續(xù)。相關(guān)分析需要依靠回歸分析來表現(xiàn)變量之間數(shù)量相關(guān)的具體形式,而回歸分析則需要依靠相關(guān)分析來表現(xiàn)變量之間數(shù)量變化的相關(guān)程度。相關(guān)分析只研究變量之間相關(guān)的方向和程度,不能推斷變量之間相互關(guān)系的具體形式,也無法從一個變量的變化來推測另一個變量的變化情況。注意避免“虛假回歸”:只有當變量之間存在高度相關(guān)時,進行回歸分析尋求其相關(guān)的具體形式才有意義。如果在沒有對變量之間是否相關(guān)以及相關(guān)方向和程度做出正確判斷之前,就進行回歸分析,很容易造成“虛假回歸”。二者的區(qū)別:在相關(guān)分析中涉及的變量不存在自變量和因變量的劃分問題,變量之間的關(guān)系是對等的;而在回歸分析中,則必須根據(jù)研究對象的性質(zhì)和研究分析的目的,對變量進行自變量和因變量的劃分。因此,在回歸分析中,變量之間的關(guān)系是不對等的。在相關(guān)分析中所有的變量都必須是隨機變量;而在回歸分析中,自變量是給定的,因變量才是隨機的,即將自變量的給定值代入回歸方程后,所得到的因變量的估計值不是惟一確定的,而會表現(xiàn)出一定的隨機波動性。相關(guān)分析主要是通過一個指標即相關(guān)系數(shù)來反映變量之間相關(guān)程度的大小,由于變量之間是對等的,因此相關(guān)系數(shù)是惟一確定的。而在回歸分析中,對于互為因果的兩個變量,則有可能存在多個回歸方程。二一元線性回歸模型總體回歸函數(shù)1、總體回歸函數(shù)假若我們要研究的問題是某市n戶城鎮(zhèn)居民家庭的可支配收入x和消費支出y之間的關(guān)系,則全體N戶居民家庭構(gòu)成了研究的總體。表2-1給出了全部居民家庭可支配收入和消費支出統(tǒng)計資料。表2-1居民家庭可支配收入和消費支出統(tǒng)計表可支配收入(X)消費支出(Y)戶數(shù)平均消費支出XYY…Y???YNE(Y1X)111121j1N111XYY…Y???YNE(Y1X)221222j2N222......XYY…Y???YNE(Y1X)ii1i2ijii......XYY…Y???YNE(Y1X)kk1k2kjkNkkk從表2-1可以看出:對于某一收入水平X,(i=1,2,…,k),有N\N=N1+N2+…+Nk)戶居民家庭消費支出與其對應(yīng),反映出在某一收入水平下有關(guān)消費支出的條件分布。根據(jù)該條件分布,可以計算出在某一收入水平下平均消費支出E(Y/X),即條件均值。從表2-1還可以看出:對于每i一收入水平Xi,僅有唯一的一個條件均值E(Y/Xi)與其對應(yīng),這種一一對應(yīng)的關(guān)系構(gòu)成了函數(shù)關(guān)系,該函數(shù)稱為總體回歸函數(shù)(PopulationRegressionFunction,PRF)。記為:E(Y/Xi)=f(Xi)(2-1)總體回歸函數(shù)反映了給定X/.的Y分布的總體均值隨X的變化而變化的關(guān)系。2、回歸系數(shù):P°和七總體回歸函數(shù)f(*)若采用線性函數(shù)的形式,有:E(Y/Xj)=?!?P1Xj(2-2)其中P。和七是未知而固定的參數(shù),稱為回歸系數(shù)(RegressionCoefficients),P°稱為截距系數(shù)(InterceptCoefficients),p]稱為斜率系數(shù)(SlopeCoefficients)o該函數(shù)稱為線性總體回歸函數(shù)。總體回歸函數(shù)的隨機設(shè)定E(Y/X〔)描述了在某一收入水平下平均消費支出水平,但是對于某一戶居民的家庭消費支出Y不一定恰好與該水平一致,或多或少地存在一些偏差。該偏差用P表示,并定義:TOC\o"1-5"\h\zii\o"CurrentDocument"七二Y-E(Y/Xj)(2-3)則有:\o"CurrentDocument"Y=E(Y/X)+p=P+PX+p(2-4)jjj01jj式(2-4)中已反映了除收入之外眾多影響消費支出的因素的綜合影響,是一個不能觀測的隨機變量,稱為隨機誤差項(StochasticError)。式(2-4)為總體回歸函數(shù)的隨機設(shè)定形式。樣本回歸函數(shù)根據(jù)總體資料可以建立總體回歸函數(shù),揭示被解釋變量隨解釋變量的變化而變化的規(guī)律。但在大多數(shù)實際情況中,總體的信息往往無法全部獲得,我們所掌握的不過是與某些固定的X值相對應(yīng)的Y值的樣本。需要根據(jù)已知的樣本信息去估計總體回歸函數(shù)。假定現(xiàn)在不知道建立總體回歸函數(shù)的總體資料,僅僅掌握來自總體的一組樣本數(shù)據(jù),例如,根據(jù)調(diào)查得到某市職工個人月可支配收入與月消費支出數(shù)據(jù)資料(見表2-2)表2-2某市職工個人月可支配收入與月消費支出調(diào)查資料單位:元/月序號12345678910可支配收入(X)800100012001400160018002000220024002600消費支出(Y)700650900950110011501200140015501500根據(jù)以上樣本數(shù)據(jù)擬合一個線性方程:(2-5)該方程式稱為樣本回歸函數(shù)(SampleRegressionFunction,SRF)。比較式(2-2)與(2-5),假若充分地“接近”P,并且耽也充分地“接近”P,就可以0011

用樣本回歸函數(shù)Y去估計總體回歸函數(shù)E(YIX.)。所以Y亦稱為E(YIX.)的估計量;吭稱為P的i1i1U0八.估計量"1稱為°1的估計量。.一八?一式(2-5)中Y.與實際的值存在一定的偏差,該偏差e用表示。定乂:ii(2-6)Y=Y+e=P+BX+e(2-6)iii01iie稱為樣本剩余項,也稱為殘差。圖2-1總體回歸函數(shù)與樣本回歸函數(shù)的關(guān)系X1i第二節(jié)一元線性回歸模型參數(shù)估計e稱為樣本剩余項,也稱為殘差。圖2-1總體回歸函數(shù)與樣本回歸函數(shù)的關(guān)系X1i一■古典線性回歸模型的假定以一元線性回歸模型Y=P0+P1Xi+也為例,古典線性回歸模型的假定如下:假定1:在給定X的條件下,光的條件均值為零。即,EglXg假定2:在給定任意X、X.的條件下,已、氣不相關(guān)。即,Cov(光.,"=0。假定3:對于每一個XJ的條件方差是一個等于戒的常數(shù)。即,V*I婦*)=。2。假定4:在給定Xj的條件下,Xj和已不相關(guān)。即,Cov(^.,勺=0。滿足以上四個假定的線性回歸模型稱為古典線性回歸模型「所謂“古典”是作為一種標準或規(guī)范來使用的,凡是不滿足以上假定的回歸模型,就不是“古典”回歸模型。在前述假定下,用最小二乘法得到的回歸參數(shù)的估計值,按照高斯一馬爾可夫定理(Gauss-MarkovTheorem)的意義來說,是“最優(yōu)的”。假定5:對于每一個光都服從于均值為零、方差為。2正態(tài)分布。即,光?N(0,。2)滿足以上五個假定的線性回歸模型稱為古典正態(tài)線性回歸模型。'

二,?通最小二乘法(一)最小二乘原理利用樣本回歸函數(shù)估計總體回歸函數(shù),是根據(jù)一個給定的包含〃組X和y觀測數(shù)據(jù)的樣本,建…人.......一^立樣本回歸函數(shù),使估計值y.盡可能接近觀測值y?。最小二乘原理就是根據(jù)使樣本剩余的平方和達到最小的準則,確定模型中的參數(shù),建立樣本回歸函數(shù)。(二)最小二乘估計量1、計算、推導(dǎo)由e=y-Y=Y-B-BX,得TOC\o"1-5"\h\ziiii01(2-7)£e2=£(Y-B-BX)2ii01i(2-7)對于給定的樣本,£e2的大小取決于B和B的大小,即£e2是B和B的函數(shù)。按照最小i01i01二乘原理,要求所選定的B和6應(yīng)使£e2最小,要做到這一點,可以借助微積分中求極值的方法,01i用£e2分別對6和B求偏導(dǎo)數(shù),并令其為零,滿足該條件的6和B可以使£e2最小。即:0101正e2鄧’用£e2分別對6和B求偏導(dǎo)數(shù),并令其為零,滿足該條件的6和B可以使£e2最小。即:0101正e2鄧’0可得到:2(y-B0,4—。即1Xi)=°乙(y—B0-B]x.)x=0(2-8)整理后有:£y=,B+bSXv1Vv£xy=B0£x+B]£X2(2-9)求解得:八n£XY-£X£YB1=n£x2-(£x)2'iiB旦-B呈0n1n(2-10)(2-11)(2-12)£(X—X)(Y—Y)iX—X)2i(2-12)(2-13)一、(2-13)一、則°1=X’-X,£xy=亍ii£x2iy,=匕-Y(離差)(2-14)以上°0和°]是根據(jù)最小二乘原理求得的,故稱為普通最小二乘估計量。2、實例利用表2-2的樣本資料建立最小二乘回歸模型的過程如下:表2-3計算表序號X.Y,xyX2x.yX2i1800700-900-41081000016810036900064000021000650-700-460490000211600322000100000031200900-500-21025000044100105000144000041400950-300-1609000025600480001960000516001100-100-101000010010002560000618001150100401000016004000324000072000120030090900008100270004000000822001400500290250000841001450004840000924001550700440490000193600308000576000010260015009003908100001521003510006760000合計1700011100003300000889000168000032200000平均17001110£xy1680000▽ii==0.5091£x23300000i—q—=Y—°X—q—=Y—°X=1110-0.5091x1700=244.54551°0樣本回歸函數(shù)為:Y=244.5455+0.5091Xii上式表明,該市職工每月可支配收入若是增加100元,職工將會拿出其中的50.91元用于消費。(三)普通最小二乘回歸直線的性質(zhì)回歸直線具有以下性質(zhì):回歸直線通過樣本均值。估計值匕的均值等于觀測值匕的均值。剩余項e的均值為零。Z剩余項e?與估計量匕不相關(guān)。剩余項e?與解釋變量X,不相關(guān)。三,■小二乘估計量的性質(zhì)(一)線性性最小二乘法計算的估計量是隨機變量七的線性函數(shù)。1.%的線性由式(2-14)得:八^xyEx(Y-Y)YxYYExYxY&=——=——i_i=——i—?=——I1Ex2Ex2Ex2Ex2Ex2=E^L(這里Ex=0)Ex2iix,Ex2i有:p=EkY1ii2.P的線性0由式(2-13)得:p=Y—Bx=1Zy—ZkYX=z(I—kX)Y01niiinii(2-15)…1、二令h=kX有:p=EhY0ii(2-16)(二)無偏性.........如果估計量8的均值等于總體參數(shù)真值8,則該估計量就是無偏估計量。8的無偏性1由式(2-15)得:8二£kY1因為:£k=0,ii£kx=1

ii所以:81=81+£k巴二£k(8+8x+r)=8£k+8£kxi01ii0i1ii(2-17)(2-18(2-18)(2-19)(2-20)則8就是8的最佳由此可得:E(|3)=E(8+£kp)=E(8)+E(£kp)=8+£kE(^)二811ii1ii1ii1即:E(8)=811、8的無偏性0由式(2-16)可得:8=8+£hp00iia一E(8)=800(三)有效性(最佳無偏性)在所有關(guān)于總體參數(shù)真值8的無偏估計量中,若估計量8具有最小方差,無偏估計量。L8]的有效性由式(2-17)可得:Var(P)=Var(P+£k日)

11i=Var(P)+Var(£k日)E1iiVar(k四.)=£k2Var(u)i=b2乙k2i=b2£[;]2(2-21)八.....A設(shè)P*是用其他估計方法得到的關(guān)于七的線性無偏估計量。由其線性性質(zhì)可知P11對其求方差可得:Var(P*)=Var£((?-k)+k)Y=b2£(①-k)2+Var(P)\o"CurrentDocument"1iiiiii1=加Y,ii這里b2£(①—k)2>0,所以有:Var(P*)>Var(P)11八2.p0的有效性同理,由式(2-16)可得:£y2/dX2Var(P)Yib20n£x2i(2-22)”設(shè)P0*是用其他估計方法得到的關(guān)于P0的線性無偏估計量,則有:A與對P的有效性分析相同1Var(P*)>Var(P)00結(jié)論:在古典線性回歸模型的假定下,最小二乘估計量在所有線性無偏估計量中,具有最小方差,這一結(jié)論即是著名的高斯-馬爾可夫(Gauss-Markov)定理。、估計量P0和P1的分布1、理論基礎(chǔ)對于一個古典正態(tài)線性回歸模型,即同時滿足第二節(jié)中假定5的古典線性回歸模型,其隨機擾動項u服從正態(tài)分布。由于Y是u的線性函數(shù),而P和P又分別是Y的線性函數(shù),根據(jù)正態(tài)分布iii01iKA的性質(zhì)可知,P和P也服從正態(tài)分布。01由以上分析可知:E(P)=P,E(P)=P0011Var(p)=^^ib2,Var(p)=bb0nZx2i從而有:rZx2)亍ib2U0nZX2/4?P0?NP,在上面計算P和P方差的表達式中,除了隨機擾動項的方差b2之外,01都是可以根據(jù)樣本資料估計的??梢杂胋2的無偏估計量42來代替b2計算『和&的方差。01Ze2人一?b2=Ln—2(2-23)Ze2可以根據(jù)式(2-8)計算,也可以由下式計算:iZe:=Zy:+P:Zx22、實例對于例題2-1.Zy2+p2Zx2b2=i1i-(2-24)n—2889000—0.50912x330000010—2=4212.0909ZX—3220000(X4212.0909/Var(P)=年ib2==4109.980nZx210x3300000iS(P0)=JVar(P0)=64.1091b24212.0909Var(P1)=L^3300000-ic?Z~一一一S(P1)=dVar(p1)=0.0357。第三節(jié)顯著性檢驗一,擬合優(yōu)度與相關(guān)系數(shù)檢驗(一)擬合優(yōu)度與可決系數(shù)擬合優(yōu)度是指樣本回歸直線對觀測數(shù)據(jù)擬合的優(yōu)劣程度。我們所希望的就是圍繞回歸直線的剩余盡可能的小。擬合優(yōu)度通常用可決系數(shù)來度量??蓻Q系數(shù)是樣本回歸直線對數(shù)據(jù)擬合程度的綜合度量。在雙變量的情況下,通常用r2表示可決系數(shù)??蓻Q系數(shù)是建立在對被解釋變量總變差分解的基礎(chǔ)之上。圖2-2總變差分解圖圖2-2中,觀測值Y的離差y=Y-Y=Y-Y+Y-Y=e+§。/iiiiiii.、—.其中,舍=Y?-Y,是樣本回歸直線所確定的估計值與平均值的差;人....Cj=Yi-Y?,是樣本觀測值與回歸直線所確定的估計值之差。y越大,e越小,估計值與觀測值越接近,該點擬合的越好;反之,擬合的越差。當y=y時,iiii完全擬合。采用£y2指標進行分析,該指標稱為總變差或總離差平方和,簡記為tss。i£y2=£(e+y)2'=£e:'+£y2+2£ey根據(jù)£ey=0,所以有II(2-25)其中,2y:=£(匕-Y)2,稱為回歸平方和,簡記為ESS;2e=2(Y.-Y?)2,稱為殘差平方和,簡記為RSS。這樣式(2-25)也可以記為:TSS=RSS+ESS(2-26)當根據(jù)樣本采用最小二乘法確定了一條回歸直線時,TSS的大小是一定的。ESS越大,RSS越小,該回歸直線擬合的越好;反之,擬合的越差。1、定義:r2=E||,r2稱為(樣本)可決系數(shù),它是最常用的回歸直線擬合優(yōu)度的度量,表示TSS由回歸模型做出解釋的變差在總變差中所占的比重。TSS-RSSTSS由式(2-26)得(2-27)RSS=1-——TSSTSS-RSSTSS(2-27)上式表明,若樣本剩余RSS越小,r2的值就越大,擬合優(yōu)度越好;反之,RSS越大,r2的值就越小,擬合優(yōu)度越差。2、可決系數(shù)r2還可以按以下推導(dǎo)出的公式求得:2、(2-28)(2-29)(2-30)=Y-Y=(任+任X)-(任+任X)=BxTOC\o"1-5"\h\z01i011iESS2y22(Bx)2穴2x2TSS=*==P^芥iii(2-28)(2-29)(2-30)由式(2-14)和(2-27)可得:對于例題2-1,(對于例題2-1,(2xy)2

r2=__i'V(2x2)(2y2)II168000023300000x889000=0.96213、r2具有以下兩個性質(zhì)(1)r2是一個非負數(shù)。(2)r2的取值范圍是:0<r2<1Or2=1意味著完全擬合,r2=0意味著被解釋變量與解釋變量之間沒有線性關(guān)系,0<r2<1時,r2越接近于1擬合效果越好。(二)相關(guān)系數(shù)檢驗1.相關(guān)系數(shù)相關(guān)系數(shù)是兩個變量之間的相關(guān)程度的度量。定義:£(X-X)J-Y)乙yr=Li=ii-;Z(X.—X)£Q—Y)\,2必k:?T(2-31)在一元線性回歸中,相關(guān)系數(shù)在數(shù)值上是可決系數(shù)開平方??梢愿鶕?jù)下式計算:r=土偵r2(2-32)r具有以下性質(zhì):(1)它可以是正值也可以是負值,其符號取決于式(2-31)中分子的符號。(2)它的取值范圍在-1和+1之間,即-1<r<+1。(3)它的性質(zhì)是對稱的,X與Y的相關(guān)系數(shù)rxy和Y與X的相關(guān)系數(shù)ryx是相同的,都是r。(4)它只是線性聯(lián)系或線性相關(guān)的度量,不用來描述非線性關(guān)系。2.相關(guān)系數(shù)檢驗法相關(guān)系數(shù)檢驗法是在建立一元線性回歸模型之后,考察兩個變量之間是否具有顯著的線性相關(guān)關(guān)系,相關(guān)系數(shù)檢驗法的步驟如下:(1)根據(jù)相關(guān)系數(shù)的計算公式計算相關(guān)系數(shù)r。(2)給定顯著性水平a,根據(jù)a和從相關(guān)系數(shù)臨界值表中查出相關(guān)系數(shù)臨界值[偵-2)的值,比較r與ra(n-2)的值。若|r|>^(n-2),表明兩變量在顯著性水平a時線性相關(guān)關(guān)系顯著;否則|r|<[(n-2)表明兩變量在顯著性水平a時線性相關(guān)關(guān)系不顯著。二回歸系數(shù)估計量的檢驗(t檢驗)進行回歸系數(shù)估計量的檢驗方法隨所構(gòu)造的檢驗統(tǒng)計量不同而不同,應(yīng)用最為普遍的是t檢驗。(一)t統(tǒng)計量回歸系數(shù)估計量服從正態(tài)分布:.rZx2)。。頊,》"21,i/(。?NP,i1vb2用b2的無偏估計量S2羊來代替b2時,可以構(gòu)造t統(tǒng)計量:B-PB-P—i=i七(P「^b7~(2-33)p-pp-p-0_^-0Se(p0)(2-34)所構(gòu)造的t統(tǒng)計量服從自由度為n-2的t分布。即t?t(n-2)(二)回歸系數(shù)估計量的t檢驗步驟一'??、.??…一一.?一卜面以估計量p]為例,介紹t檢驗的步驟。提出假設(shè)原假設(shè)H0:p1=0備擇假設(shè)H1:p產(chǎn)0給定顯著性水平,查t分布表獲得臨界值t(n-2),對于例2-1,在顯著性水平a=0.05,n-2=8o.2時,查t分布表,得到:t(n-2)=2.306。o23.根據(jù)式(2-33)利用樣本數(shù)據(jù)計算檢驗統(tǒng)計量t的值A(chǔ)Cp-p0.5091===14.2605Se(p)0.03574.進行比較,做出判斷若ltl>t(n-2),差異顯著,拒絕原假設(shè),接受備擇假設(shè)o2若ltl<t(n-2),差異不顯著,接受原假設(shè)(見圖2-3)。o23.4.本例中,14.2605>2.306,即ItQt.n-2),差異顯著,拒絕?!?的假設(shè)。2圖2-32圖2-3陰影部分為t檢驗的否定域三,方程的整體性檢驗(F檢驗)(一)方差分析由式(2-25)可知:£旻二2+£y2或TSS=RSS+ESS對總平方和(TSS)的這兩個分量進行研究,就稱為從回歸角度進行的方差分析(AnalysisofVariance,AOV)。每個平方和都具有相應(yīng)的自由度,假定給n個變量賦予數(shù)值,在計算平方和時,總有k個變量可以自由取值,即是這k個變量線性獨立,我們說這個平方和的自由度為k。與每一個平方和相聯(lián)系的是它們的自由度。對于一元線性回歸模型,TSS有n-1個自由度;ESS有1個自由度;RSS有n-2個自由度。平方和與自由度之比即為平均平方和。將平方和、自由度及平均平方和列成一個表,該表稱為方差分析表(見表2-4)。表2-4方差分析表(二)F檢驗統(tǒng)計量定義從方差分析的角度進行的回歸模型整體性檢驗所采用的檢驗統(tǒng)計量是F統(tǒng)計量。檢驗統(tǒng)計量F反映平均回歸平方和與平均剩余平方和的比較。£x;F=—(2-35)£e2'n-2且F服從自由度為1和n-2的F分布。即:F?F(1,n-2)可以推導(dǎo),F(xiàn)與可決系數(shù)r2有以下關(guān)系_r2,~,、F=(n-2)(2-36)1—r2利用檢驗統(tǒng)計量是F可以對回歸方程進行顯著性檢驗,即F檢驗。(三)方程的整體性檢驗(F檢驗)的步驟1.提出假設(shè)原假設(shè)H0:楫=0備擇假設(shè)H1:p產(chǎn)0

給定顯著性水平a,查F分布表獲得臨界值Fa(1,n-2),對于例2-1,在顯著性水平a=0.05,n-2=8時,查F分布表,得到:F005根據(jù)式(2-35)利用樣本數(shù)據(jù)計算檢驗統(tǒng)計量F的值.(1,8)=5.32。F=4£X=855303.273=203.0591乙e2/n-24212.0909i(1,8)=5.32。進行比較,做出判斷若F〉Fa(1,n-2),差異顯著,拒絕原假設(shè),接受備擇假設(shè);若F<Fa(1,n-2),差異不顯著,接受原假設(shè)(見圖2-4)。本例中,203.0591〉5.32,即F〉F0.05(1,8),差異顯著,拒絕。尸0的假設(shè),方程顯著不為零。P(F)p{F〉F(1,n-2)}=a

p{F<4(1n-2)}=1-aF(1,n-2)圖2-4陰影部分為F檢驗的否定域第四節(jié)一元線性回歸模型案例及預(yù)測預(yù)測就是利用模型已含有過去和現(xiàn)在的樣本數(shù)據(jù)或信息擬合的回歸模型,對被解釋變量的可能值做出定量的估計。一,點預(yù)測根據(jù)樣本數(shù)據(jù),利用最小二乘法,可以得到最小二乘估計值,建立一元回歸的預(yù)測模型。根據(jù)預(yù)測模型可以在給定X的條件下,求得Y的估計值,并進行點預(yù)測。根據(jù)樣本數(shù)據(jù),得到以下樣本回歸函數(shù)Y=B+Bxi01i當X.=X時,Y=B+BX,Y為點預(yù)測值。1000100例如,根據(jù)所給樣本數(shù)據(jù),建立了如下樣本回歸函數(shù)Y=244.5455+0.5091Xii一.--若已知家庭月可支配收入X.=1600兀,根據(jù)上述模型,可預(yù)測家庭的月消費支出%為:人一%=244.5455+0.5091x1600=1059.11(兀):向預(yù)測分為兩類:預(yù)測對應(yīng)于給定X條件下的個別Y值。這類預(yù)測我們稱為個別值預(yù)測。(一)均值預(yù)測即,對應(yīng)于給定X條件下的Y的總體均值的預(yù)測。當給定X=X0時,匕=Y0,Y0是總體均值E(Y0|X。)的一個估計值。人....且Y0服從于均值為叫1X0)的正態(tài)分布。根據(jù)正態(tài)分布與檢驗統(tǒng)計量小關(guān)系,有:人Y—E(YIX)t=-000-se([)(2-37)….一....八?■八服從于自由度為〃-2的t分布。式中Se(*)為*的標準誤差EJi板+.給定顯著性水平a有:(2-38)Y—E(YIX)—tV^0—Z<taSe(Y)a202」或:PY—tS(Y)<E(YIX)<Y+1S(Y)0ae0000ae01-22(2-39)上式表明,在重復(fù)抽樣中,若構(gòu)造100個這樣的區(qū)間,將會有(1-a)x100以上的區(qū)間包含總體均值E(Y0IX0)。建立所預(yù)測的總體均值E(Y0IX0)的置信區(qū)間為:Y—tS(Y),Y+1S(Y)0ae00ae022(2-40)對于前述例題,S(Y)=6[1+普又)2■n乙o(eeso(s(e(2-41)TOCS(Y)=6[1+普又)2■n乙o(eeso(s(e(2-41)nLx2Ii,,4212.0909x仁+1600—1700)2]"103300000J=,4212.0909x給定顯著性水平o=0.05,n-2=8時,查t分布表,得到:10025=2.306從而—tS(Y)=1059.11-2.306x20.8320=1011.67(元)0Oe02+1S(Y)=1059.11+2.306x20.8320=1107.14(元)0Oe02P11011.67<E(Y0IX0)<1107.14]=95%即每月可支配收入為1600元的家庭,其平均消費支出在1011.07元至1107.14元之間的概率為95%。(二)個別值預(yù)測即,對應(yīng)于給定X條件下的個別Y值的預(yù)測。.….八當給定X=X時,Y=Y,Y=Y,殘差為e,e=Y—Y。0i0i00000可以證明e服從于均值為零的正態(tài)分布。根據(jù)正態(tài)分布與檢驗統(tǒng)計量t的關(guān)系,有:服從于自由度為n-2的t分布。式中Se(e0)為e0的標準誤差,(2-42)S(e)3:1+1+(X。-又)2e0yn£x2給定顯著性水平o有:(2-42)O(ees-1o.O(ees2或:「.一八一]PY—tS(e)<Y<Y+1S(e)=1—o(2-43)0oe000oe0L22」上式表明,在重復(fù)抽樣中,若構(gòu)造100個這樣的區(qū)間,將會有(1-o)X100以上的區(qū)間包含個

別值*。建立所預(yù)測的個別值Y0的置信區(qū)間為:Y-1Y-1S(e),L。,°對于前述例題,七+1S(%)2(2-44)7~:>楠21+1+(X"X)2InLx2'viJ1(X-X)2Se(e0)=%1+n+^x^ECL__1(1600-1700)2)=|4212.0909x"+仍+(3300000'J=68.1620給定顯著性水平a=0.05。n-2=8時,查t分布表,得到:10025=2.306從而=.C,、,一、—tS(e)=1059.11-2.306x68.1620=901.92(兀)0de02q_‘c,、,一、+1S(e)=1059.11+2.306x68.1620=1216.29(兀)0以e02尸后01.92<Y0<1216.29〕=95%7~:>楠21+1+(X"X)2InLx2'viJ即每月可支配收入為1600元的家庭,以家庭消費支出在901.92元至1216.29元之間的概率為95%。三、一元回歸模型實例分析(一)研究目的依據(jù)1996-2005年《中國統(tǒng)計年鑒》提供的資料,經(jīng)過整理,獲得以下農(nóng)村居民人均消費支出和人均純收入的數(shù)據(jù)如表2-5:表2-5農(nóng)村居民1995-2004人均消費支出和人均純收入數(shù)據(jù)資料單位:元年度1995199619971998199920002001200220032004人均純收入1577.741926.072090.132161.982210.342253.422366.402475.632622.242936.40人均消費支出1310.361572.081617.151590.331577.421670.131741.091834.311943.302184.65(二)建立模型以農(nóng)村居民人均純收入為解釋變量X,農(nóng)村居民人均消費支出為被解釋變量Y,分析Y隨X的變化

而變化的因果關(guān)系。考察樣本數(shù)據(jù)的分布并結(jié)合有關(guān)經(jīng)濟理論,建立一元線性回歸模型如下:匕=。0坨*f根據(jù)表2-5編制計算各參數(shù)的基礎(chǔ)數(shù)據(jù)計算表。求得:歹=2262.035Y=1704.082x2=1264471.423iy2=516634.011ixy=78885

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論