一元線性回歸模型_第1頁
一元線性回歸模型_第2頁
一元線性回歸模型_第3頁
一元線性回歸模型_第4頁
一元線性回歸模型_第5頁
已閱讀5頁,還剩13頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

一元線性回歸模型一元線性回歸模型有一元線性回歸模型(統(tǒng)計模型)如下,氣稱解釋變量(自

上模型可以分為兩1氣+ut上式表示變量兀和七之間的真實關(guān)系。其中兀稱被解釋變量(因變量),變量),ut稱隨機誤差項,0稱常數(shù)項,]稱回歸系數(shù)(通常未知)。部分。(1)回歸函數(shù)部分,E(y)=0+1xt,(2)隨機部分,ut。氣稱解釋變量(自

上模型可以分為兩陽=向+周&圖2.1陽=向+周&圖2.1真實的回歸直線這種模型可以賦予各種實際意義,收入與支出的關(guān)系;如脈搏與血壓的關(guān)系;商品價格與供給量的關(guān)系;文件容量與保存時間的關(guān)系;林區(qū)木材采伐量與木材剩余物的關(guān)系;身高與體重的關(guān)系等。以收入與支出的關(guān)系為例。假設(shè)固定對一個家庭進(jìn)行觀察,隨著收入水平的不同,與支出呈線性函數(shù)關(guān)系。但實際上數(shù)據(jù)來自各個家庭,來自各個不同收入水平,使其他條件不變成為不可能,所以由數(shù)據(jù)得到的散點圖不在一條直線上(不呈函數(shù)關(guān)系),而是散在直線周圍,服從統(tǒng)計關(guān)系。隨機誤差項ut中可能包括家庭人口數(shù)不同,消費習(xí)慣不同,不同地域的消費指數(shù)不同,不同家庭的外來收入不同等因素。所以在經(jīng)濟(jì)問題上“控制其他因素不變”是不可能的?;貧w模型的隨機誤差項中一般包括如下幾項內(nèi)容,(1)非重要解釋變量的省略,(2)人的隨機行為,(3)數(shù)學(xué)模型形式欠妥,(4)歸并誤差(糧食的歸并)(5)測量誤差等?;貧w模型存在兩個特點。(1)建立在某些假定條件不變前提下抽象出來的回歸函數(shù)不能百分之百地再現(xiàn)所研究的經(jīng)濟(jì)過程。(2)也正是由于這些假定與抽象,才使我們能夠透過復(fù)雜的經(jīng)濟(jì)現(xiàn)象,深刻認(rèn)識到該經(jīng)濟(jì)過程的本質(zhì)。通常線性回歸函數(shù)E(yt)=0+1氣是觀察不到的,利用樣本得到的只是對E(yt)=0+1xt的估計,即對0和]的估計。在對回歸函數(shù)進(jìn)行估計之前應(yīng)該對隨機誤差項ut做出如下假定。ut是一個隨機變量,ut的取值服從概率分布。E(ut)=0。D(ut)=E[ut-E(ut)]2=E(ut)2=2。稱u.具有同方差性。ut為正態(tài)分布(根據(jù)中心'極限定理)。'以上四個假定可作如下表達(dá)。utN(0,b2)。Cov(u.,u.)=E[(u.-E(u.))(u.-E(u.))]=E(u.,u.)=0,(2j)。含義是不同觀測值所對TOC\o"1-5"\h\z.J..JJ.J應(yīng)的隨機項相互獨立。稱為u.的非自相關(guān)性。x.是非隨機的。'Cov(u.,x.)=E[(u.-E(u.))(x.-E(x.))]=E[u.(x.-E(x.)]=E[u.x.-u.E(x.)]=E(u.x.)=0.u.與x,相互獨立。否則,分不清是誰對兀的貢獻(xiàn)。'''''''

(8)對于多元線性回歸模型,解釋變量之間不能完全相關(guān)或高度相關(guān)(非多重共線性。在假定(1),(2)成立條件下有E3)=E(0+1氣+氣)=0+1氣。最小二乘估計(OLS)對于所研究的經(jīng)濟(jì)問題,通常真實的回歸直線是觀測不到的。收集樣本的目的就是要對這條真實的回歸直線做出估計。怎樣估計這條直線呢?顯然綜合起來看,這條直線處于樣本數(shù)據(jù)的中心位置最合理。怎樣用數(shù)學(xué)語言描述“處于樣本數(shù)據(jù)的中心位置”?設(shè)估計的直線用△△yt=。0町七表示。其中y稱y的擬合值(fittedvalue),B和B分別是°和】的估計量。觀測值到七勺0101這條直線的縱向距離用ut表示,稱為殘差。y=y+u=B+Bx+uJtJttL°Jtt稱為估計的模型。假定樣本容量為T。(1)用“殘差和最小”確定直線位置是一個途徑。但很快發(fā)現(xiàn)計算“殘差和”存在相互抵消的問題。(2)用“殘差絕對值和最小”確定直線位置也是一個途徑。但絕對值的計算比較麻煩。(3)最小二乘法的原則是以“殘差平方和最小”確定直線位置。用最小二乘法除了計算比較方便外,得到的估計量還具有優(yōu)良特性。(這種方法對異常值非常敏感)設(shè)殘差平方和用Q表示,Q=2U2=2(y—y)2=£(y—B—Bx)2,wtt?ttr0r1"TOC\o"1-5"\h\zi=1i=1i=1則通過Q最小確定這條直線,即確定B0和B]的估計值。以B0和B]為變量,把Q看作是B0和B的函數(shù),這是一個求極值的問題。求q對B和B的偏導(dǎo)數(shù)并令其為零,得正規(guī)方程,101r景=22(七盤。、"-1)=0(1)叩0i=1虹啤=2£(y—B-Bx)(-x)=0(2)郎t01tt1I=1下面用代數(shù)和矩陣兩種形式推導(dǎo)計算結(jié)果。首先用代數(shù)形式推導(dǎo)。由(1)、(2)式得,(3)⑷'£(yt-B°邛己)=0i=1TI£(y-p-BX)X=0t01rti=1

(3)式兩側(cè)用除"并整理得,入——6。=y-叩把(5)式代入(4)式并整理,得,…_、',—r_[(七—(3)⑷(3)式兩側(cè)用除"并整理得,入——6。=y-叩把(5)式代入(4)式并整理,得,…_、',—r_[(七—y)―叩七―,)]x=0(6)i=1—(y-y)x-61"(x-x)x=0i=1i=1£(一、Jx(y-y)£^t(8)因為£x(七—y)=oi=1£X(x-X)=0,分別在(8)式的分子和分母上減£X(y-y)和ti=1ti=1£x(x-x)得,ti=1-y)-£x(yt_y)-x)x-£x(x-x)ttt£(x-x)(y-y)

t

(x-x)2

t下面用矩陣形式推導(dǎo)(10)TTr6。T+61(£xQ=£yti=1i=1yxXz=l

一一2xXz=l(16+xzz=l06?2EEo

《3^np1--XEr-2X£3.最小二乘估計量B0和B]的特性(1)線性特性這里指&和氏分別是yt的線性函數(shù)。

y,一、x—x)j=y,_、‘—(x—x)2t.y(X—X)(j—力y(x—x)j—Jy(x—x)B=——v一―t—=,寸tt—1y(x—x)2ty,一、x—x)j=y,_、‘—(x—x)2t無偏性利用上式E(B)=E(kj)=E[k(n+1x+u)]=E(nk+1kx+1rtt'01tt0t1ttku)=E[1k(x廠x)+kut]=1+E(kut)=1有效性0,1的OLS估計量的方差比其他估計量的方差小。Gauss-Marcov定理:若ut滿足E(ut)=0,D(ut)=2,那么用OLS法得到的估計量就具有最佳線性無偏性。估計量稱最佳線性無偏估計量。最佳線性無偏估計特性保證估計值最大限度的集中在真值周圍,估計值的置信區(qū)間最小。上面的評價是對小樣本而言,若是對大樣本而言還應(yīng)討論估計量的漸近無偏性,一致性和漸近有效性。先給出漸近分布的概念。漸近分布。用T<T2<...<Tn表示連續(xù)遞增樣本容量。設(shè)在每個樣本容量T.下重復(fù)抽樣。則每個xTi都應(yīng)有自己的均值E(xT)與方差Var(xT)。利用遞增樣本可以求得隨機變量序列,'11xT={xT1,xT2,…,xTn}其中每個元素都是相應(yīng)樣本容量下的一個隨機變量。當(dāng)Tn趨于無窮大時,這些分布收斂于某一分布。則稱該分布為漸近分布或極限分布。漸近期望。對于期望值序列,E(xT)={E(xT1),E(xT2),…,E(xTN)}如隨著T-8,期望值E(xT)收斂于某一常數(shù),則稱為xT的漸近期望。記為LimE(xT)=(與期望概念不同)T—8與期望值序列相對應(yīng),也可以寫出方差序列。Var(xT)=E(xT-E(xT))N(,—)。當(dāng)T—8,Var(x)—0。為防止分布發(fā)生退化,可以用T乘Var(x)。當(dāng)T—TTVar(x)—2。漸近方差。若上述隨機變量序列有漸近期望,同時有新序列,E[T(xT-E(xT))2]={E{T[xT1-E(xT1)]2},E{N(,—)。當(dāng)T—8,Var(x)—0。為防止分布發(fā)生退化,可以用T乘Var(x)。當(dāng)T—TTVar(x)—2。漸近方差。若上述隨機變量序列有漸近期望,同時有新序列,E[T(xT-E(xT))2]={E{T[xT1-E(xT1)]2},E{T瞄-E(xT2)]2},...,E(T[xTN-E(xTN)]2}}滿足LimE[T(xT-E(xT))2]=vTT8則定義xT的漸近方差為—LimE[T(x-E(x))2]=—vTt“''T漸近無偏性。若6的漸近期望為,則6為的漸近無偏估計量,即LimE(Bt)=T—3致性若&滿足(1)漸近無偏性,(2)LimVar(&t)=0,則&具有一致性,&為T—3的一致估計量。漸近有效性。若B滿足(1)具有一致性,(2)與其他估計量的方差相比,B的漸進(jìn)方差較小,Var(&t)<Var(~T),則稱&具有漸近有效性。OLS估計量都能滿足上述漸近特性,但滿足漸近特性的估計量不見得是最佳線性無偏估計量。注意:分清4個式子的關(guān)系。⑴真實的統(tǒng)計模型,兀=0+—x+u(2)估計的統(tǒng)計模型,yt=B0+B—xt+Ut⑶真實的回歸直線,E(yt)=0+—xt(4)估計的回歸直線,yt=B0+B]xt4.OLS回歸直線的性質(zhì)殘差和等于零,Ut=0由正規(guī)方程2(y-B-BX)(-1)=0得(y-B-Bx)=(y-y)=(U)=0t01tt01tttt700tt估計的回歸直線yt=B0+B—xt過(x,y)點。正規(guī)方程(yt-B0-B—xt)=0兩側(cè)同除樣本容量t,得y=B0+B—x。得證。(3)yt的擬合值的平均數(shù)等于其樣本觀測值的平均數(shù)y-1y-i(B+B,tttt0J⑷Cov(ut,xt)—0xt)=八—,yt—y。B0+B—x—y。得證。只需證明(x廣x)ut上式為正規(guī)方程之一。(5)Cov(ut,yt)—0只需證明(§「y)u,xtutxutxtut△△xt(y,邛0-Bixt)=0。yu

ttyU

ttut(B0+B1xt)△△一=Bou/%utxt=0兀的分布和#]的分布1xt+E(ut)=

0+"0+1Xt。1x)+Var(u)=b2根據(jù)假定條件utN(0,b2),TOC\o"1-5"\h\zE3t)=E(0+1xt+ut)=0+Var(yt)=Var(o+1xt+u)=Var(1xt+E(ut)=

0+"0+1Xt。1x)+Var(u)=b2可以證明E(代)=1,Var(代)=J1_b2,111乙(Xt-X)2B是y的線性函數(shù)(B=ky),所以1Jt1"tB|N(|,——b2)。11乙(xt-X)2b2的估計定義b2=(Zu12)*T-2)其中2表示待估參數(shù)的個數(shù)??梢宰C明E(b2)=b2。b2是b2的無偏估計量。因為ut是殘差,所以b2又稱作誤差均方??捎脕砜疾煊^測值對回歸直線的離散程度。'B1的估計的方差是y^ar(B])=S2B)=^1_b2,Var(B/=S2&=—b21(1)乙(xt-x)20(0)T乙(xt-X)2擬合優(yōu)度的測量擬合優(yōu)度是指回歸直線對觀測值的擬合程度。顯然若觀測值離回歸直線近,則擬合程度好;反之則擬合程度差。圖2.3三種離差示意圖可以證明(y-y)2=(y-y)2+(y-y)2=(y-y)2+(u)2圖2.3三種離差示意圖tttJtttSST(總平方和)=SSR(回歸平方和)+SSE(殘差平方和)證明(y-y)2=[(y-y)+(y-y)]2=(y-y)2+(y-y)2+2(y-y)tytttytttytt(y廣y)其中(y-y)(y-y)=(y-y)(3(x-元)=(3(y-y)x-元B(y-y)=Bttttt1t1ttt1tt1UXf=0''度量擬合優(yōu)度的統(tǒng)計量是可決系數(shù)(確定系數(shù))。&、—(y一y)2R2v-=(回歸平萬和)/(總平萬和)=SSR/SST乙(yt-y)2所以R2的取值范圍是[0,1]。對于一組數(shù)據(jù),SST是不變的,所以SSR\(I),SSEl(f)。SSR:舊指回歸平方和(regressionsumofsquares),現(xiàn)指殘差平方和(sumofsquaredresiduals)SSE:舊指殘差平方和(errorsumofsquares(sumofsquarederrors)),現(xiàn)指回歸平方和(explainedsumofsquares)回歸參數(shù)的顯著性檢驗及其置信區(qū)間主要是檢驗]是否為零。通常用樣本計算的%不等于零,但應(yīng)檢驗這是否有統(tǒng)計顯著性。H0:1=0;H1:10在H0成立條件下,t=^3=土=—B1S(跖s(B1)司庫廠X)2若t>,(T-2),則10;<t<t還可以利用B]估計3]的置信區(qū)間。由于二一yF的點預(yù)測。根據(jù)估計的回歸函數(shù),得yF=60珥XF-七(T-2)}=1-(Bp由大括號內(nèi)不等式得3]的置信區(qū)間B1-S(Bpt(T-2)-B1-B1+((31)t(T-2)其中s(B)是S2(B1)=£(1_yF的點預(yù)測。根據(jù)估計的回歸函數(shù),得yF=60珥XFyF的點預(yù)測及其區(qū)間預(yù)測下面以時間序列數(shù)據(jù)為例介紹預(yù)測問題。預(yù)測可分為事前預(yù)測和事后預(yù)測。兩種預(yù)測都是在樣本區(qū)間之外進(jìn)行,如圖所示。對于事后預(yù)測,被解釋變量和解釋變量的值在預(yù)測區(qū)間都是已知的??梢灾苯佑脤嶋H發(fā)生值評價模型的預(yù)測能力。對于事前預(yù)測,解釋變量是未發(fā)生的。(當(dāng)模型中含有滯后變量時,解釋變量則有可能是已知的。)當(dāng)預(yù)測被解釋變量時,則首先應(yīng)該預(yù)測解釋變量的值。對于解釋變量的預(yù)測,通常采用時間序列模型。yF口N(0+1xFyF口N(0+1xFb2(1+^+JXF-x)2))1F'TZ(七-x)*12所以,y的區(qū)間預(yù)測是yf□[t(t-2)\t+1+去X專]⑶E(yF)的區(qū)間預(yù)測E(yf)的分布是e(yF)□n(0所以,e(yF)□n(0+單個yF的區(qū)間預(yù)測yf的分布是x,b2(+1FTZ(xt-X)2則E(則E(yF)的區(qū)間預(yù)測是yf1+4XF-X)2]T乙(Xt-x)2案例:用回歸模型預(yù)測木材剩余物(file:b1c3)

伊春林區(qū)位于黑龍江省東北部。全區(qū)有森林面積218.9732萬公頃,木材蓄積量為2.324602億m3。森林覆蓋率為62.5%,是我國主要的木材工業(yè)基地之一。1999年伊春林區(qū)木材采伐量為532萬m3。按此速度44年之后,1999年的蓄積量將被采伐一空。所以目前亟待調(diào)整木材采伐規(guī)劃與方式,保護(hù)森林生態(tài)環(huán)境。為緩解森林資源危機,并解決部分職工就業(yè)問題,除了做好木材的深加工外,還要充分利用木材剩余物生產(chǎn)林業(yè)產(chǎn)品,如紙漿、紙袋、紙板等。因此預(yù)測林區(qū)的年木材剩余物是安排木材剩余物加工生產(chǎn)的一個關(guān)鍵環(huán)節(jié)。下面,利用一元線性回歸模型預(yù)測林區(qū)每年的木材剩余物。顯然引起木材剩余物變化的關(guān)鍵因素是年木材采伐量。給出伊春林區(qū)16個林業(yè)局1999年木材剩余物和年木材采伐量數(shù)據(jù)如表2.1。散點圖見圖2.14。觀測點近似服從線性關(guān)系。建立一元線性回歸模型如下:兀=0+1氣+氣表2.1年剩余物y,和年木材采伐量x,數(shù)據(jù)林業(yè)局名J年木材剩余物v(萬m3),年木材采伐量x(萬m3)烏伊嶺r26.13t61.4東風(fēng)23.4948.3新青21.9751.8紅星11.5335.9五營7.1817.8上甘嶺6.8017.0友好18.4355.0翠巒11.6932.7烏馬河6.8017.0美溪9.6927.3大豐7.9921.5南岔12.1535.5帶嶺6.8017.0朗鄉(xiāng)17.2050.0桃山9.5030.0雙豐5.5213.8合計__202.87532.00圖2.14年剩余物y,和年木材采伐量x,散點圖DependentVariable:YMethod:LeastSquaresDate:10/09/03Time:15:38Sample:116Includedobservations:16VariableCoefficientStd.Errort-StatisticProb.C-0.7629281.220966-0.6240560.5421X0.4042800.03337712.112660.0000R-squared0.912090Meandependentvar12.67938AdjustedR-squared0.906668S.D.dependentvar6.665466S.E.ofregressionAkaikeinfocriterion4.376633SumsquaredresidSchwarzcriterion4.473207Loglikelihood-33.01306F-statistic146.7166Durbin-Watsonstat1.481946Prob(F-statistic)0.000000圖2.15EViews輸出結(jié)果EViews估計結(jié)果見圖2.15。建立EViews數(shù)據(jù)文件的方法見附錄1。在已建立Eviews數(shù)據(jù)文件的基礎(chǔ)上,進(jìn)行OLS估計的操作步驟如下:打開工作文件,從主菜單上點擊Quick鍵,選EstimateEquation功能。在出現(xiàn)的對話框中輸入ycx。點擊Ok鍵。立即會得到如圖2.15所示的結(jié)果。下面分析EViews輸出結(jié)果。先看圖2.15的最上部分。被解釋變量是*估計方法是最小二乘法。本次估計用了16對樣本觀測值。輸出格式的中間部分給出5列。第1列給出截距項(C)和解釋變量氣。第2列給出第1列相應(yīng)項的回歸參數(shù)估計值叩0和%)。第3列給出相應(yīng)回歸參數(shù)估計值的樣本標(biāo)準(zhǔn)差(s(B°),s(Bp)。第4列給出相應(yīng)H值。第5列給出t統(tǒng)計量取值大于用樣本計算的t值(絕對值)的概率值。以t=12.11266為例,相應(yīng)概率0.0000表示統(tǒng)計量t取值(絕對值)大于12.1的概率是一個比萬分之一還小的數(shù)。換句話說,若給定檢驗水平為0.05,則臨界值為t0.05(14)=2.15。t=12.1>2.15落在了H。的拒絕域,所以結(jié)論是]不為零。輸出格式的最下部分給出了評價估計的回歸函數(shù)的若干個統(tǒng)計量的值。依縱向順序,這些統(tǒng)計量依次是可決系數(shù)月、調(diào)整的可決系數(shù)r2(第3章介紹)、回歸函數(shù)的標(biāo)準(zhǔn)差(s.e.,即均方誤差的算術(shù)根6)、殘差平方和、對數(shù)極大似然函數(shù)值(第2章介紹)、DW統(tǒng)計量的值、被解釋變量的平均數(shù)(項)、被解釋變量的標(biāo)準(zhǔn)差(s(七))、赤池(Akaike)信息準(zhǔn)則(是一個選擇變量最優(yōu)滯后期的統(tǒng)計量)、施瓦茨(Schwatz)準(zhǔn)則(是一個選擇變量最優(yōu)滯后期的統(tǒng)計量)、F統(tǒng)計量(第3章介紹)的值以及F統(tǒng)計量取值大于該值的概率。注意:S.D,和s.e.的區(qū)別。s.e,和SSE的關(guān)系。根據(jù)EViews輸出結(jié)果(圖2.15),寫出OLS估計式如下:&t=-0.7629+0.4043氣(2.64)(-0.6)(12.1)R2=0.91,s.e.=2.04其中括號內(nèi)數(shù)字是相應(yīng)t統(tǒng)計量的值。s.e,是回歸函數(shù)的標(biāo)準(zhǔn)誤差,即6=睥七2.?'(16-2)。R2是可決系數(shù)。R2=0.91說明上式的擬合情況較好。兀變差的91%由變量氣解釋。檢驗回歸系數(shù)顯著性的原假設(shè)和備擇假設(shè)是(給定=0.05)H0:1=0;H1:10

234567892345678910111213141516Actual|FittedIResidual26.130024.05992.0701523.490018.76384.7262121.970020.17881.7912311.530013.7507-2.220727.180006.433250.746756.000006.109830.6901718.430021.4725-3.0424611.690012.4570-0.767026.800006.109830.690179.6900010.2739-0.583917.990007.929090.0609112.150013.5890-1.439006.800006.109830.6901717.200019.4511-2.251069.5000011.3655-1.065475.520004.016130.70387Ms~T~因為t=12.1>t005(14)=2.15,所以檢驗結(jié)果是拒絕]=0,即認(rèn)為年木材剩余物和年木材采伐量之間存在回歸關(guān)系。上述模型的經(jīng)濟(jì)解釋是,對于伊春林區(qū)每采伐1m3木材,將平均產(chǎn)生0.4m3的剩余物。圖2.16給出相應(yīng)的殘差圖。Actual表示y的實際觀測值,F(xiàn)itted表示y的擬合值y,,Residual表示殘差Ut。殘差圖中的兩條虛線與中心線的距離表示殘差的一個標(biāo)準(zhǔn)差,即S.e.。通過殘差圖可以看到,大部分殘差值都落在了正、負(fù)一個標(biāo)準(zhǔn)差之內(nèi)。估計]的置信區(qū)間。由B-Pt=P{J^<t0.05(14)}=笊5(61)得M1-61-t0.05(14)S(61)1的置信區(qū)間是[61-t0.05(14)S(61),61+‘0.05(14)S(61)](2.65)[0.4043-2.15x0.0334,0.4043+2.15x0.0334][0.3325,0.4761](2.65)以95%的置信度認(rèn)為,]的真值范圍應(yīng)在[0.3325,0.4761]范圍中。下面求兀的點預(yù)測和平均木材剩余物產(chǎn)出量的置信區(qū)間預(yù)測。假設(shè)烏伊嶺林業(yè)局2000年計劃采伐木材20萬m3,求木材剩余物的點預(yù)測值。y2000=-°.7629+°.4043知00=-0.7629+0.4043x20=7.3231萬m3(2.66)(七一a)2)Z(a-a)2,、一1s2(y2000)=。2(T+=4.1453(—+(20(七一a)2)Z(a-a)2S(y2000)=*0.4546=0.6742因為一一、f<、cc、(y2000)=(60+61*2000)=p0+。1*2000=(y2000)t=°2000—E(y2000)?tS(y2000)("2)則置信度為0.95的2000年平均木材剩余物E(y2000)的置信區(qū)間是y2000土‘0.05(14)S(y2000)=7.3231土2』5X0.6742=5.8736,8.7726(2.67)從而得出預(yù)測結(jié)果,2000年若采伐木材20萬m3,產(chǎn)生木材剩余物的點估計值是7.3231萬m3。平均木材剩余物產(chǎn)出量的置信區(qū)間估計是在[5.8736,8.7726]萬m3之間。從而為恰當(dāng)安排2000年木材剩余物的加工生產(chǎn)提供依據(jù)。問題:估計結(jié)果中&0沒有顯著性,去掉截距項0可以嗎?答:依據(jù)實際意義可知,沒有木材采伐量就沒有木材剩余物,所以理論上0是可以取零的。而有些問題就不可以。例如家庭消費和收入的關(guān)系。即使家庭收入為零,消費仍然非零。一般來說,截距項的估計量沒有顯著性時,也不做剔出處理。本案例剔出截距項后的估計結(jié)果是yt=0.3853*t(28.3)R2=0.91,s.e.=2.0點預(yù)測值是y2000=0.3853*2000=0.3853x20=7.7060萬m3附錄1:怎樣用EViews通過鍵盤輸入數(shù)據(jù)建立新工作文件的方法是從EViews主菜單中單擊File鍵,選擇New,Workfile。則打開一個數(shù)據(jù)范圍選擇框(WorkfileRange)如圖1。需要做出3項選擇。選擇數(shù)據(jù)性質(zhì)。數(shù)據(jù)性質(zhì)分為:②啟始期(Startdate)。③終止期(Enddate)。3項選擇完畢后,點擊“OK”鍵。這時,會建立起一個尚未命名的工作文件(Workfile),且處于打開狀態(tài)。當(dāng)打開新工作文件或現(xiàn)有工作文件后,可以通過鍵盤輸入數(shù)據(jù)和追加數(shù)據(jù)。具體操作如下:從EViews主菜單中點擊Quick鍵,選擇EmptyGroup功能。這時會打開一個空白表格數(shù)據(jù)窗口(Group)如圖3所示。每一個空格代表一個觀測值位置。按列依次輸入每一個變量(或序列)的觀測值。鍵入每一個觀測值后,可通過按回車鍵(Enter鍵)或方向指示鍵()進(jìn)行確認(rèn)。按方向指示鍵()的好處是在確認(rèn)了當(dāng)前輸入的觀測值的同時,還把光標(biāo)移到了下一個待輸入位置。每一列數(shù)據(jù)上方的灰色空格是用于輸入變量名的。給變量命名時,字符不得超過16個。注意:下列名字具有特殊意義,給變量命名時,應(yīng)避免使用。它們是:ABS,ACOS,AR,ASIN,C,CON,CNORM,COEF,COS,D,DLOG,DNORM,ELSE,ENDIF,EXP,LOG,LOGIT,LPT1,LPT2,MA,NA,NRND,PDL,RESID,RND,SAR,SIN,SMA,SQR,THENo

附錄2:怎樣用EViews預(yù)測。以案例1為例,給定%=20,求yt=?EViews預(yù)測步驟如下。(1)點擊Procs鍵選Changeworkfilerange功能。在彈出的對話框的Enddata選擇框處改為17。點擊OK鍵。(2)雙擊工作文件的Sample:117區(qū)域,在彈出的對話框的Samplerangepairs選擇框處把16改為117。(3)雙擊工作文件窗口中的x序列,打開x數(shù)據(jù)窗口。點擊Edit+/-鍵,使x數(shù)據(jù)窗口處于可編輯狀態(tài)。在t=17的x的觀測值位置輸入20。相當(dāng)于給定x=20。(4)打開估計式eq01窗口,點擊Forecast鍵。在S.E.選擇框處填入yfse,表示要yt的預(yù)測值(用YF表示)也要yt的預(yù)測標(biāo)準(zhǔn)差(用yfse表示)。點擊OK鍵,工作文件窗口中已經(jīng)出現(xiàn)一個yf序列。雙擊yf序列,可以看到。y17=7.322668。相關(guān)理論相關(guān)分析是研究變量間相互關(guān)系的最基本方法。從相關(guān)分析中引出的相關(guān)系數(shù)是回歸分析的一個基本統(tǒng)計量。掌握它有助于對經(jīng)濟(jì)問題和經(jīng)濟(jì)計量模型的分析與理解。11.1相關(guān)的定義與分類定義:相關(guān)(correlation)指兩個或兩個以上變量間相互關(guān)系的程度或強度。分類:①按強度分{完全相關(guān):變量間存在函數(shù)關(guān)系。例,圓的周長,L=2nr。高度相關(guān)(強相關(guān)):變量間近似存在函數(shù)關(guān)系。例,我國家庭收入與支出的關(guān)系。弱相關(guān):變量間有關(guān)系但不明顯。例,近年來我國耕種面積與產(chǎn)量。零相關(guān):變量間不存在任何關(guān)系。例,某班學(xué)生的學(xué)習(xí)成績與年齡。0102030405001020304050完全相關(guān)01020304050高度相關(guān)、線性相關(guān)、正相關(guān)2.02.53.03.54.04.5弱相關(guān)按變量個數(shù)分「按形式分:線性相關(guān),非線性相關(guān){簡單相關(guān):指兩個變量間相關(guān)〈I按符號分:正相關(guān),負(fù)相關(guān),零相關(guān)復(fù)相關(guān)(多重相關(guān)和偏相關(guān)):指三個或三個以上變量間的相關(guān)。非線性相關(guān)負(fù)相關(guān)-4-202非線性相關(guān)負(fù)相關(guān)-4-2024零相關(guān)因非線性相關(guān)可以轉(zhuǎn)化為線性相關(guān)處理,而復(fù)相關(guān)又可看作是簡單相關(guān)基礎(chǔ)上的拓展,所以后面重點介紹簡單線性相關(guān)。11.2簡單線性相關(guān)的度量用簡單線性相關(guān)系數(shù),簡稱相關(guān)系數(shù)(correlationcoefficient)度量兩個變量間的線性相關(guān)強度,用表示。的隨機變量表達(dá)式是Cov(X,y.)一,一'「二。、D(xt隊:D(yt)的統(tǒng)計表達(dá)式是_T,"t*yt_%)_?,3廣"1、「¥?—)2J)2一洪(「『》(yf)2)tt=1t?\tt=1tyt=1tt=1ty其中T,總體容量;氣,yt,變量的觀測值;巴,%,變量觀測值的均值。下面解釋為什么能對變量間的線性相關(guān)強度進(jìn)行定量度量。因為表達(dá)式的分子是協(xié)方差,Cov(x,y);分母是x和y的標(biāo)準(zhǔn)差之積。而x和yttIttt的標(biāo)準(zhǔn)差不會為零,所以Cov(xt,yt)是否為零,就決定了是否為零,即標(biāo)志著變量xt,yt間是否存在線性相關(guān)關(guān)系。但Cov(xt,yt)有兩個缺點:①它是一個有量綱的量,取值容易受測量單位的影響;②取值范圍寬,相關(guān)性越強,Cov(xt,yt)取值越大。為克服上述缺點,用xt,yt的標(biāo)準(zhǔn)差除Cov(xt,y),于是就得到相關(guān)系數(shù)的統(tǒng)計表達(dá)式。它是一個無量綱量。t相關(guān)系數(shù)是對總體而言。當(dāng)研究某個問題時,所得數(shù)據(jù)常是一個樣本。對樣本來說,相關(guān)系數(shù)常用r表示,即r是總體相關(guān)系數(shù)的估計值。r_p_一吉"=)(yt-y)]凄廣亍)."廣3"一y)2^)^^其中T,樣本容量;xt,yt,變量的觀測值;X,y,變量觀測值的均值。11.3相關(guān)系數(shù)的取值范圍當(dāng)兩個變量嚴(yán)格服從線性關(guān)系時,II_1。證:設(shè)直線斜率為k,即y_a+kx。則有£(xt-x)(yt-y)_£(xt-x)k(x,-x)_】-£(xt-x)2E(yt-y)2\'E(x^-x)2k2£(xt-x)2當(dāng)兩個變量不存在線性關(guān)系時,_0。上述是兩種極端情形,所以相關(guān)系數(shù)的取值范圍是[-1,1]。當(dāng)Cov(xt,yt)>0時,則>0(正相關(guān));當(dāng)Cov(xt,yt)<0時,貝<0(負(fù)相關(guān));若Cov(xt,yt)_0,貝_0(零相關(guān))。為什么圖1為正相關(guān)?為什么圖2為負(fù)相關(guān)?用(xt-x)(yt-y)解釋。

6420-2-4-6-66420-2-4-6-6-4-20246圖1正相關(guān)例1:散點圖與相關(guān)系數(shù)r=0.9911.4線性相關(guān)系數(shù)的局限性只適用于考察變量間的線性相關(guān)關(guān)系。也就是說當(dāng)=0時,只說明二變量間不存在線性相關(guān)關(guān)系,但不能保證不存在其它非線性相關(guān)關(guān)系。所以變量不相關(guān)與變量相互獨立在概念上是不同的。相關(guān)系數(shù)的計算是一個數(shù)學(xué)過程。它只說明二變量間的相關(guān)強度,但不能揭示這種相關(guān)性的原因,不能揭示變量間關(guān)系的實質(zhì),即變量間是否真正存在內(nèi)在聯(lián)系,因果關(guān)系。所以在計算r的同時,還要強調(diào)對實際問題的分析與理解。一般說二變量相關(guān)時,可能屬于如下一種關(guān)系。單向因果關(guān)系。如施肥量與農(nóng)作物產(chǎn)量;對金屬的加熱時間與溫度值。雙向因果關(guān)系。如工業(yè)生產(chǎn)與農(nóng)業(yè)生產(chǎn);商品供給量與商品價格。另有隱含因素影響二變量變化。如市場上計算機銷量與電視機銷量呈正相關(guān)。顯然人均收入的增加是一個隱含因素。虛假相關(guān)。如年國民生產(chǎn)總值與刑事案件數(shù)呈正相關(guān)。顯然二變量間不存在因果關(guān)系。應(yīng)屬虛假相關(guān)。中國和美國某個經(jīng)濟(jì)指標(biāo)高度相關(guān),顯然這沒有可比性,毫無意義。(file:correlation1)(file:correlation1)11.5簡單相關(guān)系數(shù)的檢驗(1)直接檢驗(查相關(guān)系數(shù)臨界值表)H0:=0;H1:0用氣和yt的樣本計算相關(guān)系數(shù),,以自由度f=T-2查臨界值表'。檢驗規(guī)則是,若r>r(T-2)(臨界值),則氣和yt相關(guān);若rVr(T-2)(臨界值),則氣和yt不相關(guān)。(2)t檢驗Ho:=0;H1:0t=空:sr二(r-P)....''1一r2T一2?t(T-2)其中2表示涉及兩個變量。若t>t(T-2),則氣和兀相關(guān);若tVt(T-2),則氣和yt不相關(guān)。附錄:相關(guān)系數(shù)臨界值表fa0.100.050.020.010.00110.987690.996920.9995070.9998770.999998820.900000.950000.980000.990000.9990030.80540.87830.934330.958730.9911640.72930.81140.88220.917200.9740650.66940.75450.83290.87450.9507460.62150.70670.78870.83430.9249370.58220.66640.74980.79770.898280.54940.63190.71550.76460.872190.52140.60210.68510.73480.8471100.49330.57600.65810.70790.8233110.47620.55290.63390.68350.8010120.45750.53240.61200.66140.7800130.44090.51390.59230.64110.7603140.42590.49730.57420.62260.7420150.41240.48210.55770.60550.7246160.40000.46830.54250.58970.7084170.38870.45550.52850.57510.6932180.37830.44380.51550.56140.6787190.36870.43290.50340.54870.6652200.35980.42270.49210.53680.6524250.32330.38090.44510.48690.5974300.29600.34940.40930.44870.5541350.27460.32460.38100.41820.5189400.25730.30440.35780.39320.4896450.24280.28750.33840.37210.4648500.23060.27320.32180.35410.4433600.21080.25000.29480.32480.4078700.19540.23190.27370.30170.3799800.18290.21720.25650.28300.3568900.17260.20500.24220.26730.33751000.16380.19460.23010.25400.3211注:P{|r|>ra(f)}=a,其中a表示顯著性水平,f表示自由度,ra(f)為臨界值。11.6偏相關(guān)系數(shù)影響時,以上介紹了簡單線性相關(guān)系數(shù),但是當(dāng)兩個變量xt,匕同時受其它變量七,z2t,…

有必要研究當(dāng)控制其它變量Z",匕,…,不變時,該兩個變量與兀之間的相關(guān)關(guān)系。稱這種相關(guān)關(guān)系為偏相關(guān)關(guān)系。以3個變量氣,*勺,為例(多于3個變量的情形與此相似。),假定控制zt不變,測度氣,yt偏相關(guān)關(guān)系的偏相關(guān)系數(shù)定義如下。影響時,p=控制z不變條件下的氣,^的簡單相關(guān)系數(shù)。X"'11因為z也是隨機變量,一般不容易得到控制z為一個常數(shù)條件下的X和J的值。實際tttt計算方法是,從氣,兀中分別剔除zt的影響,然后計算相關(guān)系數(shù)。步驟如下:(1)求Xt對Zt的回歸估計式,Xt=P0邛1Zt+ut計算殘差,-rAut=Xt-f30邛1ZtUt中不再含有zt對xt的影響。(2)求兀對zt的回歸估計式,j=a+az+v計算殘差,v=y-a-aztJt01tv中不再含有z對y的影響。則U與v的簡單相關(guān)系數(shù)就是X與y在剔除z的影響后的偏tttttttt相關(guān)系數(shù),即r=0.9898r=0.9984r…=ruvxy,zttrtt例2中央支出與地方支出的偏相關(guān)系數(shù)r=0.9898r=0.9984obs財政收入(INCOME)中央支出(X1)地方支出(X2)19811089.5602.2512.819821124575.1578.219831249642.5649.919841501.9738.7807.719851866.4836.51008.219862260.3962.31368.619872368.91031.91416.6198826281060.41646.2198929471105.2193519903312.61372.82079.419913610.91517.72295.819924153.11817.92571.819935088.21957.23330.2

x1=170.90+0.3614incomex1=170.90+0.3614income+RES1(3.9)(23.1)x2=-221.49+0.6952income+RES2(-6.6)(58.6)r=0.99r=-0.8511.7復(fù)相關(guān)系數(shù)在多元回歸中,用偏相關(guān)系數(shù)可以分別測量被解釋變量對每個解釋變量的偏相關(guān)關(guān)系,而復(fù)相關(guān)系數(shù)則是測量被解釋變量與全部解釋變量的相關(guān)關(guān)系。假定兀是被解釋變量,解釋變量是七,七,…,氣k-1,復(fù)相關(guān)系數(shù)的具體計算過程是(])用y對氣1,%,…,氣k-1回歸,y=&+&x+...+&x+uJtr0L]t1rk-1tk-1t求出yt的擬合值序列yt,(2)計算y與y的簡單相關(guān)系數(shù),則稱r.是y與x,x,…,x的復(fù)相關(guān)系數(shù)。ttyy

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論