一元線性回歸模型_第1頁
一元線性回歸模型_第2頁
一元線性回歸模型_第3頁
一元線性回歸模型_第4頁
一元線性回歸模型_第5頁
已閱讀5頁,還剩14頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

一元線性回歸模型一元線性回歸模型有一元線性回歸模型(統(tǒng)計模型)如下,y=。0+咕+ut上式表示變量yt和xt之間的真實關(guān)系。其中yt稱被解釋變量(因變量),xt稱解釋變量(自變量),ut稱隨機誤差項,P0稱常數(shù)項,P1稱回歸系數(shù)(通常未知)。上模型可以分為兩部分。(1)回歸函數(shù)部分,E(yt)=P0+P1xt,(2)隨機部分,ut。盼盼=,+所應(yīng)圖2?1真實的回歸直線這種模型可以賦予各種實際意義,收入與支出的關(guān)系;如脈搏與血壓的關(guān)系;商品價格與供給量的關(guān)系;文件容量與保存時間的關(guān)系;林區(qū)木材采伐量與木材剩余物的關(guān)系;身高與體重的關(guān)系等。以收入與支出的關(guān)系為例。假設(shè)固定對一個家庭進(jìn)行觀察,隨著收入水平的不同,與支出呈線性函數(shù)關(guān)系。但實際上數(shù)據(jù)來自各個家庭,來自各個不同收入水平,使其他條件不變成為不可能,所以由數(shù)據(jù)得到的散點圖不在一條直線上(不呈函數(shù)關(guān)系),而是散在直線周圍,服從統(tǒng)計關(guān)系。隨機誤差項,中可能包括家庭人口數(shù)不同,消費習(xí)慣不同,不同地域的消費指數(shù)不同,不同家庭的外來收入不同等因素。所以在經(jīng)濟(jì)問題上“控制其他因素不變”是不可能的?;貧w模型的隨機誤差項中一般包括如下幾項內(nèi)容,(1)非重要解釋變量的省略,(2)人的隨機行為,(3)數(shù)學(xué)模型形式欠妥,(4)歸并誤差(糧食的歸并)(5)測量誤差等?;貧w模型存在兩個特點。(1)建立在某些假定條件不變前提下抽象出來的回歸函數(shù)不能百分之百地再現(xiàn)所研究的經(jīng)濟(jì)過程。(2)也正是由于這些假定與抽象,才使我們能夠透過復(fù)雜的經(jīng)濟(jì)現(xiàn)象,深刻認(rèn)識到該經(jīng)濟(jì)過程的本質(zhì)。通常線性回歸函數(shù)E(y)=P0+B1氣是觀察不到的,利用樣本得到的只是對E(y,)=P0+P1xt的估計,即對。0和。1的估計。在對回歸函數(shù)進(jìn)行估計之前應(yīng)該對隨機誤差項ut做出如下假定。ut是一個隨機變量,ut的取值服從概率分布。E(ut)=0。D(ut)=E[ut-E(ut)]2=E(uy=b2。稱%具有同方差性。ut為正態(tài)分布(根據(jù)中心極限定理)。1以上四個假定可作如下表達(dá)。u廣N(0,b2)。⑤Cov(叫,u)=E[(u廣E(u.))(u廠E(u.))]=E(u.,u)=0,(i句)。含義是不同觀測值所對應(yīng)的隨機項相互獨立。'稱為u.的非自相關(guān)性?!?%.是非隨機的。Cov(u.,x)=E[(u.-E(u))(x.-E(x))]=E[u.(x-E(x.)]=E[u.x.-uE(x.)]=E(u.x)ii i ii i ii i iiii ii

u.與x.相互獨立。否則,分不清是誰對yt的貢獻(xiàn)。*(8)對于多元線性回歸模型,解釋變量之間不能完全相關(guān)或高度相關(guān)(非多重共線性)。在假定(1),(2)成立條件下有E伉)=E(P0+代xt+ut)=P0+。遇。最小二乘估計(OLS)對于所研究的經(jīng)濟(jì)問題,通常真實的回歸直線是觀測不到的。收集樣本的目的就是要對這條真實的回歸直線做出估計。怎樣估計這條直線呢?顯然綜合起來看,這條直線處于樣本數(shù)據(jù)的中心位置最合理。怎樣用數(shù)學(xué)語言描述“處于樣本數(shù)據(jù)的中心位置”?設(shè)估計的直線用。t=P°W1xt表示。其中y稱y的擬合值(fittedvalue),我和&分別是楫和用的估計量。觀測值到這,tt 0 1 0 ==1條直線的縱向距離用ut表示,稱為 殘差。y=v+u=2+&x+分tytutP0P1tut稱為估計的模型。假定樣本容量為T。(1)用“殘差和最小”確定直線位置是一個途徑。但很快發(fā)現(xiàn)計算“殘差和”存在相互抵消的問題。(2)用“殘差絕對值和最小”確定直線位置也是一個途徑。但絕對值的計算比較麻煩。(3)最小二乘法的原則是以“殘差平方和最小”確定直線位置。用最小二乘法除了計算比較方便外,得到的估計量還具有優(yōu)良特性。(這種方法對異常值非常敏感)設(shè)殘差平方和用Q表示,Q=丈u12=£(yt-yt)2=£(yt-60-6】七)2,TOC\o"1-5"\h\zi=1 i=1 i=1則通過Q最小確定這條直線,即確定6和B的估計值。以6和B為變量,把Q看作是601 01 0和&的函數(shù),這是一個求極值的問題。求Q對&和&的偏導(dǎo)數(shù)并令其為零,得正規(guī)方程,廣1 廣0廣1(1)(2)廣地=2£(y-6-6X)(-1)=0鄰0 i=1 ' 0 1(1)(2)J^^=2£(y_g_gX)(-x)=0

v wtK0K1ttdP1 i=1下面用代數(shù)和矩陣兩種形式推導(dǎo)計算結(jié)果。首先用代數(shù)形式推導(dǎo)。由(1)、(2)式得,(3)£(y-6-6x)=0t0 1t

(3)E(y-6-6x產(chǎn)產(chǎn)0

t0 1t1i=1(4)(3)式兩側(cè)用除r,并整理得,把(5)式代入(4)式并整理,得,E[(yE(y-6-6x產(chǎn)產(chǎn)0

t0 1t1i=1(4)(3)式兩側(cè)用除r,并整理得,把(5)式代入(4)式并整理,得,E[(y-y)

ti=1(6)-°E(x-x)x=0

1t ti=1E/ —、x(y-y)Et,-(x-x)xt(8)因為Ex(y-y)—0Ex(x-X)=0,分別在(8)式的分子和分母上減EX(y-§)和ti=1E一,Ex(xti=1-x)得,-§)-Ex(y-y)-t Ex,(y, E(x-x)x-Ex(x-x)

tt t(9)V/ 一、/一、,(x-x)(y-y)— t t -E(x-x)2t下面用矩陣形式推導(dǎo)(10)EEyti=1xtyti=1ExEx;

x—「Ey—Etxtyt「TEx1-1「Ey,]—ExL tE二t」le『」tP061」1t1TE七2-(E七)2「Ex2

l-Ext-Ex「EyLEVt這種形式在單位根檢驗的理論分析中非常有用。最小二乘估計量&和&的特性01

(1)線性特性這里指&和&分別是v的線性函數(shù)。TOC\o"1-5"\h\z廣0廣1 1Z(X—x)(y—y)Z(x—x)y—yZ(x—x)Z(x—x)y^■7 t = t t t tZ(x—x)2 Z(x—x)2 Z(x—x)2t t t令k= (xL),代入上式得Z(xt-x)261=Zk/可見族是乙的線性函數(shù),是用的線性估計量。同理80也具有線性特性。⑵無偏性利用上式E(61)=E(ZkJ〉=E[Zk?0+6廣+u)]=E叩0Zk+P1Zktxt+Zktu)=E[p1Zkt(xt-x)+Zkt匕]=P1+E(Zktut)=61(3)有效性60,61的ols估計量的方差比其他估計量的方差小。Gauss-Marcov定理:若勺滿足E(ut)=0,D(u)=Q2,那么用OLS法得到的估計量就具有最佳線性無偏性。估計量稱最佳線性無偏估計量。最佳線性無偏估計特性保證估計值最大限度的集中在真值周圍,估計值的置信區(qū)間最小。上面的評價是對小樣本而言,若是對大樣本而言還應(yīng)討論估計量的漸近無偏性,一致性和漸近有效性。先給出漸近分布的概念。注意:分清4個式子的關(guān)系。真實的統(tǒng)計模型,yt=60+61xt+ut估計的統(tǒng)計模型,y=我+6x+ut0 1tt真實的回歸直線,E(yt)=60+61xt估計的回歸直線,y=&+&xTOC\o"1-5"\h\z/1 0 1tOLS回歸直線的性質(zhì)(1)殘差和等于零,Zut=0由正規(guī)方程》(y-6邛x)(-1)=0得Z切邛邛x)=Z(y-y)=Z(u)=0t0 1t t0 1t t,t t⑵估計的回歸直線y邛+6x過(x,y)點。_ yt0 1t J正規(guī)方程Z(y-&-6x)=0兩側(cè)同除樣本容量,,得y=&+6x。得證。t廣0L1t 0廣1(3)yt的擬合值的平均數(shù)等于其樣本觀測值的平均數(shù),[=y。

=上£&=上£(&+=上£&=上£(&+6x)=6+6I=y。得證。L°Lit or1八:— _ -tt y1 TCov(ut,x)=0只需證明^(x廣I)u上式為正規(guī)方程之一。Cov(ut,云,)=0只需證明y(y「y)u-yIu=yxtu=yxt(y-P邛xt)=0。t tt t't0r1t_y=Jyu-況=pa0-yyu=yyu=yu(6+6xt)d,tt t0 1t+y-yUt ^^^t ttu+Byuxt=0t1ttyt的分布和&1的分布根據(jù)假定條件u廣N(0,G),E&t)=E(B0+Pixt+u)=屋+。遇+E(u)=。0+。ixt。Var&)=Var(P0+P1x+u)=Var(P0+P1x)+Var(u)=Q2乙是ut的線性函數(shù),所以 ' ',廣N氣珥氣,Q2)??梢宰C明E(B1)=% Var(61)=y(1_)2b2,B1是yt的線性函數(shù)(&1=yk"所以P1~N?1,十G2)。tQ2的估計定義其中2表示待估參數(shù)的個數(shù)??梢宰C明E(62)=Q2。Q2是Q2的無偏估計量。因為u,是殘差,所以Q2又稱作誤差均方。可用來考察觀測值對回歸直線的離散程度。 tp的估計的方差是yxyx2x 二—Q2(xt-X)2VAr(p1)=S2(p)=y一1 1y(x-I)2擬合優(yōu)度的測量擬合優(yōu)度是指回歸直線對觀測值的擬合程度。顯然若觀測值離回歸直線近,則擬合程度好;反之則擬合程度差。

圖2.3圖2.3三種離差示意圖可以證明£(y7)2=£(y-y)2+£(yt-y)2=£(y-y)2+£G)2。I 71 t71 71 tSST(總平方和)=SSR(回歸平方和)+SSE(殘差平方和)證明£(y-y)2=£[(y-y)+(y-y)]2=£(y-y)2+£(y-y)2+2£(y-y)(y-y)1y 1't ytJ 1't ytJ 1七七/其中 £(y-y)(y-y)=£(y -y)& (x -x )=0 £(y -y)x -x & £(y -y )=& £ux=01,tt 1,t11 1 1,t1 1 1,t 1t1度量擬合優(yōu)度的統(tǒng)計量是可決系數(shù)(確定系數(shù))?!?-)2R2=建(yty)=(回歸平方和)/(總平方和)=SSR/SST£(yt-y)2所以R2的取值范圍是[0,1]。對于一組數(shù)據(jù),SST是不變的,所以SSRf(I),SSEI(f)。SSR:舊指回歸平方和(regressionsumofsquares),現(xiàn)指殘差平方和(sumofsquaredresiduals)SSE:舊指殘差平方和(errorsumofsquares(sumofsquarederrors)),現(xiàn)指回歸平方和(explainedsumofsquares)回歸參數(shù)的顯著性檢驗及其置信區(qū)間H1:P1止H1:P1止0H°"1=0;JVS三(。JVS三(。1)t=T=s(。1)若ItI>ta(t-2),則P1主0;若1若1t1<ta(T-2)還可以利用61估計。1的置信區(qū)間。由于P{j<七(t-2)}=1-as(61)由大括號內(nèi)不等式得61的置信區(qū)間R-st<6<R+st61 匕"a(T-2)<61<6i+S("a(T-2)其中s、是s2(61= 1_=—62的算術(shù)根,而其中的Cf是62的算術(shù)根。yF的點預(yù)測及其區(qū)間預(yù)測下面以時間序列數(shù)據(jù)為例介紹預(yù)測問題。預(yù)測可分為事前預(yù)測和事后預(yù)測。兩種預(yù)測都是在樣本區(qū)間之外進(jìn)行,如圖所示。對于事后預(yù)測,被解釋變量和解釋變量的值在預(yù)測區(qū)間都是已知的??梢灾苯佑脤嶋H發(fā)生值評價模型的預(yù)測能力。對于事前預(yù)測,解釋變量是未發(fā)生的。(當(dāng)模型中含有滯后變量時,解釋變量則有可能是已知的。)當(dāng)預(yù)測被解釋變量時,則首先應(yīng)該預(yù)測解釋變量的值。對于解釋變量的預(yù)測,通常采用時間序列模型。T t2 『3(目前)樣本區(qū)間 事后預(yù)測事前預(yù)測預(yù)測還分為有條件預(yù)測和無條件預(yù)測。對于無條件預(yù)測,預(yù)測式中所有解釋變量的值都是已知的。所以事后預(yù)測應(yīng)該屬于無條件預(yù)測。當(dāng)一個模型的解釋變量完全由滯后變量組成時,事前預(yù)測也有可能是無條件預(yù)測。例如。t=P°W1xt-1當(dāng)預(yù)測T+1期的y值時,xt用的是T期值,是已知值。預(yù)測還分為靜態(tài)預(yù)測和動態(tài)預(yù)測。yF的點預(yù)測。根據(jù)估計的回歸函數(shù),得八 ■八 一一0F=P0W1^F單個yF的區(qū)間預(yù)測0f的分布是0~N(6。+6琮。2(1+1+(七-x)2))F 0 1F T-(Xf-x)2所以,七的區(qū)間預(yù)測是 0 土[ta(『q;1+1+(七一x)2]F F a(T-2) \T-(七一x)2(3)E(yF)的區(qū)間預(yù)測E(of)的分布是E(9)~N(P°+Bx^。2(上+(-7)2))F 。M丁£(七一x)2則E(y)的區(qū)間預(yù)測是9土[t cy:1+(XF—x)2]F \t£(xt-x)210.案例:用回歸模型預(yù)測木材剩余物(file:b1c3)伊春林區(qū)位于黑龍江省東北部。全區(qū)有森林面積 218.9732萬公頃,木材蓄積量為2.324602億m3。森林覆蓋率為62.5%,是我國主要的木材工業(yè)基地之一。1999年伊春林區(qū)木材采伐量為532萬m3。按此速度44年之后,1999年的蓄積量將被采伐一空。所以目前亟待調(diào)整木材采伐規(guī)劃與方式,保護(hù)森林生態(tài)環(huán)境。為緩解森林資源危機,并解決部分職工就業(yè)問題,除了做好木材的深加工外,還要充分利用木材剩余物生產(chǎn)林業(yè)產(chǎn)品,如紙漿、紙袋、紙板等。因此預(yù)測林區(qū)的年木材剩余物是安排木材剩余物加工生產(chǎn)的一個關(guān)鍵環(huán)節(jié)。下面,利用一元線性回歸模型預(yù)測林區(qū)每年的木材剩余物。顯然引起木材剩余物變化的關(guān)鍵因素是年木材采伐量。給出伊春林區(qū)16個林業(yè)局1999年木材剩余物和年木材采伐量數(shù)據(jù)如表2.1。散點圖見圖2.14。觀測點近似服從線性關(guān)系。建立一元線性回歸模型如下:yt=Bo+。遇+ut 表2.1年剩余物yt和年木材采伐量x數(shù)據(jù) 林業(yè)局名 年木材剩余物y(萬m3)年木材采伐量x(萬m3)烏伊嶺26.1361.4東風(fēng)23.4948.3新青21.9751.8紅星11.5335.9五營7.1817.8上甘嶺6.8017.0友好18.4355.0翠巒11.6932.7烏馬河6.8017.0美溪9.6927.3大豐7.9921.5南岔12.1535.5帶嶺6.8017.0朗鄉(xiāng)17.2050.0桃山9.5030.0雙豐552138^計 202.87 532.00圖2.14年剩余物片和年木材采伐量xt散點圖DependentVariable:YMethod:LeastSquaresDate:10/09/03Time:15:38Sample:116Includedobservations:16VariableCoefficientStd.Errort-StatisticProb.C-0.7629281.220966 -0.6248560.5421X0.4042800.033377 12.112660.0000R-squared0.912890Meandependentvar12.67938AdjustedR-squared0.906668S.D.dependentvar6.665466S.E.ofregressionAkaikeinfocriterion4.376633Sumsquaredresid^8.05231Schwarzcriterion4.473207Loglikelihood-33.01306F-statistic146.7166Durbin-Watsonstat1.481946Prob(F-statistic)0.000000圖2.15EViews輸出結(jié)果EViews估計結(jié)果見圖2.15。建立EViews數(shù)據(jù)文件的方法見附錄1。在已建立Eviews數(shù)據(jù)文件的基礎(chǔ)上,進(jìn)行OLS估計的操作步驟如下:打開工作文件,從主菜單上點擊Quick鍵,選EstimateEquation功能。在出現(xiàn)的對話框中輸入ycx。點擊Ok鍵。立即會得到如圖2.15所示的結(jié)果。下面分析EViews輸出結(jié)果。先看圖2.15的最上部分。被解釋變量是*估計方法是最小二乘法。本次估計用了16對樣本觀測值。輸出格式的中間部分給出5列。第1列給出截距項(0和解釋變量x。第2列給出第1列相應(yīng)項的回歸參數(shù)估計值(&和&)。第3列f 0 1給出相應(yīng)回歸參數(shù)估計值的樣本標(biāo)準(zhǔn)差(s(&0),s(61))。第4列給出相應(yīng)t值。第5列給出t統(tǒng)計量取值大于用樣本計算的t值(絕對值)的概率值。以t=12.11266為例,相應(yīng)概率0.0000表示統(tǒng)計量t取值(絕對值)大于12.1的概率是一個比萬分之一還小的數(shù)。換句話說,若給定檢驗水平為0.05,則臨界值為t0.05(14)=2.15。t=12.1>2.15落在了H0的拒絕域,所以結(jié)論是P1不為零。輸出格式的最下部分給出了評價估計的回歸函數(shù)的若干個統(tǒng)計量的值。依縱向順序,這些統(tǒng)計量依次是可決系數(shù)〃2、調(diào)整的可決系數(shù)R2(第3章介紹)、回歸函數(shù)的標(biāo)準(zhǔn)差(s.e.,即均方誤差的算術(shù)根s)、殘差平方和、對數(shù)極大似然函數(shù)值(第2章介紹)、DW統(tǒng)計量的值、被解釋變量的平均數(shù)(§)、被解釋變量的標(biāo)準(zhǔn)差($(七))、赤池(Akaike)信息準(zhǔn)則(是一個選擇變量最優(yōu)滯后期的統(tǒng)計量)、施瓦茨(Schwatz)準(zhǔn)則(是一個選擇變量最優(yōu)滯后期的統(tǒng)計量)、F統(tǒng)計量(第3章介紹)的值以及F統(tǒng)計量取值大于該值的概率。注意:S.D?和s.e.的區(qū)別。s.e.和SSE的關(guān)系。根據(jù)EViews輸出結(jié)果(圖2?15),寫出OLS估計式如下:§=-0.7629+0.4043x (2.64)(-0.6) (12.1) R2=0.91,s.e.=2.04其中括號內(nèi)數(shù)字是相應(yīng)t統(tǒng)計量的值。s.e.是回歸函數(shù)的標(biāo)準(zhǔn)誤差,即s=佬u,2.;(i6-2)。R2是可決系數(shù)。R2=0.91說明上式的擬合情況較好。乙變差的91%由變量氣解釋。檢驗回歸系數(shù)顯著性的原假設(shè)和備擇假設(shè)是(給定a=0.05)23452345678910111213141516Ms~T~Actual|FittedIResidual26.130024.05992.0701523.490018.76384.7262121.970020.17881.7912311.530013.7507-2.220727.180006.433250.746756.000006.109830.6901710.430021.4725-3.0424611.690012.4570-0.767026.000006.109830.690179.6900010.2739-0.583917.990007.929090.0609112.150013.5890-1.439006.000006.109830.6901717.200019.4511-2.251069.5000011.3655-1.865475.520004.816130.70307圖2.16殘差圖因為t=12.1>t005(14)=2.15,所以檢驗結(jié)果是拒絕P1=0,即認(rèn)為年木材剩余物和年木材采伐量之間存在回歸關(guān)系。上述模型的經(jīng)濟(jì)解釋是,對于伊春林區(qū)每采伐1m3木材,將平均產(chǎn)生0.4m3的剩余物。圖2.16給出相應(yīng)的殘差圖。Actual表示yt的實際觀測值,F(xiàn)itted表示yt的擬合值y,Residual表示殘差u。殘差圖中的兩條虛線與中心線的距離表示殘差的一個標(biāo)準(zhǔn)差,即s.e.。通過殘差圖可以看到,大部分殘差值都落在了正、負(fù)一個標(biāo)準(zhǔn)差之內(nèi)。估計。1的置信區(qū)間。由t=P{ <《05(14)}=0?95'(P1)得P1-P1-t0.05(14)S(61)P1的置信區(qū)間是[B-t005(14s(6),&+t005n4s(6)]1 0.05(14) 1 1 0.05(14) 1/[0.4043-2.15x0.0334,0.4043+2.15x0.0334][0.3325,0.4761] (2.65)以95%的置信度認(rèn)為,P1的真值范圍應(yīng)在[0.3325,0.4761]范圍中。下面求yt的點預(yù)測和平均木材剩余物產(chǎn)出量的置信區(qū)間預(yù)測。假設(shè)烏伊嶺林業(yè)局2000年計劃采伐木材20萬m3,求木材剩余物的點預(yù)測值。y2000=-0.7629+0.4043%。。=-0.7629+0.4043x20=7.3231萬m3 (2.66)

s2(y2000)=62(1+;七_(dá),2)TZ(x-x)2=4.1453(—+(20-33.25)2)=0.454616 3722.2606s(y2000)=y‘0.4546=0.6742因為y2000)=E(P0+B1*2000)=。0+,1*2000=E(^2000)y2000y2000-E(y200)t(T-2)2000則置信度為0.95的2000年平均木材剩余物E(y2000)的置信區(qū)間是y2000土危5(14)s(y2000)=久3231土2』5X0.6742(2.67)=5.8736,8.7726(2.67)從而得出預(yù)測結(jié)果,2000年若采伐木材20萬m3,產(chǎn)生木材剩余物的點估計值是7.3231萬m3。平均木材剩余物產(chǎn)出量的置信區(qū)間估計是在[5.8736,8.7726]萬m3之間。從而為恰當(dāng)安排2000年木材剩余物的加工生產(chǎn)提供依據(jù)。問題:估計結(jié)果中&0沒有顯著性,去掉截距項B0可以嗎?答:依據(jù)實際意義可知,沒有木材采伐量就沒有木材剩余物,所以理論上B0是可以取零的。而有些問題就不可以。例如家庭消費和收入的關(guān)系。即使家庭收入為零,消費仍然非零。一般來說,截距項的估計量沒有顯著性時,也不做剔出處理。本案例剔出截距項后的估計結(jié)果是y=0.3853*(28.3) R2=0.91,s.e.=2.0點預(yù)測值是y2000=0.3853*2000=0.3853x20=7.7060萬m3附錄1:怎樣用EViews通過鍵盤輸入數(shù)據(jù)建立新工作文件的方法是從EViews主菜單中單擊File鍵,選擇New,Workfile。則打開一個數(shù)據(jù)范圍選擇框(WorkfileRange)如圖1。需要做出3項選擇。①選擇數(shù)據(jù)性質(zhì)。數(shù)據(jù)性質(zhì)分為:②啟始期(Startdate)。③終止期(Enddate)。3項選擇完畢后,點擊“OK”鍵。這時,會建立起一個尚未命名的工作文件(Workfile),且處于打開狀態(tài)。當(dāng)打開新工作文件或現(xiàn)有工作文件后,可以通過鍵盤輸入數(shù)據(jù)和追加數(shù)據(jù)。具體操作如下:從EViews主菜單中點擊Quick鍵,選擇EmptyGroup功能。這時會打開一個空白表格數(shù)據(jù)窗口(Group)如圖3所示。每一個空格代表一個觀測值位置。按列依次輸入每一個變量(或序列)的觀測值。鍵入每一個觀測值后,可通過按回車鍵(Enter鍵)或方向指示鍵(1)進(jìn)行確認(rèn)。按方向指示鍵(1)的好處是在確認(rèn)了當(dāng)前輸入的觀測值的同時,還把光標(biāo)移到了下一個待輸入位置。每一列數(shù)據(jù)上方的灰色空格是用于輸入變量名的。給變量命名時,字符不得超過16個。注意:下列名字具有特殊意義,給變量命名時,應(yīng)避免使用。它們是:ABS,ACOS,AR,ASIN,C,CON,CNORM,COEF,COS,D,DLOG,DNORM,ELSE,ENDIF,EXP,LOG,LOGIT,LPT1,LPT2,MA,NA,NRND,PDL,RESID,RND,SAR,SIN,SMA,SQR,THENo附錄2:怎樣用EViews預(yù)測。以案例1為例,給定xt=20,求y=?EViews預(yù)測步驟如下。(1) 點擊Procs鍵選Changeworkfilerange功能。在彈出的對話框的Enddata選擇框處改為17。點擊OK鍵。(2) 雙擊工作文件的Sample:117區(qū)域,在彈出的對話框的Samplerangepairs選擇框處把16改為117o(3) 雙擊工作文件窗口中的x序列,打開x數(shù)據(jù)窗口。點擊Edit+/-鍵,使x數(shù)據(jù)窗口處于可編輯狀態(tài)。在t=17的x的觀測值位置輸入20。相當(dāng)于給定x=20o(4) 打開估計式eq01窗口,點擊Forecast鍵。在S.E.選擇框處填入yfse,表示要yt的預(yù)測值(用YF表示)也要yt的預(yù)測標(biāo)準(zhǔn)差(用yfse表示)。點擊OK鍵,工作文件窗口中已經(jīng)出現(xiàn)一個yf序列。雙擊yf序列,可以看到。y17=7.322668。11.相關(guān)理論相關(guān)分析是研究變量間相互關(guān)系的最基本方法。從相關(guān)分析中引出的相關(guān)系數(shù)是回歸分析的一個基本統(tǒng)計量。掌握它有助于對經(jīng)濟(jì)問題和經(jīng)濟(jì)計量模型的分析與理解。11.1相關(guān)的定義與分類定義:相關(guān)(correlation)指兩個或兩個以上變量間相互關(guān)系的程度或強度。分類:①按強度分{完全相關(guān):變量間存在函數(shù)關(guān)系。例,圓的周長,L=2n,。高度相關(guān)(強相關(guān)):變量間近似存在函數(shù)關(guān)系。例,我國家庭收入與支出的關(guān)系。弱相關(guān):變量間有關(guān)系但不明顯。例,近年來我國耕種面積與產(chǎn)量。零相關(guān):變量間不存在任何關(guān)系。例,某班學(xué)生的學(xué)習(xí)成績與年齡。按變量個數(shù)分「按形式分:線性相關(guān),非線性相關(guān){簡單相關(guān):指兩個變量間相關(guān),按符號分:正相關(guān),負(fù)相關(guān),零相關(guān)復(fù)相關(guān)(多重相關(guān)和偏相關(guān)):指三個或三個以上變量間的相關(guān)。

非線性相關(guān)負(fù)相關(guān)240零相關(guān)-4 -2非線性相關(guān)負(fù)相關(guān)240零相關(guān)-4 -2因非線性相關(guān)可以轉(zhuǎn)化為線性相關(guān)處理,而復(fù)相關(guān)又可看作是簡單相關(guān)基礎(chǔ)上的拓展,所以后面重點介紹簡單線性相關(guān)。11.2簡單線性相關(guān)的度量用簡單線性相關(guān)系數(shù),簡稱相關(guān)系數(shù)(correlationcoefficient)度量兩個變量間的線性相關(guān)強度,用P表示。P的隨機變量表達(dá)式是P的統(tǒng)計表達(dá)式是C 1?1(七fx)(Ly) ?(…)(…)T t_1 t xtyP一 , — 頃'X'y—L。十”?(y,f?斗i(氣一叩學(xué):(七-叩vTt=1tx\tt=1ty t=1 t=1 y其中T,總體容量;xt,*變量的觀測值;四,四,變量觀測值的均值。下面解釋P為什么能對變量間的線性相關(guān)強度進(jìn)行定量度量。因為P表達(dá)式的分子是協(xié)方差,Cov(xt,yt);分母是x.和yt的標(biāo)準(zhǔn)差之積。而xt和yt的標(biāo)準(zhǔn)差不會為零,所以Cov(xt,y)是否為零,就決定了?'是否為零,即標(biāo)志著變量x,yt間是否存在線性相關(guān)關(guān)系。但Cov(xt,y)有兩個缺點:①它是一個有量綱的量,取值容易受測量單位的影響;②取值范圍寬,相關(guān)性越強,Cov(xt,yt)取值越大。為克服上述缺點,用xt,yt的標(biāo)準(zhǔn)差除Cov(xt,y>于是就得到相關(guān)系數(shù)P的統(tǒng)計表達(dá)式。它是一個無量綱量。相關(guān)系數(shù)P是對總體而言。當(dāng)研究某個問題時,所得數(shù)據(jù)常是一個樣本。對樣本來說,相關(guān)系數(shù)常用,表示,即,是總體相關(guān)系數(shù)P的估計值。r=r=P= ==計?1(yx-1尸t一一

二旗t=1(xt-x)(yt-y)_£T1(xt[x)(yt-y)2/丁x戶口:/廣y)2其中T,樣本容量;xt,yt,變量的觀測值;X,y,變量觀測值的均值。11.3相關(guān)系數(shù)的取值范圍當(dāng)兩個變量嚴(yán)格服從線性關(guān)系時,1Pl=1。證:設(shè)直線斜率為k,即y=a+kx。則有

p=£(七-工)(兒-y) = £(七-丁)k(七--) =1/——/——寸£(xt一x)2£(七一y)2VS(七一x)2k2£(x±一x)2(2) 當(dāng)兩個變量不存在線性關(guān)系時,|p|=0。(3) 上述是兩種極端情形,所以相關(guān)系數(shù)的取值范圍是[-1,1]。當(dāng)Cova〃乙)>0時,則p>0(正相關(guān));當(dāng)Cov(x〃y)<0時,貝Up<0頃相關(guān));若Cov(xt,y)=0,貝Up=0(零相關(guān))。為什么圖1為正相關(guān)?為什么圖2為負(fù)相關(guān)?用E(叫-x)(yt-y)解釋。6420-2-4-6-6 -4 -2 0 2 4 6圖6420-2-4-6-6 -4 -2 0 2 4 6圖2負(fù)相關(guān)1 2r=0.9911.4線性相關(guān)系數(shù)的局限性(1)只適用于考察變量間的線性相關(guān)關(guān)系。也就是說當(dāng)p=0時,只說明二變量間不存在線性相關(guān)關(guān)系,但不能保證不存在其它非線性相關(guān)關(guān)系。所以變量不相關(guān)與變量相互獨立在概念上是不同的。(2) 相關(guān)系數(shù)的計算是一個數(shù)學(xué)過程。它只說明二變量間的相關(guān)強度,但不能揭示這種相關(guān)性的原因,不能揭示變量間關(guān)系的實質(zhì),即變量間是否真正存在內(nèi)在聯(lián)系,因果關(guān)系。所以在計算r的同時,還要強調(diào)對實際問題的分析與理解。(3) 一般說二變量相關(guān)時,可能屬于如下一種關(guān)系。單向因果關(guān)系。如施肥量與農(nóng)作物產(chǎn)量;對金屬的加熱時間與溫度值。雙向因果關(guān)系。如工業(yè)生產(chǎn)與農(nóng)業(yè)生產(chǎn);商品供給量與商品價格。另有隱含因素影響二變量變化。如市場上計算機銷量與電視機銷量呈正相關(guān)。顯然人均收入的增加是一個隱含因素。虛假相關(guān)。如年國民生產(chǎn)總值與刑事案件數(shù)呈正相關(guān)。顯然二變量間不存在因果關(guān)系。應(yīng)屬虛假相關(guān)。中國和美國某個經(jīng)濟(jì)指標(biāo)高度相關(guān),顯然這沒有可比性,毫無意義。

(file:correlationl)(file:correlationl)11.5簡單相關(guān)系數(shù)的檢驗(1)直接檢驗(查相關(guān)系數(shù)臨界值表)H0:p=0;H1:p主0用xt和兀的樣本計算相關(guān)系數(shù),,以自由度f=T-2查臨界值表。檢驗規(guī)則是,若IrI>%(T-2)(臨界值),則xt和yt相關(guān);若IrI<%(T-2)(臨界值),則xt和yt不相關(guān)。⑵t檢驗H0:p=0;H1:p主0t= =sr(r-P)???'、_2*T-2)其中2表示涉及兩個變量。若111>ta(t-2),則X和乙相關(guān);若111<ta(T-2),則X和yt不相關(guān)。附錄:相關(guān)系數(shù)臨界值表fa0.100.050.020.010.00110.987690.996920.9995070.9998770.999998820.900000.950000.980000.990000.9990030.80540.87830.934330.958730.9911640.72930.81140.88220.917200.9740650.66940.75450.83290.87450.9507460.62150.70670.78870.83430.9249370.58220.66640.74980.79770.898280.54940.63190.71550.76460.872190.52140.60210.68510.73480.8471100.49330.57600.65810.70790.8233110.47620.55290.63390.68350.8010120.45750.53240.61200.66140.7800130.44090.51390.59230.64110.7603140.42590.49730.57420.62260.7420150.41240.48210.55770.60550.7246160.40000.46830.54250.58970.7084170.38870.45550.52850.57510.6932180.37830.44380.51550.56140.6787190.36870.43290.50340.54870.6652200.35980.42270.49210.53680.6524

250.32330.38090.44510.48690.5974300.29600.34940.40930.44870.5541350.27460.32460.38100.41820.5189400.25730.30440.35780.39320.4896450.24280.28750.33840.37210.4648500.23060.27320.32180.35410.4433600.21080.25000.29480.32480.4078700.19540.23190.27370.30170.3799800.18290.21720.25650.28300.3568900.17260.20500.24220.26730.33751000.16380.19460.23010.25400.3211注:P{|*>%(f)}=a,其中a表示顯著性水平,f表示自由度,%(f)為臨界值。11.6偏相關(guān)系數(shù)以上介紹了簡單線性相關(guān)系數(shù),但是當(dāng)兩個變量x?yt同時受其它變量z#Z2t,…,影響時,有必要研究當(dāng)控制其它變量z1,z2t,…,不變時,該兩個變量xt,y之間的相關(guān)關(guān)系。稱這種相關(guān)關(guān)系為偏相關(guān)關(guān)系。以3個變量xt,y,zt,為例(多于3個變量的情形與此相似。),假定控制氣不變,測度xt,yt偏相關(guān)關(guān)系的偏相關(guān)系數(shù)定義如下。p…=控制氣不變條件下的xt,yt的簡單相關(guān)系數(shù)。'Pt,'t因為z也是隨機變量,一般不容易得到控制z為一個常數(shù)條件下的xt和yt的值。實際計算方法是,從xt,yt中分別剔除氣的影響,然后計算相關(guān)系數(shù)。步驟如下:(1)求xt對氣的回歸估計式,一一 人 . .x=P0W1氣七t計算殘差,u=氣邛-6氣t1 0 1tut中不再含有z對xt的影響。(2)求,£對氣的回歸估計式,yt=a+azt+v計算殘差,01tv=y廣a-aztv中不再含有z對0y的影響。則u與v的簡單相關(guān)系數(shù)就是x,與y在剔除z的影響后的偏t t t t t ttt相關(guān)系數(shù),即「一=ruvxy,ztt ttt例2中央支出與地方支出的偏相關(guān)系數(shù)obs財政收入(INCOME)中央支出(X1)地方支出(X2)19811089.5602.2512.819821124575.1578.219831249642.5649.919841501.9738.7807.719851866.4836.51008.219862260.3962.31368.619872368.91031.91416.6198826281060.41646.2198929471105.2193519903312.61372.82079.419913610.91517.72295.819924153.11817.92571.819935088.21957.23330.2

200015001000500r=0.9898500x1=170.90+0.3614income+RES1x2=-221.49+0.6952income+200015001000500r=0.9898500x1=170.90+0.3614income+RES1x2=-221.49+0.6952income+RES2(-6.6) (58.6)20001500100001000200030004000(3.9) (23.1)-100 -50 0 50 100 150r=0.99r=-0.85r=0.9911.7復(fù)相關(guān)系數(shù)在多元回歸中,用偏相關(guān)系數(shù)可以分別測量被解釋變量對每個解釋變量的偏相關(guān)關(guān)系,而復(fù)相關(guān)系數(shù)則是測量被解釋變量與全部解釋變量

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論