計量經(jīng)濟學-多元線性回歸(一)_第1頁
計量經(jīng)濟學-多元線性回歸(一)_第2頁
計量經(jīng)濟學-多元線性回歸(一)_第3頁
計量經(jīng)濟學-多元線性回歸(一)_第4頁
計量經(jīng)濟學-多元線性回歸(一)_第5頁
已閱讀5頁,還剩55頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

《計量經(jīng)濟學》

Econometrics

問題導入

1.影響消費支出的因素只有收入嗎?

2.商品需求量只受價格影響嗎?

3.工資由哪些變量引起?2關于模型中的趨勢變量如果要考察消費與可支配收入的關系,可以引入時間趨勢變量,目的是為模型能夠描述消費與收入的真實關系(不受時間影響)因為個人消費與可支配收入這兩個變量的共同特點是隨時間而遞增。在模型中引入時間變量,從而使消費與收入的關系為一種不依賴于時間的關系。3為什么要引入趨勢變量?為了分析應變量與時間的關系趨勢變量代替一個影響Y的基本變量(如技術進步、人口增長、經(jīng)濟發(fā)展等等)4第4章多元線性回歸(一)

4.1多變量線性回歸模型

4.2多元線性回歸模型的若干假設

4.3多元線性回歸模型的參數(shù)估計

4.4多元線性回歸模型的擬合優(yōu)度

4.5多元線性回歸模型的參數(shù)檢驗

4.6多元線性回歸模型的預測

4.7案例分析

54.1多變量線性回歸模型總體回歸模型:在線性回歸模型中的解釋變量有多個總體回歸函數(shù):6i=1,2…,n其中:k為解釋變量的數(shù)目,j稱為回歸參數(shù),也叫偏回歸系數(shù)。表示在其他解釋變量保持不變的情況下,Xj每變化1個單位時,Y的均值E(Y)的變化;即:j給出了Xj的單位變化對Y均值的“直接”(不含其他變量)影響。樣本回歸模型樣本回歸函數(shù)7kikiiiXXXYbbbb?????22110++++=LikikiiieXXXY+++++=bbbb????22110L

ei稱為殘差或剩余項(residuals),可看成是總體回歸函數(shù)中隨機擾動項i的近似替代。8思考

假設要求建立一個計量經(jīng)濟學模型來說明在學院跑道上慢跑半個小時或半個小時以上的人數(shù),以便決定是否修建第二條跑道以滿足所有的鍛煉者,你通過整個學年收集數(shù)據(jù),得到兩個可能的解釋性方程:其中:Y為某天慢跑者的人數(shù),X1為該天的降雨量,

X2為該天日照時間,

X3為該天的最高溫度,

X4為第二天需交學期論文的班級數(shù)。請回答:(1)這兩個方程你認為哪個更合理些?(2)為什么用相同的數(shù)據(jù)去估計相同變量的系數(shù)卻得到不同的符號?4.2多元線性回歸模型的若干假設關于X的假設X是確定性變量,不是隨機變量各X之間不相關(無多重共線性)關于μ的假設零均值、同方差、不序列相關服從正態(tài)分布關于X與μ的假設X與μ不相關9零均值、同方差、不序列相關104.3多元線性回歸模型的參數(shù)估計普通最小二乘估計11對于隨機抽取的n組觀測值如果樣本函數(shù)的參數(shù)估計值已經(jīng)得到,則有:i=1,2…n

根據(jù)最小二乘原理,參數(shù)估計值應該是右列方程組的解kikiiiXXXYbbbb?????22110++++=L12于是得到關于待估參數(shù)估計值的正規(guī)方程組:即:解該(k+1)

個方程組成的線性代數(shù)方程組,即可得到(k+1)個待估參數(shù)的估計值隨機誤差項的方差的無偏估計

13

可以證明,隨機誤差項的方差的無偏估計量為:樣本容量問題最小樣本容量:樣本最小容量必須不少于模型中解釋變量的數(shù)目(包括常數(shù)項),即n≥k+1滿足基本要求的樣本容量:n30時,Z檢驗才能應用;

n-k≥8時,t分布較為穩(wěn)定一般經(jīng)驗認為:當n≥30或者至少n≥3(k+1)時,才能說滿足模型估計的基本要求。14多元回歸模型參數(shù)估計實例人均消費水平、人均GDP、上一年度消費水平的關系(P23)建立模型Eviews實現(xiàn)(兩種方法)直接在命令框中輸入“l(fā)sYcXY(-1)”生成Y(-1),在打開一個新組,輸入命令15請注意觀察:此時的樣本容量為多大?自由度為多大?16DependentVariable:XFMethod:LeastSquaresDate:03/22/13Time:08:54Sample:19782007Includedobservations:30VariableCoefficientStd.Errort-StatisticProb.C224.303555.648204.0307420.0004GDP0.3864340.00774449.901920.0000R-squared0.988881Meandependentvar2175.067AdjustedR-squared0.988484S.D.dependentvar2021.413S.E.ofregression216.9246Akaikeinfocriterion13.66132Sumsquaredresid1317576.Schwarzcriterion13.75473Loglikelihood-202.9198F-statistic2490.202Durbin-Watsonstat0.115833Prob(F-statistic)0.000000DependentVariable:XFMethod:LeastSquaresDate:03/22/13Time:08:56Sample(adjusted):19792007Includedobservations:29afteradjustingendpointsVariableCoefficientStd.Errort-StatisticProb.C89.4006927.310563.2734840.0030GDP0.1288270.0227855.6540610.0000XF(-1)0.7394490.06501811.372930.0000R-squared0.998127Meandependentvar2243.724AdjustedR-squared0.997983S.D.dependentvar2021.281S.E.ofregression90.77644Akaikeinfocriterion11.95237Sumsquaredresid214249.4Schwarzcriterion12.09382Loglikelihood-170.3094F-statistic6928.210Durbin-Watsonstat0.449287Prob(F-statistic)0.000000XF=C(1)+C(2)*GDPXF=C(1)+C(2)*GDP+C(3)*XF(-1)17XF=C(1)+C(2)*GDPXF=C(1)+C(2)*GDP+C(3)*XF(-1)多元回歸的若干重要結論OLS估計量仍然是最佳線性無偏估計量線性性、無偏性、有效性樣本回歸線過均值點Y的估計的均值等于真實的Y的均值殘差與X不相關殘差與Y不相關184.4多元線性回歸模型的擬合優(yōu)度可決系數(shù)與調整的可決系數(shù)19記總離差平方和的分解自由度(n-1)=(n-k-1)+(k)20XiXSRFY21

可決系數(shù)該統(tǒng)計量越接近于1,模型的擬合優(yōu)度越高。

問題:隨著解釋變量個數(shù)增加而減小,至少不會增加,所以R2是解釋變量數(shù)目的增函數(shù)。

這就給人一個錯覺:要使得模型擬合得好,只要增加解釋變量即可——R2需調整,必須消除這種因素。22調整的可決系數(shù)調整的思路:將殘差平方和與總離差平方和分別除以各自的自由度,以剔除變量個數(shù)對擬合優(yōu)度的影響:其中:n-k-1為殘差平方和的自由度

n-1為總體平方和的自由度k為回歸平方和的自由度

23R2

與的性質調整的可決系數(shù):使得具有不同樣本容量和解釋變量數(shù)目的回歸方程可以進行擬合優(yōu)度的比較。與的關系24赤池信息準則(AIC)與施瓦茨準則(SC)這兩個準則均要求僅當所增加的解釋變量能夠減少AIC值或SC值時才在原模型中增加該解釋變量。比較上例的輸出結果中的AIC和SC,你的結論是什么?赤池信息準則和施瓦茨準則4.5多元線性回歸模型的參數(shù)檢驗4.5.1參數(shù)顯著性檢驗——t檢驗4.5.2參數(shù)的置信區(qū)間4.5.3方程顯著性檢驗——F檢驗這部分與一元線性回歸不同4.5.4R2與F統(tǒng)計量的關系254.5.3方程顯著性檢驗——F檢驗26

模型的顯著性檢驗就是檢驗模型的全體解釋變量總體上對被解釋變量是否存在明顯的影響。即檢驗模型

中的參數(shù)j是否不全為0。即

可提出如下原假設與備擇假設:H0:1=2==k=0H1:j不全為0i=1,2…,n27XiXSRFYF檢驗的思想來自于總離差平方和的分解式:

TSS=ESS+RSS28

如果這個比值較大,則X的聯(lián)合體對Y的解釋程度高,可認為總體存在線性關系,反之總體上可能不存在線性關系。

因此,可通過該比值的大小對總體線性關系進行推斷。由于回歸平方和?=2?iyESS是解釋變量X的聯(lián)合體對被解釋變量Y的線性作用的結果,考慮比值

29

根據(jù)數(shù)理統(tǒng)計學中的知識,在原假設H0成立的條件下,統(tǒng)計量

服從自由度為(k,n-k-1)的F分布。

給定顯著性水平,可得到臨界值F(k,n-k-1)

,由樣本求出統(tǒng)計量F的數(shù)值,通過

來拒絕(或接受)原假設H0,以判定原方程總體上的線性關系是否顯著成立。~F(k,n-k-1)4.5.1參數(shù)顯著性檢驗——t檢驗必須對每個解釋變量進行顯著性檢驗,以決定是否作為解釋變量被保留在模型中。這一檢驗是由對變量的t檢驗完成的。3031

1、t統(tǒng)計量

32

2、t檢驗

原假設與備擇假設:

給定顯著性水平,可得到臨界值t/2(n-k-1),由樣本求出統(tǒng)計量t的數(shù)值,通過

t

t/2(n-k-1)或t≤-t/2(n-k-1)來拒絕或接受原假設H0,從而判定對應的解釋變量是否應包括在模型中。如果顯著性水平不太高,也不要簡單地剔除變量,還要看它在模型及應用中的作用。H1:j0H0:j=0(i=1,2…k)注意:一元線性回歸中,t檢驗與F檢驗一致

33檢驗步驟0,0,)()(4)(3)?(?205.0)1(00222不顯著異于參數(shù)則不拒絕顯著異于參數(shù)則拒絕,,若)判斷:(

。分布表,找出)查()計算統(tǒng)計量:(。,如選擇顯著水平jjjiHHn-k-1ttn-k-1ttk-1nttStbbbbaaaaa<3-==34一個關于個人收入與物價水平及失業(yè)率的關系的回歸方程如下(括號內(nèi)為估計標準差):其中:W為第t年每位雇員的收入,P為第t年的物價水平,U為第t年的失業(yè)率。(1)對系數(shù)進行假設檢驗。(2)討論Pt-1在理論上的正確性,是否可以從方程中刪除?為什么?

4.5.2參數(shù)的置信區(qū)間35

參數(shù)的置信區(qū)間用來考察:在一次抽樣中所估計的參數(shù)值離參數(shù)的真實值有多“近”。在(1-)的置信水平下i的置信區(qū)間是:

如何才能縮小置信區(qū)間?

增大樣本容量n

提高模型的擬合優(yōu)度提高樣本觀測值的分散度4.6多元線性回歸模型的預測點預測區(qū)間預測364.7案例分析37生產(chǎn)函數(shù)是描述生產(chǎn)過程中投入的生產(chǎn)要素的某種組合與其最大的可能產(chǎn)出之間的數(shù)學依存關系的表達式。38取對數(shù)之后391.建立模型根據(jù)生產(chǎn)理論,建立模型:只有取對數(shù)后,才能將其變成線性模型估計模型直接在命令框中輸入“l(fā)slog(Y)clog(k)log(L)”生成三個對數(shù)序列后再進行回歸4041DependentVariable:LOG(Y)Method:LeastSquaresDate:03/22/13Time:11:20Sample:19872006Includedobservations:20VariableCoefficientStd.Errort-StatisticProb.LOG(K)0.8062760.02456532.821880.0000LOG(L)0.4026990.1420822.8342670.0114C-3.0082051.359114-2.2133580.0408R-squared0.997005Meandependentvar9.903467AdjustedR-squared0.996653S.D.dependentvar0.547656S.E.ofregression0.031686Akaikeinfocriterion-3.928423Sumsquaredresid0.017068Schwarzcriterion-3.779063Loglikelihood42.28423F-statistic2829.504Durbin-Watsonstat0.652073Prob(F-statistic)0.000000估計結果:(-2.21)(32.82)(2.83)2.模型檢驗(1)經(jīng)濟意義檢驗

(2)變量顯著性檢驗p值均小于0.05,顯著(3)方程顯著性檢驗 F統(tǒng)計量的p值小于0.01,顯著423.預測已知2007年固定資本存量為117908.2億元,就業(yè)人數(shù)為76990.00萬人。打開Workfile窗口,Procs/Structure/ResizeCurrent將k和l序列中錄入2007年數(shù)據(jù)再次得到回歸模型Equation/procs/forecast,將范圍改為1987——2007打開yf序列,即可觀測到1987-2007年度的所有預測值43課后練習:2、5、7、10、12、1344知識延伸:受約束回歸我們對參數(shù)的顯著性檢驗僅僅是對系數(shù)是否顯著為0進行的檢驗,如果要對參數(shù)之間的關系進行檢驗,該如何做?——受約束回歸45一、模型參數(shù)的線性約束46例如對模型:施加約束:得:或:(1)(2)如果對(2)式回歸得出:則由約束條件可得:這些約束條件是否為真,需要進行檢驗常用F檢驗47XiXSRFY受約束與無約束模型都有相同的TSS受約束樣本回歸模型的殘差平方和RSSR>=無約束RSSU48

這意味著,通常情況下,對模型施加約束條件會降低模型的解釋能力。但是,如果約束條件為真,則受約束回歸模型與無約束回歸模型具有相同的解釋能力,RSSR

與RSSU的差異變小??捎肦SSR-RSSU的大小來檢驗約束的真實性

根據(jù)數(shù)理統(tǒng)計學的知識:于是:?注意,kU-kR恰為約束條件的個數(shù)。二、對回歸模型增加或減少解釋變量49考慮如下兩個回歸模型(1)(2)(1)式可看成是(2)式的受約束回歸:H0:相應的F統(tǒng)計量為:50

如果約束條件為真,即額外的變量Xk+1,…,Xk+q對Y沒有解釋能力,則F統(tǒng)計量較小;否則,約束條件為假,意味著額外的變量對Y有較強的解釋能力,則F統(tǒng)計量較大。因此,可通過F的計算值與臨界值的比較,來判斷額外變量是否應包括在模型中。應用:51下表列出了1960-1982美國家庭人均雞肉年消費量Y與家庭月收入X,雞肉價格P1、豬肉價格P2、牛肉價格P3、每磅雞肉替代品的綜合真實價格P23(豬肉與牛肉的零售價格的加權平均)的相關數(shù)據(jù)。綜合練習YEARY人均雞肉消費量X1人均真實可支配收入p1每磅雞肉的真實零售價格p2每磅豬肉的真是零售價格p3:每磅牛肉的真實零售價格p23:每磅雞肉替代品的綜合真實價格196027.8397.542.250.778.365.8196129.9413.338.15279.266.9196229.8439.240.35479.267.8196330.8459.739.555.379.269.6196431.2492.937.354.777.468.7196533.3528.638.163.780.273.6196635.6560.339.369.880.476.3196736.4624.637.865.983.977.2196836.7666.438.464.585.578.1196938.4717.840.17093.784.7197040.4768.238.673.2106.193.3197140.3843.339.867.8104.889.7197241.8911.639.779.1114100.7197340.4931.152.195.4124.1113.5197440.71021.548.994.2127.6115.3197540.11165.958.3123.5142.9136.7197642.71349.657.9129.9143.6139.2197744.11449.456.5117.6139.2132197846.71575.563.7130.9165.5132.1197950.61759.161.6129.8203.3154.4198050.11994.258.9128219.6174.9198151.72258.166.4141221.6180.8198252.92478.770.4168.2232.6189.452現(xiàn)在考慮下面的需求函數(shù),請回答以下問題:(1)你會選擇哪個模型,為什么?(2)你怎樣解釋模型中X和P1的系數(shù)?(3)模型2和模型4的設定有何不同?(4)如果你采用第四個模型,可能會遇到什么問題?(5)因為模型5中包含牛肉和豬肉的綜合價格,你認為函數(shù)5比和函數(shù)4更好嗎?(6)豬肉和牛肉是雞肉的競爭或替代品嗎?你怎樣知道?(7)假定函數(shù)5是正確的,估計此模型,解釋你的結果(8)如果你使用了“錯誤”模型2,通過考察系數(shù)的關系,評估這個模設定錯誤的后果。53(1)模型5看起來最好,因為它包含了所有經(jīng)濟相關的變量,其中P3,還可以減少模型中變量的個數(shù),減輕豬肉價格與牛肉價格之間可能存在的多重共線性。(2)lnX前的系數(shù)代表了收入彈性,lnP1系數(shù)代表了雞肉價格彈性。(3)4同時考慮了牛肉和豬肉(4)如果采用模型4,則模型中豬肉和牛肉價格之間存在多重共線性(5)是的,因為有助于減輕多重共線性(6)應該是替代品(7)(8)54假如現(xiàn)在要考慮雞肉的家庭消費需求是否受豬肉及牛肉價格的影響。系數(shù)分別代表收入彈性、自價格彈性、與豬肉的交叉價格彈性和與牛肉的交叉價格彈性,根據(jù)經(jīng)濟理論,我們預期:lnx前的系數(shù)>0;lnp1的系數(shù)<0;lnp2的系數(shù)>0,如果雞肉和豬肉是替代品;<0,如果雞肉和豬肉是互補品;=0,如果雞肉和豬肉是無關產(chǎn)品看輸出的模型,豬肉和牛肉的系數(shù)并不顯著,于是我們認為,雞肉和兩者不相干,做出假設:55結論:?雞肉的需求不依賴于豬肉和牛肉的價格。自價格彈性小于0,絕對值小于1,說明什么?56結論:?57第四章結束練習題為了研究投資率(投資占GDP的比例)與儲蓄率(儲蓄占GDP的比例)之間的關系,馬丁和查爾斯得到21個國家的樣本數(shù)據(jù)。每個國家的投資率是1960——1974年間的平均投資率,儲蓄率是同期的平均儲蓄率。變量INVERATE表示投資率,SAVRATE表示儲蓄率。(1)將投資率對儲蓄率描點(2)基于這個描點圖,你認為如下模型對這些數(shù)據(jù)的擬合效果同樣好嗎?線性——

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論