第二章經典線性回歸模型詳解演示文稿_第1頁
第二章經典線性回歸模型詳解演示文稿_第2頁
第二章經典線性回歸模型詳解演示文稿_第3頁
第二章經典線性回歸模型詳解演示文稿_第4頁
第二章經典線性回歸模型詳解演示文稿_第5頁
已閱讀5頁,還剩108頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第二章經典線性回歸模型詳解演示文稿本文檔共113頁;當前第1頁;編輯于星期六\10點58分優(yōu)選第二章經典線性回歸模型本文檔共113頁;當前第2頁;編輯于星期六\10點58分第一節(jié)線性回歸模型的概念

一.雙變量線性回歸模型

我們在上一章給出的需求函數(shù)的例子

Q=α+βP+u(2.1)是一個雙變量線性回歸模型,模型中只有兩個變量,一個因變量,一個解釋變量,由解釋變量的變動來解釋因變量的變動,或者說用因變量對解釋變量進行線性回歸,因而稱為雙變量線性回歸模型,亦稱簡單線性回歸模型。讓我們再看一個例子。

C=α+βD+u(2.2)

這是凱恩斯消費函數(shù),其中C為消費支出,D為個人可支配收入,u為擾動項(或誤差項)。本文檔共113頁;當前第3頁;編輯于星期六\10點58分此模型中,方程左端的消費支出(C)為因變量(或被解釋變量),方程右端的個人可支配收入(D)為解釋變量(或自變量)。α和β是未知參數(shù),由于雙變量線性回歸模型的圖形是一條直線,因而α和β習慣上又分別稱為截距和斜率。這里斜率β的含義是解釋變量增加一個單位所引起的因變量的變動。例如在(2.2)式中,β的含義是個人可支配收入增加一個單位所引起的消費的增加量,經濟學中稱之為邊際消費傾向(MPC)。截距α的含義是解釋變量為0時α的值。截距α有時有經濟含義,但大多數(shù)情況下沒有,因此,在計量經濟分析中,通常不大關注α的取值如何。本文檔共113頁;當前第4頁;編輯于星期六\10點58分在教學中,我們習慣上采用Y表示因變量,X表示解釋變量,雙變量線性回歸模型的一般形式為:Y=α+βX+u在實踐中,此模型被應用于因變量和解釋變量的一組具體觀測值和(t=1,2,…,n),因而模型表示為:

=α+β+utt=1,2,…,n(2.3)它表明,對于n個時期t=1,2,…,n,該模型成立。更一般的形式為:=α+β+ui,i=1,2,...,n(2.4)即模型對X和Y的n對觀測值(i=1,2,…,n)成立。(2.3)式一般用于觀測值為時間序列的情形,在橫截面數(shù)據(jù)的情形,通常采用(2.4)式。本文檔共113頁;當前第5頁;編輯于星期六\10點58分二、多元線性回歸模型

在許多實際問題中,我們所研究的因變量的變動可能不僅與一個解釋變量有關。因此,有必要考慮線性模型的更一般形式,即多元線性回歸模型:

t=1,2,…,n

在這個模型中,Y由X1、X2、X3、…XK所解釋,有K+1個未知參數(shù)β0、β1、β2、…βK。

這里,“斜率”βj的含義是其它變量不變的情況下,Xj改變一個單位對因變量所產生的影響。本文檔共113頁;當前第6頁;編輯于星期六\10點58分

例2.2食品需求方程

其中,Y=在食品上的總支出

X=個人可支配收入

P=食品價格指數(shù)用美國1959-1983年的數(shù)據(jù),得到如下回歸結果(括號中數(shù)字為標準誤差):Y和X的計量單位為10億美元(按1972不變價格計算).本文檔共113頁;當前第7頁;編輯于星期六\10點58分多元線性回歸模型中斜率系數(shù)的含義上例中斜率系數(shù)的含義說明如下:價格不變的情況下,個人可支配收入每上升10億美元(1個billion),食品消費支出增加1.12億元(0.112個billion)。收入不變的情況下,價格指數(shù)每上升一個點,食品消費支出減少7.39億元(0.739個billion)本文檔共113頁;當前第8頁;編輯于星期六\10點58分回到一般模型

t=1,2,…,n即對于n組觀測值,有本文檔共113頁;當前第9頁;編輯于星期六\10點58分其矩陣形式為:

其中

本文檔共113頁;當前第10頁;編輯于星期六\10點58分第二節(jié)線性回歸模型的估計

一.經典線性回歸模型的統(tǒng)計假設(1)E(ut)=0,t=1,2,…,n

即各期擾動項的均值(期望值)均為0。均值為0的假設反映了這樣一個事實:擾動項被假定為對因變量的那些不能列為模型主要部分的微小影響。沒有理由相信這樣一些影響會以一種系統(tǒng)的方式使因變量增加或減小。因此擾動項均值為0的假設是合理的。

本文檔共113頁;當前第11頁;編輯于星期六\10點58分(2)E(uiuj)=0,i≠j

即各期擾動項互不相關。也就是假定它們之間無自相關或無序列相關。實際上該假設等同于:

cov(ui,uj)=0,i≠j這是因為:

cov(ui,uj)=E{[ui-E(ui)][uj-E(uj)]}=E(uiuj)——根據(jù)假設(1)(3)E(ut2)=σ2,t=1,2,…,n

即各期擾動項的方差是一常數(shù),也就是假定各擾動項具有同方差性。這是因為:

Var(ut)=E{[ut-E(ut)]2}=E(ut2)——根據(jù)假設(1)本文檔共113頁;當前第12頁;編輯于星期六\10點58分

(4)Xjt是非隨機量,j=1,2,…kt=1,2,…n(5)(K+1)<n;

即觀測值的數(shù)目要大于待估計的參數(shù)的個數(shù)(要有足夠數(shù)量的數(shù)據(jù)來擬合回歸線)。(6)各解釋變量之間不存在嚴格的線性關系。上述假設條件可用矩陣表示為以下四個條件:本文檔共113頁;當前第13頁;編輯于星期六\10點58分A1.E(u)=0

A2.由于顯然,僅當

E(uiuj)=0,i≠jE(ut2)=σ2,t=1,2,…,n

這兩個條件成立時才成立,因此,此條件相當前面條件(2),(3)兩條,即各期擾動項互不相關,并具有常數(shù)方差。本文檔共113頁;當前第14頁;編輯于星期六\10點58分

A3.X是一個非隨機元素矩陣。

A4.Rank(X)=(K+1)<n.

------相當于前面(5)(6)兩條即矩陣X的秩=(K+1)<n

滿足條件(A1)—(A4)的線性回歸模型稱為經典線性回歸模型或古典線性回歸模型(CLR模型)。

當然,為了后面區(qū)間估計和假設檢驗的需要,還要加上一條:

A5.各期擾動項服從正態(tài)分布。

~,t=1,2,…n本文檔共113頁;當前第15頁;編輯于星期六\10點58分二、最小二乘估計1.最小二乘原理為了便于理解最小二乘法的原理,我們用雙變量線性回歸模型作出說明。對于雙變量線性回歸模型Y=α+βX+u,我們的任務是,在給定X和Y的一組觀測值(X1,Y1),(X2,Y2),...,(Xn,Yn)的情況下,如何求出

Yt=α+βXt+ut

中α和β的估計值和,

使得擬合的直線為“最佳”。直觀上看,也就是要求在X和Y的散點圖上穿過各觀測點畫出一條“最佳”直線,如下圖所示。本文檔共113頁;當前第16頁;編輯于星期六\10點58分*****

et************

YXXt圖2.2

Yt本文檔共113頁;當前第17頁;編輯于星期六\10點58分殘差

擬合的直線稱為擬合的回歸線.對于任何數(shù)據(jù)點(Xt,Yt),此直線將Yt的總值分成兩部分。第一部分是Yt的擬合值或預測值:,t=1,2,……,n第二部分,et,代表觀測點對于回歸線的誤差,稱為擬合或預測的殘差(residuals):

t=1,2,……,n

即t=1,2,……,n本文檔共113頁;當前第18頁;編輯于星期六\10點58分殘差平方和我們的目標是使擬合出來的直線在某種意義上是最佳的,直觀地看,也就是要求估計直線盡可能地靠近各觀測點,這意味著應使殘差總體上盡可能地小。要做到這一點,就必須用某種方法將每個點相應的殘差加在一起,使其達到最小。理想的測度是殘差平方和,即本文檔共113頁;當前第19頁;編輯于星期六\10點58分最小二乘法最小二乘法就是選擇一條直線,使其殘差平方和達到最小值的方法。即選擇和,使得達到最小值。本文檔共113頁;當前第20頁;編輯于星期六\10點58分

運用微積分知識,使上式達到最小值的必要條件為:即本文檔共113頁;當前第21頁;編輯于星期六\10點58分整理,得:此二式稱為正規(guī)方程。解此二方程,得:其中:樣本均值離差本文檔共113頁;當前第22頁;編輯于星期六\10點58分2.多元線性回歸模型的最小二乘估計在多元線性回歸模型的情況下,我們的模型是:

問題是選擇,使得殘差平方和最小。

殘差為:本文檔共113頁;當前第23頁;編輯于星期六\10點58分要使殘差平方和

為最小,則應有:我們得到如下K+1個方程(即正規(guī)方程):

本文檔共113頁;當前第24頁;編輯于星期六\10點58分按矩陣形式,上述方程組可表示為:本文檔共113頁;當前第25頁;編輯于星期六\10點58分=即本文檔共113頁;當前第26頁;編輯于星期六\10點58分三.最小二乘估計量的性質我們的模型為估計式為

1.的均值本文檔共113頁;當前第27頁;編輯于星期六\10點58分(由假設3)

(由假設1)即這表明,OLS估計量是無偏估計量。本文檔共113頁;當前第28頁;編輯于星期六\10點58分2.的方差為求Var(),我們考慮

本文檔共113頁;當前第29頁;編輯于星期六\10點58分不難看出,這是的方差-協(xié)方差矩陣,它是一個(K+1)×(K+1)矩陣,其主對角線上元素為各系數(shù)估計量的方差,非主對角線上元素為各系數(shù)估計量的協(xié)方差。本文檔共113頁;當前第30頁;編輯于星期六\10點58分由上一段的(2.19)式,我們有因此本文檔共113頁;當前第31頁;編輯于星期六\10點58分

請注意,我們得到的實際上不僅是的方差,而且是一個方差-協(xié)方差矩陣,為了反映這一事實,我們用下面的符號表示之:為方便起見,我們也常用表示的方差-協(xié)方差矩陣,因此上式亦可寫作:需要注意的是,這里不表示方差向量,而是方差-協(xié)方差矩陣。本文檔共113頁;當前第32頁;編輯于星期六\10點58分4.高斯-馬爾科夫定理對于以及標準假設條件A1-A4,普通最小二乘估計量(OLS估計量)是最佳線性無偏估計量(BLUE)。我們已在上一段中證明了無偏性,下面證明線性和最小方差性。本文檔共113頁;當前第33頁;編輯于星期六\10點58分由OLS估計量的公式

可知,可表示為一個矩陣和因變量觀測值向量的乘積:其中是一個(K+1)*n非隨機元素矩陣。因而是線性估計量。本文檔共113頁;當前第34頁;編輯于星期六\10點58分現(xiàn)設為的任意一個線性無偏估計量,即其中是一個(K+1)*n非隨機元素矩陣。則

顯然,若要為無偏估計量,即,只有,為(K+1)階單位矩陣。本文檔共113頁;當前第35頁;編輯于星期六\10點58分的方差為:

我們可將寫成

從而將的任意線性無偏估計量與OLS估計量聯(lián)系起來。本文檔共113頁;當前第36頁;編輯于星期六\10點58分由可推出:即

因而有由從而,因此上式中間兩項為0,我們有本文檔共113頁;當前第37頁;編輯于星期六\10點58分因此

最后的不等號成立是因為為半正定矩陣。這就證明了OLS估計量是的所有線性無偏估計量中方差最小的。至此,我們證明了高斯-馬爾科夫定理。本文檔共113頁;當前第38頁;編輯于星期六\10點58分4.的分布我們在前面列出的假設條件(A5)表明,

~N(0,),t=1,2,…,n即各期擾動項服從均值為0、方差為的正態(tài)分布??紤]到假設條件(A3),即是一個非隨機元素矩陣,則由前面(2.20)式:

我們有:本文檔共113頁;當前第39頁;編輯于星期六\10點58分這表明,是N個正態(tài)分布變量的線性函數(shù),因而亦為正態(tài)分布變量,即(2.22)由此可知,系數(shù)估計量向量的每個元素都是正態(tài)分布的,即

j=0,1…,k(2.23)其中cjj為矩陣中的(j+1,j+1)元素(主對角線上第j+1個元素)。本文檔共113頁;當前第40頁;編輯于星期六\10點58分第三節(jié)擬合優(yōu)度一.決定系數(shù)R2

在估計了線性回歸模型之后,一個很自然的問題是,估計出的回歸線與觀測值擬合得好不好?這就是擬合優(yōu)度要解決的問題。擬合優(yōu)度的一個通行的測度是因變量Y的(樣本)變差被模型所解釋的比例,也就是因變量Y的變差被諸解釋變量所解釋的比例。這個統(tǒng)計量稱為決定系數(shù)(coefficientofdetermination),記做,定義為:

本文檔共113頁;當前第41頁;編輯于星期六\10點58分其中,=殘差平方和

ESS為ExplainedSumofSquares的縮寫;

RSS為ResidualSumofSquares的縮寫;

TSS為TotalSumofSquares的縮寫。本文檔共113頁;當前第42頁;編輯于星期六\10點58分決定系數(shù)R2

計量了Y的總變差中可以歸因于X和Y之間關系的比例,或者說Y的變動中可以由X的變動來解釋的比例。它是回歸線對各觀測點擬合緊密程度的測度。我們有::完全擬合,:X與Y完全不存在線性關系,

本文檔共113頁;當前第43頁;編輯于星期六\10點58分的值越高,擬合得越好。但什么是高?并沒有絕對的標準,要根據(jù)具體問題而定。此外,回歸中使用時間序列數(shù)據(jù)還是橫截面數(shù)據(jù)也有不同的標準。對時間序列數(shù)據(jù)來說,的值在0.8、0.9以上是很常見的事,而在橫截面數(shù)據(jù)的情況下,0.4、0.5的值也不能算低。為方便計算,我們也可以用矩陣形式表示。本文檔共113頁;當前第44頁;編輯于星期六\10點58分

我們有:殘差其中,殘差平方和:本文檔共113頁;當前第45頁;編輯于星期六\10點58分而

將上述結果代入R2的公式,得到:這就是決定系數(shù)R2的矩陣形式。本文檔共113頁;當前第46頁;編輯于星期六\10點58分二.修正決定系數(shù):

殘差平方和的一個特點是,每當模型增加一個解釋變量,并用改變后的模型重新進行估計,殘差平方和的值會減小。由此可以推論,決定系數(shù)是一個與解釋變量的個數(shù)有關的量:解釋變量個數(shù)增加減小R2

增大也就是說,人們總是可以通過增加模型中解釋變量的方法來增大R2

的值。因此,用R2

來作為擬合優(yōu)度的測度,不是十分令人滿意的。

本文檔共113頁;當前第47頁;編輯于星期六\10點58分為此,我們定義修正決定系數(shù)(Adjusted)如下:本文檔共113頁;當前第48頁;編輯于星期六\10點58分是經過自由度調整的決定系數(shù),稱為修正決定系數(shù)。我們有:(1)(2)僅當K=0時,等號成立。即

(3)當K增大時,二者的差異也隨之增大。

(4)可能出現(xiàn)負值。本文檔共113頁;當前第49頁;編輯于星期六\10點58分三.例子下面我們給出兩個簡單的數(shù)值例子,以幫助理解這兩節(jié)的內容.

例2.3 Yt=1+2X2t+3X3t+ut

設觀測數(shù)據(jù)為:Y:31835X2:31524X3:54646

試求各參數(shù)的OLS估計值,以及。解:我們有本文檔共113頁;當前第50頁;編輯于星期六\10點58分本文檔共113頁;當前第51頁;編輯于星期六\10點58分本文檔共113頁;當前第52頁;編輯于星期六\10點58分本文檔共113頁;當前第53頁;編輯于星期六\10點58分本文檔共113頁;當前第54頁;編輯于星期六\10點58分

例2.4

設n=20,k=3,R2=0.70,求。解:下面改變n的值,看一看的值如何變化。我們有若n=10,則=0.55

若n=5,則=-0.20

由本例可看出,有可能為負值。這與R2不同()。本文檔共113頁;當前第55頁;編輯于星期六\10點58分

第四節(jié)非線性關系的處理

迄今為止,我們已解決了線性模型的估計問題。但在實際問題中,變量間的關系并非總是線性關系,經濟變量間的非線性關系比比皆是。如大家所熟悉的柯布-道格拉斯生產函數(shù):

就是一例。在這樣一些非線性關系中,有些可以通過代數(shù)變換變?yōu)榫€性關系處理,另一些則不能。下面我們通過一些例子來討論這個問題。本文檔共113頁;當前第56頁;編輯于星期六\10點58分一.線性模型的含義

線性模型的基本形式是:

其特點是可以寫成每一個解釋變量和一個系數(shù)相乘的形式。線性模型的線性包含兩重含義:(1)變量的線性變量以其原型出現(xiàn)在模型之中,而不是以X2或Xβ之類的函數(shù)形式出現(xiàn)在模型中。(2)參數(shù)的線性

因變量Y是各參數(shù)的線性函數(shù)。本文檔共113頁;當前第57頁;編輯于星期六\10點58分二.線性化方法

對于線性回歸分析,只有第二種類型的線性才是重要的,因為變量的非線性可通過適當?shù)闹匦露x來解決。例如,對于

此方程的變量和參數(shù)都是線性的。本文檔共113頁;當前第58頁;編輯于星期六\10點58分

參數(shù)的非線性是一個嚴重得多的問題,因為它不能僅憑重定義來處理??墒牵绻P偷挠叶擞梢幌盗械腦β或eβX項相乘,并且擾動項也是乘積形式的,則該模型可通過兩邊取對數(shù)線性化。例如,需求函數(shù)

其中,Y=對某商品的需求

X=收入

P=相對價格指數(shù)

ν=擾動項可轉換為:本文檔共113頁;當前第59頁;編輯于星期六\10點58分

用X,Y,P的數(shù)據(jù),我們可得到logY,logX和logP,從而可以用OLS法估計上式。

logX的系數(shù)是β的估計值,經濟含義是需求的收入彈性,logP的系數(shù)將是γ的估計值,即需求的價格彈性。彈性(elasticity)是一變量變動1%所引起的另一變量變動的百分比。其定義為本例中,需求的收入彈性是收入變化1%,價格不變時所引起的商品需求量變動的百分比。需求的價格彈性是價格變化1%,收入不變時所引起的商品需求量變動的百分比。本文檔共113頁;當前第60頁;編輯于星期六\10點58分三.例子例2.5需求函數(shù)本章§1中,我們曾給出一個食品支出為因變量,個人可支配收入和食品價格指數(shù)為解釋變量的線性回歸模型例子(例2.2)?,F(xiàn)用這三個變量的對數(shù)重新估計(采用同樣的數(shù)據(jù)),得到如下結果(括號內數(shù)字為標準誤差):回歸結果表明,需求的收入彈性是0.64,需求的價格彈性是-0.48,這兩個系數(shù)都顯著異于0。本文檔共113頁;當前第61頁;編輯于星期六\10點58分

例2.6柯布-道格拉斯生產函數(shù)

用柯布和道格拉斯最初使用的數(shù)據(jù)(美國1899-1922年制造業(yè)數(shù)據(jù))估計經過線性化變換的模型得到如下結果(括號內數(shù)字為標準誤差):

從上述結果可以看出,產出的資本彈性是0.23,產出的勞動彈性為0.81。本文檔共113頁;當前第62頁;編輯于星期六\10點58分例2.7貨幣需求量與利率之間的關系

M=a(r-2)b這里,變量非線性和參數(shù)非線性并存。對此方程采用對數(shù)變換

logM=loga+blog(r-2)令Y=logM,X=log(r-2),β1=loga,β2=b

則變換后的模型為:

Yt=β1+β2Xt+ut

本文檔共113頁;當前第63頁;編輯于星期六\10點58分

將OLS法應用于此模型,可求得β1和β2的估計值,從而可通過下列兩式求出a和b估計值:

應當指出,在這種情況下,線性模型估計量的性質(如BLUE,正態(tài)性等)只適用于變換后的參數(shù)估計量,而不一定適用于原模型參數(shù)的估計量和。本文檔共113頁;當前第64頁;編輯于星期六\10點58分例2.8上例在確定貨幣需求量的關系式時,我們實際上給模型加進了一個結束條件。根據(jù)理論假設,在某一利率水平上,貨幣需求量在理論上是無窮大。我們假定這個利率水平為2%。假如不給這一約束條件,而是從給定的數(shù)據(jù)中估計該利率水平的值,則模型變?yōu)椋?/p>

M=a(r-c)b

式中a,b,c均為參數(shù)。仍采用對數(shù)變換,得到

log(Mt)=loga+blog(rt-c)+utt=1,2,…,n

我們無法將log(rt-c)定義為一個可觀測的變量X,因為這里有一個未知量c。也就是說,此模型無法線性化。在這種情況下,只能用估計非線性模型參數(shù)值的方法。本文檔共113頁;當前第65頁;編輯于星期六\10點58分四.非線性回歸

模型

Y=a(X-c)b是一個非線性模型,a、b和c是要估計的參數(shù)。此模型無法用取對數(shù)的方法線性化,只能用非線性回歸技術進行估計,如非線性最小二乘法(NLS)。該方法的原則仍然是殘差平方和最小。計量經濟軟件包通常提供這類方法,本書第五章將對非線性回歸方法作較深入的介紹,這里僅給出有關非線性最小二乘法的大致步驟如下:本文檔共113頁;當前第66頁;編輯于星期六\10點58分非線性回歸方法的步驟1. 首先給出各參數(shù)的初始估計值(合理猜測值);2. 用這些參數(shù)值和X觀測值數(shù)據(jù)計算Y的各期預測值(擬合值);3.計算各期殘差,然后計算殘差平方和∑e2;4.對一個或多個參數(shù)的估計值作微小變動;

5.計算新的Y預測值、殘差平方和∑e2;

6.若新的∑e2小于老的∑e2,說明新參數(shù)估計值優(yōu)于老估計值,則以它們作為新起點;

7.重復步驟4,5,6,直至無法減小∑e2為止。

8.最后的參數(shù)估計值即為最小二乘估計值。本文檔共113頁;當前第67頁;編輯于星期六\10點58分第五節(jié)假設檢驗本節(jié)討論經典線性回歸模型的區(qū)間估計和假設檢驗問題。我們的模型是:

在第二節(jié)中我們證明了在擾動項服從正態(tài)分布的假設(A5)下,

~j=0,1…,k

其中cjj為矩陣中的(j+1,j+1)元素(主對角線上第j+1個元素)。這一結果為基于OLS估計量的假設檢驗提供了堅實的基礎。本文檔共113頁;當前第68頁;編輯于星期六\10點58分一、β的置信區(qū)間我們可構造一個檢驗統(tǒng)計量

該變量服從均值為0、標準差為1的標準正態(tài)分布。與估計量相聯(lián)系的概率分布的標準差,通常稱為標準誤差(standarderror),用Se表示。的標準誤差為:

本文檔共113頁;當前第69頁;編輯于星期六\10點58分如果σ為已知,則由于檢驗統(tǒng)計量z服從標準正態(tài)分布,因而我們可以立即給出總體參數(shù)的95%的置信區(qū)間為:但實際上,我們一般無法知道擾動項分布的方差,而必須根據(jù)觀測值數(shù)據(jù)估計出,然后再來考慮的置信區(qū)間的計算問題。本文檔共113頁;當前第70頁;編輯于星期六\10點58分

1.2

的估計可以證明,2的無偏估計量是

式中是殘差平方和,分母是的自由度,這是因為我們在估計的過程中,失去了(K+1)個自由度。2.的置信區(qū)間我們重新定義的標準誤差為:本文檔共113頁;當前第71頁;編輯于星期六\10點58分則檢驗統(tǒng)計量

不再服從標準正態(tài)分布,而是服從自由度為(n-k-1)的t分布,即這里n和k分別為觀測值和解釋變量的數(shù)目。故的(1-α)%置信區(qū)間為:其中α為顯著性水平,通常取α=0.05。本文檔共113頁;當前第72頁;編輯于星期六\10點58分例2.9回到食品需求的例子(例2.2):

其中,Y=在食品上的總支出,X=個人可支配收入,P=食品價格指數(shù)用美國1959-1983年的數(shù)據(jù),得到如下回歸結果(括號中數(shù)字為標準誤差):

求的95%置信區(qū)間。本文檔共113頁;當前第73頁;編輯于星期六\10點58分由回歸結果可知,,我們不難得到的95%置信區(qū)間為:即為0.1058~0.1182。本文檔共113頁;當前第74頁;編輯于星期六\10點58分二、假設檢驗的邏輯和步驟假設檢驗始于一個給定的假設,即所謂“原假設”,亦稱“零假設”,然后計算檢驗統(tǒng)計量,這個檢驗統(tǒng)計量在原假設成立的假定下的概率分布是已知的。下一步是判斷計算出的檢驗統(tǒng)計量的值是否不大可能來自此分布,如果判斷是不大可能,則表明原假設不大可能成立。我們用一個例子來說明上述有關假設檢驗的思路。設有一個原假設規(guī)定的值為,這里是研究人員選擇的一個值,如果這個原假設(H0:=)成立,我們知道統(tǒng)計量

本文檔共113頁;當前第75頁;編輯于星期六\10點58分應服從自由度為(n-k-1)的t分布,即如果原假設不成立,則備擇假設H1:成立。用于計算t的所有的量都是已知的,可以用估計值及其標準誤差Se()算出t的值,因此t可作為檢驗統(tǒng)計量用于假設檢驗,如果算出的t值絕對值過大,落入t分布的尾部,意味著原假設不大可能成立,因為在原假設成立的情況下,得到這樣一個t值的概率很小。本文檔共113頁;當前第76頁;編輯于星期六\10點58分由上面的說明不難看出,假設檢驗可以說就是檢驗是否出現(xiàn)了小概率事件,如果出現(xiàn)小概率事件,則拒絕原來關于總體參數(shù)的假設;如果檢驗表明得到的樣本值并不屬于小概率事件,即若我們的假設成立,得到該樣本值的概率不算小,則我們不能拒絕原來的假設,或者說,我們“接受”原假設。問題是,我們上面提到的概率究竟應該小到什么程度才算小。一般說來,這取決于我們愿意承擔的拒絕一個正確的假設和接受一個錯誤的假設這兩方面的風險。在實踐中,一般習慣于取5%作為拒絕假設的臨界水平,稱為5%的顯著性水平。本文檔共113頁;當前第77頁;編輯于星期六\10點58分假設檢驗的具體步驟是:(1)建立關于總體參數(shù)的原假設和備擇假設;(2)計算檢驗統(tǒng)計量,檢驗原假設(是否出現(xiàn)小概率事件);(3)得出關于原假設是否合理的結論。例2.10仍用食品需求的例子(例2.2)試檢驗原假設:。本文檔共113頁;當前第78頁;編輯于星期六\10點58分原假設:H0:β1=0.12備擇假設:H1:β1≠0.12我們有:

用υ=n-k-1=25-2-1=22查t表,截斷兩側5%面積的t臨界值tc=2.074∵

故拒絕原假設H0:。本文檔共113頁;當前第79頁;編輯于星期六\10點58分三、系數(shù)的顯著性檢驗在假設檢驗中,有關斜率系數(shù)是否為0的假設檢驗特別重要。如果通過檢驗,接受的原假設,則表明Xj和Y沒有關系,即Xj對Y的變動沒有影響。在這種情況下,可考慮從模型中剔除Xj。這類檢驗稱為系數(shù)的顯著性檢驗。1. 單個系數(shù)顯著性檢驗目的是檢驗某個解釋變量的系數(shù)βj是否為0,即該解釋變量是否對因變量有影響。原假設H0:

βj=0

備擇假設H1:

βj≠0本文檔共113頁;當前第80頁;編輯于星期六\10點58分單個系數(shù)顯著性檢驗的檢驗統(tǒng)計量是自由度為n-k-1的t統(tǒng)計量:~t(n-k-1)其中,為矩陣主對角線上第j+1個元素。而本文檔共113頁;當前第81頁;編輯于星期六\10點58分

例2.11仍用食品需求的例子(例2.2),回歸結果如下(括號中數(shù)字為標準誤差):

試檢驗價格的系數(shù)的顯著性。解:原假設H0:備擇假設H1:

查t表,

故拒絕原假設H0。結論:顯著異于0,P對Y有影響。本文檔共113頁;當前第82頁;編輯于星期六\10點58分2.若干個系數(shù)的顯著性檢驗(聯(lián)合假設檢驗)

有時需要同時檢驗若干個系數(shù)是否為0,這可以通過建立單一的原假設來進行。設要檢驗g個系數(shù)是否為0,即與之相對應的g個解釋變量對因變量是否有影響。不失一般性,可設原假設和備擇假設為:

H0:β1=β2=…=βg

=0H1:

H0不成立

(即X1,…Xg中某些變量對Y有影響)本文檔共113頁;當前第83頁;編輯于星期六\10點58分分析:這實際上相當于檢驗g個約束條件

β1=0,β2=0,…,βg

=0是否同時成立。若H0為真,則正確的模型是:

據(jù)此進行回歸(有約束回歸),得到殘差平方和

SR是H0為真時的殘差平方和。

本文檔共113頁;當前第84頁;編輯于星期六\10點58分若H1為真,正確的模型即原模型:據(jù)此進行無約束回歸(全回歸),得到殘差平方和S是H1為真時的殘差平方和。本文檔共113頁;當前第85頁;編輯于星期六\10點58分

如果H0為真,則不管X1,…Xg這g個變量是否包括在模型中,所得到的結果不會有顯著差別,因此應該有:

S≈SR如果H1為真,則由上一節(jié)中所討論的殘差平方和∑e2的特點,無約束回歸增加了變量的個數(shù),應有

S<SR

通過檢驗二者差異是否顯著地大,就能檢驗原假設是否成立。本文檔共113頁;當前第86頁;編輯于星期六\10點58分所使用的檢驗統(tǒng)計量是:

~F(g,n-k-1)其中,g為分子自由度,n-k-1為分母自由度。使用的作用是消除具體問題中度量單位的影響,使計算出的F值是一個與度量單位無關的量。本文檔共113頁;當前第87頁;編輯于星期六\10點58分例2.12給定20組Y,X1,X2,X3的觀測值,試檢驗模型中X1和X3對Y是否有影響?解:(1)全回歸估計得到:S=∑e2=25

(2)有約束回歸

估計得到:SR=∑e2=30本文檔共113頁;當前第88頁;編輯于星期六\10點58分原假設H0:β1=

β3=0

備擇假設H1:

H0不成立我們有:n=20,g=2,k=3用自由度(2,16)查F分布表,5%顯著性水平下,

∵F=1.6<FC=3.63,故接受H0。結論:X1和X3對Y無顯著影響本文檔共113頁;當前第89頁;編輯于星期六\10點58分3.全部斜率系數(shù)為0的檢驗

上一段結果的一個特例是所有斜率系數(shù)均為0的檢驗,即回歸方程的顯著性檢驗:

H0:

β1=β2=…=βK=0

也就是說,所有解釋變量對Y均無影響。注意到g=K,

則該檢驗的檢驗統(tǒng)計量為:

本文檔共113頁;當前第90頁;編輯于星期六\10點58分

分子分母均除以,有

從上式不難看出,全部斜率為0的檢驗實際是檢驗R2的值是否顯著異于0,如果接受原假設,則表明因變量的行為完全歸因于隨機變化。若拒絕原假設,則表明所選擇模型對因變量的行為能夠提供某種程度的解釋。本文檔共113頁;當前第91頁;編輯于星期六\10點58分四.檢驗其他形式的系數(shù)約束條件

上面所介紹的檢驗若干個系數(shù)顯著性的方法,也可以應用于檢驗施加于系數(shù)的其他形式的約束條件,如

檢驗的方法仍是分別進行有約束回歸和無約束回歸,求出各自的殘差平方和SR和S,然后用F統(tǒng)計量進行檢驗。當然,單個系數(shù)的假設檢驗,如H0:3=1.0,亦可用t檢驗統(tǒng)計量進行檢驗。本文檔共113頁;當前第92頁;編輯于星期六\10點58分例2.13Cobb-Douglas生產函數(shù)

Y=AKαLβν

試根據(jù)美國制造業(yè)1899-1922年數(shù)據(jù)檢驗規(guī)模效益不變的約束:α+β=1解:(1)全回歸

本文檔共113頁;當前第93頁;編輯于星期六\10點58分(2)有約束回歸:將約束條件代入,要回歸的模型變?yōu)椋?/p>

Y=AKαL1-αν

為避免回歸系數(shù)的不一致問題,兩邊除以L,模型變換為:

Y/L=A(K/L)αν

回歸,得:本文檔共113頁;當前第94頁;編輯于星期六\10點58分

由回歸結果得到的約束回歸和全回歸的殘差平方和分別為

SR=0.0716S=0.0710

(3)檢驗原假設H0:α+β=1

備擇假設H1:α+β≠1

本例中,g=1,K=2,n=24

本文檔共113頁;當前第95頁;編輯于星期六\10點58分

用自由度(1,21)查F表,5%顯著性水平下,F(xiàn)c=4.32∵F=0.18<Fc=4.32

故接受原假設H0:α+β=1

(4)結論我們的數(shù)據(jù)支持規(guī)模收益不變的假設。本文檔共113頁;當前第96頁;編輯于星期六\10點58分五、回歸結果的提供和分析1.回歸結果提供的格式在論文、專著或報告中提供回歸分析結果時一般應采用簡潔而通行的格式,以便于交流。通行的格式有以下兩種:(1)

這里116.7、0.112和-0.739分別為常數(shù)項和兩個斜率系數(shù)的估計值,括號中提供的是的標準誤差。本文檔共113頁;當前第97頁;編輯于星期六\10點58分(2)括號中數(shù)字分別是原假設、和成立時的t值。由此可見,這兩種格式的唯一區(qū)別就在于括號中數(shù)字的含義不同。正因為如此,人們在論文或著作中提供回歸結果時,必須在適當?shù)胤秸f明括號中數(shù)字是標準誤差還是t值。需要說明的是,提供回歸結果的標準格式中一般還包括檢驗一階自相關的DW檢驗值,我們將在下一章“自相關”一節(jié)中介紹。本文檔共113頁;當前第98頁;編輯于星期六\10點58分2.回歸結果的分析結果的分析主要包括以下內容:(1)系數(shù)估計值。首先是分析系數(shù)的符號是否正確,系數(shù)值的大小是否恰當,是否符合理論預期和常識。上一段例中斜率系數(shù)一正一負,符合經濟理論,數(shù)值大小也大致合理。(2)擬合情況。例中很高,擬合較理想。(3)系數(shù)的顯著性。例中斜率系數(shù)的t值分別為37.33和-6.48,表明這些系數(shù)顯著異于0,X和P對Y有影響。(4)根據(jù)DW檢驗值說明是否存在擾動項的自相關。如何說明,將在下一章中介紹。本文檔共113頁;當前第99頁;編輯于星期六\10點58分第六節(jié)

預測

我們用OLS法對多元回歸模型的參數(shù)進行了估計之后,如果結果理想,則可用估計好的模型進行預測。預測指的是對諸自變量的某一組具體值

來預測與之相對應的因變量值。當然,要進行預測,有一個假設前提應當滿足,即擬合的模型在預測期也成立。

本文檔共113頁;當前第100頁;編輯于星期六\10點58分點預測值由與給定的諸X值對應的回歸值給出,即

而預測期的實際Y值由下式給出:

其中u0是從預測期的擾動項分布中所取的值。本文檔共113頁;當前第101頁;編輯于星期六\10點58分預測誤差可定義為:兩

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論