簡單線性回歸模型(20120911)_第1頁
簡單線性回歸模型(20120911)_第2頁
簡單線性回歸模型(20120911)_第3頁
簡單線性回歸模型(20120911)_第4頁
簡單線性回歸模型(20120911)_第5頁
已閱讀5頁,還剩104頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、1引子引子: :中國旅游業(yè)總收入將超過中國旅游業(yè)總收入將超過30003000億美元嗎?億美元嗎?“未來我國旅游需求將快速增長,根據(jù)中國政府所制定未來我國旅游需求將快速增長,根據(jù)中國政府所制定的遠(yuǎn)景目標(biāo),到的遠(yuǎn)景目標(biāo),到20202020年,中國入境旅游人數(shù)將達到年,中國入境旅游人數(shù)將達到2.12.1億億人次;國際旅游外匯收入人次;國際旅游外匯收入580580億美元,國內(nèi)旅游收入億美元,國內(nèi)旅游收入25002500億美元。到億美元。到20202020年,中國旅游業(yè)總收入將超過年,中國旅游業(yè)總收入將超過30003000億美億美元,相當(dāng)于國內(nèi)生產(chǎn)總值的元,相當(dāng)于國內(nèi)生產(chǎn)總值的8%8%至至11%”11%

2、”。 引自引自20082008年中國旅行社發(fā)展研究咨詢報告年中國旅行社發(fā)展研究咨詢報告 (參考現(xiàn)狀:第一產(chǎn)業(yè)占(參考現(xiàn)狀:第一產(chǎn)業(yè)占GDP的的15%,建筑業(yè)占,建筑業(yè)占GDP 的的7%)什么決定性因素能使中國什么決定性因素能使中國旅游業(yè)總收入超過旅游業(yè)總收入超過30003000億美元億美元, 將超過建筑業(yè),并接近或超過第一產(chǎn)業(yè)將超過建筑業(yè),并接近或超過第一產(chǎn)業(yè)?旅游業(yè)的發(fā)展與這種決定性因素的數(shù)量關(guān)系究竟是什么?旅游業(yè)的發(fā)展與這種決定性因素的數(shù)量關(guān)系究竟是什么?2顯然,對旅游起決定性影響作用的是顯然,對旅游起決定性影響作用的是“中國居民的收入中國居民的收入水平水平”以及以及“入境旅游人數(shù)入境旅游

3、人數(shù)”等等因素。等等因素?!奥糜螛I(yè)總收入旅游業(yè)總收入”(Y Y)與)與“居民平均收入居民平均收入”(X1X1)或)或者者“入境旅游人數(shù)入境旅游人數(shù)”(X2X2)究竟有怎樣的數(shù)量關(guān)系呢?)究竟有怎樣的數(shù)量關(guān)系呢? 能否用某種函數(shù)關(guān)系式能否用某種函數(shù)關(guān)系式 Y= f ( X ) Y= f ( X ) 去表現(xiàn)和度量經(jīng)濟變?nèi)ケ憩F(xiàn)和度量經(jīng)濟變量之間的數(shù)量關(guān)系呢量之間的數(shù)量關(guān)系呢? ? 具體該具體該怎樣去表現(xiàn)和計量呢怎樣去表現(xiàn)和計量呢? ?需要尋求研究經(jīng)濟變量之間數(shù)量關(guān)系的方法需要尋求研究經(jīng)濟變量之間數(shù)量關(guān)系的方法為了不使問題復(fù)雜化為了不使問題復(fù)雜化, , 我們先從我們先從最簡單的最簡單的模型入手模型入手

4、, ,在在最理想的條件下最理想的條件下的來討論的來討論, ,即即: : 只分析最簡單的變量間數(shù)量關(guān)系只分析最簡單的變量間數(shù)量關(guān)系 在某些標(biāo)準(zhǔn)的在某些標(biāo)準(zhǔn)的( (或基本的、古典的或基本的、古典的) )假定條件下討論假定條件下討論 為什么先討論簡單線性回歸模型呢?為什么先討論簡單線性回歸模型呢?簡單線性回歸模型簡單線性回歸模型: : 只有兩個變量且其關(guān)系為線性的回歸模型。只有兩個變量且其關(guān)系為線性的回歸模型。特點特點: : 簡單線性回歸的原理可以直接用代數(shù)式及平面圖形簡單線性回歸的原理可以直接用代數(shù)式及平面圖形 去表述,較為直觀,更容易被理解和接受。去表述,較為直觀,更容易被理解和接受。 在此基礎(chǔ)

5、上在此基礎(chǔ)上很容易拓展到多個變量的情況。很容易拓展到多個變量的情況。雖然簡單雖然簡單, ,而本章的思想和原理是理解整個計量經(jīng)濟學(xué)的重要而本章的思想和原理是理解整個計量經(jīng)濟學(xué)的重要基礎(chǔ)。基礎(chǔ)。本章主要內(nèi)容本章主要內(nèi)容: 回歸分析的基本概念回歸分析的基本概念 線性回歸模型參數(shù)的估計線性回歸模型參數(shù)的估計 參數(shù)的區(qū)間估計和假設(shè)檢驗參數(shù)的區(qū)間估計和假設(shè)檢驗 回歸方程的擬合優(yōu)度回歸方程的擬合優(yōu)度 回歸模型預(yù)測回歸模型預(yù)測 EViewsEViews的基本操作的基本操作5 第一節(jié)第一節(jié) 回歸分析與回歸函數(shù)回歸分析與回歸函數(shù)一、相關(guān)分析與回歸分析一、相關(guān)分析與回歸分析(對統(tǒng)計學(xué)的回顧)(對統(tǒng)計學(xué)的回顧) 計量

6、經(jīng)濟學(xué)研究的是經(jīng)濟變量之間的數(shù)量關(guān)系計量經(jīng)濟學(xué)研究的是經(jīng)濟變量之間的數(shù)量關(guān)系1 1、經(jīng)濟變量之間的相互關(guān)系、經(jīng)濟變量之間的相互關(guān)系 從性質(zhì)上看從性質(zhì)上看, , 變量之間的關(guān)系可能有三種情況變量之間的關(guān)系可能有三種情況: : 確定性的函數(shù)關(guān)系確定性的函數(shù)關(guān)系 Y=f (X) 可用數(shù)學(xué)方法直接計算可用數(shù)學(xué)方法直接計算 沒有關(guān)系沒有關(guān)系 不用去分析不用去分析 相關(guān)關(guān)系相關(guān)關(guān)系不確定的統(tǒng)計關(guān)系不確定的統(tǒng)計關(guān)系 Y= f(X)+ (為隨機變量為隨機變量) 需要用統(tǒng)計方法分析需要用統(tǒng)計方法分析 經(jīng)濟變量之間的關(guān)系主要呈現(xiàn)為相關(guān)關(guān)系,下面著重討論經(jīng)濟變量之間的關(guān)系主要呈現(xiàn)為相關(guān)關(guān)系,下面著重討論相關(guān)關(guān)系。相

7、關(guān)關(guān)系。 6 6 相關(guān)關(guān)系的類型類型 變量間的相關(guān)關(guān)系可以有各種類型變量間的相關(guān)關(guān)系可以有各種類型: : 從所涉及的變量數(shù)量看從所涉及的變量數(shù)量看 簡單相關(guān)簡單相關(guān) 兩個變量之間的相關(guān)關(guān)系兩個變量之間的相關(guān)關(guān)系 多重相關(guān)多重相關(guān) 多個變量之間的復(fù)相關(guān)關(guān)系多個變量之間的復(fù)相關(guān)關(guān)系 從變量相關(guān)關(guān)系的表現(xiàn)形式看從變量相關(guān)關(guān)系的表現(xiàn)形式看 線性相關(guān)線性相關(guān)散布圖接近一條直線散布圖接近一條直線 非線性相關(guān)非線性相關(guān)散布圖接近一條曲線散布圖接近一條曲線 從變量相關(guān)關(guān)系變化的方向看從變量相關(guān)關(guān)系變化的方向看 正相關(guān)正相關(guān)變量同方向變化,同增同減變量同方向變化,同增同減 負(fù)相關(guān)負(fù)相關(guān)變量反方向變化,一增一減變

8、量反方向變化,一增一減 不相關(guān)不相關(guān) 2、相關(guān)關(guān)系 相關(guān)關(guān)系的描述相關(guān)關(guān)系的描述 最直觀的描述方式最直觀的描述方式坐標(biāo)圖(散布圖、散點圖)坐標(biāo)圖(散布圖、散點圖) 7函數(shù)關(guān)系函數(shù)關(guān)系相關(guān)關(guān)系相關(guān)關(guān)系(線性線性)沒有關(guān)系沒有關(guān)系相關(guān)關(guān)系相關(guān)關(guān)系(非線性非線性)8 3 3、相關(guān)程度的度量、相關(guān)程度的度量相關(guān)系數(shù)相關(guān)系數(shù) 總體線性相關(guān)系數(shù)總體線性相關(guān)系數(shù):如果如果 和和 總體的全部數(shù)據(jù)總體的全部數(shù)據(jù)都已知,都已知, 和和 的方差和協(xié)方差也已知,則的方差和協(xié)方差也已知,則X和和Y的的總體線性相關(guān)系數(shù)總體線性相關(guān)系數(shù) 為為: 其中:其中: -X 的方差的方差 -Y的方差的方差 -X和和Y的協(xié)方差的協(xié)方差

9、特點:特點:總體相關(guān)系數(shù)只反映總體兩個變量總體相關(guān)系數(shù)只反映總體兩個變量 和和 的的線性相關(guān)程度線性相關(guān)程度對于特定的總體來說,對于特定的總體來說, 和和 的數(shù)值是既定的,總體相關(guān)系的數(shù)值是既定的,總體相關(guān)系數(shù)數(shù) 是客觀存在的是客觀存在的特定數(shù)值特定數(shù)值( (為非隨機變量為非隨機變量) )??傮w變量總體變量 和和 的全部數(shù)值通常不可能直接全部觀測,所以的全部數(shù)值通常不可能直接全部觀測,所以總體相關(guān)系數(shù)一般是總體相關(guān)系數(shù)一般是未知未知的的。 (, )()( )Cov X YVar X Var Y(, )Cov X Y()Var X( )Var YXXXXYYYYYX9如果只知道如果只知道 X 和

10、和 Y 的樣本觀測值,則的樣本觀測值,則X和和Y的的樣本線性樣本線性相關(guān)系數(shù)相關(guān)系數(shù) 為:為: 其中:其中: 和和 分別是變量分別是變量X和和Y的樣本觀測值,的樣本觀測值, 和和 分別是變量分別是變量 X 和和Y 樣本值的平均值樣本值的平均值注意注意 : 每一組樣本觀測值都可以計算一個每一組樣本觀測值都可以計算一個 , 所以所以 是隨是隨抽樣波動而變動的抽樣波動而變動的隨機變量隨機變量。iY_X_Y_22()()()()iiXYiiXX YYrXXYYiXXYrX和和Y的的樣本線性相關(guān)系數(shù)樣本線性相關(guān)系數(shù):XYrXYr正確理解和使用相關(guān)系數(shù)正確理解和使用相關(guān)系數(shù) X X和和Y Y 都是相互都是

11、相互對稱對稱的隨機變量,的隨機變量, 線性相關(guān)系數(shù)只反映變量間的線性相關(guān)系數(shù)只反映變量間的線性相關(guān)線性相關(guān)程度,不能說程度,不能說明非線性相關(guān)關(guān)系明非線性相關(guān)關(guān)系 樣本相關(guān)系數(shù)是總體相關(guān)系數(shù)的樣本估計值,由于樣本相關(guān)系數(shù)是總體相關(guān)系數(shù)的樣本估計值,由于抽抽樣波動樣波動,樣本相關(guān)系數(shù)是隨抽樣而變動的,樣本相關(guān)系數(shù)是隨抽樣而變動的隨機變量。隨機變量。 10XYYXrr用相關(guān)系數(shù)去分析經(jīng)濟變量間的數(shù)量關(guān)系較為簡單用相關(guān)系數(shù)去分析經(jīng)濟變量間的數(shù)量關(guān)系較為簡單, ,可可以在一定程度上測定變量間的數(shù)量關(guān)系以在一定程度上測定變量間的數(shù)量關(guān)系, ,但是對于具體但是對于具體研究變量間的數(shù)量規(guī)律性還有局限性。研究

12、變量間的數(shù)量規(guī)律性還有局限性。11只是相關(guān)分析還不能達到計量經(jīng)濟分析的目的只是相關(guān)分析還不能達到計量經(jīng)濟分析的目的 相關(guān)分析的局限相關(guān)分析的局限: : 相關(guān)系數(shù)只能反映變量間的線性相關(guān)程度,不能確定相關(guān)系數(shù)只能反映變量間的線性相關(guān)程度,不能確定變量間的變量間的因果關(guān)系因果關(guān)系。 相關(guān)系數(shù)只能說明兩個變量線性相關(guān)的方向和程度相關(guān)系數(shù)只能說明兩個變量線性相關(guān)的方向和程度, ,不不能說明相關(guān)關(guān)系具體接近哪條直線能說明相關(guān)關(guān)系具體接近哪條直線, ,也就不能說明一個變也就不能說明一個變量的變動會導(dǎo)致另一個變量變動的量的變動會導(dǎo)致另一個變量變動的具體數(shù)量規(guī)律具體數(shù)量規(guī)律。計量經(jīng)濟學(xué)關(guān)心的問題:計量經(jīng)濟學(xué)關(guān)

13、心的問題: 是經(jīng)濟變量間的因果關(guān)系以及隱藏在隨機性后面的具是經(jīng)濟變量間的因果關(guān)系以及隱藏在隨機性后面的具體統(tǒng)計規(guī)律性體統(tǒng)計規(guī)律性 在這方面回歸分析方法可以發(fā)揮更為重要的作用。在這方面回歸分析方法可以發(fā)揮更為重要的作用。124 4、回歸分析、回歸分析回歸的古典意義古典意義: 高爾頓遺傳學(xué)的回歸概念高爾頓遺傳學(xué)的回歸概念 ( ( 父母身高與子女身高的關(guān)系父母身高與子女身高的關(guān)系) )子女的身高有向人的平均身高子女的身高有向人的平均身高 回歸回歸 的趨勢的趨勢回歸的現(xiàn)代意義現(xiàn)代意義: 對作為對作為變動結(jié)果變動結(jié)果的被解釋變量與若干個作為的被解釋變量與若干個作為變動原因變動原因的解釋變量之間依存關(guān)系的

14、研究的解釋變量之間依存關(guān)系的研究回歸的目的目的(實質(zhì)實質(zhì)): 由解釋變量去估計被解釋變量的由解釋變量去估計被解釋變量的平均值平均值(1 1)明確幾個概念)明確幾個概念(為深刻理解(為深刻理解“回歸回歸”) 被解釋變量被解釋變量 Y Y 的的條件分布條件分布: 當(dāng)解釋變量當(dāng)解釋變量 X X 取某固定值時(取某固定值時(條件條件),),Y Y 的值不確定,的值不確定,Y Y的不同取值會形成一定的分布,這是的不同取值會形成一定的分布,這是Y Y的的條件分布條件分布。 被解釋變量被解釋變量 Y Y 的的條件概率條件概率: X X取某固定值時,取某固定值時,Y Y 取不同值的概率稱為取不同值的概率稱為Y

15、 Y的的條件概率條件概率。 被解釋變量被解釋變量 Y Y的的條件期望條件期望: 對于對于X X 的每一個取值,的每一個取值, 對對Y Y所形成的分布確定所形成的分布確定 其期望或均值,稱為其期望或均值,稱為Y Y 的的條件期望或條件均值,條件期望或條件均值, 用用 表示。表示。注意注意:Y:Y的條件期望是隨的條件期望是隨X(X(條件條件) )的變動而變動的的變動而變動的 iX()iE Y X)(iXYEYX14回歸線回歸線:對于每一個對于每一個X的取值的取值 ,都有,都有Y的條件期望的條件期望 與之對應(yīng),代表與之對應(yīng),代表Y的條件期望的點的軌跡形成的條件期望的點的軌跡形成 的直線或曲線稱為回歸

16、線。的直線或曲線稱為回歸線?;貧w函數(shù)回歸函數(shù):被解釋變量:被解釋變量 Y的條件期望的條件期望 隨隨解釋變量解釋變量X的變化而有規(guī)律的變化而有規(guī)律的變化,如果把的變化,如果把Y的條件期的條件期望表現(xiàn)為望表現(xiàn)為 X 的某種函數(shù)的某種函數(shù) ,這個函數(shù)稱為回歸函數(shù)。這個函數(shù)稱為回歸函數(shù)?;貧w函數(shù)分為:總體回歸函數(shù)和樣本回歸函數(shù)回歸函數(shù)分為:總體回歸函數(shù)和樣本回歸函數(shù) iXX YiX()iE Y X()iE Y X()iE Y XE()()iiY Xf X15每每 月月 家家 庭庭 可可 支支 配配 收收 入入 X200025003000350040004500500055006000650013121

17、5301631184320372277246929243515352113401619172619742210238828893338372139541400171317862006232525263090365038654108每每1548175018352265241926813156380240264345月月1688181418852367252228873300408741654812家家173819851943248526653050332142984380庭庭180020412037251527993189365443124580消消19022186207826892887335

18、338424413費費220021792713291335344074支支231222982898303837104165出出2316292331673834 Y Y238730533310249831873510268932861591191520922586275430393396385340364148()iE Y X舉例舉例: 假如已知由假如已知由100100個家庭構(gòu)成的個家庭構(gòu)成的總體總體的數(shù)據(jù)的數(shù)據(jù) (單位單位:元元)二、總體回歸函數(shù)二、總體回歸函數(shù)(PRF)16家庭消費支出的條件期望與家庭收入的關(guān)系的圖形家庭消費支出的條件期望與家庭收入的關(guān)系的圖形:對于這對于這100100個家庭

19、的總體,家庭消費支出的條件期望個家庭的總體,家庭消費支出的條件期望 與家庭收入與家庭收入 接近線性關(guān)系接近線性關(guān)系, , 可以把家庭消費可以把家庭消費支出的條件均值表示為家庭收入的線性函數(shù):支出的條件均值表示為家庭收入的線性函數(shù):其中其中: : 為截距系數(shù),為截距系數(shù), 為斜率系數(shù)為斜率系數(shù)iiXXYE)()(iXYE()iE Y XiXY17 1. 1. 總體回歸函數(shù)的概念總體回歸函數(shù)的概念 假如已知假如已知所研究的經(jīng)濟現(xiàn)象總體的被解釋變量所研究的經(jīng)濟現(xiàn)象總體的被解釋變量Y和解和解釋變量釋變量X的每個觀測值的每個觀測值(如所舉例,但通常這是不可能(如所舉例,但通常這是不可能的?。┑模。?,那么

20、,可以計算出總體被解釋變量,那么,可以計算出總體被解釋變量Y的條件期的條件期望望 ,并將其表現(xiàn)為解釋變量,并將其表現(xiàn)為解釋變量X的某種線性或非的某種線性或非線性函數(shù)線性函數(shù) 這個函數(shù)稱為這個函數(shù)稱為總體回歸函數(shù)(總體回歸函數(shù)(PRF) 本質(zhì)本質(zhì): : 總體回歸函數(shù)實際上表現(xiàn)的是所研究的特定總體中總體回歸函數(shù)實際上表現(xiàn)的是所研究的特定總體中被解釋變量隨解釋變量的變動而變動的某種被解釋變量隨解釋變量的變動而變動的某種規(guī)律性規(guī)律性, ,即被解即被解釋變量的釋變量的數(shù)據(jù)生成過程數(shù)據(jù)生成過程。計量經(jīng)濟學(xué)的根本目的就是要去探尋經(jīng)濟變量間數(shù)量關(guān)系計量經(jīng)濟學(xué)的根本目的就是要去探尋經(jīng)濟變量間數(shù)量關(guān)系的規(guī)律的規(guī)律

21、, , 也就是要努力去尋求總體回歸函數(shù)也就是要努力去尋求總體回歸函數(shù)。)()(iiXfXYE)(iXYE18 iuiXXY)(iXYEiY條件期望條件期望表現(xiàn)形式表現(xiàn)形式例如例如Y的條件期望的條件期望 是解是解 釋變量釋變量X的線性函數(shù),可表示為:的線性函數(shù),可表示為: 個別(實際)值個別(實際)值表現(xiàn)形式表現(xiàn)形式(隨機設(shè)定形式)(隨機設(shè)定形式) 對于一定的對于一定的 ,Y的各個別(實際的各個別(實際)值值 并不一定等于條件并不一定等于條件期望,而是分布在期望,而是分布在 的周圍,若令各個的周圍,若令各個 與條件期望與條件期望 的偏差為的偏差為 ,即,即稱為稱為隨機誤差項隨機誤差項或或隨機擾動

22、項隨機擾動項,顯然,顯然 是個隨機變量是個隨機變量則有則有 iYiYiX)(iXYE12()()iiiiE Y Xf XX)(iXYE)(iXYEiuiuiiiiiiXYXYEYu21)(12()iiiiiiYE Y XuXu2.2.總體回歸函數(shù)的表現(xiàn)形式總體回歸函數(shù)的表現(xiàn)形式PRFiu(系統(tǒng)變動部分系統(tǒng)變動部分)(隨機變動部分隨機變動部分)iY3.3.如何理解總體回歸函數(shù)如何理解總體回歸函數(shù)作為總體運行的客觀規(guī)律,總體回歸函數(shù)是作為總體運行的客觀規(guī)律,總體回歸函數(shù)是客觀存在客觀存在的,的, 其其參數(shù)參數(shù)雖然未知雖然未知, ,但是是確定的但是是確定的常數(shù)常數(shù)??傮w回歸函數(shù)中的總體回歸函數(shù)中的隨

23、機擾動項隨機擾動項 是是不可直接觀測不可直接觀測的。的。實際的經(jīng)濟研究中總體回歸函數(shù)的形式通常是實際的經(jīng)濟研究中總體回歸函數(shù)的形式通常是未知未知的,只的,只 能根據(jù)經(jīng)濟理論和實踐經(jīng)驗去加以能根據(jù)經(jīng)濟理論和實踐經(jīng)驗去加以設(shè)定設(shè)定。在計量經(jīng)濟研究。在計量經(jīng)濟研究 中,設(shè)定計量經(jīng)濟模型,實際就是在設(shè)定總體回歸函數(shù)可中,設(shè)定計量經(jīng)濟模型,實際就是在設(shè)定總體回歸函數(shù)可 能的具體形式。計量經(jīng)濟學(xué)研究中能的具體形式。計量經(jīng)濟學(xué)研究中“計量計量”的根本目的就的根本目的就 是要去尋求總體回歸函數(shù)。是要去尋求總體回歸函數(shù)。總體回歸函數(shù)中總體回歸函數(shù)中 Y Y 與與 X X 的關(guān)系可以是的關(guān)系可以是線性線性的,也可

24、以是的,也可以是 非線性非線性的。的。19iu20計量經(jīng)濟學(xué)中計量經(jīng)濟學(xué)中, ,線性回歸模型的線性回歸模型的“線性線性” ” 有兩種解釋有兩種解釋: 就變量而言就變量而言是線性的是線性的 Y Y的條件期望(均值)是的條件期望(均值)是 X X 的線性函數(shù)的線性函數(shù) 就參數(shù)而言就參數(shù)而言是線性的是線性的 YY的條件期望(均值)是參數(shù)的條件期望(均值)是參數(shù) 的線性函數(shù)的線性函數(shù)例如:例如: 對變量、參數(shù)均為對變量、參數(shù)均為“線性線性” 對參數(shù)對參數(shù)“線性線性”,對變量,對變量”非線性非線性” 對變量對變量“線性線性”,對參數(shù),對參數(shù)”非線性非線性注意:注意:在計量經(jīng)濟學(xué)中,線性回歸模型主要指就參

25、數(shù)而言在計量經(jīng)濟學(xué)中,線性回歸模型主要指就參數(shù)而言是是“線性線性”的的, 因為只要對參數(shù)而言是線性的因為只要對參數(shù)而言是線性的, 都可以用類都可以用類似的方法去估計其參數(shù),都可以歸于線性回歸似的方法去估計其參數(shù),都可以歸于線性回歸。iiiXXYE21)(12()lniiiE Y XXiiiXXYE21)(“線性線性”的判斷的判斷 三、隨機擾動項三、隨機擾動項u概念概念 在總體回歸函數(shù)中,各個在總體回歸函數(shù)中,各個 的實的實 際值與其條件期望際值與其條件期望 的偏的偏 差差 有很重要的意義。若只有有很重要的意義。若只有 對對Y有影響有影響, 與與 不不應(yīng)有偏差。若有偏差應(yīng)有偏差。若有偏差 存在,

26、就存在,就說明還存在其他影響因素,因此說明還存在其他影響因素,因此 實際代表了被排除在實際代表了被排除在模型以外的所有因素對模型以外的所有因素對 Y 的影響。的影響。性質(zhì)性質(zhì) 是其期望為是其期望為 0 有一定分布的隨機變量。有一定分布的隨機變量。重要性:重要性:隨機擾動項的性質(zhì)決定著計量經(jīng)濟分析結(jié)果的性隨機擾動項的性質(zhì)決定著計量經(jīng)濟分析結(jié)果的性質(zhì),決定著計量經(jīng)濟方法的選擇。質(zhì),決定著計量經(jīng)濟方法的選擇。21iuiuiY)(iiXYEiuiY)(iiXYEXiuiu()iE Y XiYYiXX 引入隨機擾動項引入隨機擾動項 的原因的原因原生性原因原生性原因: : “人們并不清楚了解的偶然性和無數(shù)

27、微弱影響的人們并不清楚了解的偶然性和無數(shù)微弱影響的不能被解釋的不能被解釋的因素因素”是是未知未知影響因素影響因素的代表的代表( (理論的模糊性導(dǎo)致某些因素未知理論的模糊性導(dǎo)致某些因素未知) ) 是是眾多細(xì)小影響因素眾多細(xì)小影響因素的綜合代表的綜合代表 ( (非系統(tǒng)性影響非系統(tǒng)性影響) ) 變量可能有內(nèi)在變量可能有內(nèi)在隨機性隨機性 ( (人類經(jīng)濟行為的內(nèi)在隨機性人類經(jīng)濟行為的內(nèi)在隨機性) )反映了經(jīng)濟行為的內(nèi)在隨機性。由大數(shù)定理反映了經(jīng)濟行為的內(nèi)在隨機性。由大數(shù)定理可可保證其保證其符合符合Gauss假設(shè)假設(shè)和正態(tài)性假定和正態(tài)性假定,使使統(tǒng)計推斷具有可靠性統(tǒng)計推斷具有可靠性。衍生性原因衍生性原因:

28、 :不是真正的不能被解釋的因素不是真正的不能被解釋的因素( (可能引起不服從可能引起不服從GaussGauss假定)假定) 模型可能存在設(shè)定誤差模型可能存在設(shè)定誤差 ( (變量、函數(shù)形式的設(shè)定不準(zhǔn)確)變量、函數(shù)形式的設(shè)定不準(zhǔn)確)例例如如, ,未取得數(shù)據(jù)未取得數(shù)據(jù)的已知影響因素的已知影響因素 ( (數(shù)據(jù)欠缺而舍棄數(shù)據(jù)欠缺而舍棄) ) 模型中變量可能存在觀測誤差模型中變量可能存在觀測誤差 ( (變量數(shù)據(jù)不符合實際變量數(shù)據(jù)不符合實際) )如果包括了衍生性因素如果包括了衍生性因素, ,模型可能是不適當(dāng)?shù)哪P涂赡苁遣贿m當(dāng)?shù)? (這需要專門討論這需要專門討論)! )!22iu四、樣本回歸函數(shù)四、樣本回歸函

29、數(shù)(SRF)通常總體變量的每個觀測值實際上無法取得,只可能獲得某些樣通常總體變量的每個觀測值實際上無法取得,只可能獲得某些樣本觀測值,可以通過樣本觀測值去確定樣本回歸函數(shù)本觀測值,可以通過樣本觀測值去確定樣本回歸函數(shù).樣本回歸線:樣本回歸線: 對于對于X的一定值,取得的一定值,取得Y 的的樣本觀測值樣本觀測值,可計算其條件,可計算其條件 均值,樣本觀測值條件均值的軌跡,稱為樣本回歸線。均值,樣本觀測值條件均值的軌跡,稱為樣本回歸線。樣本回歸函數(shù):樣本回歸函數(shù):如果把被解釋變量如果把被解釋變量Y的樣本條件的樣本條件均值均值 表示為解釋變量表示為解釋變量X的某種的某種函數(shù),這個函數(shù)稱為樣本回歸函函

30、數(shù),這個函數(shù)稱為樣本回歸函數(shù)(數(shù)(SRF)。)。 23XYiYiYiXSRF24 將樣本條件均值表現(xiàn)為解釋變量的函數(shù),樣本回歸函數(shù)如果為將樣本條件均值表現(xiàn)為解釋變量的函數(shù),樣本回歸函數(shù)如果為 線性函數(shù),可表示為線性函數(shù),可表示為 其中:其中: 是與是與 相對應(yīng)的相對應(yīng)的 Y 的樣本條件均值的樣本條件均值 和和 分別是樣本回歸函數(shù)的參數(shù)分別是樣本回歸函數(shù)的參數(shù) 個別值(實際值)形式:個別值(實際值)形式: 被解釋變量被解釋變量Y的實際觀測值的實際觀測值 不完全等于樣本條件均值不完全等于樣本條件均值 , 二者之差用二者之差用 表示,表示, 稱為稱為剩余項剩余項或或殘差項殘差項: 則則 或或 12i

31、iYXiY12iYieiiieYY12iiiYXeiXie樣本回歸函數(shù)的表現(xiàn)形式樣本回歸函數(shù)的表現(xiàn)形式iY條件均值形式:條件均值形式:樣本回歸函數(shù)樣本回歸函數(shù)的特點的特點樣本回歸線是隨抽樣波動而變化的樣本回歸線是隨抽樣波動而變化的:每次抽樣都能獲得一個樣本,就可以擬合一條樣本回歸每次抽樣都能獲得一個樣本,就可以擬合一條樣本回歸線,線,(SRF不唯一)不唯一) Y SRF1 SRF2 樣本回歸函數(shù)的函數(shù)形式樣本回歸函數(shù)的函數(shù)形式應(yīng)與所設(shè)定的總體回歸函數(shù)的應(yīng)與所設(shè)定的總體回歸函數(shù)的函數(shù)形式一致。函數(shù)形式一致。 X 樣本回歸線只是樣本條件均值的軌跡,還不是總體回歸樣本回歸線只是樣本條件均值的軌跡,還

32、不是總體回歸 線,它至多只是未知的總體回歸線的近似表現(xiàn)。線,它至多只是未知的總體回歸線的近似表現(xiàn)。25樣本回歸函數(shù)與總體回歸函數(shù)的關(guān)系樣本回歸函數(shù)與總體回歸函數(shù)的關(guān)系 SRF PRF A X 26iYYiYiY()iiE Y XieiuiX總體回歸函數(shù)總體回歸函數(shù)樣本回歸函數(shù)樣本回歸函數(shù)12iiiiiieeYYYX12()iiiiiiiYYYuEuXX對樣本回歸的理解對樣本回歸的理解 如果能夠通過某種方式獲得如果能夠通過某種方式獲得 和和 的數(shù)值,顯然的數(shù)值,顯然: 和和 是對總體回歸函數(shù)參數(shù)是對總體回歸函數(shù)參數(shù) 和和 的估計的估計 是對總體條件期望是對總體條件期望 的估計的估計 在概念上類似

33、總體回歸函數(shù)中的在概念上類似總體回歸函數(shù)中的 ,可視,可視 為對為對 的估計的估計(有時也記為有時也記為 )。27對比:對比: 總體回歸函數(shù)總體回歸函數(shù) 樣本回歸函數(shù)樣本回歸函數(shù)12iYieiuiu12()iiE Y X121212()()iiiiiiiiiiE Y XXE Y XYYuuX其中1212iiiiiiiYXYYXeeY其中iu28 目的: 計量經(jīng)濟分析的計量經(jīng)濟分析的目標(biāo)是尋求總體回歸函數(shù)目標(biāo)是尋求總體回歸函數(shù)。即用樣本回即用樣本回歸函數(shù)歸函數(shù)SRF去估計總體回歸函數(shù)去估計總體回歸函數(shù)PRF。 由于樣本對總體總是存在代表性誤差,由于樣本對總體總是存在代表性誤差,SRF 總會過高總

34、會過高或過低估計或過低估計PRF。要解決的問題是什么要解決的問題是什么? 需要尋求一種規(guī)則和方法,使其得到的需要尋求一種規(guī)則和方法,使其得到的SRF的參數(shù)的參數(shù) 和和 能盡可能能盡可能“接近接近”總體回歸函數(shù)中的參數(shù)總體回歸函數(shù)中的參數(shù) 和和 的真的真實值。實值。 這樣的這樣的“規(guī)則和方法規(guī)則和方法”有很多種,如矩估計、極大似有很多種,如矩估計、極大似然估計、最小二乘估計等。其中最常用的是最小二乘法。然估計、最小二乘估計等。其中最常用的是最小二乘法。11212回歸分析的目的回歸分析的目的第二節(jié)第二節(jié) 簡單線性回歸模型的最小二乘估計簡單線性回歸模型的最小二乘估計用樣本去估計總體回歸函數(shù),總要使用

35、特定的方法,而任用樣本去估計總體回歸函數(shù),總要使用特定的方法,而任何估計參數(shù)的方法都需要有一定的前提條件何估計參數(shù)的方法都需要有一定的前提條件假定條件假定條件 一、一、簡單線性回歸的基本假定簡單線性回歸的基本假定 為什么要作基本假定?為什么要作基本假定? 只有具備一定的假定條件,所作出的估計才具有良好只有具備一定的假定條件,所作出的估計才具有良好的的統(tǒng)計性質(zhì)統(tǒng)計性質(zhì)。(估計的參數(shù)才能估計的參數(shù)才能盡可能地接近盡可能地接近總體參數(shù)真實值總體參數(shù)真實值) 因為模型中有隨機擾動項,估計的參數(shù)是隨機變量,因為模型中有隨機擾動項,估計的參數(shù)是隨機變量,顯然參數(shù)估計值的分布與擾動項的分布有關(guān),只有對顯然參

36、數(shù)估計值的分布與擾動項的分布有關(guān),只有對隨機擾動的分布作出假定,才能比較方便地隨機擾動的分布作出假定,才能比較方便地確定所估確定所估計參數(shù)的分布性質(zhì)計參數(shù)的分布性質(zhì),也才可能進行,也才可能進行假設(shè)檢驗和區(qū)間估假設(shè)檢驗和區(qū)間估計計等統(tǒng)計推斷等統(tǒng)計推斷。假定分為:假定分為:對模型和變量的假定對模型和變量的假定對隨機擾動項的假定對隨機擾動項的假定 291. 1.對模型和變量的假定對模型和變量的假定例如對于例如對于要得到模型中的參數(shù)較理想的估計結(jié)果,需要一些前提:要得到模型中的參數(shù)較理想的估計結(jié)果,需要一些前提:假定模型設(shè)定是正確的(變量和模型假定模型設(shè)定是正確的(變量和模型無設(shè)定誤差)無設(shè)定誤差)假

37、定解釋變量假定解釋變量X在重復(fù)抽樣中取固定值在重復(fù)抽樣中取固定值。 假定解釋變量假定解釋變量X是非隨機是非隨機的,或者雖然的,或者雖然X是隨機的,是隨機的, 但但與擾動項與擾動項u是不相關(guān)是不相關(guān)的。的。(從變量從變量X角度看是外生的角度看是外生的)注意注意: 解釋變量非隨機在自然科學(xué)的實驗研究中相對容易解釋變量非隨機在自然科學(xué)的實驗研究中相對容易滿足,而在經(jīng)濟領(lǐng)域中滿足,而在經(jīng)濟領(lǐng)域中, ,變量的觀測通常是被動不可控的,變量的觀測通常是被動不可控的,X X非隨機的假定并不一定都能滿足。非隨機的假定并不一定都能滿足。3012iiiYXu2.2.對隨機擾動項對隨機擾動項u u的假定的假定 假定假

38、定1 1:零均值假定零均值假定: 在給定在給定X的條件下,的條件下, 的條件期望為零的條件期望為零 假定假定2 2:同方差假定同方差假定: 在給定在給定X的條件下,的條件的條件下,的條件方差為某個常數(shù)方差為某個常數(shù) 31iu22)()(iiiiiXuEuEXuVariu()0iiE u X2iXX Y()iE Y X即:雖然即:雖然Y的條件期望會隨的條件期望會隨X而變化,但而變化,但Y對其條件期望的離散對其條件期望的離散程度保持不變程度保持不變!32 假定假定3 3:無自相關(guān)假定無自相關(guān)假定: 隨機擾動項隨機擾動項 的逐次值互不相關(guān)的逐次值互不相關(guān) 假定假定4 4:解釋變量解釋變量 是非隨機的

39、,或者雖然是非隨機的,或者雖然 是隨是隨機的但與擾動項機的但與擾動項 不相關(guān)不相關(guān) (從隨機擾動從隨機擾動 角度看角度看) iuiuiXiu( ,)( )()()0()ijiijjijCov u uE uE uuE uE uuij( ,)( )()0iiiiiiCov u XE uE uXE XiX233假定假定5:對隨機擾動項分布的對隨機擾動項分布的正態(tài)性假定正態(tài)性假定, 即假定即假定 服從均值為零、方差為服從均值為零、方差為 的正態(tài)分布的正態(tài)分布 (說明:說明:正態(tài)性假定并不影響對參數(shù)的點估計,所以有時不正態(tài)性假定并不影響對參數(shù)的點估計,所以有時不列入基本假定,但這對確定所估計參數(shù)的分布性

40、質(zhì)是需要的。列入基本假定,但這對確定所估計參數(shù)的分布性質(zhì)是需要的。且根據(jù)中心極限定理,當(dāng)樣本容量趨于無窮大時,且根據(jù)中心極限定理,當(dāng)樣本容量趨于無窮大時, 的分布的分布會趨近于正態(tài)分布。所以大樣本下正態(tài)性假定有其合理性)會趨近于正態(tài)分布。所以大樣本下正態(tài)性假定有其合理性)注意注意: :并不是參數(shù)估計的每一具體步驟都要用到所有的假定并不是參數(shù)估計的每一具體步驟都要用到所有的假定, ,但對全部假定先有完整的認(rèn)識但對全部假定先有完整的認(rèn)識, ,對學(xué)習(xí)計量經(jīng)濟學(xué)的原對學(xué)習(xí)計量經(jīng)濟學(xué)的原理是有益的。理是有益的。iuiu2( ,)iuN o在對在對 的基本假定下的基本假定下 Y Y 的分布性質(zhì)的分布性質(zhì)由

41、于由于其中的其中的 和和 是非隨機的,是非隨機的, 是隨機變量,因此是隨機變量,因此Y是隨機變量是隨機變量, 的分布性質(zhì)決定了的分布性質(zhì)決定了 的分布性質(zhì)。的分布性質(zhì)。 對對 的一些假定可以等價地表示為對的一些假定可以等價地表示為對 的假定:的假定: 假定假定1:零均值假定:零均值假定 假定假定2:同方差假定:同方差假定 假定假定3:無自相關(guān)假定:無自相關(guān)假定 假定假定5:正態(tài)性假定:正態(tài)性假定 34iuiiiuXY21iuiuiYiY212(,)iiYNXiiiXXYE21)(12, iX2()iiVar Y X( ,)0ijCov Y Yiu 二、普通最小二乘法普通最小二乘法(OLS) (

42、rdinary Least Squaresrdinary Least Squares)1. OLS的基本思想的基本思想對于對于 ,不同的估計方法可以得到不同的,不同的估計方法可以得到不同的樣本回歸參數(shù)樣本回歸參數(shù) 和和 ,由此所估計的,由此所估計的 也就不同。也就不同。理想的估計結(jié)果應(yīng)該使估計的理想的估計結(jié)果應(yīng)該使估計的 與真實的與真實的 之差之差(即剩即剩余余 )總的來說總的來說越小越好越小越好 (注意:并不是個別的并不是個別的 越小越好越小越好)3512iYiYieiY12iiYXieiYieieiYSRF1iXYXSRF2因因 可正可負(fù),總有可正可負(fù),總有 ,但,但我們關(guān)心的不是我們關(guān)心

43、的不是 的符號而是偏的符號而是偏離程度,即絕對值離程度,即絕對值ie0ie ieie36可是可是 不便于運算,可以取不便于運算,可以取 的平方的平方 ,尋求能夠使,尋求能夠使 最小的實際結(jié)果。最小的實際結(jié)果。即即對于特定的樣本,由于樣本觀測值對于特定的樣本,由于樣本觀測值Y和和X是既定的,是既定的, 的大小實際上決定于的大小實際上決定于 和和 。( 和和 對應(yīng)于某樣本回歸線,即對應(yīng)于某樣本回歸線,即 實際決定于樣本回歸線實際決定于樣本回歸線)要解決的問題要解決的問題: 如何尋求能使如何尋求能使 最小的最小的 和和 。362ie22212minmin()min()iiiiieYYYX2ie122

44、ie12122ieieie2ie 2. 正規(guī)方程和估計式正規(guī)方程和估計式用克萊姆法則求解方程組,得到以觀測值表現(xiàn)的用克萊姆法則求解方程組,得到以觀測值表現(xiàn)的OLS估計量估計量: 372122()iiiiiiiXYXX YnXX222()iiiiiinX YXYnXX對對 取偏導(dǎo)數(shù)并令其為取偏導(dǎo)數(shù)并令其為0,可得正規(guī)方程,可得正規(guī)方程12212iiiiiiYnXX YXX21221212()20()20()()iiiiiiieXeYYXX 或整理得或整理得正規(guī)方程:正規(guī)方程:2212()iiieYX(兩邊同除兩邊同除n)0ie 12YX一些有意義的結(jié)論:一些有意義的結(jié)論:0iie X 38 為表

45、達得更加簡潔,或者可用離差形式的為表達得更加簡潔,或者可用離差形式的OLS估計量估計量: 容易證明容易證明由正規(guī)方程:由正規(guī)方程: 則則 注意:注意:其中:其中: 本課程中:凡是大寫的本課程中:凡是大寫的 和和 均表示觀測值;均表示觀測值; 凡是小寫的凡是小寫的 和和 均表示觀測值的離差均表示觀測值的離差而且由而且由 和和 得到得到樣本回歸函數(shù)可用離差形式寫為樣本回歸函數(shù)可用離差形式寫為 _12YXXXxiiYYyii用離差表現(xiàn)的用離差表現(xiàn)的OLSOLS估計式估計式2iiyxiiXY2112YXixiyiXiY_22_222()()()()iiiiiiiiiiiinX YXYXX YYx yx

46、nXXXX12YX2()iiYYXX 3. OLSOLS回歸線的數(shù)學(xué)性質(zhì)回歸線的數(shù)學(xué)性質(zhì) 可以證明可以證明:(見教材:(見教材P34P35證明,注意證明,注意:證明過程用到證明過程用到OLS原則和原則和 正規(guī)方程的結(jié)論,但與基本假定無關(guān)。這些性質(zhì)對很多結(jié)論的證明有用)正規(guī)方程的結(jié)論,但與基本假定無關(guān)。這些性質(zhì)對很多結(jié)論的證明有用) 剩余項剩余項 的均值為零的均值為零 OLS回歸線通過樣本均值回歸線通過樣本均值 估計值估計值 的均值等于實際觀測值的均值等于實際觀測值 的均值的均值 39ie0ieenYXXYiY12YXiY12121()iiXXYYnn(可由OLS第一個正規(guī)方程 直接得到)(由O

47、LS正規(guī)方程 兩邊同除n得到)12()0iiYX0ie 被解釋變量估計值被解釋變量估計值 與剩余項與剩余項 不相關(guān)不相關(guān) Cov(,)0iiY eiYie 解釋變量解釋變量 與剩余項與剩余項 不相關(guān)不相關(guān) ieiXCov(,)0iiX e由OLS正規(guī)方程有:1Cov(,)()()0iiiiiiieX eeeXneXXX12121Cov( ,)()()0()()()0iiiiiii iiiiiiiY eYeeee XYeenYYeYeYeX因為000iiieee X(注意:紅色的項都為0)12iiiYXe12iiYX對于對于41例例1:研究某市城鎮(zhèn)居民人均鮮蛋需求量研究某市城鎮(zhèn)居民人均鮮蛋需求量

48、Y(公斤公斤)與與人均可支配收入人均可支配收入X(元元,1980年不變價計年不變價計)的關(guān)系的關(guān)系設(shè)定模型設(shè)定模型: : 1995-2005年樣本數(shù)據(jù)樣本數(shù)據(jù):年份19951996199719981999200020012002200320042005Y14.414.414.414.717.016.318.018.518.219.317.1X847.3821.0884.2903.7984.11035.31200.91289.81432.91539.01633.611,16.57,1142.89,nYXtttuXY21224489.940.005858661.8iiix yx1216.570.0

49、05 1142.8910.60YX10.600.005ttYX這樣的估計結(jié)果是否令人滿意呢這樣的估計結(jié)果是否令人滿意呢?所估計參數(shù)是否接近總體的的真實參數(shù)呢所估計參數(shù)是否接近總體的的真實參數(shù)呢?計算計算:估計參數(shù):估計參數(shù):估計結(jié)果估計結(jié)果: :先明確幾點先明確幾點: : 由由OLSOLS估計有估計有 由由OLS估計量可以看出估計量可以看出 都都由可觀測的樣本值由可觀測的樣本值 和和 及樣本容量及樣本容量n唯一表示。唯一表示。 因存在抽樣波動,因存在抽樣波動,OLS估計估計 是隨機變量是隨機變量 OLS估計量是估計量是點估計量點估計量2122()iiiiiiiXYXX YnXX42iYiX22

50、2()iiiiiinX YXYnXXkk目的目的: : 分析分析OLSOLS估計是否符合估計是否符合“盡可能地接近總體參數(shù)真實盡可能地接近總體參數(shù)真實值值”的要求的要求? ?4. OLS4. OLS估計式的統(tǒng)計性質(zhì)估計式的統(tǒng)計性質(zhì)43參數(shù)估計量的優(yōu)劣需要有評價的標(biāo)準(zhǔn)參數(shù)估計量的優(yōu)劣需要有評價的標(biāo)準(zhǔn) 從估計的條件看從估計的條件看: :參數(shù)無法通過觀測直接確定,只能通過參數(shù)無法通過觀測直接確定,只能通過樣本去估計,但是樣本樣本去估計,但是樣本總體,而且存在抽樣波動總體,而且存在抽樣波動,參數(shù)估參數(shù)估計值不一定等于總體參數(shù)的真實值計值不一定等于總體參數(shù)的真實值。從估計方法看從估計方法看: : 參數(shù)估

51、計方法及所確定的估計式有可能不參數(shù)估計方法及所確定的估計式有可能不完備,不一定能得到總體參數(shù)的真實值,需要對方法作評價。完備,不一定能得到總體參數(shù)的真實值,需要對方法作評價。對各種估計方法的評價與選擇,需要有一定的評價標(biāo)準(zhǔn)。對各種估計方法的評價與選擇,需要有一定的評價標(biāo)準(zhǔn)。基本準(zhǔn)則:基本準(zhǔn)則:參數(shù)估計值應(yīng)參數(shù)估計值應(yīng)盡可能地接近盡可能地接近總體參數(shù)的真實值總體參數(shù)的真實值 怎樣才算怎樣才算“盡可能地接近盡可能地接近”總體參數(shù)的真實值呢?總體參數(shù)的真實值呢? 用統(tǒng)計語言表述用統(tǒng)計語言表述就是就是參數(shù)估計量應(yīng)具有的統(tǒng)計性質(zhì):參數(shù)估計量應(yīng)具有的統(tǒng)計性質(zhì): 無偏性、有效性、一致性無偏性、有效性、一致性

52、等。等。理論計量經(jīng)濟學(xué)主要討論參數(shù)估計量是否符合一定的準(zhǔn)則。理論計量經(jīng)濟學(xué)主要討論參數(shù)估計量是否符合一定的準(zhǔn)則。44 (1) 無偏性 前提:前提:重復(fù)抽樣重復(fù)抽樣中中估計方法固定估計方法固定、樣本數(shù)不變樣本數(shù)不變、由重復(fù)、由重復(fù)抽樣得到的觀測值抽樣得到的觀測值, ,可得一系列參數(shù)估計值可得一系列參數(shù)估計值 的分布稱為的分布稱為 的抽樣分布的抽樣分布如果如果 ,則稱則稱 是參數(shù)是參數(shù) 的無偏估計量,的無偏估計量,如果如果 ,則稱,則稱 是是有偏的估計,其偏倚為有偏的估計,其偏倚為 ( )E( )E偏倚=( )E 概 率 密 度 )(*E( )f)(*f偏倚估計值45 (2) (2)有效性有效性前

53、提:前提:樣本相同樣本相同、用、用不同的方法不同的方法估計參數(shù),可以找到若干估計參數(shù),可以找到若干 個不同的個不同的無偏估計無偏估計量,但抽樣分布的方差可能不同量,但抽樣分布的方差可能不同 目標(biāo)目標(biāo): 努力尋求其抽樣分布具有最小方差的估計量努力尋求其抽樣分布具有最小方差的估計量 既是無偏的同時又具有最小方差特性的估計量,稱為既是無偏的同時又具有最小方差特性的估計量,稱為有效有效 估計量。估計量。 概 率 密 度 估計值464646 (3) (3) 漸近性質(zhì)漸近性質(zhì)(大樣本性質(zhì))(大樣本性質(zhì))思想思想:當(dāng)樣本容量較小時,有時很難找到最佳無偏估計,需要考慮當(dāng)樣本容量較小時,有時很難找到最佳無偏估計

54、,需要考慮樣本擴大后的性質(zhì)(樣本擴大后的性質(zhì)(估計方法不變估計方法不變,樣本數(shù)逐步增大樣本數(shù)逐步增大)一致性:一致性: 當(dāng)樣本容量當(dāng)樣本容量 n 趨于無窮大時,如果估計量趨于無窮大時,如果估計量 依概率收斂于依概率收斂于 總體參數(shù)的真實值,就稱這個估計量總體參數(shù)的真實值,就稱這個估計量 是是 的一致估計量。的一致估計量。即即 (漸近無偏估計量是當(dāng)樣本容量變得足夠大時其偏倚趨于零的估計量)(漸近無偏估計量是當(dāng)樣本容量變得足夠大時其偏倚趨于零的估計量)漸近有效性:漸近有效性:當(dāng)樣本容量當(dāng)樣本容量 n 趨于無窮大時,在所有的一致趨于無窮大時,在所有的一致估計量中,具有最小的漸近方差。估計量中,具有最

55、小的漸近方差。1)(limPnP)lim(或或474747 概 率 密 度 估計值 100()f80( )f40()f20()f20一致性、漸近有效性一致性、漸近有效性40601、 線性特征線性特征 是是Y的線性函數(shù)的線性函數(shù) 2、 無偏特性無偏特性 可以證明可以證明 (證明見教材證明見教材P38) 4811()E222()()()iiiiiiiiiiXXYYx yk ykYXXxOLSOLS估計量的統(tǒng)計性質(zhì)估計量的統(tǒng)計性質(zhì)高斯定理高斯定理2iiixkxk12YXiiYXkY1()iiXk Yn(注意(注意: 無偏性的證明中用到了基本假定中無偏性的證明中用到了基本假定中 零均值等假定)零均值等

56、假定)kiu22()E3、有效性有效性(最小方差特性)最小方差特性)(證明見教材證明見教材P68附錄附錄21)可以證明:在所有的線性無偏估計中,可以證明:在所有的線性無偏估計中,OLS估計估計 具具有最小方差有最小方差(注意(注意:最小方差性的證明中用到了基本假定中的同方差、無自最小方差性的證明中用到了基本假定中的同方差、無自 相關(guān)等假定)相關(guān)等假定)結(jié)論結(jié)論(高斯定理)(高斯定理): 在古典假定條件下,在古典假定條件下,OLSOLS估計量是最佳線性無偏估計量是最佳線性無偏估計量(估計量(BLUEBLUE) (注意注意: :古典假定是古典假定是BLUEBLUE的前提)的前提)49k 第三節(jié)第三

57、節(jié) 擬合優(yōu)度的度量擬合優(yōu)度的度量概念概念:樣本回歸線是對樣本數(shù)據(jù)的一種擬合。樣本回歸線是對樣本數(shù)據(jù)的一種擬合。不同的模型(不同函數(shù)形式不同的模型(不同函數(shù)形式)可擬可擬合出不同的樣本回歸線合出不同的樣本回歸線相同的模型用不同方法去估計參相同的模型用不同方法去估計參數(shù),也可以擬合出不同的回歸線數(shù),也可以擬合出不同的回歸線擬合的回歸線與樣本觀測值總是有偏離。樣本回歸線擬合的回歸線與樣本觀測值總是有偏離。樣本回歸線對樣本觀測數(shù)據(jù)擬合的優(yōu)劣程度,可對樣本觀測數(shù)據(jù)擬合的優(yōu)劣程度,可稱為稱為擬合優(yōu)度擬合優(yōu)度。如何評價樣本回歸線對樣本數(shù)據(jù)的擬合程度呢如何評價樣本回歸線對樣本數(shù)據(jù)的擬合程度呢?需要對擬合優(yōu)度加

58、以具體的度量。需要對擬合優(yōu)度加以具體的度量。對擬合優(yōu)度的度量可以建立在對對擬合優(yōu)度的度量可以建立在對 Y 的總變差分解的基礎(chǔ)上的總變差分解的基礎(chǔ)上50XY 一、總變差的分解一、總變差的分解 分析分析Y的觀測值的觀測值 、估計值、估計值 與平均值與平均值 有以下關(guān)系有以下關(guān)系 將上式兩邊平方加總,可證得將上式兩邊平方加總,可證得(提示:交叉項(提示:交叉項 ) (TSS) (ESS) (RSS) 或者表示為或者表示為總變差總變差 (TSS):被解釋變量:被解釋變量Y的觀測值與其平均值的離差平的觀測值與其平均值的離差平 方和方和(總平方和)(總平方和)(說明說明 Y 的總變動程度)的總變動程度)解

59、釋了的變差解釋了的變差 (ESS):被解釋變量:被解釋變量Y的估計值與其平均值的的估計值與其平均值的 離差平方和離差平方和(回歸平方和)(回歸平方和)(由回歸作出說明的由回歸作出說明的 Y 的總變動程度)的總變動程度)剩余平方和剩余平方和 (RSS):被解釋變量觀測值與估計值之差的平方:被解釋變量觀測值與估計值之差的平方 和和(未解釋的平方和)(未解釋的平方和)(沒有被回歸作出說明的沒有被回歸作出說明的 Y 的總變動程度)的總變動程度)51()()()iiiiiiiYYYYYYYYYY222()()()iiiiYYYYYY2iy222iiiyye2ie()0iiYY e2iyiYiYY 52i

60、YYiXSRF變差分解的圖示變差分解的圖示(以某一個觀測值為例以某一個觀測值為例)()iiYYy 來自回歸()iiiYYe=來自殘差()iiYYy 變差iYiY()iiiYYYeY222iiiyye對于某一個觀測值對于某一個觀測值對于所有的觀測值對于所有的觀測值 XY 二、可決系數(shù)二、可決系數(shù) 以以TSS同除總變差等式同除總變差等式 兩邊:兩邊: 或或 定義:定義:回歸平方和(解釋了的變差回歸平方和(解釋了的變差ESS) 在總變在總變 差(差(TSS) 中所占的比重稱為可決系數(shù),用中所占的比重稱為可決系數(shù),用 或或 表示表示: 532iy2r2iy222iyRy2221iieRy 22221i

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論