![計量經(jīng)濟(jì)學(xué)ppt課件(完整版)_第1頁](http://file4.renrendoc.com/view/ad9d5aac917c3146d474ee9bba3d4723/ad9d5aac917c3146d474ee9bba3d47231.gif)
![計量經(jīng)濟(jì)學(xué)ppt課件(完整版)_第2頁](http://file4.renrendoc.com/view/ad9d5aac917c3146d474ee9bba3d4723/ad9d5aac917c3146d474ee9bba3d47232.gif)
![計量經(jīng)濟(jì)學(xué)ppt課件(完整版)_第3頁](http://file4.renrendoc.com/view/ad9d5aac917c3146d474ee9bba3d4723/ad9d5aac917c3146d474ee9bba3d47233.gif)
![計量經(jīng)濟(jì)學(xué)ppt課件(完整版)_第4頁](http://file4.renrendoc.com/view/ad9d5aac917c3146d474ee9bba3d4723/ad9d5aac917c3146d474ee9bba3d47234.gif)
![計量經(jīng)濟(jì)學(xué)ppt課件(完整版)_第5頁](http://file4.renrendoc.com/view/ad9d5aac917c3146d474ee9bba3d4723/ad9d5aac917c3146d474ee9bba3d47235.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、計量經(jīng)濟(jì)學(xué)ECONOMETRICS第一章 概 述1.1 什么是計量經(jīng)濟(jì)學(xué)?1930年12月29日,在耶魯大學(xué)經(jīng)濟(jì)學(xué)家歐文費(fèi)雪(Irving Fisher)和挪威經(jīng)濟(jì)學(xué)家弗里希(Ragnar Frisch)的倡議下,計量經(jīng)濟(jì)學(xué)會(Econometric Society)在美國俄亥俄州克里夫蘭成立,由弗里希擔(dān)任主編的計量經(jīng)濟(jì)學(xué)會的刊物計量經(jīng)濟(jì)學(xué)學(xué)刊(Econometrica)于1933年創(chuàng)刊。1一般認(rèn)為,計量經(jīng)濟(jì)學(xué)會的成立,標(biāo)志著計量經(jīng)濟(jì)學(xué)作為經(jīng)濟(jì)學(xué)的一門獨(dú)立學(xué)科被正式確定。 1 http:/.在計量經(jīng)濟(jì)學(xué)學(xué)刊創(chuàng)刊號上 ,弗里希進(jìn)一步指出:“但經(jīng)濟(jì)學(xué)中的數(shù)量方法有幾個方面,不應(yīng)該將其中任何一個單方
2、面與計量經(jīng)濟(jì)學(xué)相混淆。計量經(jīng)濟(jì)學(xué)與經(jīng)濟(jì)統(tǒng)計學(xué)絕非一碼事;它也不同于我們所說的一般經(jīng)濟(jì)理論,盡管經(jīng)濟(jì)理論具有明顯的數(shù)量特征;計量經(jīng)濟(jì)學(xué)也不應(yīng)被看成是數(shù)學(xué)在經(jīng)濟(jì)學(xué)中的應(yīng)用。經(jīng)驗(yàn)表明,統(tǒng)計學(xué)、經(jīng)濟(jì)理論和數(shù)學(xué)這三方面對于要真正理解現(xiàn)代經(jīng)濟(jì)生活的數(shù)量關(guān)系來說,都是必要的,但沒有哪一個方面是足夠的,這三者結(jié)合起來才是力量,這種結(jié)合便構(gòu)成了計量經(jīng)濟(jì)學(xué)?!?1 http:/.1.2 計量經(jīng)濟(jì)學(xué)是一門獨(dú)立的經(jīng)濟(jì)學(xué)科一、計量經(jīng)濟(jì)學(xué)與其他學(xué)科的不同經(jīng)濟(jì)理論主要是根據(jù)邏輯推理得出結(jié)論,說明研究經(jīng)濟(jì)現(xiàn)象的本質(zhì)和規(guī)律,大多數(shù)是定性的。經(jīng)濟(jì)理論所涉及到的數(shù)量關(guān)系也都是確定的,并不能給出具體的數(shù)值度量。 計量經(jīng)濟(jì)學(xué)所要研究的
3、就是如何估計這個具體的數(shù)值,并且計量經(jīng)濟(jì)學(xué)所研究的數(shù)量關(guān)系不是確定的變量關(guān)系而是隨機(jī)變量關(guān)系。數(shù)理經(jīng)濟(jì)學(xué)是要用數(shù)學(xué)形式來表述經(jīng)濟(jì)理論 。計量經(jīng)濟(jì)學(xué)家就是把數(shù)理經(jīng)濟(jì)學(xué)家提出來的數(shù)學(xué)方程式(公式)改造成適合于經(jīng)驗(yàn)驗(yàn)證的形式。 這種從數(shù)學(xué)公式到計量經(jīng)濟(jì)學(xué)方程式(公式)的轉(zhuǎn)換需要許多的創(chuàng)造性和實(shí)際技巧。經(jīng)濟(jì)統(tǒng)計學(xué)主要是收集、加工并用圖表的形式來體現(xiàn)經(jīng)濟(jì)數(shù)據(jù)。 計量經(jīng)濟(jì)學(xué)根據(jù)需要的原始資料進(jìn)行參數(shù)估計,驗(yàn)證經(jīng)濟(jì)理論。 二、計量經(jīng)濟(jì)學(xué)在經(jīng)濟(jì)學(xué)中的地位克萊因(Lawrence R. Klein)認(rèn)為:“計量經(jīng)濟(jì)已經(jīng)在經(jīng)濟(jì)學(xué)科中居于重要的地位”,“大多數(shù)大學(xué)的學(xué)院中,計量經(jīng)濟(jì)學(xué)的講授已經(jīng)成為經(jīng)濟(jì)學(xué)課程表中最有
4、權(quán)威的一部分”。薩繆爾森甚至認(rèn)為:“第二次世紀(jì)大戰(zhàn)后的經(jīng)濟(jì)學(xué)是計量經(jīng)濟(jì)學(xué)的時代”。從1969年諾貝爾經(jīng)濟(jì)學(xué)設(shè)立到2012年,共有71位經(jīng)濟(jì)學(xué)家獲獎,覆蓋了經(jīng)濟(jì)學(xué)各分支學(xué)科分支學(xué)科,直接因?qū)τ嬃拷?jīng)濟(jì)學(xué)的創(chuàng)立和發(fā)展作出貢獻(xiàn)而獲獎的經(jīng)濟(jì)學(xué)家達(dá)12人,居經(jīng)濟(jì)學(xué)個分支學(xué)科之首(詳見附錄1.1)。 三、計量經(jīng)濟(jì)學(xué)有自己獨(dú)特的研究經(jīng)濟(jì)問題的方法首先,計量經(jīng)濟(jì)學(xué)要根據(jù)觀測(observational)數(shù)據(jù)而不是實(shí)驗(yàn)(experimental)數(shù)據(jù)來建立模型。 其次,從建立與應(yīng)用計量經(jīng)濟(jì)學(xué)模型的全過程來看,理論模型的設(shè)定和樣本數(shù)據(jù)的收集,都必須對經(jīng)濟(jì)理論和所要研究的經(jīng)濟(jì)現(xiàn)象有深刻的認(rèn)識。所購建的計量經(jīng)濟(jì)學(xué)模型必
5、須與實(shí)際經(jīng)濟(jì)現(xiàn)象和經(jīng)濟(jì)理論相符合,否則,模型將毫無意義。這一點(diǎn)正是為什么說計量經(jīng)濟(jì)學(xué)不是數(shù)學(xué)或數(shù)學(xué)在經(jīng)濟(jì)學(xué)上的應(yīng)用,而是經(jīng)濟(jì)學(xué)的理由。最后,計量經(jīng)濟(jì)學(xué)在某種角度是一門綜合方法論學(xué)科,其核心內(nèi)容是模型參數(shù)估計方法,但是,在整個計量經(jīng)濟(jì)學(xué)的分析中,涉及到各種方法與思想。這也恰恰是讓學(xué)習(xí)者感覺到這門學(xué)科難以掌握、不是很系統(tǒng)的原因所在 。1.3 計量經(jīng)濟(jì)學(xué)方法論什么是計量經(jīng)濟(jì)學(xué)方法論呢?實(shí)際上,就是計量經(jīng)濟(jì)學(xué)家們對一個經(jīng)濟(jì)問題到底是怎么分析的呢?使用什么樣的方法呢?計量經(jīng)濟(jì)學(xué)的思想方法有若干派別,我們這里講的主要是至今仍在經(jīng)濟(jì)學(xué)及其他社會和行為科學(xué)領(lǐng)域研究中占主導(dǎo)地位的傳統(tǒng)或經(jīng)典方法論。一、在理論和假
6、說的基礎(chǔ)上建立計量經(jīng)濟(jì)學(xué)模型凱恩斯(John Maynard Keynes)在就業(yè)、利息和貨幣通論中說,存在一條基本的心理規(guī)律:通?;蚱骄?,人們傾向于隨著他們收入的增加而增加其消費(fèi),但是消費(fèi)的增加不如收入增加那么多。消費(fèi)與收入的這種關(guān)系被稱作消費(fèi)函數(shù)或消費(fèi)傾向。那么,增加的消費(fèi)與增加的收入之比率,也就是說增加的1單位收入中用于增加消費(fèi)部分的比率,稱為邊際消費(fèi)傾向(marginal propensity to consume, MPC)。 邊際消費(fèi)傾向的公式是: 表示增加的消費(fèi), 表示增加的收入; 代表消費(fèi), 代表收入。如果我們把消費(fèi)和收入之間的關(guān)系看成函數(shù)關(guān)系,那么就可以建立一個函數(shù)方程來
7、: (1.3.1)根據(jù)微積分的知識,我們知道MPC實(shí)際上就是函數(shù)的導(dǎo)數(shù),即可以寫成:凱恩斯設(shè)想,邊際消費(fèi)傾向MPC是大于零小于1的。進(jìn)一步,我們可以看到凱恩斯假設(shè)的消費(fèi)與收入之間的關(guān)系是正向關(guān)系,但他并沒有明確指出二者之間準(zhǔn)確的函數(shù)關(guān)系。 為了簡單起見,數(shù)理經(jīng)濟(jì)學(xué)家建立了一個如下的凱恩斯消費(fèi)函數(shù)(consumption function): (1.3.2)其中, 代表消費(fèi), 代表收入,而 和 分別表示截距(intercept)和斜率(slope)方程(1.3.2)的幾何意義是一條直線,見圖1.1。這種函數(shù)關(guān)系,我們稱為線性關(guān)系,即消費(fèi)與收入之間的關(guān)系是線性關(guān)系。圖1.1 凱恩斯消費(fèi)函數(shù)1現(xiàn)在來
8、定義一些概念和說明一下計量經(jīng)濟(jì)學(xué)模型建立的思想。1解釋變量與被解釋變量。2. 截距和斜率 、模型(model) 、模型參數(shù)(parameter) 3. “線性”的含義。 4在線性函數(shù)方程(1.3.2)中具有非常重要的意義。 5計量經(jīng)濟(jì)學(xué)模型建立的思想 。計量經(jīng)濟(jì)學(xué)模型方程(1.3.1)和方程(1.3.2)修改成如下的形式: (1.3.3) (1.3.4)變量 是一個隨機(jī)變量(random variable, stochastic variable),被稱為隨機(jī)干擾項(stochastic disturbance term)或隨機(jī)誤差項(stochastic error term)。二、統(tǒng)計數(shù)據(jù)
9、的獲得與參數(shù)估計1. 數(shù)據(jù)類型。時間序列數(shù)據(jù)(time series data)。截面數(shù)據(jù)(cross-section data)。 面板數(shù)據(jù)(panel data)。 2. 參數(shù)估計。 利用回歸分析(regression analysis)方法,得到參數(shù) 和 的估計值 。表1.1 1978-2011年間中國人均國內(nèi)生產(chǎn)總值與居民消費(fèi)水平數(shù)據(jù)(單位:元)年份人均國內(nèi)生產(chǎn)總值(X)居民消費(fèi)水平(Y)年份人均國內(nèi)生產(chǎn)總值(X)居民消費(fèi)水平(Y)197838123551979419 20819965846 27891980463 23819976420 3002198149
10、2 26419986796 31591982528 28819997159 33461983583 31620007858 36321984695 36120018622 3887 1985858 44620029398 4144 1986963 497200310542 4475 19871112 565200412336 5032 19881366 714200514185 5596 19891519 788200616500 6299 19901644 833200720169 7310 19911893 932200823708 8430 19922311 1116200925608
11、9283 19932998 1393201030015 10522 19944044 1833201135181 12272 圖1.2 1978-2011年間中國人均國內(nèi)生產(chǎn)總值與居民消費(fèi)水平的關(guān)系 和 的估計值分別為374.6882和0.350334。從而所估計的消費(fèi)函數(shù)是, (1.3.5)什么是“回歸”?什么是“回歸分析方法”?為什么估計出來的消費(fèi)函數(shù)變量Y頂上有帽(或尖)符號,并且和變量X一樣都有下標(biāo)符號t? 首先,計量經(jīng)濟(jì)模型(1.3.4)是一個隨機(jī)模型,因?yàn)橛须S機(jī)變量 的存在,但是,這個模型也是純隨機(jī)數(shù)學(xué)模型,因此,不可能寫成帶有具體數(shù)值的模型來; 其次,要寫成帶有具體數(shù)值,或者講,
12、帶有具體的參數(shù)數(shù)值的模型來,也就是說,把抽象的參數(shù)符號賦予具體的數(shù)值,就必須利用具體的數(shù)據(jù)來估計。因此,我們得到的 和 的數(shù)值是通過具體一組數(shù)據(jù)估計獲得的樣本。 方程(1.3.5)叫做樣本回歸函數(shù)(sample regression function, SRF)或樣本回歸方程(sample regression equation);圖1-2中所顯示出的直線稱為樣本回歸線(sample regression lines)。 樣本估計值用帽表示: 樣本回歸函數(shù)下標(biāo) 表示不同樣本觀測值。N個不同樣本,確定與隨機(jī)的關(guān)系。樣本函數(shù)一旦確定,對于某個樣本來講,這個樣本函數(shù)就是一個確定的、具體的函數(shù)關(guān)系。但
13、是同時因?yàn)闃颖颈旧淼碾S機(jī)性,參數(shù)又是隨機(jī)變量。 三、假設(shè)檢驗(yàn)首先,通過統(tǒng)計推斷(statistical inference)即假設(shè)檢驗(yàn)(hypothesis testing)來肯定或否定經(jīng)濟(jì)理論,這是本書最重要的內(nèi)容。其次,需要考慮的問題是:數(shù)據(jù)的選擇是不是有問題?建立的模型一定存在因果關(guān)系嗎?經(jīng)濟(jì)理論一定能夠得到模型驗(yàn)證嗎?建立的經(jīng)濟(jì)模型一定能夠發(fā)現(xiàn)新的經(jīng)濟(jì)理論呢?例如,在19世紀(jì)晚期,英國經(jīng)濟(jì)學(xué)家威廉姆斯坦利杰文斯(William Stanley Jevons)曾經(jīng)假設(shè)太陽黑子導(dǎo)致經(jīng)濟(jì)活動增加。 四、模型應(yīng)用如果所選擇的模型經(jīng)過驗(yàn)證肯定了所考慮的經(jīng)濟(jì)理論或假說,那么就可以根據(jù)模型來預(yù)測與預(yù)
14、報。比如根據(jù)樣本回歸方程(1.3.5)來預(yù)測2012年的居民消費(fèi)水平。假設(shè)2012年人均國內(nèi)生產(chǎn)總值為X=36000元,代入方程(1.3.5)得到:圖1.3 計量經(jīng)濟(jì)學(xué)的研究過程經(jīng)濟(jì)理論數(shù)理模型計量經(jīng)濟(jì)模型參數(shù)估計模型應(yīng)用預(yù)測結(jié)構(gòu)分析政策制定驗(yàn)證理論數(shù)據(jù)假設(shè)檢驗(yàn)1.4 計量經(jīng)濟(jì)學(xué)的類型理論計量經(jīng)濟(jì)學(xué)(theoretical econometrics)和應(yīng)用計量經(jīng)濟(jì)學(xué)(applied econometrics)。 經(jīng)典計量經(jīng)濟(jì)學(xué)(classical econometrics)一般指20世紀(jì)70年代以前的計量經(jīng)濟(jì)學(xué),非經(jīng)典計量經(jīng)濟(jì)學(xué)(non-classical econometrics)或現(xiàn)代計量
15、經(jīng)濟(jì)學(xué)(modern econometrics),主要包括微觀計量經(jīng)濟(jì)學(xué)、非參數(shù)計量經(jīng)濟(jì)學(xué)、時間序列計量經(jīng)濟(jì)學(xué)和平行數(shù)據(jù)計量經(jīng)濟(jì)學(xué)。即經(jīng)典方法和貝葉斯方法(Bayesian)。宏觀計量經(jīng)濟(jì)學(xué)(Macroeconometrics)和微觀計量經(jīng)濟(jì)學(xué)(Microeconometrics) 1.5 預(yù)備知識和計量經(jīng)濟(jì)學(xué)軟件1. 宏觀經(jīng)濟(jì)學(xué)方面的基本知識。2. 數(shù)學(xué)方面。需要基本的微積分和線性代數(shù)方面的知識。 3. 統(tǒng)計學(xué)和數(shù)理統(tǒng)計方面。個體、總體、樣本、隨機(jī)變量、條件概率、數(shù)學(xué)期望、常見隨機(jī)變量分布、平均值、方差、標(biāo)準(zhǔn)差、協(xié)方差、相關(guān)系數(shù)、統(tǒng)計估計量、點(diǎn)估計、區(qū)間估計、參數(shù)估計、中心極限定理、小概率事
16、件、兩類錯誤、假設(shè)檢驗(yàn)等。 常用的計量經(jīng)濟(jì)學(xué)軟件很多。諸如EViews(Econometric Views)、TSP(Time Series Processor)、PcGIVE(Personal Computer, General Instrumental Variable Estimation)、FcFiml(Personal Computer, Full Instrument Maximum Likelihood Estimation)、RATS、Microfit、Mathematica、S-plus、Ox、ET、LIMDEP、SHAZAM、MINITAB、BMD、GUASS、STATA、
17、SPSS、SAS等。EViews 是目前世界上最流行的計量經(jīng)濟(jì)學(xué)軟件之一。1.6 進(jìn)一步學(xué)習(xí)建議古拉扎蒂. 計量經(jīng)濟(jì)學(xué)基礎(chǔ). 5版. 費(fèi)劍平譯. 北京:中國人民大學(xué)出版社,2011.威廉格林. 計量經(jīng)濟(jì)學(xué)分析. 6版. 張成思譯. 北京:中國人民大學(xué)出版社,2011.本章結(jié)束了!準(zhǔn)備好了嗎?下節(jié)課我們開始學(xué)習(xí)新課程!第二章 簡單線性回歸模型2.1 什么是“回歸”? “回歸”這個詞是由英國維多利亞時期博學(xué)科學(xué)家法蘭西斯高爾頓(Francis Galton)首先提出來的。法蘭西斯高爾頓在利用統(tǒng)計方法研究人類遺傳學(xué)中發(fā)現(xiàn),父母高,兒女也高;父母矮,兒女也矮,但是給定父母的身高,兒女輩的平均身高卻趨于
18、或者“回歸”到全體人口的平均身高,即“回歸于平均值”(regression toward the mean)。 另一位英國數(shù)理統(tǒng)計學(xué)家卡爾皮爾遜(Karl Pearson)發(fā)現(xiàn),對于父親高的群體,兒子輩的平均身高低于父輩的身高,而對于父親矮的群體,兒子輩的平均身高則高于父輩的身高。 兒子輩的身高“回歸”到男子的平均身高 。表2.1 模仿70對父子身高的調(diào)查結(jié)果(純假設(shè)構(gòu)造數(shù)據(jù),單位:厘米)父親兒子父親兒子父親兒子父親兒子父親兒子父親兒子父親兒子1531501531661651601651731781661781801901711531521531681651621651751781671781
19、811901721531541531711651631651771781681781831901731531561531721651651651801781701901601901751531581531731651661781561781721901621901771531591531751651671781581781731901641901781531601651551651681781601781741901651901801531621651561651701781611781751901671901821531631651571651711781631781761901691901
20、84153165165158165172178165178178190170190186圖2.1 給定父親身高后兒子輩身高的假設(shè)分布(Y代表兒子輩身高,X代表給定的父親身高,單位:厘米)表2.2 按照給定父親身高對兒子輩身高重新編排(單位:厘米)項目給定父親身高153165178190兒子輩身高15016315516715617216017215216515616815817316217315416615717016017416417515616815817116117516517715817116017216317616717815917216217316517816918016017316
21、3175166180170182162175165177167181171184166180168183186170平均值162.7166.4169.8172.6圖2.2 兒子輩身高的平均值連接成一條直線,這條直線就叫做回歸線 對回歸的現(xiàn)代理解已經(jīng)有了很大的不同,在計量經(jīng)濟(jì)學(xué)上所講的回歸,實(shí)際上,與所說的回歸分析(regression analysis)是一個意思。從狹義上講,回歸分析是指: 一個變量對另一個變量的依賴關(guān)系,在計量經(jīng)濟(jì)學(xué)上,就是指被解釋變量對解釋變量(一個或多個)的依賴關(guān)系(也可以說成統(tǒng)計依賴關(guān)系)。其用意在于通過后者的已知或設(shè)定值,去估計或預(yù)測前者的(總體)均值;或者,利用回
22、歸分析得到的樣本模型中的(總體)參數(shù)的估計值來解釋被解釋變量的經(jīng)濟(jì)意義,即經(jīng)濟(jì)結(jié)構(gòu)分析。例如第1章我們談到的凱恩斯消費(fèi)函數(shù)的計量經(jīng)濟(jì)模型, 人均國內(nèi)生產(chǎn)總和居民消費(fèi)水平數(shù)據(jù)作為樣本得到的樣本回歸模型 實(shí)際上 是一個隨機(jī)變量,而 也是隨機(jī)變量,但是在經(jīng)典計量經(jīng)濟(jì)學(xué)中,我們假定 不是隨機(jī)變量,也就是說,在不同的多個樣本抽取中取同樣一組數(shù)值。所謂的被解釋變量 與解釋變量 的依賴關(guān)系,往往含有因果關(guān)系的意思,也就是說,在經(jīng)濟(jì)理論假設(shè)(因果關(guān)系)的前提下,作為檢驗(yàn)經(jīng)濟(jì)理論的計量經(jīng)濟(jì)模型自然就存在著因果關(guān)系,這種因果方向是從 到 ,而不存在從 到 的因果關(guān)系。但是,這并不能說明被解釋變量 與解釋變量 本來
23、就存在因果關(guān)系。依賴關(guān)系的另一層含義 :用樣本模型中得到的對總體參數(shù)的估計值來解釋被解釋變量的經(jīng)濟(jì)意義,即經(jīng)濟(jì)結(jié)構(gòu)分析。廣義的回歸分析包括:根據(jù)樣本數(shù)據(jù)對計量經(jīng)濟(jì)模型參數(shù)進(jìn)行估計,得到樣本回歸方程;對回歸方程、參數(shù)估計值進(jìn)行顯著性假設(shè)檢驗(yàn);利用回歸方程進(jìn)行分析、評價及預(yù)測。2.2 總體回歸函數(shù)與樣本回歸函數(shù)一、隨機(jī)變量與統(tǒng)計學(xué)中一些基本概念回歸分析中,我們所談的統(tǒng)計依賴關(guān)系,是不確定的關(guān)系,即變量是隨機(jī)變量(random variable, stochastic variable)。農(nóng)作物收成對氣溫、降雨量、陽光、土壤質(zhì)量以及施肥量的關(guān)系。 影響農(nóng)作物收成的因素是復(fù)雜的、多樣的(不可辨認(rèn)的)。
24、 確定的關(guān)系萬有引力定律其中, , 為兩個物體的質(zhì)量 ,F(xiàn)為引力,G為比例常數(shù),r為距離。如何處理隨機(jī)變量問題?建立與隨機(jī)變量相關(guān)的模型呢?經(jīng)濟(jì)學(xué)家建立純數(shù)學(xué)模型: Q代表商品需求量,P代表商品價格,Ps代表替代品價格,Y代表可支配收入。數(shù)理經(jīng)濟(jì)學(xué)家建立線性模型:計量經(jīng)濟(jì)學(xué)家隨機(jī)模型:通過樣本估計得到具體的方程:在概率論與數(shù)理統(tǒng)計中,隨機(jī)變量的含義是指定義在樣本空間上具有一定概率分布的變量。也就是說,隨機(jī)變量是具有一定概率的不確定的變量。統(tǒng)計學(xué)中一些基本概念 :總體(population)是指包含所研究的全部個體(數(shù)據(jù))的集合;樣本或樣本空間(sample space)是指從總體中抽取的一部分
25、元素的集合,構(gòu)成樣本的元素的個數(shù)叫做樣本量(sample size)或樣本容量(sample capacity) 平均數(shù)也稱為均值(mean),是指變量值相加后除以變量個數(shù)得到的結(jié)果,記作,離差(deviation),是指變量值與均值之差,記作,方差(variance),是指各變量值與均值之差(離差)的平方的平均數(shù),記作 , ,標(biāo)準(zhǔn)差(standard error),是指方差的平方根,記作, ,數(shù)學(xué)期望(mathematical expectation)或期望(expectation),是指隨機(jī)變量平均取值大小,記作, ,協(xié)方差(covariance),是指兩個變量的離差乘積的數(shù)學(xué)期望,記作;
26、相關(guān)系數(shù)(correlation coefficient),是指兩個變量之間線性關(guān)系的一個度量,定義為: (2.2.1)樣本相關(guān)系數(shù)可以寫成如下形式 : (2.2.2)二、總體回歸函數(shù)(重新回到回歸的概念)例2.1 假想一個社區(qū)是由60戶家庭組成的總體(population),現(xiàn)在來研究該社區(qū)整體家庭每月家庭消費(fèi)與每月可支配收入之間的關(guān)系。 把60個家庭按照可支配收入水平不同分成10組(子總體),每組有不同個數(shù)的家庭組成,這樣,就有了10個固定的 值以及每個 值對應(yīng)著不同個數(shù)的 值。 項目每月家庭可支配收入X32004000480056006400720080008800960010400每月
27、家庭消費(fèi)支出Y220026003160320040804400480054005480600024002800336037204280460054405480580060802600296036003800440048005600560062007000280032003760412046405200576060806600712030003400392043204720540058006280700072003520452050005600640075607400460064807640共計13000184801780028280271203000027400417203864048440E
28、(YX)26003080356040404520500054805960 64406920表2.3 每月家庭可支配收入與消費(fèi)支出(單位:元)平均值或均值,也稱為條件均值或條件期望值(conditional expected values),用符號表示為,讀作“給定 值條件下 的期望值”。根據(jù)表2.4中的數(shù)據(jù)可以計算出,其中 =1,2,10, 表示給定的第 組家庭月可支配收入。 項目每月家庭可支配收入X32004000480056006400720080008800960010400條件概率P (YXi) 1/5 1/6 1/5 1/7 1/6 1/6 1/5 1/7 1/6 1/7 1/5 1
29、/6 1/5 1/7 1/6 1/6 1/5 1/7 1/6 1/7 1/5 1/6 1/5 1/7 1/6 1/6 1/5 1/7 1/6 1/7 1/5 1/6 1/5 1/7 1/6 1/6 1/5 1/7 1/6 1/7 1/5 1/6 1/5 1/7 1/6 1/6 1/5 1/7 1/6 1/7 1/6 1/7 1/6 1/6 1/7 1/6 1/7 1/7 1/7 1/7E(YX)26003080356040404520500054805960 64406920表2.4 與表2.3數(shù)據(jù)對應(yīng)的條件概率分布比如, =8000元,的概率分布為 Y 4800 5440 5600 5760
30、 5800 P (Y | Xi) 1/5 1/5 1/5 1/5 1/5需要指出的是:條件期望值與無條件期望值 (unconditional expected value)是不同的。現(xiàn)在把表2.3中的數(shù)據(jù),以 為橫軸,以 和 為縱軸,做出散點(diǎn)圖來,并將條件期望值 各點(diǎn)連接起來,就形成了一條直線,見圖2.3。我們把這條直線稱為總體回歸線(population regression line,PRL)或一般地稱為總體回歸曲線(population regression curve)?;蛘哒f, 對 的回歸(regression of on )。圖2.3 家庭可支配收入與家庭消費(fèi)支出的散點(diǎn)圖(E代表條
31、件期望值)圖2.3中的總體回歸線是一條直線,這不說明所有的總體回歸線都是直線,也可能是拋物線、指數(shù)曲線等其他曲線。 另外,我們假設(shè)對于每個 ,都有 值在其條件期望值左右的一定分布,而總體回歸線恰好是穿過這些條件期望或均值的直線或曲線。 對于每一個條件期望 都是 的函數(shù),其中 是 的某個給定值,可以寫成: (2.2.3)方程(2.2.3)稱為條件期望函數(shù)(conditional expectation function,CEF)或總體回歸函數(shù)(population regression function,PRF)或簡稱總體回歸(population regression,PR)。 一般情況下,我
32、們把總體回歸函數(shù)設(shè)為線性形式,即 (2.2.4)方程(2.2.4)稱為線性總體回歸函數(shù)(linear population regression function)或簡稱線性總體回歸(linear population regression)。 和 是未知但卻固定的參數(shù)。需要測算或估計出具體的數(shù)值 。在實(shí)際經(jīng)濟(jì)現(xiàn)象中,要全部掌握總體數(shù)據(jù)往往是比較困難的或者是不可能的 。被看成常數(shù) ?;貧w系數(shù)(regression coefficients) 模型參數(shù) 三、隨機(jī)誤差項與總體回歸函數(shù)隨機(jī)設(shè)定形式離差(個別值 ) (2.2.5) 是一個不可觀測的可正可負(fù)的隨機(jī)變量 。稱為隨機(jī)誤差項(stochast
33、ic error term)或隨機(jī)擾動項或隨即干擾項(stochastic disturbance term)。 也可以寫成 (2.2.6) (2.2.8)等價表示(一般的):等價表示(線性的):四個函數(shù) (2.2.3) (2.2.5) (2.2.4) (2.2.6)(2.2.5)和(2.2.6)稱為總體回歸函數(shù)隨機(jī)設(shè)定形式。(2.2.4)和(2.2.6)被稱為線性回歸模型(linear regression model,LRM)。確定函數(shù)形式隨機(jī)設(shè)定形式對于只有一個解釋變量的線性回歸模型也叫做一元線性回歸模型或簡單線性回歸模型(Simple linear regression model)。
34、簡單線性回歸模型圖2.4 給定 后 的分布以及隨機(jī)誤差項 的幾何表示 0隨機(jī)誤差項產(chǎn)生的原因:1由于經(jīng)濟(jì)理論的不完備,作為未知因素的代表。比如,每月家庭可支配收入對消費(fèi)支出的影響,還可以能存在眾多未知因素對消費(fèi)支出產(chǎn)生影響。2由于數(shù)據(jù)欠缺,作為無法取得數(shù)據(jù)的代表。比如,在收入對消費(fèi)的影響中,我們很清楚家庭財富對消費(fèi)支出有很大的影響,但不幸的是,一般很難得到家庭財富的信息。3由于忽略了一些影響微小的因素,作為眾多微小影響因素的代表。比如,在家庭收入與消費(fèi)的例子中,除了收入之外,還有家庭的子女?dāng)?shù)、性別、宗教、教育和地區(qū)也是影響因素,但是這些影響因素很微小,如果一一收集數(shù)據(jù)并引入模型是劃不來的,因此
35、,只能把這些眾多微小影響因素當(dāng)作隨機(jī)變量處理。4作為數(shù)據(jù)觀測誤差的代表。一是由于主客觀的原因,在取得觀測數(shù)據(jù)時往往存在測量誤差和登記誤差;二是有些數(shù)據(jù)難以直接觀測,必須采取替代變量而產(chǎn)生誤差。5作為模型設(shè)定錯誤的代表。比如在研究家庭收入與消費(fèi)之間的關(guān)系時,我們設(shè)定了簡單線性模型,但是,實(shí)際上收入與消費(fèi)的關(guān)系也許并非是線性的,并且影響消費(fèi)的解釋變量也不僅有收入,所以模型的正確性還有待進(jìn)一步研究。6人類行為以及經(jīng)濟(jì)現(xiàn)象內(nèi)在的隨機(jī)性。即使把所有的因素全部納入模型中,人的行為以及所從事的經(jīng)濟(jì)活動還是可能存在不可重復(fù)性和隨機(jī)性,即所謂變量的“內(nèi)在”隨機(jī)性。四、樣本回歸函數(shù)表2.5 表2.3中的兩組樣本數(shù)
36、據(jù)第一組樣本數(shù)據(jù)第二組樣本數(shù)據(jù)YXYX280032002200320026004000352040003600480036004800380056003200560044006400472064004600720048007200480080005800800056008800540088006200960058009600600010400700010400樣本回歸線Y1,Y2圖2.5 從表2.3中獲取的兩組樣本數(shù)據(jù)(表2.5)的散點(diǎn)圖圖2.6 表2.3中數(shù)據(jù)的總體回歸線與樣本回歸線一般地, (2.2.10)稱為樣本回歸函數(shù)(sample regression function,SRF) 。
37、 是 的估計量; 是 的估計量; 是 的估計量。 是回歸線上與 相對應(yīng)的 的條件均值的估計 ,與 的個別值 離差為 (2.2.11 )或 (2.2.12)方程(2.2.12)稱為樣本回歸函數(shù)的隨機(jī)設(shè)定形式,其中, 稱為剩余項或殘差(residual),是隨機(jī)誤差項 的估計量。 因此,也可以說,回歸分析就是用樣本回歸函數(shù)SRF的方程來估計總體回歸函數(shù)PRF的方程。注意,估計量(estimator),又稱樣本統(tǒng)計量(statistic)與估計值的區(qū)別。由估計量算出的具體數(shù)值,稱為估計值(estimate,estimated value)。估計量是一個隨機(jī)變量,估計值是一個具體的數(shù)值。 和 即可看作
38、估計值,也可看作估計量,當(dāng)看作估計量時,是隨機(jī)變量,樣本函數(shù)也變成了隨機(jī)關(guān)系。為什么?估計量 即可看作估計值,也可看成隨機(jī)變量。為什么?五、總體回歸函數(shù)與樣本回歸函數(shù)的關(guān)系設(shè)定總體回歸函數(shù),再用樣本回歸函數(shù)來估計總體回歸函數(shù),這是計量經(jīng)濟(jì)學(xué)基本的思想方法。第一,怎么樣建立樣本回歸函數(shù)呢?第二,由于樣本的不同,得到的樣本回歸函數(shù)也不一樣,那么,哪一個樣本回歸函數(shù)更好呢?也就是說,哪一個樣本回歸函數(shù)更“接近”真實(shí)的總體回歸函數(shù)呢?4個方程 (2.2.4) (2.2.9 ) (2.2.10) (2.2.12) 前兩個方程是關(guān)于總體回歸函數(shù)的,方程(2.2.9)是隨機(jī)設(shè)定形式。后兩個方程是關(guān)于樣本回歸
39、函數(shù)的,方程(2.2.12)是隨機(jī)設(shè)定形式。 方程(2.2.4)與方程(2.2.10)對應(yīng);方程(2.2.9)與方程(2.2.12)對應(yīng) 。方程(2.2.10)是用來估計在給定 后 的條件均值,即所謂總體回歸線;而方程(2.2.12)是用來估算 的個別值 。方程(2.2.12)的真正意義是:用 來估計 ,即用樣本估計總體所產(chǎn)生的誤差,這是 被稱為殘差的真實(shí)意義所在。方程(2.2.4)是總體回歸函數(shù)的確定表示形式,方程(2.2.9)是總體回歸函數(shù)的隨機(jī)表示形式,也就是說,前者是確定的函數(shù)關(guān)系,后者是隨機(jī)的函數(shù)關(guān)系。那么,顯然 是隨機(jī)變量,從而 也是隨機(jī)變量。方程(2.2.10)是樣本回歸函數(shù)的確
40、定表示形式,方程(2.2.12)是樣本回歸函數(shù)的隨機(jī)設(shè)定形式 。如何正確理解?某個樣本條件下,確定關(guān)系;大量樣本條件下,統(tǒng)計關(guān)系隨機(jī)關(guān)系。圖2.7 總體回歸函數(shù)與樣本回歸函數(shù)的關(guān)系SRF: 0A從圖2.7中,我們看到:SRF在PRF上方時,是高估;SRF在PRF下方時,是低估。2.3 模型參數(shù)估計:普通最小二乘法 一般常用的方法有兩種:普通最小二乘法(ordinary least squares,OLS)極大似然法(maximum likelihood,ML)。普通最小二乘法應(yīng)用最為廣泛,因此,本書只介紹該方法以及其演變形式加權(quán)最小二乘法(weighted least squares,WLS)
41、。一、普通最小二乘法OLS普通最小二乘法是由德國數(shù)學(xué)家高斯(Carl Friedrich Gauss)提出 由于 可以取正負(fù)值,最后會抵消,因此,選擇最小二乘法:讓殘差平方和最小,即進(jìn)一步寫成: (2.3.1)把上式的殘差平方和看成為自變量為 和的二元函數(shù) ,根據(jù)微積分知識,在偏導(dǎo)數(shù)都等于零的條件下,函數(shù)取極大值。 對參數(shù) 和 分別求偏導(dǎo)數(shù),并令方程為零。 (2.3.2)(2.3.3)整理得正規(guī)方程(normal equations )為: (2.3.4) (2.3.5)解正規(guī)方程得到參數(shù)估計值為: (2.3.6) (2.3.7)進(jìn)一步簡化為離差形式: (2.3.8) (2.3.9)離差形式簡
42、單、方便運(yùn)算和推導(dǎo)。 下面給出一些方便使用的等價公式來。1) (2.3.10)2) (2.3.11)3) (2.3.12)4) (2.3.13)5) (2.3.14)用離差形式(deviation form)表達(dá)樣本回歸函數(shù)和總體回歸函數(shù): (2.3.15) (2.3.16)注意:沒有截距項。 或者二、OLS回歸線的純數(shù)值性質(zhì)(numerical properties) 1回歸線穿過 和 的樣本均值點(diǎn)( , ) 。SRF: 2估計值 的均值等于實(shí)際值 的均值。3. 殘差 的均值為零 。 (2.3.19)4殘差 與估計值 不相關(guān),即所謂兩個變量不相關(guān),即協(xié)方差為零。 證明殘差與估計值不相關(guān),即協(xié)
43、方差為零。繼續(xù),由殘差和樣本函數(shù)的離差表達(dá)式以及最小二乘法的結(jié)果得, (2.3.20)所以,即殘差與估計值不相關(guān)。5殘差 與解釋變量 不相關(guān) ,即證明殘差與解釋變量不相關(guān):所以,例2.2 利用例2.1的表2.5中的第一組樣本數(shù)據(jù)來求回歸線。見表2.6。序號可支配收入 消費(fèi)支出 13200 2800-3600-1640 5904000 12960000 24000 2600-2800-1840 5152000 7840000 348003600-2000-8401680000 4000000 456003800-1200-6407680001440000 564004400-400-40 160
44、00 160000 672004600400160 64000 160000 7800048001200360 432000 1440000 88800560020001160 2320000 4000000 99600620028001760 4928000 7840000 1010400600036001560 5616000 12960000合計680004440026880000 52800000平均68004440表2.6 表2.5中第一組樣本數(shù)據(jù)及相關(guān)數(shù)據(jù)(單位:元)將有關(guān)數(shù)據(jù)代入方程(2.3.8)和(2.3.9)得介紹大家使用EViews 6.0軟件。第一步,文件創(chuàng)建。將鼠標(biāo)放置
45、窗口最上端的工具欄的第一項File并點(diǎn)擊,選擇New項的Workfile并點(diǎn)擊,彈出下列窗口在Workfile structure type 對話框中選擇Unstructured/Undated(因數(shù)據(jù)不是時間序列數(shù)據(jù),如果是時間序列數(shù)據(jù),請選擇Dated-regular frequency),在右邊data range的observations 鍵入10。下面Names(optional)是給文件起名字。我給文件起名字為“家庭收入與消費(fèi)樣本回歸”。點(diǎn)擊OK,文件就建成了。第二步,數(shù)據(jù)輸入。在最上面的工具欄中選擇Quick一項并點(diǎn)擊,選擇其中Empty Group (Edit Series)并
46、點(diǎn)擊,彈出下列窗口用鼠標(biāo)點(diǎn)擊第一行第一列單元格,并選擇鍵盤上的圖標(biāo)“”健并鍵入,此時,單元格左邊序號列第一行出現(xiàn)obs(有兩個obs了)替代原來的1,接著輸入解釋變量符號X,再將鼠標(biāo)移至第二列第一行并點(diǎn)擊,同時彈出了一個提問窗口。選擇第一個Numeric series(已經(jīng)是默認(rèn)),點(diǎn)擊OK。再次點(diǎn)擊第二列第一行,輸入被解釋變量符號Y,回車,再次彈出上面的窗口,選擇Numeric series(默認(rèn)),點(diǎn)擊OK。然后輸入10對數(shù)據(jù)。第三步,樣本回歸。數(shù)據(jù)輸入完畢,最好先保存,即選擇save或name,可以起個名字,或者直接使用默認(rèn)文件名Group01。點(diǎn)擊最上面工具欄Quick一項,選擇其中E
47、stimate Equation,彈出下面窗口鍵入字母Y C X(中間用空格隔開)。估計方法Method選擇LS(默認(rèn)的) 點(diǎn)擊確定即可得到回歸結(jié)果如下:上圖陰影部分中的數(shù)據(jù)就是參數(shù)的估計值,與計算結(jié)果一致。點(diǎn)擊Name保存回歸結(jié)果。最后,不要忘記保存文件,即選擇工具欄File,再選擇save保存文件。2.4 經(jīng)典線性回歸模型的基本假定一、高斯假定這些假定(assumptions)最早是由高斯于1821年提出來的,因此,也叫做高斯假定或古典假定或經(jīng)典假定或基本假定,而滿足這些假定的線性回歸模型稱作古典或經(jīng)典(又稱高斯)線性回歸模型(classical linear regression mod
48、el,CLRM)。(一) 對模型的假定1假定模型是線性模型。回歸模型對解釋變量而言不一定是線性的,但對于參數(shù)而言是線性的。 2假定模型不存在設(shè)定誤差(specification error)。即模型設(shè)定是正確的,沒有遺漏重要的解釋變量。3觀測次數(shù)必須大于待估計的參數(shù)個數(shù)或者解釋變量的個數(shù)。(二) 對解釋變量 的假定1假定解釋變量 是非隨機(jī)變量。即在重復(fù)樣本中,解釋變量取值是固定的或在不同多個樣本中取同一組。 2解釋變量 與隨機(jī)干擾項 不相關(guān)。即解釋變量與隨機(jī)干擾項的協(xié)方差為零, 。3解釋變量的取值不可以全部相同,且沒有異常。也就是說,解釋變量的方差是有限的正數(shù), ,且解釋變量的取值對于其余觀測
49、值不能過大或過小。(三) 對隨即干擾項的假定1均值為零。在解釋變量是非隨機(jī)的條件下,即2同方差性(homoscedasticity)或方差相等。即3無自相關(guān)(no autocorrelation)。協(xié)方差為零,即二、簡單線性回歸模型的基本假定假定1 隨機(jī)干擾項均值為零。 假定2 隨機(jī)干擾項具有同方差性 。假定3 隨機(jī)干擾項無自相關(guān)。 假定4 隨機(jī)干擾項與解釋變量不相關(guān)。假定5 隨機(jī)干擾項服從正態(tài)分布。即隨機(jī)干擾項服從均值為零,方差為 的正態(tài)分布1, (2.4.5)1 中心極限定理(central limit theorem)對簡單線性回歸模型的基本假定與高斯假定之間關(guān)系的幾點(diǎn)說明:1從假定1可
50、以推導(dǎo)出假定4,因此,假定4并非必需的,但是由于假定4的重要性而單獨(dú)設(shè)為一條假定。2假定1其實(shí)已經(jīng)包含了模型設(shè)定無遺漏,即模型設(shè)定是正確的。4簡單線性回歸模型只有一個解釋變量,通常不可能只有一次觀測次數(shù)。5解釋變量是非隨機(jī)的假定。一般來說,已經(jīng)認(rèn)為在假定里。6對“解釋變量不可以全部相同,且沒有異常。”這一條,暫且認(rèn)為模型選定時一定滿足。7假定5不屬于高斯假定。除了假定5,一般我們認(rèn)為簡單線性回歸模型的基本假定已經(jīng)滿足了高斯假定,即模型屬于經(jīng)典線性回歸模型CLRM。如果把假定5加入經(jīng)典線性回歸模型的假定中,那么就得到經(jīng)典正態(tài)線性回歸模型(classical normal linear regre
51、ssion model,CNLRM)。簡單線性回歸模型 的分布完全取決于 的分布,結(jié)論:結(jié)論1 (2.4.6)結(jié)論2 (2.4.7)結(jié)論3 (2.4.8)結(jié)論4 (2.4.9) 一個非常有價值的問題是:所有的假定有多真實(shí)?有人說:“假定是否真實(shí)不重要,重要的是基于這些假定的預(yù)測結(jié)果?!?另外一個有趣的問題是:這些假定似乎在配合OLS估計量的純數(shù)據(jù)性質(zhì)的結(jié)論。難道這是巧合嗎?2.5 OLS估計的精度或標(biāo)準(zhǔn)差在統(tǒng)計學(xué)中,估計量的精度用標(biāo)準(zhǔn)差來衡量。在高斯假定下,求得OLS的估計量的精度,即簡單線性回歸模型的參數(shù)的最小二乘估計量的方差(variance)和標(biāo)準(zhǔn)差(standard error, SE
52、): (2.5.1) (2.5.2) (2.5.3) (2.5.4) 是隨機(jī)干擾項 的方差, 是樣本容量。 的估計量為 (2.5.5) 也是 在 條件下的方差。 是 的最小二乘估計量。(證明見附錄)表達(dá)式 稱為自由度(degree of freedom,df) 是殘差平方和或剩余平方和(residual sum of squares,RSS)。什么是自由度? 是指觀測值的總個數(shù)中獨(dú)立的觀測個數(shù)。所謂獨(dú)立的觀測個數(shù)是指總個數(shù)減去約束或限制條件的個數(shù)。 比如,OLS方法中,對于殘差平方和,觀測值的總個數(shù)就是樣本容量 ,約束條件有兩個,即為了求參數(shù)估計值 和 需要的兩個約束方程,因此,獨(dú)立觀測值就變
53、成了 。 一般規(guī)律是:殘差平方和的自由度個數(shù)(number of df)等于樣本容量減去參數(shù)個數(shù),設(shè)參數(shù)個數(shù)為 ,即 。 如果 ,這樣的線性回歸函數(shù)可以寫成:叫做多元線性回歸模型(Multiple linear regression model),這是第3章專門討論的內(nèi)容。一旦得知 , 就能計算出來。 可利用方程(2.3.1)算出,即或利用方程(2.3.16)和(2.3.8)算出 公式推導(dǎo)1) (2.5.6)2) (2.5.7)利用式子(2.5.6)計算更簡單,利用(2.5.7)計算更精確。 的算術(shù)平方根 (2.5.8)稱為估計值的標(biāo)準(zhǔn)差(standard error of estimate)
54、或回歸標(biāo)準(zhǔn)差(standard error of the regression)。 例2.3 從例2.2中,得知 26880000, 52800000, 0.509091, 10根據(jù)表2.6中數(shù)據(jù)可以計算出 14224000,則根據(jù)公式(2.5.6)得 259.719 而根據(jù)公式(2.5.7)得, 259.7201參數(shù)估計量的方差與回歸方程的方差之間關(guān)系的解釋:1 的方差與 成正比,與 成反比。分母越小,方差越小,估計量越精確 ;分子越大,方差越大。 2 的方差與 和 成正比,與 和樣本容量 成反比。進(jìn)一步還可以得到 和 的相互依賴關(guān)系,即利用二者之間的協(xié)方差來判斷 。2.6 OLS估計的統(tǒng)計
55、性質(zhì):高斯-馬爾科夫定理1線性性(linear)2無偏性(unbiased)/無偏估計量(unbiased estimator): 概率密度的估計值0 3有效性(efficient)/有效估計量(efficient estimator): 概率密度的估計值0最佳線性無偏估計量(best linear unbiased estimators,BLUE) 高斯-馬爾科夫定理(Gauss-Markov theorem) :在給定經(jīng)典線性回歸模型的假定下,最小二乘估計量在所有線性無偏估計量中具有最小方差,即它們是最佳線性無偏估計量OLS估計量是BLUE 證明OLS估計量是BLUE 1線性性證明。設(shè) 為
56、一組常數(shù),且滿足(可以證明), 即 (2.6.1)類似有設(shè) ,滿足 ,則 (2.6.2)2無偏性證明。 (2.6.3) (2.6.4)類似可以證明, (2.6.5) (2.6.6)3有效性證明。 證明過程比較繁瑣,在此省略(見附錄 )上述討論的統(tǒng)計性質(zhì)(statistical property)被稱為有限樣本性質(zhì)(finite sample properties)或小樣本性質(zhì)(small-sample properties):這些性質(zhì)的成立與估計量的樣本容量無關(guān)。但是,在有限樣本情況下,有時候很難找到最佳線性無偏估計量,這時候就要考慮大樣本條件下的性質(zhì),一般是指樣本無窮大時的大樣本漸進(jìn)性質(zhì)(l
57、arge-sample asymptotic properties)。在此,不討論這個問題。2.7 判定系數(shù)R2:“擬合優(yōu)度”的一個度量一、總變差的分解對于一組數(shù)據(jù),在OLS條件下所擬合出來的樣本回歸線的優(yōu)劣問題,叫做樣本回歸線的擬合優(yōu)度(goodness of fit)。根據(jù)公式(2.3.20)得知,注意:在此結(jié)論的證明中,利用了即為最小二乘法的等價結(jié)論。所以,下列結(jié)果是在OLS條件下才成立的。由方程(2.3.17 )得 (2.7.1)或 (2.7.2)稱為總變差或總離差平方和或總平方和(total sum of squares,TSS),記作TSS。它反映了被解釋變量的樣本觀測值總體離差的
58、大小。稱為回歸平方和或解釋平方和(explained sum of squares,ESS),記作ESS。它反映了樣本估計值的離差平方和,即由樣本回歸線作出解釋的那部分變差。 稱為殘差平方和(residual sum of squares,RSS),記作RSS。它反映了被解釋變量的樣本觀測值與估計值之差的平方和,即未被解釋的那部分變差。方程(2.7.1)或(2.7.2)還可以寫成: (2.7.3) 即總變差被分解成兩部分:一部分是回歸線的變差,就是回歸平方和或解釋平方和,即用回歸線來解釋的那部分;另一部分是被解釋變量的樣本觀測值與回歸線或樣本估計值之差的平方和,這是表示未被解釋的那部分,因此叫
59、做殘差平方和??傋儾罘纸獾膸缀我饬x 圖2.11 總變差的分解圖SRF方程(2.7.3)兩邊同除以得 (2.7.4)或 (2.7.5)方程(2.7.4)和方程(2.75)給出了一個比例關(guān)系,即歸回平方和與殘差平方和分別占總變差的比例。 二、判定系數(shù)的定義與性質(zhì)(一)判定系數(shù)的定義 (2.7.6)或 (2.7.7)稱為可決系數(shù)或判定系數(shù)(coefficient of determination,或用 表示)。 是對回歸線擬合優(yōu)度的最為常用的度量。 其含義是:測度了在總變差中由回歸模型解釋的那部分所占的比例,即樣本回歸線對樣本觀測值擬合優(yōu)劣程度的指標(biāo)。 越大,擬合優(yōu)度就越高。 例如,利用例2.2的表
60、2.6中數(shù)據(jù)計算出: 539636.36, 14224000, 則可決系數(shù)為 即說明,在表2.6的被解釋變量(家庭消費(fèi)支出)的樣本觀測值的總變差中,有96.21%由所估計的樣本回歸模型(回歸線)做出了解釋。(二)判定系數(shù)的性質(zhì)判定系數(shù)是回歸線對樣本觀測值擬合程度的一個度量,因此,它不僅適用于簡單線性回歸模型,也完全適用于多元線性回歸模型(第3章討論的內(nèi)容)。設(shè)樣本的容量為 ,參數(shù)個數(shù)為 ,則下列方程仍然成立 方差分析中各項的自由度 的自由度為 的自由度為 的自由度為 1。 1 TSS中有一個約束條件,因此,自由度為n-1;RSS中有k個參數(shù)作為約束條件,因此,自由度為n-k;ESS的自由度為解
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年鎳及鎳合金材合作協(xié)議書
- 華師大版數(shù)學(xué)八年級下冊17.3《一次函數(shù)》(第4課時)聽評課記錄
- 八年級地理下冊7.4長江三角洲區(qū)域的內(nèi)外聯(lián)系聽課評課記錄3
- 人教版數(shù)學(xué)八年級下冊聽評課記錄:第19章 正比例函數(shù)(二)
- 數(shù)學(xué)必修三知識點(diǎn)歸納
- 大班健康預(yù)防疾病流行
- 沃爾瑪?shù)膯T工培訓(xùn)
- 三年級下冊計算題口算
- 2024-2025學(xué)年四年級語文上冊第二單元7火燒云說課稿語文S版
- 2024年春五年級語文下冊第二單元7珍珠鳥作業(yè)設(shè)計語文S版
- 藥劑科基本藥物處方用藥狀況點(diǎn)評工作表
- 初中音樂聽課筆記20篇
- 央國企信創(chuàng)化與數(shù)字化轉(zhuǎn)型規(guī)劃實(shí)施
- 拆遷征收代理服務(wù)投標(biāo)方案
- 完形療法概述
- SL631-637-2012-水利水電工程單元工程施工質(zhì)量驗(yàn)收評定標(biāo)準(zhǔn)
- 商標(biāo)基礎(chǔ)知識課件
- 監(jiān)理質(zhì)量管理講義監(jiān)理工作的基本知識
- 涉詐風(fēng)險賬戶審查表
- 2023年大學(xué)英語四級考試模擬真題及答案
- 四年級數(shù)學(xué)上冊口算天天練4
評論
0/150
提交評論