版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、經典線性回歸模型第1頁,共107頁,2022年,5月20日,18點5分,星期二2.1 回歸分析概述一、變量間的關系及回歸分析的基本概念二、總體回歸函數(shù)(PRF)三、隨機擾動項四、樣本回歸函數(shù)(SRF)第2頁,共107頁,2022年,5月20日,18點5分,星期二一、變量間的關系及回歸分析的基本概念1. 變量間的關系(1)確定性關系或函數(shù)關系:研究的是確定現(xiàn)象非隨機變量間的關系。(2)統(tǒng)計依賴或相關關系:研究的是非確定現(xiàn)象隨機變量間的關系。第3頁,共107頁,2022年,5月20日,18點5分,星期二2. 回歸分析的基本概念回歸分析(regression analysis)是研究一個變量關于另一
2、個(些)變量的具體依賴關系的計算方法和理論。其目的在于通過后者的已知或設定值,去估計和(或)預測前者的(總體)均值。被解釋變量(Explained Variable)或應變量(Dependent Variable)。解釋變量(Explanatory Variable)或自變量(Independent Variable)。第4頁,共107頁,2022年,5月20日,18點5分,星期二回歸分析構成計量經濟學的方法論基礎,其主要內容包括:(1)根據(jù)樣本觀察值對經濟計量模型參數(shù)進行估計,求得回歸方程;(2)對回歸方程、參數(shù)估計值進行顯著性檢驗;(3)利用回歸方程進行分析、評價及預測。第5頁,共107頁
3、,2022年,5月20日,18點5分,星期二二、總體回歸函數(shù)回歸分析關心的是根據(jù)解釋變量的已知或給定值,考察被解釋變量的總體均值,即當解釋變量取某個確定值時,與之統(tǒng)計相關的被解釋變量所有可能出現(xiàn)的對應值的平均值。第6頁,共107頁,2022年,5月20日,18點5分,星期二例2.1:一個假想的社區(qū)有100戶家庭組成,要研究該社區(qū)每月家庭消費支出Y與每月家庭可支配收入X的關系。 即如果知道了家庭的月收入,能否預測該社區(qū)家庭的平均月消費支出水平。 為達到此目的,將該100戶家庭劃分為組內收入差不多的10組,以分析每一收入組的家庭消費支出。第7頁,共107頁,2022年,5月20日,18點5分,星期
4、二第8頁,共107頁,2022年,5月20日,18點5分,星期二由于不確定因素的影響,對同一收入水平X,不同家庭的消費支出不完全相同;但由于調查的完備性,給定收入水平X的消費支出Y的分布是確定的,即以X的給定值為條件的Y的條件分布(Conditional distribution)是已知的,例如:P(Y=561|X=800)=1/4。第9頁,共107頁,2022年,5月20日,18點5分,星期二因此,給定收入X的值Xi,可得消費支出Y的條件均值(conditional mean)或條件期望(conditional expectation):E(Y|X=Xi)。該例中:E(Y | X=800)=
5、605描出散點圖發(fā)現(xiàn):隨著收入的增加,消費“平均地說”也在增加,且Y的條件均值均落在一根正斜率的直線上。這條直線稱為總體回歸線。第10頁,共107頁,2022年,5月20日,18點5分,星期二05001000150020002500300035005001000150020002500300035004000每月可支配收入X(元)每月消費支出Y(元)第11頁,共107頁,2022年,5月20日,18點5分,星期二在給定解釋變量Xi條件下被解釋變量Yi的期望軌跡稱為總體回歸線(population regression line),或更一般地稱為總體回歸曲線(population regress
6、ion curve)。稱為(雙變量)總體回歸函數(shù)(population regression function, PRF)。 相應的函數(shù):第12頁,共107頁,2022年,5月20日,18點5分,星期二含義:回歸函數(shù)(PRF)說明被解釋變量Y的平均狀態(tài)(總體條件期望)隨解釋變量X變化的規(guī)律。 函數(shù)形式:可以是線性或非線性的。 例2.1中,將居民消費支出看成是其可支配收入的線性函數(shù)時: 為一線性函數(shù)。其中,0,1是未知參數(shù),稱為回歸系數(shù)(regression coefficients)。第13頁,共107頁,2022年,5月20日,18點5分,星期二三、隨機擾動項總體回歸函數(shù)說明在給定的收入水平
7、Xi下,該社區(qū)家庭平均的消費支出水平。但對某一個別的家庭,其消費支出可能與該平均水平有偏差。稱為觀察值圍繞它的期望值的離差(deviation),是一個不可觀測的隨機變量,又稱為隨機干擾項(stochastic disturbance)或隨機誤差項(stochastic error)。第14頁,共107頁,2022年,5月20日,18點5分,星期二例2.1中,給定收入水平Xi ,個別家庭的支出可表示為兩部分之和:(1)該收入水平下所有家庭的平均消費支出E(Y|Xi),稱為系統(tǒng)性(systematic)或確定性(deterministic)部分;(2)其他隨機或非確定性(nonsystemati
8、c)部分i。第15頁,共107頁,2022年,5月20日,18點5分,星期二稱為總體回歸函數(shù)(PRF)的隨機設定形式。表明被解釋變量除了受解釋變量的系統(tǒng)性影響外,還受其他因素的隨機性影響。由于方程中引入了隨機項,成為計量經濟學模型,因此也稱為總體回歸模型。第16頁,共107頁,2022年,5月20日,18點5分,星期二隨機誤差項主要包括下列因素:在解釋變量中被忽略的因素的影響;變量觀測值的觀測誤差的影響;模型關系的設定誤差的影響;其他隨機因素的影響。產生并設計隨機誤差項的主要原因:理論的含糊性;數(shù)據(jù)的欠缺;節(jié)省原則。第17頁,共107頁,2022年,5月20日,18點5分,星期二四、樣本回歸函
9、數(shù)(SRF)問題:能從一次抽樣中獲得總體的近似的信息嗎?如果可以,如何從抽樣中獲得總體的近似信息?例2.2:在例2.1的總體中有如下一個樣本,能否從該樣本估計總體回歸函數(shù)PRF? 回答:能第18頁,共107頁,2022年,5月20日,18點5分,星期二 該樣本的散點圖(scatter diagram): 畫一條直線以盡好地擬合該散點圖,由于樣本取自總體,可以該直線近似地代表總體回歸線。該直線稱為樣本回歸線(sample regression lines)。第19頁,共107頁,2022年,5月20日,18點5分,星期二 記樣本回歸線的函數(shù)形式為:稱為樣本回歸函數(shù)(sample regressi
10、on function,SRF)。第20頁,共107頁,2022年,5月20日,18點5分,星期二 注意:這里將樣本回歸線看成總體回歸線的近似替代則第21頁,共107頁,2022年,5月20日,18點5分,星期二樣本回歸函數(shù)的隨機形式/樣本回歸模型:同樣地,樣本回歸函數(shù)也有如下的隨機形式: 由于方程中引入了隨機項,成為計量經濟模型,因此也稱為樣本回歸模型(sample regression model)。 第22頁,共107頁,2022年,5月20日,18點5分,星期二 回歸分析的主要目的:根據(jù)樣本回歸函數(shù)SRF,估計總體回歸函數(shù)PRF。即,根據(jù) 估計第23頁,共107頁,2022年,5月20
11、日,18點5分,星期二注意:這里PRF可能永遠無法知道。第24頁,共107頁,2022年,5月20日,18點5分,星期二2.2 雙變量線性回歸模型的參數(shù)估計 一、雙變量線性回歸模型的基本假設 二、參數(shù)的普通最小二乘估計(OLS) 三、最小二乘估計量的性質 四、參數(shù)估計量的概率分布及隨機干 擾項方差的估計 第25頁,共107頁,2022年,5月20日,18點5分,星期二回歸分析的主要目的是要通過樣本回歸函數(shù)(模型)SRF盡可能準確地估計總體回歸函數(shù)(模型)PRF。估計方法有多種,其中最廣泛使用的是普通最小二乘法(ordinary least squares, OLS)。為保證參數(shù)估計量具有良好的
12、性質,通常對模型提出若干基本假設。實際這些假設與所采用的估計方法緊密相關。第26頁,共107頁,2022年,5月20日,18點5分,星期二 一、線性回歸模型的基本假設-P99-100-105 假設1. 解釋變量X是確定性變量,不是隨機變量; 假設2. 隨機誤差項具有零均值、同方差和無自相關: E(i)=0 i=1,2, ,n Var (i)=2 i=1,2, ,n Cov(i, j)=0 ij i,j= 1,2, ,n 第27頁,共107頁,2022年,5月20日,18點5分,星期二異方差XYXY第28頁,共107頁,2022年,5月20日,18點5分,星期二序列自相關XXYY負相關正相關第2
13、9頁,共107頁,2022年,5月20日,18點5分,星期二假設3. 隨機誤差項與解釋變量X之間不相關: Cov(Xi, i)=0 i=1,2, ,n 假設4. 服從零均值、同方差、零協(xié)方差的正態(tài)分布 iN(0, 2 ) i=1,2, ,n第30頁,共107頁,2022年,5月20日,18點5分,星期二 如果假設1、2滿足,則假設3也滿足; 如果假設4滿足,則假設2也滿足。注意: 以上假設也稱為線性回歸模型的經典假設或高斯(Gauss)假設,滿足該假設的線性回歸模型,也稱為經典線性回歸模型(Classical Linear Regression Model, CLRM)。 第31頁,共107頁
14、,2022年,5月20日,18點5分,星期二二、參數(shù)的普通最小二乘估計(OLS) 給定一組樣本觀測值(Xi, Yi)(i=1,2,n)要求樣本回歸函數(shù)盡可能好地擬合這組值. 普通最小二乘法(Ordinary least squares, OLS)給出的判斷標準是:二者之差的平方和最小。第32頁,共107頁,2022年,5月20日,18點5分,星期二最小二乘法的思路為了精確地描述Y與X之間的關系,必須使用這兩個變量的每一對觀察值(n組觀察值),才不至于以點概面(做到全面)。Y與X之間是否是直線關系(用協(xié)方差或相關系數(shù)判斷)?若是,可用一條直線描述它們之間的關系。在Y與X的散點圖上畫出直線的方法很
15、多。找出一條能夠最好地描述Y與X(代表所有點)之間的直線。問題是:怎樣算“最好”?最好指的是找一條直線使得所有這些點到該直線的縱向距離的和(平方和)最小。第33頁,共107頁,2022年,5月20日,18點5分,星期二最小二乘法的思路yx縱向距離橫向距離距離A為實際點,B為擬合直線上與之對應的點第34頁,共107頁,2022年,5月20日,18點5分,星期二最小二乘法的思路縱向距離是Y的實際值與擬合值之差,差異大擬合不好,差異小擬合好,所以稱為殘差、擬合誤差或剩余。將所有縱向距離平方后相加,即得誤差平方和,“最好”直線就是使誤差平方和最小的直線。擬合直線在總體上最接近實際觀測點。于是可以運用求
16、極值的原理,將求最好擬合直線問題轉換為求誤差平方和最小的問題。第35頁,共107頁,2022年,5月20日,18點5分,星期二YX0*Y7Y9Min數(shù)學形式第36頁,共107頁,2022年,5月20日,18點5分,星期二最小二乘法的數(shù)學原理縱向距離是Y的實際值與擬合值之差,差異大擬合不好,差異小擬合好,所以又稱為擬合誤差或殘差。將所有縱向距離平方后相加,即得誤差平方和,“最好”直線就是使誤差平方和最小的直線。于是可以運用求極值的原理,將求最好擬合直線問題轉換為求誤差平方和最小。第37頁,共107頁,2022年,5月20日,18點5分,星期二得到的參數(shù)估計量可以寫成: 稱為OLS估計量的離差形式
17、(deviation form)。 由于參數(shù)的估計結果是通過最小二乘法得到 的,故稱為普通最小二乘估計量(ordinary least squares estimators)。 第38頁,共107頁,2022年,5月20日,18點5分,星期二 例:在上述家庭可支配收入-消費支出例中,對于所抽出的一組樣本數(shù),參數(shù)估計的計算可通過下面的表進行。 第39頁,共107頁,2022年,5月20日,18點5分,星期二計量經濟學與電腦必須指出,模型的建立和實際使用,離開了電腦幾乎是不可能的。目前,已有很多計量經濟學軟件包,可以完成計量經濟學模型的參數(shù)估計、模型檢驗、預測等基本運算。幾種常見計量軟件SAS,S
18、PSS,ET,ESP,GAUSS,MATLAB,MICROTSP,STATA, MINITAB,SYSTAT,SHAZAM,EViews,DATA-FIT。本課程采用國家教委推薦的EViews進行案例教學。要求同學們掌握EViews,比較熟練地使用它,并掌握EViews與其它Windows軟件共享信息。第40頁,共107頁,2022年,5月20日,18點5分,星期二學習計量軟件的要求鼯鼠五能,不如烏賊一技!第41頁,共107頁,2022年,5月20日,18點5分,星期二第42頁,共107頁,2022年,5月20日,18點5分,星期二第43頁,共107頁,2022年,5月20日,18點5分,星期
19、二因此,由該樣本估計的回歸方程為: 第44頁,共107頁,2022年,5月20日,18點5分,星期二 四、最小二乘估計量的性質 當模型參數(shù)估計出后,需考慮參數(shù)估計值的精度,即是否能代表總體參數(shù)的真值,或者說需考察參數(shù)估計量的統(tǒng)計性質。 一個用于考察總體的估計量,可從如下幾個方面考察其優(yōu)劣性: (1)線性,即它是否是另一隨機變量的線性函數(shù);第45頁,共107頁,2022年,5月20日,18點5分,星期二(2)無偏性,即它的均值或期望值是否等于總體的真實值;(3)有效性,即它是否在所有線性無偏估計量中具有最小方差。 這三個準則也稱作估計量的小樣本性質。 擁有這類性質的估計量稱為最佳線性無偏估計量(
20、best liner unbiased estimator, BLUE)。 第46頁,共107頁,2022年,5月20日,18點5分,星期二(4)漸近無偏性,即樣本容量趨于無窮大時,是否它的均值序列趨于總體真值;(5)一致性,即樣本容量趨于無窮大時,它是否依概率收斂于總體的真值;(6)漸近有效性,即樣本容量趨于無窮大時,是否它在所有的一致估計量中具有最小的漸近方差。 當不滿足小樣本性質時,需進一步考察估計量的大樣本或漸近性質:第47頁,共107頁,2022年,5月20日,18點5分,星期二OLS參數(shù)估計量的有效性指的是:在一切線性、無偏估計量中,OLS參數(shù)估計量的方差最小。所有參數(shù)估計量線性參
21、數(shù)估計量無偏參數(shù)估計量最小二乘參數(shù)估計量第48頁,共107頁,2022年,5月20日,18點5分,星期二高斯馬爾可夫定理(Gauss-Markov theorem) 在給定經典線性回歸的假定下,最小二乘估計量是具有最小方差的線性無偏估計量。第49頁,共107頁,2022年,5月20日,18點5分,星期二 五、參數(shù)估計量的概率分布及隨機干擾項方差的估計 第50頁,共107頁,2022年,5月20日,18點5分,星期二2. 隨機誤差項的方差2的估計2又稱為總體方差。 第51頁,共107頁,2022年,5月20日,18點5分,星期二由于隨機項i不可觀測,只能從i的估計殘差ei出發(fā),對總體方差進行估計
22、。 可以證明, 2的最小二乘估計量為它是關于2的無偏估計量。 第52頁,共107頁,2022年,5月20日,18點5分,星期二第53頁,共107頁,2022年,5月20日,18點5分,星期二2.3 雙變量線性回歸模型的統(tǒng)計檢驗 一、擬合優(yōu)度檢驗 二、變量的顯著性檢驗 三、參數(shù)的置信區(qū)間 第54頁,共107頁,2022年,5月20日,18點5分,星期二 如果Yi=i 即實際觀測值落在樣本回歸“線”上,則擬合最好。 第55頁,共107頁,2022年,5月20日,18點5分,星期二 對于所有樣本點,則需考慮這些點與樣本均值離差的平方和,可以證明:第56頁,共107頁,2022年,5月20日,18點5
23、分,星期二TSS=ESS+RSS記總體平方和(Total Sum of Squares)回歸平方和(Explained Sum of Squares)殘差平方和(Residual Sum of Squares )第57頁,共107頁,2022年,5月20日,18點5分,星期二 Y的觀測值圍繞其均值的總離差(total variation)可分解為兩部分:一部分來自回歸線(ESS),另一部分則來自隨機勢力(RSS)。在給定樣本中,TSS不變,如果實際觀測點離樣本回歸線越近,則ESS在TSS中占的比重越大,因此擬合優(yōu)度:回歸平方和ESS/Y的總離差TSS第58頁,共107頁,2022年,5月20日
24、,18點5分,星期二2、判定系數(shù)R2統(tǒng)計量 稱 R2 為(樣本)判定系數(shù)/可決系數(shù)(coefficient of determination)。 判定系數(shù)的取值范圍:0,1 R2越接近1,說明實際觀測點離樣本線越近,擬合優(yōu)度越高。第59頁,共107頁,2022年,5月20日,18點5分,星期二 在例的收入消費支出例中, 注:判定系數(shù)是一個非負的統(tǒng)計量。它也是隨著抽樣的不同而不同。為此,對判定系數(shù)的統(tǒng)計可靠性也應進行檢驗,這將在以后進行。 第60頁,共107頁,2022年,5月20日,18點5分,星期二R2的其他表示方法第61頁,共107頁,2022年,5月20日,18點5分,星期二擬合優(yōu)度(或
25、稱判定系數(shù)、決定系數(shù))判定系數(shù)只是說明列入模型的所有解釋變量對應變量的聯(lián)合的影響程度,不說明模型中單個解釋變量的影響程度。對時間序列數(shù)據(jù),判定系數(shù)達到0.9以上是很平常的;但是,對截面數(shù)據(jù)而言,能夠有0.5就不錯了。第62頁,共107頁,2022年,5月20日,18點5分,星期二判定系數(shù)達到多少為宜?沒有一個統(tǒng)一的明確界限值;若建模的目的是預測應變量值,一般需考慮有較高的判定系數(shù)。若建模的目的是結構分析,就不能只追求高的判定系數(shù),而是要得到總體回歸系數(shù)的可信任的估計量。判定系數(shù)高并不一定每個回歸系數(shù)都可信任;第63頁,共107頁,2022年,5月20日,18點5分,星期二 二、變量的顯著性檢驗
26、 回歸分析是要判斷解釋變量X是否是被解釋變量Y的一個顯著性的影響因素。 在雙變量線性模型中,就是要判斷X是否對Y具有顯著的線性性影響。這就需要進行變量的顯著性檢驗。 變量的顯著性檢驗所應用的方法是數(shù)理統(tǒng)計學中的假設檢驗。 計量經濟學中,主要是針對變量的參數(shù)真值是否為零來進行顯著性檢驗的。 第64頁,共107頁,2022年,5月20日,18點5分,星期二 1、假設檢驗 所謂假設檢驗,就是事先對總體參數(shù)或總體分布形式作出一個假設,然后利用樣本信息來判斷原假設是否合理,即判斷樣本信息與原假設是否有顯著差異,從而決定是否接受或否定原假設。第65頁,共107頁,2022年,5月20日,18點5分,星期二
27、假設檢驗采用的邏輯推理方法是反證法 先假定原假設正確,然后根據(jù)樣本信息,觀察由此假設而導致的結果是否合理,從而判斷是否接受原假設。判斷結果合理與否,是基于“小概率事件不易發(fā)生”這一原理的第66頁,共107頁,2022年,5月20日,18點5分,星期二 2、變量的顯著性檢驗 第67頁,共107頁,2022年,5月20日,18點5分,星期二 檢驗步驟: (1)對總體參數(shù)提出假設 H0: 1=0, H1:10(2)以原假設H0構造t統(tǒng)計量,并由樣本計算其值(3)給定顯著性水平,查t分布表得臨界值t /2(n-2)第68頁,共107頁,2022年,5月20日,18點5分,星期二 (4) 比較,判斷 若
28、 |t| t /2(n-2),則拒絕H0 ,接受H1 ; 若 |t| t /2(n-2),則拒絕H1 ,接受H0 ; 對于雙變量線性回歸方程中的0,可構造如下t統(tǒng)計量進行顯著性檢驗: 第69頁,共107頁,2022年,5月20日,18點5分,星期二在上述收入消費支出例中,首先計算2的估計值 第70頁,共107頁,2022年,5月20日,18點5分,星期二t統(tǒng)計量的計算結果分別為: 給定顯著性水平=0.05,查t分布表得臨界值 t 0.05/2(8)=2.306 |t1|2.306,說明家庭可支配收入在0.05的顯著性水平下顯著,即是消費支出的主要解釋變量; |t0|2.306,表明在0.05的
29、顯著性水平下不顯著,無法拒絕截距項為零的假設。 第71頁,共107頁,2022年,5月20日,18點5分,星期二 假設檢驗可以通過一次抽樣的結果檢驗總體參數(shù)可能的假設值的范圍(如是否為零),但它并沒有指出在一次抽樣中樣本參數(shù)值到底離總體參數(shù)的真值有多“近”。 三、參數(shù)的置信區(qū)間 第72頁,共107頁,2022年,5月20日,18點5分,星期二 要判斷樣本參數(shù)的估計值在多大程度上可以“近似”地替代總體參數(shù)的真值,往往需要通過構造一個以樣本參數(shù)的估計值為中心的“區(qū)間”,來考察它以多大的可能性(概率)包含著真實的參數(shù)值。這種方法就是參數(shù)的區(qū)間估計。 第73頁,共107頁,2022年,5月20日,18
30、點5分,星期二 如果存在這樣一個區(qū)間,稱之為置信區(qū)間(confidence interval); 1-稱為置信系數(shù)(置信度)(confidence coefficient), 稱為顯著性水平(level of significance);置信區(qū)間的端點稱為置信限(confidence limit)或臨界值(critical values)。第74頁,共107頁,2022年,5月20日,18點5分,星期二對區(qū)間估計的形象比喻我們經常說某甲的成績“大概80分左右”,可以看成一個區(qū)間估計。(某甲的成績?yōu)楸还烙嫷膮?shù)) P(1 2 )=大概的準確程度( 1-) 如:P(75 85 )=95%=1-5%
31、“大概80分左右”犯第一類錯誤的概率(也叫顯著水平 )下限上限置信水平1 第75頁,共107頁,2022年,5月20日,18點5分,星期二/2/21-圖示如下第76頁,共107頁,2022年,5月20日,18點5分,星期二雙變量線性模型中,i (i=1,2)的置信區(qū)間:在變量的顯著性檢驗中已經知道: 意味著,如果給定置信度(1-),從分布表中查得自由度為(n-2)的臨界值,那么t值處在(-t/2, t/2)的概率是(1- )。表示為: 即第77頁,共107頁,2022年,5月20日,18點5分,星期二于是得到:(1-)的置信度下, i的置信區(qū)間是 在上述收入-消費支出例中,如果給定 =0.01
32、,查表得: 由于于是,1、0的置信區(qū)間分別為: (0.6345,0.9195) (-433.32,226.98) 第78頁,共107頁,2022年,5月20日,18點5分,星期二由于置信區(qū)間一定程度地給出了樣本參數(shù)估計值與總體參數(shù)真值的“接近”程度,因此置信區(qū)間越小越好。要縮小置信區(qū)間,需要(1)增大樣本容量n。因為在同樣的置信水平下,n越大,t分布表中的臨界值越??;同時,增大樣本容量,還可使樣本參數(shù)估計量的標準差減??;第79頁,共107頁,2022年,5月20日,18點5分,星期二 (2)提高模型的擬合優(yōu)度。因為樣本參數(shù)估計量的標準差與殘差平方和呈正比,模型擬合優(yōu)度越高,殘差平方和應越小。
33、由于置信區(qū)間一定程度地給出了樣本參數(shù)估計值與總體參數(shù)真值的“接近”程度,因此置信區(qū)間越小越好。 第80頁,共107頁,2022年,5月20日,18點5分,星期二2.4 雙變量線性回歸分析的應用:預測問題 一、0是條件均值E(Y|X=X0)或個值Y0的一個無偏估計二、總體條件均值與個值預測值的置信區(qū)間-(選學內容)第81頁,共107頁,2022年,5月20日,18點5分,星期二 對于雙變量線性回歸模型 給定樣本以外的解釋變量的觀測值X0,可以得到被解釋變量的預測值0 ,可以此作為其條件均值E(Y|X=X0)或個別值Y0的一個近似估計。 嚴格地說,這只是被解釋變量的預測值的估計值,而不是預測值。原
34、因: (1)參數(shù)估計量不確定; (2)隨機項的影響說 明第82頁,共107頁,2022年,5月20日,18點5分,星期二 二、總體條件均值與個值預測值的置信區(qū)間 1、總體均值預測值的置信區(qū)間 由于 于是可以證明 第83頁,共107頁,2022年,5月20日,18點5分,星期二因此 故 第84頁,共107頁,2022年,5月20日,18點5分,星期二于是,在1-的置信度下,總體均值E(Y|X0)的置信區(qū)間為 其中第85頁,共107頁,2022年,5月20日,18點5分,星期二2、總體個值預測值的預測區(qū)間 由 Y0=0+1X0+ 知: 于是 式中 :從而在1-的置信度下, Y0的置信區(qū)間為 第86
35、頁,共107頁,2022年,5月20日,18點5分,星期二在上述收入消費支出例中,得到的樣本回歸函數(shù)為: 則在 X0=1000處, 0 = 103.172+0.7771000=673.84 而第87頁,共107頁,2022年,5月20日,18點5分,星期二 因此,總體均值E(Y|X=1000)的95%的置信區(qū)間為: 61.05 E(Y|X=1000) 673.84+2.30661.05或 (533.05, 814.62) 同樣地,對于Y在X=1000的個體值,其95%的置信區(qū)間為: 673.84 - 2.30661.05Yx=1000 673.84 + 2.30661.05或 (372.03,
36、 975.65)第88頁,共107頁,2022年,5月20日,18點5分,星期二 總體回歸函數(shù)的置信帶(域)(confidence band)-教材P120 個體的置信帶(域)第89頁,共107頁,2022年,5月20日,18點5分,星期二 對于Y的總體均值E(Y|X)與個體值的預測區(qū)間(置信區(qū)間):(1)樣本容量n越大,預測精度越高,反之預測精度越低;(2)樣本容量一定時,置信帶的寬度當在X均值處最小,其附近進行預測(插值預測)精度越大;X越遠離其均值,置信帶越寬,預測可信度下降。第90頁,共107頁,2022年,5月20日,18點5分,星期二2.5 實例:時間序列問題 一、中國居民人均消費
37、模型 二、我國固定資產投資總額與GDP的關系第91頁,共107頁,2022年,5月20日,18點5分,星期二 一、中國居民人均消費模型 考察中國居民收入與消費支出的關系。GDPP: 人均國內生產總值(1990年不變價)CONSP:人均居民消費(以居民消費價格指數(shù)(1990=100)縮減)。第92頁,共107頁,2022年,5月20日,18點5分,星期二第93頁,共107頁,2022年,5月20日,18點5分,星期二 1. 建立模型 擬建立如下雙變量回歸模型 采用Eviews軟件進行回歸分析的結果見下表 該兩組數(shù)據(jù)是19782000年的時間序列數(shù)據(jù)(time series data); 前述收入消費支出例中的數(shù)據(jù)是截面數(shù)據(jù)(cross-sectional data)。第94頁,共107頁,2022年,5月20日,18點5分,星期二第95頁,共107頁,2022年,5月20日,18點5分,星期二一般可寫出如下回歸分析結果: (13.51) (53.47) R2=0.9927 F=2859.23 DW-d=0.5503 R2=0.9927T值:C:13.51, GDPP:53.47 臨界值: t0.05/2(21)=2.08斜率項:00.38621,符合絕對收入假說 2. 模型檢驗 第96
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 粘土蒙脫石生產加工項目可行性研究報告
- 新建螺母劈開器項目立項申請報告
- c 銀行課課程設計
- (投資方案)制磚機械項目可行性研究報告
- 2024年電子零售物流協(xié)同合同6篇
- 2024-2030年新版中國銀剛絨項目可行性研究報告
- 2024-2030年數(shù)碼產品設計公司技術改造及擴產項目可行性研究報告
- 2024-2030年撰寫:中國車用ABS合金項目風險評估報告
- 2024-2030年撰寫:中國大型球磨機行業(yè)發(fā)展趨勢及競爭調研分析報告
- 2024-2030年撰寫:中國丹白痘膠膏行業(yè)發(fā)展趨勢及競爭調研分析報告
- 9m跨度輕型屋面三角形鋼屋架設計說明書
- CA6140撥叉831002課程設計工序卡
- 全國醫(yī)療服務價格項目規(guī)范(2012年版)
- MATLAB論文基于MATLAB的自動控制系統(tǒng)及案例分析
- 化學元素周期表word版(可打印)
- 車友會活動策劃方案PPT
- 英語演講稿——Healthy Lifestyle
- 法院立案送達地址確認書
- 電氣設備拆除工程施工方案
- GB_T 20981-2021 面包質量通則(高清-現(xiàn)行)
- 企業(yè)標準化管理辦法
評論
0/150
提交評論