計量經(jīng)濟學第二章-回歸概述實用課件_第1頁
計量經(jīng)濟學第二章-回歸概述實用課件_第2頁
計量經(jīng)濟學第二章-回歸概述實用課件_第3頁
計量經(jīng)濟學第二章-回歸概述實用課件_第4頁
計量經(jīng)濟學第二章-回歸概述實用課件_第5頁
已閱讀5頁,還剩81頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第二章

經(jīng)典單方程計量經(jīng)濟學模型:

一元線性回歸模型

線性回歸的基本思想:

雙變量模型第二章

經(jīng)典單方程計量經(jīng)濟學模型:

線性回歸的基本思想雙變量模型回歸分析概述參數(shù)估計模型檢驗?zāi)P皖A(yù)測回歸分析構(gòu)成計量經(jīng)濟學的方法論基礎(chǔ)線性回歸的基本思想雙變量模型回歸分析概述參數(shù)估計模型檢驗線性回歸的基本思想雙變量模型

本節(jié)課的內(nèi)容回歸分析的含義總體回歸函數(shù)樣本回歸函數(shù)總體回歸模型回歸分析的目的樣本回歸模型隨機誤差項的性質(zhì)二、參數(shù)估計一、回歸分析概述最小二乘原理OLS下如何進行參數(shù)估計線性回歸的基本思想雙變量模型

本節(jié)課的內(nèi)容回歸分析的含義總體一、回歸分析的含義變量間的關(guān)系回歸分析的含義回歸分析的主要內(nèi)容線性回歸分析的“特殊”含義從雙變量到多變量的線性回歸一、回歸分析的含義變量間的關(guān)系回歸分析的含義回歸分析的主要內(nèi)變量間的關(guān)系變量間的關(guān)系確定性關(guān)系或函數(shù)關(guān)系統(tǒng)計依賴或相關(guān)關(guān)系經(jīng)濟變量之間的關(guān)系相關(guān)分析回歸分析線性關(guān)系非線性關(guān)系變量間的關(guān)系確定性關(guān)系或函數(shù)關(guān)系統(tǒng)計依賴或相關(guān)關(guān)系經(jīng)濟變量之間的關(guān)系相關(guān)相關(guān)分析(correlationanalysis):對稱地對待任何(兩個)變量,兩個變量都被看作是隨機的回歸分析

(regressionanalysis):對變量的處理方法存在不對稱性,即區(qū)分應(yīng)變量(被解釋變量)和自變量(解釋變量):前者是隨機變量,后者不是回歸分析/相關(guān)分析研究一個變量對另一個(些)變量的統(tǒng)計依賴關(guān)系,但它們并不意味著一定有因果關(guān)系被解釋變量(因變量)解釋變量(自變量)回歸分析情況下隨機變量非隨機變量因果關(guān)系的判定或推斷必須建立在經(jīng)實踐檢驗的相關(guān)理論基礎(chǔ)之上相關(guān)分析(correlationanalysis):對稱地是用于研究一個變量與另一個(些)變量的具體依賴關(guān)系的計算方法和理論。被解釋變量(因變量)Y解釋變量(自變量)X1、X2、……目的:在于通過自變量的已知或設(shè)定值,去估計和(或)預(yù)測因變量的(總體)均值。估計預(yù)測農(nóng)作物的產(chǎn)量示例:回歸分析(regressionanalysis)的含義是用于研究一個變量與另一個(些)變量的具體依賴關(guān)系的計算方法回歸分析的主要目的五、樣本回歸函數(shù)(SRF)問題:能從一次抽樣中獲得總體的近似的信息嗎?Y7|X=5000=420;從雙變量回歸到多元線性回歸根據(jù)表2-4的計算,得到數(shù)學S.這些假設(shè)與所采用的估計方法緊密相關(guān)。Y2|X=5000=470;同理:E(Y|X3=25000)=478記樣本回歸線的函數(shù)形式為:70000~80000美元稱i為觀察值Yi圍繞它的期望值E(Y|Xi)的離差(deviation),是一個不可觀測的隨機變量,又稱為隨機干擾項(stochasticdisturbance)或隨機誤差項(stochasticerror)。Y4|X=5000=420;3、Writing寫作。4)其它隨機因素的影響。同樣地,樣本回歸函數(shù)也有如下的隨機形式:80000~90000美元一個家庭年收入5000美元的學生,其數(shù)學分數(shù)為460,X=5000,Y1=460;“線性”回歸的特殊含義變量線性參數(shù)線性應(yīng)變量的條件均值是自變量的線性函數(shù)應(yīng)變量的條件均值是參數(shù)的線性函數(shù),變量之間并不一定是線性的線性回歸是指參數(shù)線性的回歸(即參數(shù)僅以一次方的形式出現(xiàn)在模型中),而解釋變量并不一定是線性的?;貧w分析的主要目的“線性”回歸的特殊含義變量線性參數(shù)線性應(yīng)變從雙變量回歸到多元線性回歸從雙變量回歸到多元線性回歸(1)根據(jù)自變量的取值,估計應(yīng)變量的均值。即根據(jù)樣本觀察值對經(jīng)濟計量模型參數(shù)進行估計,求得回歸方程;(2)對回歸方程、參數(shù)估計值進行顯著性檢驗;(3)根據(jù)樣本外自變量的取值,預(yù)測應(yīng)變量的均值。即利用回歸方程進行分析、評價及預(yù)測。

回歸分析的主要內(nèi)容估計檢驗預(yù)測(1)根據(jù)自變量的取值,估計應(yīng)變量的均值。即根據(jù)樣本觀察值對例2.1背景介紹SAT是ScholasticAptitudeTest,是美國高中生的所謂“高考”,在高中的最后兩年,大部分美國學生都要參加這一考試,但能否讀四年制大學并不取決于一個SAT分數(shù)。SAT由美國的CollegeBoard舉辦,在美國領(lǐng)土上每年舉辦7次,其它地方每年6次??荚囉糜⒄Z。SAT包括三種測試:1、CriticalReading閱讀;2、Math數(shù)學;3、Writing寫作。二、總體回歸函數(shù)例2.1背景介紹二、總體回歸函數(shù)例2.1:假定我們感興趣的是學生的家庭年收入與其數(shù)學分數(shù)有怎樣的關(guān)系。家庭年收入X數(shù)學分數(shù)Y70000~80000美元20000~30000美元30000~40000美元40000~50000美元<10000美元50000~60000美元60000~70000美元10000~20000美元80000~90000美元>100000美元收入變量X分為10組例2.1:假定我們感興趣的是學生的家庭年收入與其數(shù)學分數(shù)有怎一個家庭年收入5000美元的學生,其數(shù)學分數(shù)為460,X=5000,Y1=460;另一家庭年收入為5000美元的學生,其數(shù)學分數(shù)為470,X=5000,Y1=470……。這10個家庭收入為5000美元的學生,其數(shù)學平均分數(shù)為452。一個家庭年收入5000美元的學生,其數(shù)學分數(shù)為460,X=5Y1|X=5000=460;Y2|X=5000=470;Y3|X=5000=460;Y4|X=5000=420;Y5|X=5000=440;Y6|X=5000=500;Y7|X=5000=420;Y8|X=5000=410;Y9|X=5000=450;Y10|X=5000=490E(Y|X1=5000)=452同理:E(Y|X2=15000)=475同理:E(Y|X3=25000)=478同理:E(Y|X4=25000)=478同理:E(Y|X5=35000)=488……………同理:E(Y|X10=150000)=552(家庭收入、數(shù)學分數(shù)的條件均值)(家庭收入,數(shù)學分數(shù)值)做散點圖Y1|X=5000=460;Y2|X=5000=470;問題:能從一次抽樣中獲得總體的近似的信息嗎?001,表示家庭收入每增加1千美元,預(yù)期數(shù)學平均分會提高1分。Y8|X=5000=410;通過樣本回歸函數(shù)(模型)SRF用OLS法得出的樣本回歸線經(jīng)過樣本均值點,即:回歸分析的主要目的同理:E(Y|X2=15000)=475(3)根據(jù)樣本外自變量的取值,預(yù)測應(yīng)變量的均值。表示在給定收入水平X下,該組學生的數(shù)學平均分。五、樣本回歸函數(shù)(SRF)回歸分析(regressionanalysis):對變量的處理方法存在不對稱性,即區(qū)分應(yīng)變量(被解釋變量)和自變量(解釋變量):前者是隨機變量,后者不是估計總體回歸函數(shù)(模型)PRFY9|X=5000=450;估計總體回歸函數(shù)(模型)PRF50000~60000美元即給定X的條件下,Y分布的均值;Y7|X=5000=420;70000~80000美元即根據(jù)樣本觀察值對經(jīng)濟計量模型參數(shù)進行估計,求得回歸方程;這些假設(shè)與所采用的估計方法緊密相關(guān)。圖21家庭年收入與數(shù)學S.A.T分數(shù)學分數(shù)值數(shù)學分數(shù)的條件均值總體回歸線:條件均值的連線問題:能從一次抽樣中獲得總體的近似的信息嗎?圖21家庭年收由于圖2-1的總體回歸線近似線性,因此可表達為一線性函數(shù):其中,0,1是未知參數(shù),稱為回歸系數(shù)(regressioncoefficients)??傮w回歸函數(shù)1是斜率,它表示X每變動一個單位,Y(條件)均值的變化率。例:如果1=0.001,表示家庭收入每增加1千美元,預(yù)期數(shù)學平均分會提高1分。確定性非隨機總體回歸函數(shù)由于圖2-1的總體回歸線近似線性,因此可表達為一線性函數(shù):其這意味著Y依賴于X,也稱為Y對X的回歸。即給定X的條件下,Y分布的均值;或者說,總體回歸線穿過Y的條件期望值。因此,嚴格地說,回歸分析是條件回歸分析,關(guān)注的是在給定自變量取值條件下應(yīng)變量的變化。這意味著Y依賴于X,也稱為Y對X的回歸。即給定X的條件下,Y三、總體回歸模型(

總體回歸函數(shù)的統(tǒng)計或隨機設(shè)定)如何解釋個體學生分數(shù)與收入的關(guān)系呢?個體數(shù)學分數(shù)=這一組的平均分+(-)某個值隨機誤差項總體回歸函數(shù)的統(tǒng)計或隨機設(shè)定總體回歸模型如何理解該式?是一隨機變量,其值無法先驗確定,通常用概率分布描述隨機變量三、總體回歸模型(總體回歸函數(shù)的統(tǒng)計或隨機設(shè)定)如何解釋個系統(tǒng)或確定性成分非系統(tǒng)或確定性隨機成分系統(tǒng)或確定性成分(452)非系統(tǒng)或隨機成分(18)(528)(-28)系統(tǒng)或確定性成分非系統(tǒng)或確定性隨機成分系統(tǒng)或確定性成分(45表示在給定收入水平X下,該組學生的數(shù)學平均分。表示由于誤差項的存在,個人數(shù)學分數(shù)在均值附近是如何變動的。確定或非隨機總體回歸函數(shù)(總體回歸函數(shù))隨機或統(tǒng)計總體回歸函數(shù)(總體回歸模型)表示在給定收入水平X下,該組學生的數(shù)學平均分。表示由于誤差項

總體回歸函數(shù)說明在給定的收入水平Xi下,該組的數(shù)學平均分。但對該組某一個別的學生,其數(shù)學分數(shù)可能與該組平均分數(shù)有偏差。稱i為觀察值Yi圍繞它的期望值E(Y|Xi)的離差(deviation),是一個不可觀測的隨機變量,又稱為隨機干擾項(stochasticdisturbance)或隨機誤差項(stochasticerror)。記四、隨機誤差項總體回歸函數(shù)說明在給定的收入水平Xi下,該組的數(shù)1)在解釋變量中被忽略的因素的影響;如個人健康狀況、居住區(qū)域、學校開設(shè)的數(shù)學課程等因素。2)變量觀測值的觀測誤差的影響;3)即使模型中包含了所有解釋變量,但其內(nèi)在隨機性不可避免,這是做任何努力都無法解釋的。因為,人類的行為存在內(nèi)在隨機性;4)其它隨機因素的影響。奧卡姆剃刀原則。即模型是現(xiàn)實的簡化,描述應(yīng)盡可能簡單,只要不遺漏重要的信息。隨機誤差項主要包括下列因素的影響:1)在解釋變量中被忽略的因素的影響;如個人健康狀況、居住區(qū)域如何得到總體回歸函數(shù)中呢?五、樣本回歸函數(shù)(SRF)如果已知表2-1的全體數(shù)據(jù),則很容易得到總體回歸線如果僅僅有來自總體的一個樣本,則可根據(jù)樣本信息估計總體回歸函數(shù)如何得到總體回歸函數(shù)中呢?五、樣本回歸函數(shù)(SRF)如果已知五、樣本回歸函數(shù)(SRF)五、樣本回歸函數(shù)(SRF)實際中很少能獲得整個總體的數(shù)據(jù),通常,僅僅有來自總體的某一個樣本。問題:能從一次抽樣中獲得總體的近似的信息嗎?五、樣本回歸函數(shù)(SRF)實際中很少能獲得整個總體的數(shù)據(jù),通常,僅僅有來自總體的某一個根據(jù)表2-2、表2-3的數(shù)據(jù)做散點圖(scatterdiagram):樣本回歸線K個不同的樣本可得到K條不同的樣本回歸線根據(jù)表2-2、表2-3的數(shù)據(jù)做散點圖(scatterdia

記樣本回歸線的函數(shù)形式為:稱為樣本回歸函數(shù)(sampleregressionfunction,SRF)五、樣本回歸函數(shù)(SRF)記樣本回歸線的函數(shù)形式為:稱為樣本回歸函數(shù)(sampSAT是ScholasticAptitudeTest,是美國高中生的所謂“高考”,在高中的最后兩年,大部分美國學生都要參加這一考試,但能否讀四年制大學并不取決于一個SAT分數(shù)。其中,0,1是未知參數(shù),稱為回歸系數(shù)(regressioncoefficients)。根據(jù)表2-4的計算,得到數(shù)學S.因此,嚴格地說,回歸分析是條件回歸分析,關(guān)注的是在給定自變量取值條件下應(yīng)變量的變化。稱i為觀察值Yi圍繞它的期望值E(Y|Xi)的離差(deviation),是一個不可觀測的隨機變量,又稱為隨機干擾項(stochasticdisturbance)或隨機誤差項(stochasticerror)。是一隨機變量,其值無法先驗確定,通常用概率分布描述隨機變量如果已知表2-1的全體數(shù)據(jù),則很容易得到總體回歸線為保證參數(shù)估計量具有良好的性質(zhì),通常對模型提出若干基本假設(shè)。70000~80000美元確定性非隨機總體回歸函數(shù)表示在給定收入水平X下,該組學生的數(shù)學平均分。0013表示在其他條件保持不變的情況下,家庭年收入每增加1元,數(shù)學分數(shù)平均提高0.用OLS法得出的樣本回歸線經(jīng)過樣本均值點,即:80000~90000美元1綜合應(yīng)用對數(shù)學S.從雙變量到多變量的線性回歸30000~40000美元因此,選擇實際值作為衡量標準根據(jù)表2-4的計算,得到數(shù)學S.問題:能從一次抽樣中獲得總體的近似的信息嗎?同樣地,樣本回歸函數(shù)也有如下的隨機形式:

這里將樣本回歸線看成總體回歸線的近似替代則

注意:五、樣本回歸函數(shù)(SRF)SAT是ScholasticAptitudeTest,是同樣地,樣本回歸函數(shù)也有如下的隨機形式:

由于方程中引入了隨機項,成為計量經(jīng)濟模型,因此也稱為樣本回歸模型(sampleregressionmodel)。

六、樣本回歸函數(shù)的隨機形式/樣本回歸模型同樣地,樣本回歸函數(shù)也有如下的隨機形式:由于方程中引

根據(jù)樣本回歸函數(shù)SRF即,根據(jù)

估計七、回歸分析的目的PRFSRF估計總體回歸函數(shù)PRF根據(jù)樣本回歸函數(shù)SRF即,根據(jù)估計七、回歸分析的目的PR注意:這里PRF可能永遠無法知道。七、回歸分析的目的PRFSRF注意:這里PRF可能永遠無法知道。七、回歸分析的目的PRFS

回歸分析的主要目的通過樣本回歸函數(shù)(模型)SRF估計總體回歸函數(shù)(模型)PRF最廣泛使用的是普通最小二乘法

為保證參數(shù)估計量具有良好的性質(zhì),通常對模型提出若干基本假設(shè)。這些假設(shè)與所采用的估計方法緊密相關(guān)。第二部分:參數(shù)估計估計方法有多種,如OLS、MLE、GMM等(ordinaryleastsquares,OLS)回歸分析的主要目的最廣泛使用的是普通最小二乘法第二部分:參數(shù)估計最小二乘原理:即在給定樣本觀測值之下,選擇出、能使、之差的平方和最小。圖示法說明數(shù)學推導說明

回歸分析的主要目的通過樣本回歸函數(shù)(模型)SRF估計總體回歸函數(shù)(模型)PRF第二部分:參數(shù)估計最小二乘原理:即在給定樣本觀測值之下,選擇圖示法說明:1、PRF無法獲知。因此,選擇實際值作為衡量標準2、殘差之和可能正負抵消。因此,選擇殘差平方和圖示法說明:1、PRF無法獲知。因此,選擇實際值作為衡量標準OLS方法的數(shù)學推導說明如何選擇參數(shù),以使得殘差平方和最小OLS方法的數(shù)學推導說明如何選擇參數(shù),以使得殘差平方和最小方程組(*)稱為正規(guī)方程組(normalequations)。

OLS方法的數(shù)學推導說明方程組(*)稱為正規(guī)方程組(normalequations例2.1

綜合應(yīng)用例2.1綜合應(yīng)用例2.1

綜合應(yīng)用根據(jù)表2-4的計算,得到數(shù)學S.A.T分數(shù)回歸結(jié)果如下:其中,X表示家庭年收入,Y表示數(shù)學分數(shù),表示給定X水平下真實總體均值的估計量。該樣本回歸線如圖所示通常采用軟件實現(xiàn)估計可通過計算實現(xiàn)估計例2.1綜合應(yīng)用根據(jù)表2-4的計算,得到數(shù)學S.A.T分數(shù)表示由于誤差項的存在,個人數(shù)學分數(shù)在均值附近是如何變動的?;貧w分析構(gòu)成計量經(jīng)濟學的方法論基礎(chǔ)估計方法有多種,如OLS、MLE、GMM等即給定X的條件下,Y分布的均值;Y5|X=5000=440;80000~90000美元表示在給定收入水平X下,該組學生的數(shù)學平均分。表示在給定收入水平X下,該組學生的數(shù)學平均分。這意味著Y依賴于X,也稱為Y對X的回歸?;蛘哒f,總體回歸線穿過Y的條件期望值。30000~40000美元001,表示家庭收入每增加1千美元,預(yù)期數(shù)學平均分會提高1分?;貧w分析的主要目的表示由于誤差項的存在,個人數(shù)學分數(shù)在均值附近是如何變動的。五、樣本回歸函數(shù)(SRF)雙變量模型用OLS法得出的樣本回歸線經(jīng)過樣本均值點,即:表示在給定收入水平X下,該組學生的數(shù)學平均分。表示由于誤差項的存在,個人數(shù)學分數(shù)在均值附近是如何變動的。斜率系數(shù)0.0013表示在其他條件保持不變的情況下,家庭年收入每增加1元,數(shù)學分數(shù)平均提高0.0013分。例2.1

綜合應(yīng)用對數(shù)學S.A.T分數(shù)回歸結(jié)果的解釋截距的解釋則沒什么經(jīng)濟意義,因為家庭年收入為0的數(shù)據(jù)幾乎不會發(fā)生。斜率系數(shù)0.0013表示在其他條件保持不變的情況下,家庭年收普通最小二乘估計量的一些重要性質(zhì)1.用OLS法得出的樣本回歸線經(jīng)過樣本均值點,即:2.殘差的均值()總為0。3.對殘差與解釋變量的積求和,其值為零;即這兩個變量不相關(guān)。這條性質(zhì)也可用來檢查最小二乘法計算結(jié)果。4.對殘差與(估計的)的積求和,其值為0;即為0(見習題2.25)。

普通最小二乘估計量的一些重要性質(zhì)1.用OLS法得出的樣本回歸線性回歸的基本思想雙變量模型

本節(jié)課的小結(jié)回歸分析的含義總體回歸函數(shù)樣本回歸函數(shù)總體回歸模型回歸分析的目的樣本回歸模型隨機誤差項的性質(zhì)二、參數(shù)估計一、回歸分析概述最小二乘原理如何進行參數(shù)估計“線性”回歸的含義線性回歸的基本思想雙變量模型

本節(jié)課的小結(jié)回歸分析的含義總體第二章

經(jīng)典單方程計量經(jīng)濟學模型:

一元線性回歸模型

線性回歸的基本思想:

雙變量模型第二章

經(jīng)典單方程計量經(jīng)濟學模型:

線性回歸的基本思想雙變量模型回歸分析概述參數(shù)估計模型檢驗?zāi)P皖A(yù)測回歸分析構(gòu)成計量經(jīng)濟學的方法論基礎(chǔ)線性回歸的基本思想雙變量模型回歸分析概述參數(shù)估計模型檢驗線性回歸的基本思想雙變量模型

本節(jié)課的內(nèi)容回歸分析的含義總體回歸函數(shù)樣本回歸函數(shù)總體回歸模型回歸分析的目的樣本回歸模型隨機誤差項的性質(zhì)二、參數(shù)估計一、回歸分析概述最小二乘原理OLS下如何進行參數(shù)估計線性回歸的基本思想雙變量模型

本節(jié)課的內(nèi)容回歸分析的含義總體一、回歸分析的含義變量間的關(guān)系回歸分析的含義回歸分析的主要內(nèi)容線性回歸分析的“特殊”含義從雙變量到多變量的線性回歸一、回歸分析的含義變量間的關(guān)系回歸分析的含義回歸分析的主要內(nèi)變量間的關(guān)系變量間的關(guān)系確定性關(guān)系或函數(shù)關(guān)系統(tǒng)計依賴或相關(guān)關(guān)系經(jīng)濟變量之間的關(guān)系相關(guān)分析回歸分析線性關(guān)系非線性關(guān)系變量間的關(guān)系確定性關(guān)系或函數(shù)關(guān)系統(tǒng)計依賴或相關(guān)關(guān)系經(jīng)濟變量之間的關(guān)系相關(guān)相關(guān)分析(correlationanalysis):對稱地對待任何(兩個)變量,兩個變量都被看作是隨機的回歸分析

(regressionanalysis):對變量的處理方法存在不對稱性,即區(qū)分應(yīng)變量(被解釋變量)和自變量(解釋變量):前者是隨機變量,后者不是回歸分析/相關(guān)分析研究一個變量對另一個(些)變量的統(tǒng)計依賴關(guān)系,但它們并不意味著一定有因果關(guān)系被解釋變量(因變量)解釋變量(自變量)回歸分析情況下隨機變量非隨機變量因果關(guān)系的判定或推斷必須建立在經(jīng)實踐檢驗的相關(guān)理論基礎(chǔ)之上相關(guān)分析(correlationanalysis):對稱地是用于研究一個變量與另一個(些)變量的具體依賴關(guān)系的計算方法和理論。被解釋變量(因變量)Y解釋變量(自變量)X1、X2、……目的:在于通過自變量的已知或設(shè)定值,去估計和(或)預(yù)測因變量的(總體)均值。估計預(yù)測農(nóng)作物的產(chǎn)量示例:回歸分析(regressionanalysis)的含義是用于研究一個變量與另一個(些)變量的具體依賴關(guān)系的計算方法回歸分析的主要目的五、樣本回歸函數(shù)(SRF)問題:能從一次抽樣中獲得總體的近似的信息嗎?Y7|X=5000=420;從雙變量回歸到多元線性回歸根據(jù)表2-4的計算,得到數(shù)學S.這些假設(shè)與所采用的估計方法緊密相關(guān)。Y2|X=5000=470;同理:E(Y|X3=25000)=478記樣本回歸線的函數(shù)形式為:70000~80000美元稱i為觀察值Yi圍繞它的期望值E(Y|Xi)的離差(deviation),是一個不可觀測的隨機變量,又稱為隨機干擾項(stochasticdisturbance)或隨機誤差項(stochasticerror)。Y4|X=5000=420;3、Writing寫作。4)其它隨機因素的影響。同樣地,樣本回歸函數(shù)也有如下的隨機形式:80000~90000美元一個家庭年收入5000美元的學生,其數(shù)學分數(shù)為460,X=5000,Y1=460;“線性”回歸的特殊含義變量線性參數(shù)線性應(yīng)變量的條件均值是自變量的線性函數(shù)應(yīng)變量的條件均值是參數(shù)的線性函數(shù),變量之間并不一定是線性的線性回歸是指參數(shù)線性的回歸(即參數(shù)僅以一次方的形式出現(xiàn)在模型中),而解釋變量并不一定是線性的。回歸分析的主要目的“線性”回歸的特殊含義變量線性參數(shù)線性應(yīng)變從雙變量回歸到多元線性回歸從雙變量回歸到多元線性回歸(1)根據(jù)自變量的取值,估計應(yīng)變量的均值。即根據(jù)樣本觀察值對經(jīng)濟計量模型參數(shù)進行估計,求得回歸方程;(2)對回歸方程、參數(shù)估計值進行顯著性檢驗;(3)根據(jù)樣本外自變量的取值,預(yù)測應(yīng)變量的均值。即利用回歸方程進行分析、評價及預(yù)測。

回歸分析的主要內(nèi)容估計檢驗預(yù)測(1)根據(jù)自變量的取值,估計應(yīng)變量的均值。即根據(jù)樣本觀察值對例2.1背景介紹SAT是ScholasticAptitudeTest,是美國高中生的所謂“高考”,在高中的最后兩年,大部分美國學生都要參加這一考試,但能否讀四年制大學并不取決于一個SAT分數(shù)。SAT由美國的CollegeBoard舉辦,在美國領(lǐng)土上每年舉辦7次,其它地方每年6次??荚囉糜⒄Z。SAT包括三種測試:1、CriticalReading閱讀;2、Math數(shù)學;3、Writing寫作。二、總體回歸函數(shù)例2.1背景介紹二、總體回歸函數(shù)例2.1:假定我們感興趣的是學生的家庭年收入與其數(shù)學分數(shù)有怎樣的關(guān)系。家庭年收入X數(shù)學分數(shù)Y70000~80000美元20000~30000美元30000~40000美元40000~50000美元<10000美元50000~60000美元60000~70000美元10000~20000美元80000~90000美元>100000美元收入變量X分為10組例2.1:假定我們感興趣的是學生的家庭年收入與其數(shù)學分數(shù)有怎一個家庭年收入5000美元的學生,其數(shù)學分數(shù)為460,X=5000,Y1=460;另一家庭年收入為5000美元的學生,其數(shù)學分數(shù)為470,X=5000,Y1=470……。這10個家庭收入為5000美元的學生,其數(shù)學平均分數(shù)為452。一個家庭年收入5000美元的學生,其數(shù)學分數(shù)為460,X=5Y1|X=5000=460;Y2|X=5000=470;Y3|X=5000=460;Y4|X=5000=420;Y5|X=5000=440;Y6|X=5000=500;Y7|X=5000=420;Y8|X=5000=410;Y9|X=5000=450;Y10|X=5000=490E(Y|X1=5000)=452同理:E(Y|X2=15000)=475同理:E(Y|X3=25000)=478同理:E(Y|X4=25000)=478同理:E(Y|X5=35000)=488……………同理:E(Y|X10=150000)=552(家庭收入、數(shù)學分數(shù)的條件均值)(家庭收入,數(shù)學分數(shù)值)做散點圖Y1|X=5000=460;Y2|X=5000=470;問題:能從一次抽樣中獲得總體的近似的信息嗎?001,表示家庭收入每增加1千美元,預(yù)期數(shù)學平均分會提高1分。Y8|X=5000=410;通過樣本回歸函數(shù)(模型)SRF用OLS法得出的樣本回歸線經(jīng)過樣本均值點,即:回歸分析的主要目的同理:E(Y|X2=15000)=475(3)根據(jù)樣本外自變量的取值,預(yù)測應(yīng)變量的均值。表示在給定收入水平X下,該組學生的數(shù)學平均分。五、樣本回歸函數(shù)(SRF)回歸分析(regressionanalysis):對變量的處理方法存在不對稱性,即區(qū)分應(yīng)變量(被解釋變量)和自變量(解釋變量):前者是隨機變量,后者不是估計總體回歸函數(shù)(模型)PRFY9|X=5000=450;估計總體回歸函數(shù)(模型)PRF50000~60000美元即給定X的條件下,Y分布的均值;Y7|X=5000=420;70000~80000美元即根據(jù)樣本觀察值對經(jīng)濟計量模型參數(shù)進行估計,求得回歸方程;這些假設(shè)與所采用的估計方法緊密相關(guān)。圖21家庭年收入與數(shù)學S.A.T分數(shù)學分數(shù)值數(shù)學分數(shù)的條件均值總體回歸線:條件均值的連線問題:能從一次抽樣中獲得總體的近似的信息嗎?圖21家庭年收由于圖2-1的總體回歸線近似線性,因此可表達為一線性函數(shù):其中,0,1是未知參數(shù),稱為回歸系數(shù)(regressioncoefficients)??傮w回歸函數(shù)1是斜率,它表示X每變動一個單位,Y(條件)均值的變化率。例:如果1=0.001,表示家庭收入每增加1千美元,預(yù)期數(shù)學平均分會提高1分。確定性非隨機總體回歸函數(shù)由于圖2-1的總體回歸線近似線性,因此可表達為一線性函數(shù):其這意味著Y依賴于X,也稱為Y對X的回歸。即給定X的條件下,Y分布的均值;或者說,總體回歸線穿過Y的條件期望值。因此,嚴格地說,回歸分析是條件回歸分析,關(guān)注的是在給定自變量取值條件下應(yīng)變量的變化。這意味著Y依賴于X,也稱為Y對X的回歸。即給定X的條件下,Y三、總體回歸模型(

總體回歸函數(shù)的統(tǒng)計或隨機設(shè)定)如何解釋個體學生分數(shù)與收入的關(guān)系呢?個體數(shù)學分數(shù)=這一組的平均分+(-)某個值隨機誤差項總體回歸函數(shù)的統(tǒng)計或隨機設(shè)定總體回歸模型如何理解該式?是一隨機變量,其值無法先驗確定,通常用概率分布描述隨機變量三、總體回歸模型(總體回歸函數(shù)的統(tǒng)計或隨機設(shè)定)如何解釋個系統(tǒng)或確定性成分非系統(tǒng)或確定性隨機成分系統(tǒng)或確定性成分(452)非系統(tǒng)或隨機成分(18)(528)(-28)系統(tǒng)或確定性成分非系統(tǒng)或確定性隨機成分系統(tǒng)或確定性成分(45表示在給定收入水平X下,該組學生的數(shù)學平均分。表示由于誤差項的存在,個人數(shù)學分數(shù)在均值附近是如何變動的。確定或非隨機總體回歸函數(shù)(總體回歸函數(shù))隨機或統(tǒng)計總體回歸函數(shù)(總體回歸模型)表示在給定收入水平X下,該組學生的數(shù)學平均分。表示由于誤差項

總體回歸函數(shù)說明在給定的收入水平Xi下,該組的數(shù)學平均分。但對該組某一個別的學生,其數(shù)學分數(shù)可能與該組平均分數(shù)有偏差。稱i為觀察值Yi圍繞它的期望值E(Y|Xi)的離差(deviation),是一個不可觀測的隨機變量,又稱為隨機干擾項(stochasticdisturbance)或隨機誤差項(stochasticerror)。記四、隨機誤差項總體回歸函數(shù)說明在給定的收入水平Xi下,該組的數(shù)1)在解釋變量中被忽略的因素的影響;如個人健康狀況、居住區(qū)域、學校開設(shè)的數(shù)學課程等因素。2)變量觀測值的觀測誤差的影響;3)即使模型中包含了所有解釋變量,但其內(nèi)在隨機性不可避免,這是做任何努力都無法解釋的。因為,人類的行為存在內(nèi)在隨機性;4)其它隨機因素的影響。奧卡姆剃刀原則。即模型是現(xiàn)實的簡化,描述應(yīng)盡可能簡單,只要不遺漏重要的信息。隨機誤差項主要包括下列因素的影響:1)在解釋變量中被忽略的因素的影響;如個人健康狀況、居住區(qū)域如何得到總體回歸函數(shù)中呢?五、樣本回歸函數(shù)(SRF)如果已知表2-1的全體數(shù)據(jù),則很容易得到總體回歸線如果僅僅有來自總體的一個樣本,則可根據(jù)樣本信息估計總體回歸函數(shù)如何得到總體回歸函數(shù)中呢?五、樣本回歸函數(shù)(SRF)如果已知五、樣本回歸函數(shù)(SRF)五、樣本回歸函數(shù)(SRF)實際中很少能獲得整個總體的數(shù)據(jù),通常,僅僅有來自總體的某一個樣本。問題:能從一次抽樣中獲得總體的近似的信息嗎?五、樣本回歸函數(shù)(SRF)實際中很少能獲得整個總體的數(shù)據(jù),通常,僅僅有來自總體的某一個根據(jù)表2-2、表2-3的數(shù)據(jù)做散點圖(scatterdiagram):樣本回歸線K個不同的樣本可得到K條不同的樣本回歸線根據(jù)表2-2、表2-3的數(shù)據(jù)做散點圖(scatterdia

記樣本回歸線的函數(shù)形式為:稱為樣本回歸函數(shù)(sampleregressionfunction,SRF)五、樣本回歸函數(shù)(SRF)記樣本回歸線的函數(shù)形式為:稱為樣本回歸函數(shù)(sampSAT是ScholasticAptitudeTest,是美國高中生的所謂“高考”,在高中的最后兩年,大部分美國學生都要參加這一考試,但能否讀四年制大學并不取決于一個SAT分數(shù)。其中,0,1是未知參數(shù),稱為回歸系數(shù)(regressioncoefficients)。根據(jù)表2-4的計算,得到數(shù)學S.因此,嚴格地說,回歸分析是條件回歸分析,關(guān)注的是在給定自變量取值條件下應(yīng)變量的變化。稱i為觀察值Yi圍繞它的期望值E(Y|Xi)的離差(deviation),是一個不可觀測的隨機變量,又稱為隨機干擾項(stochasticdisturbance)或隨機誤差項(stochasticerror)。是一隨機變量,其值無法先驗確定,通常用概率分布描述隨機變量如果已知表2-1的全體數(shù)據(jù),則很容易得到總體回歸線為保證參數(shù)估計量具有良好的性質(zhì),通常對模型提出若干基本假設(shè)。70000~80000美元確定性非隨機總體回歸函數(shù)表示在給定收入水平X下,該組學生的數(shù)學平均分。0013表示在其他條件保持不變的情況下,家庭年收入每增加1元,數(shù)學分數(shù)平均提高0.用OLS法得出的樣本回歸線經(jīng)過樣本均值點,即:80000~90000美元1綜合應(yīng)用對數(shù)學S.從雙變量到多變量的線性回歸30000~40000美元因此,選擇實際值作為衡量標準根據(jù)表2-4的計算,得到數(shù)學S.問題:能從一次抽樣中獲得總體的近似的信息嗎?同樣地,樣本回歸函數(shù)也有如下的隨機形式:

這里將樣本回歸線看成總體回歸線的近似替代則

注意:五、樣本回歸函數(shù)(SRF)SAT是ScholasticAptitudeTest,是同樣地,樣本回歸函數(shù)也有如下的隨機形式:

由于方程中引入了隨機項,成為計量經(jīng)濟模型,因此也稱為樣本回歸模型(sampleregressionmodel)。

六、樣本回歸函數(shù)的隨機形式/樣本回歸模型同樣地,樣本回歸函數(shù)也有如下的隨機形式:由于方程中引

根據(jù)樣本回歸函數(shù)SRF即,根據(jù)

估計七、回歸分析的目的PRFSRF估計總體回歸函數(shù)PRF根據(jù)樣本回歸函數(shù)SRF即,根據(jù)估計七、回歸分析的目的PR注意:這里PRF可能永遠無法知道。七、回歸分析的目的PRFSRF注意:這里PRF可能永遠無法知道。七、回歸分析的目的PRFS

回歸分析的主要目的通過樣本回歸函數(shù)(模型)SRF估計總體回歸函數(shù)(模型)PRF最廣泛使用的是普通最小二乘法

為保證參數(shù)估計量具有良好的性質(zhì),通常對模型提出若干基本假設(shè)。這些假設(shè)與所采用的估計方法緊密相關(guān)。第二

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論