版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第二章一元線形新第一頁,共一百五十四頁,編輯于2023年,星期四回歸分析概述一元線性回歸模型的參數(shù)估計(jì)一元線性回歸模型檢驗(yàn)一元線性回歸模型預(yù)測(cè)第二頁,共一百五十四頁,編輯于2023年,星期四3.1回歸分析概述第三頁,共一百五十四頁,編輯于2023年,星期四一、變量間的關(guān)系及回歸分析的基本概念
二、總體回歸函數(shù)三、隨機(jī)擾動(dòng)項(xiàng)四、樣本回歸函數(shù)(SRF)第四頁,共一百五十四頁,編輯于2023年,星期四
(1)確定性關(guān)系或函數(shù)關(guān)系:研究的是確定現(xiàn)象非隨機(jī)變量間的關(guān)系。(2)統(tǒng)計(jì)依賴或相關(guān)關(guān)系:研究的是非確定現(xiàn)象隨機(jī)變量間的關(guān)系。一、變量間的關(guān)系及回歸分析的基本概念
1、變量間的關(guān)系經(jīng)濟(jì)變量之間的關(guān)系,大體可分為兩類:第五頁,共一百五十四頁,編輯于2023年,星期四對(duì)變量間統(tǒng)計(jì)依賴關(guān)系的考察主要是通過相關(guān)分析(correlationanalysis)或回歸分析(regressionanalysis)來完成的:例如:函數(shù)關(guān)系:統(tǒng)計(jì)依賴關(guān)系/統(tǒng)計(jì)相關(guān)關(guān)系:第六頁,共一百五十四頁,編輯于2023年,星期四
①不線性相關(guān)并不意味著不相關(guān);
②有相關(guān)關(guān)系并不意味著一定有因果關(guān)系;③回歸分析研究一個(gè)變量對(duì)另一個(gè)(些)變量的統(tǒng)計(jì)依賴關(guān)系,這種統(tǒng)計(jì)依賴關(guān)系通常表現(xiàn)為一種因果關(guān)系;可以是線性關(guān)系,也可以是非線性關(guān)系。
④相關(guān)分析對(duì)稱地對(duì)待任何(兩個(gè))變量,兩個(gè)變量都被看作是隨機(jī)的。回歸分析對(duì)變量的處理方法存在不對(duì)稱性,即區(qū)分應(yīng)變量(被解釋變量)和自變量(解釋變量):前者是隨機(jī)變量,后者不是?!⒁猓旱谄唔?,共一百五十四頁,編輯于2023年,星期四
回歸分析(regressionanalysis)是研究一個(gè)變量關(guān)于另一個(gè)(些)變量的具體依賴關(guān)系的計(jì)算方法和理論。
其用意:在于通過后者的已知或設(shè)定值,去估計(jì)和(或)預(yù)測(cè)前者的(總體)均值。這里:前一個(gè)變量被稱為被解釋變量(ExplainedVariable)或應(yīng)變量(DependentVariable),后一個(gè)(些)變量被稱為解釋變量(ExplanatoryVariable)或自變量(IndependentVariable)。2、回歸分析的基本概念第八頁,共一百五十四頁,編輯于2023年,星期四與古典回歸模型有關(guān)的詞匯對(duì)于簡(jiǎn)單線性回歸模型y=b0+b1x+,我們通常將y稱作因變量(DependentVariable)。英語軟件中的其他表達(dá)方式有:Left-HandSideVariableExplainedVariableRegressand我們通常將x稱作自變量(IndependentVariable)。英語軟件中的其他表達(dá)方式有:Right-HandSideVariableExplanatoryVariableRegressorControlVariables第九頁,共一百五十四頁,編輯于2023年,星期四
回歸分析構(gòu)成計(jì)量經(jīng)濟(jì)學(xué)的方法論基礎(chǔ),其主要內(nèi)容包括:
(1)根據(jù)樣本觀察值對(duì)經(jīng)濟(jì)計(jì)量模型參數(shù)進(jìn)行估計(jì),求得
回歸方程;(2)對(duì)回歸方程、參數(shù)估計(jì)值進(jìn)行顯著性檢驗(yàn);(3)利用回歸方程進(jìn)行分析、評(píng)價(jià)及預(yù)測(cè)。第十頁,共一百五十四頁,編輯于2023年,星期四
由于變量間關(guān)系的隨機(jī)性,回歸分析關(guān)心的是根據(jù)解釋變量的已知或給定值,考察被解釋變量的總體均值,即當(dāng)解釋變量取某個(gè)確定值時(shí),與之統(tǒng)計(jì)相關(guān)的被解釋變量所有可能出現(xiàn)的對(duì)應(yīng)值的平均值。
例3.1:一個(gè)假想的社區(qū)有100戶家庭組成,要研究該社區(qū)每月家庭消費(fèi)支出Y與每月家庭可支配收入X的關(guān)系。
即如果知道了家庭的月收入,能否預(yù)測(cè)該社區(qū)家庭的平均月消費(fèi)支出水平。
二、總體回歸函數(shù)
為達(dá)到此目的,將該100戶家庭劃分為組內(nèi)收入差不多的10組,以分析每一收入組的家庭消費(fèi)支出。第十一頁,共一百五十四頁,編輯于2023年,星期四第十二頁,共一百五十四頁,編輯于2023年,星期四
(1)由于不確定因素的影響,對(duì)同一收入水平X,不同家庭的消費(fèi)支出不完全相同;
(2)但由于調(diào)查的完備性,給定收入水平X的消費(fèi)支出Y的分布是確定的,即以X的給定值為條件的Y的條件分布(Conditionaldistribution)或條件概率是已知的,如:P(Y=561|X=800)=1/4。因此,給定收入X的值Xi,可得消費(fèi)支出Y的條件均值(conditionalmean)或條件期望(conditionalexpectation):E(Y|X=Xi)該例中:E(Y|X=800)=605E(Y|X=1100)=825分析:第十三頁,共一百五十四頁,編輯于2023年,星期四練習(xí)請(qǐng)同學(xué)們計(jì)算出表中給定不同收入水平X取值時(shí),消費(fèi)支出Y的條件均值分別是多少?嘗試在直角坐標(biāo)系中將對(duì)應(yīng)于不同收入水平的消費(fèi)支出的條件均值描繪出來.第十四頁,共一百五十四頁,編輯于2023年,星期四
描出散點(diǎn)圖發(fā)現(xiàn):隨著收入的增加,消費(fèi)“平均地說”也在增加,且Y的條件均值均落在一根正斜率的直線上。這條直線稱為總體回歸線。05001000150020002500300035005001000150020002500300035004000每月可支配收入X(元)每月消費(fèi)支出Y(元)
第十五頁,共一百五十四頁,編輯于2023年,星期四概念:
在給定解釋變量Xi條件下被解釋變量Yi的期望軌跡稱為總體回歸線(populationregressionline),或更一般地稱為總體回歸曲線(populationregressioncurve)。稱為(雙變量)總體回歸函數(shù)(populationregressionfunction,PRF)。
相應(yīng)的函數(shù):第十六頁,共一百五十四頁,編輯于2023年,星期四
回歸函數(shù)(PRF)說明被解釋變量Y的平均狀態(tài)(總體條件期望)隨解釋變量X變化的規(guī)律。含義:
函數(shù)形式:
可以是線性或非線性的。
例2.1中,將居民消費(fèi)支出看成是其可支配收入的線性函數(shù)時(shí):
為一線性函數(shù)。其中,0,1是未知參數(shù),稱為回歸系數(shù)(regressioncoefficients)。
第十七頁,共一百五十四頁,編輯于2023年,星期四
三、隨機(jī)干擾項(xiàng)總體回歸函數(shù)說明在給定的收入水平Xi下,該社區(qū)家庭平均的消費(fèi)支出水平。但對(duì)某一個(gè)別的家庭,其消費(fèi)支出可能與該平均水平有偏差。稱i為觀察值Yi圍繞它的期望值E(Y|Xi)的離差(deviation),是一個(gè)不可觀測(cè)的隨機(jī)變量,又稱為隨機(jī)干擾項(xiàng)(stochasticdisturbance)或隨機(jī)誤差項(xiàng)(stochasticerror)。記第十八頁,共一百五十四頁,編輯于2023年,星期四例2.1中,個(gè)別家庭的消費(fèi)支出為:
(*)式稱為總體回歸函數(shù)(PRF)的隨機(jī)設(shè)定形式。表明被解釋變量除了受解釋變量的系統(tǒng)性影響外,還受其他因素的隨機(jī)性影響。(1)該收入水平下所有家庭的平均消費(fèi)支出E(Y|Xi),稱為系統(tǒng)性(systematic)或確定性(deterministic)部分。(2)其他隨機(jī)或非確定性(nonsystematic)部分i。即,給定收入水平Xi,個(gè)別家庭的支出可表示為兩部分之和:(*)
由于方程中引入了隨機(jī)項(xiàng),成為計(jì)量經(jīng)濟(jì)學(xué)模型,因此也稱為總體回歸函數(shù)的隨機(jī)形式或總體回歸模型。第十九頁,共一百五十四頁,編輯于2023年,星期四隨機(jī)誤差項(xiàng)主要包括下列因素的影響:1)在解釋變量中被忽略的因素的影響;2)變量觀測(cè)值的觀測(cè)誤差的影響;3)模型關(guān)系的設(shè)定誤差的影響;4)其它隨機(jī)因素的影響。產(chǎn)生并設(shè)計(jì)隨機(jī)誤差項(xiàng)的主要原因:1)理論的含糊性;2)數(shù)據(jù)的欠缺;3)節(jié)省原則。第二十頁,共一百五十四頁,編輯于2023年,星期四
四、樣本回歸函數(shù)(SRF)
問題:能從一次抽樣中獲得總體的近似的信息嗎?如果可以,如何從抽樣中獲得總體的近似信息?
那么,能否從該樣本估計(jì)總體回歸函數(shù)PRF?
例2.2:在例2.1的總體中有如下一個(gè)樣本,
總體的信息往往無法掌握,現(xiàn)實(shí)的情況只能是在一次觀測(cè)中得到總體的一個(gè)樣本。第二十一頁,共一百五十四頁,編輯于2023年,星期四核樣本的散點(diǎn)圖(scatterdiagram):
樣本散點(diǎn)圖近似于一條直線,畫一條直線以盡好地?cái)M合該散點(diǎn)圖,由于樣本取自總體,可以用該線近似地代表總體回歸線。該線稱為樣本回歸線(sampleregressionlines)。
將樣本回歸線的函數(shù)形式定義為:稱為樣本回歸函數(shù)(sampleregressionfunction,SRF)。
第二十二頁,共一百五十四頁,編輯于2023年,星期四
這里將樣本回歸線看成總體回歸線的近似替代則
注意:第二十三頁,共一百五十四頁,編輯于2023年,星期四
樣本回歸函數(shù)的隨機(jī)形式/樣本回歸模型:同樣地,樣本回歸函數(shù)也有如下的隨機(jī)形式:
由于方程中引入了隨機(jī)項(xiàng),成為計(jì)量經(jīng)濟(jì)模型,因此也稱為樣本回歸模型(sampleregressionmodel)。
第二十四頁,共一百五十四頁,編輯于2023年,星期四
▼回歸分析的主要目的:根據(jù)樣本回歸函數(shù)SRF,估計(jì)總體回歸函數(shù)PRF。注意:這里PRF可能永遠(yuǎn)無法知道。即,根據(jù)
估計(jì)第二十五頁,共一百五十四頁,編輯于2023年,星期四依據(jù)樣本統(tǒng)計(jì)特征推斷總體統(tǒng)計(jì)特征在計(jì)量經(jīng)濟(jì)模型中,參數(shù)反映經(jīng)濟(jì)變量相互依存的性質(zhì)和程度,通常假定其是一個(gè)相對(duì)穩(wěn)定的數(shù)值。由于各種因素,觀察總體特征常常是不可能的,或者代價(jià)過于高昂。因此,對(duì)于利用計(jì)量經(jīng)濟(jì)模型研究的經(jīng)濟(jì)現(xiàn)象總體,參數(shù)一般來說是未知的。在此情況下,研究者通過獲得有代表性的樣本和研究樣本統(tǒng)計(jì)特性來間接推斷總體數(shù)量的特征。只有當(dāng)樣本是按照統(tǒng)計(jì)標(biāo)準(zhǔn)從總體中抽出時(shí)(如每個(gè)個(gè)體均有同等機(jī)會(huì)被抽出的隨機(jī)樣本),才可以依據(jù)樣本統(tǒng)計(jì)特征來推斷總體統(tǒng)計(jì)特征。第二十六頁,共一百五十四頁,編輯于2023年,星期四3.2
一元線性回歸模型
的參數(shù)估計(jì)第二十七頁,共一百五十四頁,編輯于2023年,星期四線性回歸模型的參數(shù)估計(jì)
涉及的理論問題采用什么樣的方法獲得參數(shù)估計(jì)量?什么是最佳估計(jì)量?滿足什么樣的條件時(shí)才能得到最佳估計(jì)量?第二十八頁,共一百五十四頁,編輯于2023年,星期四一、估計(jì)方法:
最小二乘法第二十九頁,共一百五十四頁,編輯于2023年,星期四回歸分析的基本概念是利用樣本資料得到對(duì)總體參數(shù)的估計(jì);用{(xi,yi):i=1,…,n}表示由總體得到的一個(gè)容量為n的隨機(jī)樣本;第三十頁,共一百五十四頁,編輯于2023年,星期四樣本回歸曲線、觀察數(shù)據(jù)和殘差....y4y1y2y3x1x2x3x4}}{{e1e2e3e4xy第三十一頁,共一百五十四頁,編輯于2023年,星期四曲線擬合與相關(guān)分析不同,曲線擬合可以測(cè)定經(jīng)濟(jì)變量間的數(shù)量聯(lián)系。一般情況下,這種聯(lián)系體現(xiàn)為因果關(guān)系,需要通過實(shí)際獲得的(樣本)數(shù)據(jù)進(jìn)行擬合。曲線擬合可以用多種方法,各有其優(yōu)點(diǎn)和弱點(diǎn)。在應(yīng)用工作中,使用較為普遍的有最小二乘法(OLS)和最大似然法。
第三十二頁,共一百五十四頁,編輯于2023年,星期四
最小二乘法(OLS)最小二乘法的思路是選擇使殘差平方和最小的參數(shù)估計(jì),即:利用求極值的方法,可以得到以下兩個(gè)一階條件:第三十三頁,共一百五十四頁,編輯于2023年,星期四最小二乘法對(duì)于給定的n組Y和X的觀察值,便可得到下列方程:式中和是X和Y的樣本均值,和是樣本觀察值對(duì)均值的離差。第三十四頁,共一百五十四頁,編輯于2023年,星期四對(duì)于某社區(qū)家庭消費(fèi)一例,用OLS方法如何估計(jì)參數(shù)值?第三十五頁,共一百五十四頁,編輯于2023年,星期四在上述家庭可支配收入-消費(fèi)支出例中,對(duì)于所抽出的一組樣本數(shù),參數(shù)估計(jì)的計(jì)算可通過下表進(jìn)行。第三十六頁,共一百五十四頁,編輯于2023年,星期四因此,由該樣本估計(jì)的回歸方程為:
第三十七頁,共一百五十四頁,編輯于2023年,星期四第三十八頁,共一百五十四頁,編輯于2023年,星期四二、估計(jì)量的性質(zhì)第三十九頁,共一百五十四頁,編輯于2023年,星期四估計(jì)量和估計(jì)
(EstimatorsandEstimates)由于我們通常不能夠全面觀察整體,因此只能依據(jù)由一個(gè)隨機(jī)樣本所做的估計(jì)來做出推斷;并且需要選擇恰當(dāng)?shù)挠?jì)量經(jīng)濟(jì)學(xué)方法進(jìn)行估計(jì)參數(shù)。由樣本統(tǒng)計(jì)數(shù)對(duì)總體參數(shù)進(jìn)行估計(jì)的方法包括點(diǎn)估計(jì)和區(qū)間估計(jì)。最小二乘法屬于點(diǎn)估計(jì)。估計(jì)得到的參數(shù)值被稱為參數(shù)的估計(jì)值,用一定方法獲得參數(shù)估計(jì)的公式被稱為參數(shù)的估計(jì)量。估計(jì)量是一個(gè)隨機(jī)變量,其值因樣本的不同而不同。第四十頁,共一百五十四頁,編輯于2023年,星期四估計(jì)量的例子假定我們想得到總體均值的估計(jì);我們需要使用期望值計(jì)算公式E(y)。考慮到每個(gè)觀察值都有相同的概率被抽取到樣本中,我們可以用1/n來替代f(yi)作為計(jì)算均值時(shí)的概率,那么我們可以利用以下公式計(jì)算出平均值:第四十一頁,共一百五十四頁,編輯于2023年,星期四什么是最佳估計(jì)量的性質(zhì)?無偏性(Unbiasedness)有效性(Efficiency)一致性(Consistency)一致性指的是大樣本漸近無偏性質(zhì)(Asymptoticproperties)第四十二頁,共一百五十四頁,編輯于2023年,星期四無偏性
若,則稱是的無偏估計(jì)量。含義:沒有系統(tǒng)偏差,從平均的意義上看是正確的。第四十三頁,共一百五十四頁,編輯于2023年,星期四14估計(jì)量A是無偏估計(jì),而估計(jì)量B則是有偏估計(jì)概率密度估計(jì)量B估計(jì)量Ab第四十四頁,共一百五十四頁,編輯于2023年,星期四OLS估計(jì)量的有效性假設(shè)和都是的無偏估計(jì),但則稱是比更有效的估計(jì)量。如果在所有無偏估計(jì)中方差最小,則稱為的最佳估計(jì)(有效估計(jì))。第四十五頁,共一百五十四頁,編輯于2023年,星期四概率密度估計(jì)量B估計(jì)量Ab估計(jì)量A和估計(jì)量B都是無偏估計(jì),但是估計(jì)量A比估計(jì)量B更有效第四十六頁,共一百五十四頁,編輯于2023年,星期四概率密度估計(jì)量B估計(jì)量Ab如果估計(jì)量C是所有無偏估計(jì)中方差最小的,則稱其為最佳估計(jì)(最有效估計(jì))估計(jì)量C第四十七頁,共一百五十四頁,編輯于2023年,星期四一致性一致性是指隨著樣本容量無限地增大,估計(jì)量將收斂于它們的真值。如果,則稱為的一致估計(jì)含義:樣本越大,估計(jì)越準(zhǔn)確。是大樣本性質(zhì)。第四十八頁,共一百五十四頁,編輯于2023年,星期四例子設(shè)X服從正態(tài)總體N(100,502)期望值的常用估計(jì)量是樣本平均數(shù):下面考察隨著樣本越來越大,估計(jì)量有什么變化?第四十九頁,共一百五十四頁,編輯于2023年,星期四
n
sx 1 505概率密度50100150200n=10.080.040.020.06第五十頁,共一百五十四頁,編輯于2023年,星期四
n
sx 1 50 4 256概率密度50100150200n=40.080.040.020.06第五十一頁,共一百五十四頁,編輯于2023年,星期四
n
sx 1 50 4 25 25 107概率密度50100150200n=250.080.040.020.06第五十二頁,共一百五十四頁,編輯于2023年,星期四
n
sx 1 50 4 25 25 10 100 58概率密度501001502000.080.04n=1000.020.06第五十三頁,共一百五十四頁,編輯于2023年,星期四
n
sx 1 50 4 25 25 10 100 59縱坐標(biāo)尺度放大10倍概率密度50100150200n=1000.80.40.20.6第五十四頁,共一百五十四頁,編輯于2023年,星期四
n
sx 1 50 4 25 25 10 100 5 1000 1.610概率密度50100150200n=10000.80.40.20.6第五十五頁,共一百五十四頁,編輯于2023年,星期四
n
sx 1 50 4 25 25 10 100 5 1000 1.6 5000 0.711概率密度50100150200n=50000.80.40.20.6第五十六頁,共一百五十四頁,編輯于2023年,星期四
有限樣本:x
是m的無偏估計(jì)
大樣本:x的概率分布退化成確定數(shù)m
plimx=m(概率極限)
直觀含義:隨著樣本越來越大,估計(jì)越來越準(zhǔn)確14第五十七頁,共一百五十四頁,編輯于2023年,星期四中心極限定理(CentralLimitTheorem)從正態(tài)總體中抽樣,其樣本均值同樣服從正態(tài)分布??傮w的分布不一定為正態(tài)分布。但當(dāng)樣本容量增大時(shí),樣本均值的分布趨近于正態(tài)分布。根據(jù)中心極限定理,任何均值為、方差為的總體,其樣本的標(biāo)準(zhǔn)化平均值漸近于標(biāo)準(zhǔn)正態(tài)分布N(0,1),或第五十八頁,共一百五十四頁,編輯于2023年,星期四例:有偏,但一致X服從正態(tài)總體N(100,502)選用如下估計(jì)量,來估計(jì)期望:下面考察隨著樣本越來越大,估計(jì)量有什么變化?第五十九頁,共一百五十四頁,編輯于2023年,星期四在有限樣本下是有偏的:在大樣本下是一致的第六十頁,共一百五十四頁,編輯于2023年,星期四7n=20Zq概率密度1第六十一頁,共一百五十四頁,編輯于2023年,星期四7n=100n=203概率密度qZ第六十二頁,共一百五十四頁,編輯于2023年,星期四7n=100n=1000n=204概率密度qZ第六十三頁,共一百五十四頁,編輯于2023年,星期四7概率密度n=1000n=1005qZ縱坐標(biāo)尺度放大10倍第六十四頁,共一百五十四頁,編輯于2023年,星期四7n=1000n=100000n=1006概率密度qZ第六十五頁,共一百五十四頁,編輯于2023年,星期四一致性是大樣本性質(zhì),它考察當(dāng)樣本越來越大時(shí),估計(jì)量是否趨于真值。如果是一致的,說明樣本越大,估計(jì)得越準(zhǔn),這是我們希望的。如果是不一致的,即使增加樣本容量,對(duì)提高估計(jì)的準(zhǔn)確性也沒有幫助。第六十六頁,共一百五十四頁,編輯于2023年,星期四總體方差估計(jì)量除了獲得有關(guān)
my的良好估計(jì)外,我們也希望得到有關(guān)
s2y的良好估計(jì);我們可以利用下面給出的樣本方差作為總體方差的估計(jì);需要注意的是,公式中分母為n-1而不是n,這是因?yàn)槲覀円残枰烙?jì)均值。如果樣本足夠大,那么我們可以用n來計(jì)算。第六十七頁,共一百五十四頁,編輯于2023年,星期四估計(jì)量作為隨機(jī)變量樣本的每個(gè)統(tǒng)計(jì)值(例如樣本均值、樣本方差等)都是一個(gè)隨機(jī)變量;每抽取一個(gè)隨機(jī)樣本,我們都會(huì)得到不同的樣本統(tǒng)計(jì)值;如果我們不斷的反復(fù)抽樣,我們可以得到有關(guān)樣本統(tǒng)計(jì)值的一個(gè)分布——
抽樣分布。第六十八頁,共一百五十四頁,編輯于2023年,星期四第六十九頁,共一百五十四頁,編輯于2023年,星期四三、經(jīng)典線性回歸模型(CLRM)
的基本假定第七十頁,共一百五十四頁,編輯于2023年,星期四做統(tǒng)計(jì)推斷,為什么需要對(duì)數(shù)據(jù)產(chǎn)生方式做出假定?如果只是估計(jì)參數(shù)0和1
,那么我們前面討論的最小二乘法已經(jīng)做到了這一點(diǎn)。但是,回歸分析的目的不僅僅是獲得和,而且要對(duì)真實(shí)的0和1
做出推斷,即用樣本對(duì)總體做出推論,統(tǒng)計(jì)學(xué)上稱之為統(tǒng)計(jì)推斷。要想用樣本對(duì)總體做出推論,估計(jì)量需要具有一系列優(yōu)良的性質(zhì),例如,無偏性、有效性等。這樣,要想利用樣本對(duì)總體做出推斷,我們就不僅要有代表總體的相應(yīng)函數(shù)形式,而且還需要對(duì)Yi的產(chǎn)生方式做出某些假定。第七十一頁,共一百五十四頁,編輯于2023年,星期四例如,對(duì)于模型可以看出,Yi依賴于Xi和ui。所以,如果不知道Xi和ui是怎樣產(chǎn)生的,或者說不對(duì)Xi和ui的產(chǎn)生方式做出某些假定,我們就無法對(duì)Yi做出任何統(tǒng)計(jì)推斷,當(dāng)然,也無法根據(jù) 和對(duì)真實(shí)的0和1
做出推斷。為了回歸估計(jì)的有效解釋,對(duì)Xi
變量(一個(gè)或多個(gè))和誤差項(xiàng)作出假定是極其重要的。經(jīng)典(又稱高斯或標(biāo)準(zhǔn))線性回歸模型(記CLRM)。這一模型已經(jīng)成為大部分計(jì)量經(jīng)濟(jì)學(xué)理論的奠基石,它有10個(gè)假定。第七十二頁,共一百五十四頁,編輯于2023年,星期四假定1:參數(shù)線性模型,即回歸模型就參數(shù)而言是線性的。第七十三頁,共一百五十四頁,編輯于2023年,星期四對(duì)變量為線性的回歸模型指的是Yi的條件期望值是Xi的線性函數(shù),在幾何圖形上,對(duì)應(yīng)的回歸線是一條直線。按照這種解釋,回歸函數(shù)是線性的,而回歸函數(shù)則不是線性的。對(duì)參數(shù)為線性的回歸模型指的是Y的條件期望值是模型中所包含的參數(shù)的一個(gè)線性函數(shù),而不一定是變量Xi的線性函數(shù)。
按照這種解釋,是一個(gè)線性回歸模型,但則不是。
第七十四頁,共一百五十四頁,編輯于2023年,星期四
假定2:在每次重復(fù)抽樣中,解釋變量X的取值具有確定性,即X的測(cè)度不含有誤差。假定3:X的值具有變異性,即在一個(gè)給定的樣本中,X的值不可以全部相同。第七十五頁,共一百五十四頁,編輯于2023年,星期四同方差情況x1x2..E(y|x)=b0+b1xyf(y|x)第七十六頁,共一百五十四頁,編輯于2023年,星期四異方差情況x
x1x2f(y|x)x3.y..E(y|x)=b0+b1x第七十七頁,共一百五十四頁,編輯于2023年,星期四假定6:隨機(jī)擾動(dòng)項(xiàng)之間不存在自相關(guān),即給定任意兩個(gè)不同的觀察對(duì)象i和j,對(duì)應(yīng)的隨機(jī)擾動(dòng)項(xiàng)和之間的協(xié)方差為零。假定7:和Xi的協(xié)方差為零,即自變量Xi與隨機(jī)擾動(dòng)項(xiàng)互相獨(dú)立,互不相關(guān)。
第七十八頁,共一百五十四頁,編輯于2023年,星期四假定8:解釋變量之間不存在完全的線性關(guān)系。
此假定是針對(duì)多元線性回歸模型而言的,要求解釋變量之間不能存在完全的線性函數(shù)關(guān)系。以避免出現(xiàn)完全的多重共線性問題。假定9:觀察次數(shù)n必須大于待估計(jì)參數(shù)的個(gè)數(shù)。
這一假定主要是來自于對(duì)數(shù)學(xué)求解的要求。假定10:正確地設(shè)定了回歸模型。
所謂正確地設(shè)定了模型,是指回歸模型使用了正確的解釋變量和合理的函數(shù)形式,并且對(duì)誤差項(xiàng)的統(tǒng)計(jì)分布做出了正確的假定。第七十九頁,共一百五十四頁,編輯于2023年,星期四這些假定用處任何科學(xué)研究中,通常都需要做某些假定,是因?yàn)樗鼈儽阌谥鸩秸归_主題研究,盡管它們?cè)诂F(xiàn)實(shí)中不一定是真實(shí)的。可以作一個(gè)類比,計(jì)量經(jīng)濟(jì)學(xué)中的CLRM就相當(dāng)于經(jīng)濟(jì)學(xué)價(jià)格理論中的完全競(jìng)爭(zhēng)模型。從完全競(jìng)爭(zhēng)模型引申出來的含義能使我們更好地領(lǐng)會(huì)非競(jìng)爭(zhēng)模型。在我們清楚了CLRM
的性質(zhì)后,在以后的篇章里可以分析如果CLRM
地一個(gè)或多個(gè)假定不成立時(shí)會(huì)出現(xiàn)什么情況以及如何處理。第八十頁,共一百五十四頁,編輯于2023年,星期四消費(fèi)——收入一例的EVIEWS結(jié)果第八十一頁,共一百五十四頁,編輯于2023年,星期四四、最小二乘估計(jì)量的性質(zhì)第八十二頁,共一百五十四頁,編輯于2023年,星期四我們關(guān)心的一個(gè)問題是,利用普通最小二乘法由樣本數(shù)據(jù)估計(jì)得到的參數(shù)、能否很好地代表總體回歸模型的參數(shù)0
和1?這涉及到最小二乘估計(jì)量具有的性質(zhì)。在滿足經(jīng)典線性回歸模型基本假定下,最小二乘估計(jì)量有以下四種重要的性質(zhì):線性性,是指估計(jì)參數(shù)和均是樣本觀測(cè)值(Xi和Yi)的線性函數(shù)。無偏性,就是估計(jì)參數(shù)和的期望值等于總體回歸模型的參數(shù)0和1
。有效性,是指用各種方法求得的總體回歸模型參數(shù)的線性估計(jì)量中,利用普通最小二乘法估計(jì)的參數(shù)和的方差最小。第八十三頁,共一百五十四頁,編輯于2023年,星期四高斯—馬爾可夫定理(Gauss-Markovtheorem)
在給定經(jīng)典線性回歸的假定下,最小二乘估計(jì)量是具有最小方差的線性無偏估計(jì)量。為什么?類似地:第八十四頁,共一百五十四頁,編輯于2023年,星期四證:易知故同樣地,容易得出
和第八十五頁,共一百五十四頁,編輯于2023年,星期四第八十六頁,共一百五十四頁,編輯于2023年,星期四(2)證明最小方差性其中,ci=ki+di,di為不全為零的常數(shù)則容易證明
普通最小二乘估計(jì)量(ordinaryleastSquaresEstimators)稱為最佳線性無偏估計(jì)量(bestlinearunbiasedestimator,BLUE)
第八十七頁,共一百五十四頁,編輯于2023年,星期四
由于最小二乘估計(jì)量擁有一個(gè)“好”的估計(jì)量所應(yīng)具備的小樣本特性,它自然也擁有大樣本特性。
第八十八頁,共一百五十四頁,編輯于2023年,星期四對(duì)于一元線性回歸模型,若:滿足經(jīng)典線性回歸模型基本假定采用最小二乘法估計(jì)參數(shù)則,估計(jì)量具有如下性質(zhì):線性無偏有效一致因此,可以得出結(jié)論:第八十九頁,共一百五十四頁,編輯于2023年,星期四
3.3OLS估計(jì)量的精度
與概率分布第九十頁,共一百五十四頁,編輯于2023年,星期四已經(jīng)知道,OLS估計(jì)量:已經(jīng)證明,在CLRM假定下:1、OLS估計(jì)的精度第九十一頁,共一百五十四頁,編輯于2023年,星期四第九十二頁,共一百五十四頁,編輯于2023年,星期四隨機(jī)誤差項(xiàng)的方差2的估計(jì)
由于隨機(jī)項(xiàng)i不可觀測(cè),只能從i的估計(jì),即殘差ei出發(fā),對(duì)總體方差進(jìn)行估計(jì)。
2又稱為總體方差。
可以證明:(1)2的最小二乘或最大似讓估計(jì)量為:(2)是2的無偏估計(jì)量,即:
有興趣的同學(xué)可以自己去證明第九十三頁,共一百五十四頁,編輯于2023年,星期四在應(yīng)用研究中需要用其無偏估計(jì)量代替,即:模型參數(shù)和標(biāo)準(zhǔn)差的估計(jì)量:這些統(tǒng)計(jì)量用以描述估計(jì)量的精密度或“可靠性”。第九十四頁,共一百五十四頁,編輯于2023年,星期四為了對(duì)參數(shù)和進(jìn)行顯著性檢驗(yàn),必須首先確定它們的概率分布。由古典回歸模型的假定條件已知,模型中的隨機(jī)擾動(dòng)項(xiàng)~,因而因變量Y也服從方差為的正態(tài)分布。由于和都是Y的線性組合,因此和也表現(xiàn)為正態(tài)分布,即:2、估計(jì)量和的概率分布第九十五頁,共一百五十四頁,編輯于2023年,星期四在樣本為大樣本時(shí),用估計(jì)的標(biāo)準(zhǔn)誤差作和標(biāo)準(zhǔn)化變換,可以構(gòu)造標(biāo)準(zhǔn)正態(tài)變量。在當(dāng)樣本為小樣本時(shí),回歸系數(shù)標(biāo)準(zhǔn)化變換后,即:并不遵循正態(tài)分布,而是服從自由度為(n-2)的t分布,即:第九十六頁,共一百五十四頁,編輯于2023年,星期四3、回歸參數(shù)的區(qū)間估計(jì)用OLS法可以得到總體回歸模型中參數(shù)和的估計(jì)量,這種估計(jì)為點(diǎn)估計(jì)。盡管在重復(fù)抽樣中可以預(yù)計(jì)其期望會(huì)等于參數(shù)的真值,即,但是還不能說明所得參數(shù)的點(diǎn)估計(jì)值的可靠性。參數(shù)真值可能比點(diǎn)估計(jì)值大,也可能比點(diǎn)估計(jì)值小,很可能在左右的一個(gè)區(qū)間范圍內(nèi)。的上限上下限是多少?為此,我們要設(shè)法找到可能包括參數(shù)真值的一個(gè)范圍,并且確定這個(gè)范圍內(nèi)包含參數(shù)真值的可靠程度。這就需要對(duì)參數(shù)進(jìn)行區(qū)間估計(jì)。第九十七頁,共一百五十四頁,編輯于2023年,星期四這樣一個(gè)區(qū)間,稱之為置信區(qū)間(confidenceinterval);
1-稱為置信系數(shù)(置信度)(confidencecoefficient),
稱為顯著性水平(levelofsignificance);置信區(qū)間的端點(diǎn)稱為置信限(confidencelimit)或臨界值(criticalvalues)?;貧w參數(shù)的區(qū)間估計(jì)(*)第九十八頁,共一百五十四頁,編輯于2023年,星期四對(duì)區(qū)間估計(jì)進(jìn)一步說明和點(diǎn)估計(jì)量相對(duì)照,區(qū)間估計(jì)量是一個(gè)構(gòu)造出來的區(qū)間,要使得它把參數(shù)得真值包括在區(qū)間的界限內(nèi)有一個(gè)特定的概率1-α。式(*)中的區(qū)間是一個(gè)隨機(jī)區(qū)間。置信區(qū)間是隨機(jī)的,對(duì)置信區(qū)間所作的概率表述應(yīng)從重復(fù)抽樣的意義上加以理解。也就是說,如果在重復(fù)抽樣中,象式(*)那樣在1-α的概率基礎(chǔ)上構(gòu)造置信區(qū)間多次,平均地說,這些區(qū)間中將有100(1-α)%次包含著參數(shù)真值。如果估計(jì)量的抽樣或概率分布已知,相應(yīng)的置信區(qū)間(表達(dá)式)就會(huì)構(gòu)造出來。第九十九頁,共一百五十四頁,編輯于2023年,星期四回歸系數(shù)的置信區(qū)間已經(jīng)知道,在隨機(jī)誤差項(xiàng)的正態(tài)性假定下,OLS估計(jì)量本身是正態(tài)分布的。以為例,當(dāng)2已知時(shí),構(gòu)造變量如下Z變量,Z變量是一個(gè)標(biāo)準(zhǔn)化正態(tài)變量。實(shí)踐中,2通常并不知道,只能得到其無偏估計(jì)量
此時(shí),構(gòu)造如下t變量,t變量是一個(gè)遵循自由度為n-2的t分布。第一百頁,共一百五十四頁,編輯于2023年,星期四2未知時(shí),我們用t分布來建立的置信區(qū)間給出了100(1-α)%置信區(qū)間:利用同樣的方法,可以得到的置信區(qū)間。第一百零一頁,共一百五十四頁,編輯于2023年,星期四4、2的置信區(qū)間可以證明,在正態(tài)性假定下,構(gòu)造統(tǒng)計(jì)量:
遵循自由度為n-2的分布??梢岳梅植冀⒌闹眯艆^(qū)間:
、是得自數(shù)值表中自由度為n-2的兩個(gè)臨界值。第一百零二頁,共一百五十四頁,編輯于2023年,星期四f()2.5%2.5%95%2.179717.5346
的95%置信區(qū)間(8個(gè)自由度)第一百零三頁,共一百五十四頁,編輯于2023年,星期四
2的100(1-α)%置信區(qū)間:對(duì)于消費(fèi)——收入一例,請(qǐng)給出真實(shí)系數(shù)和方差的95%置信區(qū)間分別是什么?第一百零四頁,共一百五十四頁,編輯于2023年,星期四如何減小方差?
的方差大小取決于模型誤差項(xiàng)的方差、X的變異程度和樣本中觀測(cè)值的個(gè)數(shù)。這一結(jié)果的含義是,研究人員在獲取樣本資料時(shí),要注意盡可能地?cái)U(kuò)大樣本容量,并增加解釋變量的變異。這一結(jié)論也適用于多元回歸模型的情況。在應(yīng)用工作中,由于時(shí)間序列數(shù)據(jù)受到現(xiàn)有統(tǒng)計(jì)資料的限制,研究人員常常無法隨意地?cái)U(kuò)大樣本,也難以增大解釋變量的變異程度,一種選擇是利用時(shí)間序列數(shù)據(jù)與截面混合數(shù)據(jù)估計(jì)模型。對(duì)于自行調(diào)查獲得的截面數(shù)據(jù),研究人員在確定調(diào)查方案時(shí)應(yīng)考慮保證適當(dāng)?shù)臉颖疽?guī)模,同時(shí)有目的地選擇有利于增大解釋變量變異程度的抽樣方法,如采用分層抽樣。第一百零五頁,共一百五十四頁,編輯于2023年,星期四3.4一元線性回歸模型的
統(tǒng)計(jì)檢驗(yàn)
第一百零六頁,共一百五十四頁,編輯于2023年,星期四本節(jié)內(nèi)容一、擬合優(yōu)度檢驗(yàn)
二、變量的顯著性檢驗(yàn)
三、參數(shù)的置信區(qū)間
第一百零七頁,共一百五十四頁,編輯于2023年,星期四回歸分析是要通過樣本所估計(jì)的參數(shù)來代替總體的真實(shí)參數(shù),或者說是用樣本回歸線代替總體回歸線。
盡管從統(tǒng)計(jì)性質(zhì)上已知,如果有足夠多的重復(fù)抽樣,參數(shù)的估計(jì)值的期望(均值)就等于其總體的參數(shù)真值,但在一次抽樣中,估計(jì)值不一定就等于該真值。那么,在一次抽樣中,參數(shù)的估計(jì)值與真值的差異有多大,是否顯著,這就需要進(jìn)一步進(jìn)行統(tǒng)計(jì)檢驗(yàn)。主要包括擬合優(yōu)度檢驗(yàn)、變量的顯著性檢驗(yàn)及參數(shù)的區(qū)間估計(jì)。第一百零八頁,共一百五十四頁,編輯于2023年,星期四
一、擬合優(yōu)度檢驗(yàn)
擬合優(yōu)度檢驗(yàn):對(duì)樣本回歸直線與樣本觀測(cè)值之間擬合程度的檢驗(yàn)。
度量擬合優(yōu)度的指標(biāo):判定系數(shù)(可決系數(shù))R2
問題:采用普通最小二乘估計(jì)方法,已經(jīng)保證了模型最好地?cái)M合了樣本觀測(cè)值,為什么還要檢驗(yàn)擬合程度?第一百零九頁,共一百五十四頁,編輯于2023年,星期四1、總離差平方和的分解
已知由一組樣本觀測(cè)值(Xi,Yi),i=1,2…,n得到如下樣本回歸直線
第一百一十頁,共一百五十四頁,編輯于2023年,星期四第一百一十一頁,共一百五十四頁,編輯于2023年,星期四
對(duì)于所有樣本點(diǎn),則需考慮這些點(diǎn)與樣本均值離差的平方和,可以證明:記總離差平方和(TotalSumofSquares)回歸平方和(ExplainedSumofSquares)殘差平方和(ResidualSumofSquares
)建議同學(xué)自己去證明第一百一十二頁,共一百五十四頁,編輯于2023年,星期四
即Y的觀測(cè)值圍繞其均值的總離差(totalvariation)可分解為兩部分:一部分來自回歸線(ESS),另一部分則來自隨機(jī)勢(shì)力(RSS)??傠x差平方和可以分為殘差平方和與回歸平方和兩部分,即:
由以上總離差平方和、回歸平方和、殘差平方和三者之間的關(guān)系可知,在總離差平方和中,回歸平方和所占的比例越大,說明回歸方程與樣本觀測(cè)值的擬合度越好;殘差平方和所占的比例越大,說明回歸方程與樣本觀測(cè)值的擬合度越差。因此,我們可以用回歸平方和與總離差平方和的比值來反映模型的擬合優(yōu)度,此即判定系數(shù)。第一百一十三頁,共一百五十四頁,編輯于2023年,星期四2、判定系數(shù)R2統(tǒng)計(jì)量
稱R2為(樣本)判定系數(shù)/可決系數(shù)(coefficientofdetermination)。
判定系數(shù)的取值范圍[0,1]
,R2越接近1,說明實(shí)際觀測(cè)點(diǎn)離樣本線越近,擬合優(yōu)度越高。第一百一十四頁,共一百五十四頁,編輯于2023年,星期四判定系數(shù)低可能由于幾個(gè)原因:X不是Y的良好解釋變量;模型形式設(shè)定錯(cuò)誤。在實(shí)際應(yīng)用中??梢园l(fā)現(xiàn),利用時(shí)間序列數(shù)據(jù)估計(jì)的模型R2一般較高,而用截面數(shù)據(jù)估計(jì)的模型R2值較低。判定系數(shù)R2統(tǒng)計(jì)量
第一百一十五頁,共一百五十四頁,編輯于2023年,星期四需要說明的是,判定系數(shù)作為評(píng)價(jià)標(biāo)準(zhǔn)相對(duì)于設(shè)定的模型,而不是解釋變量的實(shí)際解釋能力。R2值依賴于所給出的回歸方程的數(shù)學(xué)函數(shù)形式,對(duì)相同的因果關(guān)系采用不同的表達(dá)式將得到不同的R2值。此外,我們估計(jì)方程的目的常常并非是為了獲得高R2,而是要得到可靠的參數(shù)估計(jì),以便利用估計(jì)結(jié)果進(jìn)行統(tǒng)計(jì)推斷。因而我們需要注意,不要將判定系數(shù)高低作為評(píng)價(jià)模型優(yōu)劣的唯一標(biāo)準(zhǔn)。判定系數(shù)R2統(tǒng)計(jì)量
第一百一十六頁,共一百五十四頁,編輯于2023年,星期四雖然R2可按上述所給的定義直接計(jì)算,但利用下面的公式能更加快捷的求得:由于R2還可以寫成這是一個(gè)容易計(jì)算的表達(dá)式。判定系數(shù)R2統(tǒng)計(jì)量
第一百一十七頁,共一百五十四頁,編輯于2023年,星期四R2與r對(duì)于一元回歸模型,雖然從形式上看判定系數(shù)是相關(guān)系數(shù)的平方,但在回歸分析中,R2是一個(gè)比r更有意義的度量,因?yàn)榍罢吒嬖V我們?cè)谝蜃兞康淖儺愔杏山忉屪兞磕軌蚪忉尩牟糠终级啻蟮囊粋€(gè)比例,因而提供了有關(guān)自變量的變異在多大程度上決定因變量變異的一個(gè)度量,從后者則不能得到這種信息。第一百一十八頁,共一百五十四頁,編輯于2023年,星期四二、假設(shè)檢驗(yàn)假設(shè)檢驗(yàn)是統(tǒng)計(jì)推斷的一個(gè)主要內(nèi)容,它的基本任務(wù)是根據(jù)樣本所提供的信息,對(duì)未知總體分布的某些方面的假設(shè)作出合理的判斷。假設(shè)檢驗(yàn)的程序是,先根據(jù)實(shí)際問題的要求提出一個(gè)論斷,稱為統(tǒng)計(jì)假設(shè),記為H0,然后根據(jù)樣本的有關(guān)信息,對(duì)H0的真?zhèn)芜M(jìn)行判斷,作出拒絕H0還是接受H0的決策。第一百一十九頁,共一百五十四頁,編輯于2023年,星期四假設(shè)檢驗(yàn)盡管研究者總是熱衷于了解由現(xiàn)實(shí)觀察樣本所得到的估計(jì)結(jié)果是否支持被質(zhì)疑的理論,但證明一個(gè)給定的假設(shè)是否正確幾乎是不可能的,唯一能做的只是聲稱一個(gè)特定的樣本證明了特定的假設(shè)。盡管我們不能使用假設(shè)檢驗(yàn)來證明某一給定理論是“正確的”,但是我們通??梢栽谝粋€(gè)合理的顯著性水平上拒絕一個(gè)給定的假設(shè)。在這種情況下,研究者可以得出結(jié)論,如果假設(shè)的理論是正確的,所使用的樣本就幾乎不可能被觀察到。第一百二十頁,共一百五十四頁,編輯于2023年,星期四待檢驗(yàn)假設(shè)的設(shè)定;用于決定是否拒絕假設(shè)的判定原則;將這一判定原則應(yīng)用于恰當(dāng)?shù)慕y(tǒng)計(jì)量,在產(chǎn)生不正確判斷時(shí)說面臨的兩類錯(cuò)誤。假設(shè)檢驗(yàn)用于回歸分析的三個(gè)核心問題第一百二十一頁,共一百五十四頁,編輯于2023年,星期四第一:經(jīng)典虛擬假設(shè)和備擇假設(shè)虛擬假設(shè):通常是研究者(對(duì)某一回歸參數(shù)的)非預(yù)期取值的一種表述。習(xí)慣上,虛擬假設(shè)寫作:H0:你的非預(yù)期取值范圍,如β1≤0備擇假設(shè):通常是對(duì)研究者預(yù)期取值的表述。備擇假設(shè)寫作:HA:你的預(yù)期取值范圍,如β1>0第一百二十二頁,共一百五十四頁,編輯于2023年,星期四統(tǒng)計(jì)檢驗(yàn)存在發(fā)生錯(cuò)誤的可能第一類錯(cuò)誤:棄真。我們拒絕了一個(gè)為真的虛擬假設(shè)。第二類錯(cuò)誤:取偽。我們沒有拒絕一個(gè)不真的虛擬假設(shè)。犯第一類錯(cuò)誤和犯第二類錯(cuò)誤的概率此消彼長(zhǎng)。經(jīng)濟(jì)研究中對(duì)取偽的錯(cuò)誤是非常重視的,如果把一個(gè)假的理論指導(dǎo)實(shí)踐,后果是嚴(yán)重的;反之,若把真的拋棄,并不是一個(gè)大問題。第一百二十三頁,共一百五十四頁,編輯于2023年,星期四第二:假設(shè)檢驗(yàn)的判定規(guī)則第一百二十四頁,共一百五十四頁,編輯于2023年,星期四假設(shè)檢驗(yàn)的基本思想是概率性質(zhì)的反證法,即小概率事件原理。該原理認(rèn)為“小概率事件在一次試驗(yàn)中幾乎是不可能發(fā)生的”。在原假設(shè)H0下構(gòu)造一個(gè)事件,這個(gè)事件在“原假設(shè)H0是正確”的條件下是一個(gè)小概率事件。為了檢驗(yàn)原假設(shè)H0是否正確,先假定這個(gè)假設(shè)是正確的,看由此能推出什么結(jié)果。如果導(dǎo)致一個(gè)不合理的結(jié)果(小概率事件發(fā)生了),則表明“原假設(shè)H0是正確”是錯(cuò)誤的,即原假設(shè)H0不正確,因此要拒絕原假設(shè)H0。如果沒有導(dǎo)致一個(gè)不合理的現(xiàn)象的出現(xiàn)(小概率事件沒有發(fā)生),則不能認(rèn)為原假設(shè)H0不正確,因此不能拒絕原假設(shè)H0。第一百二十五頁,共一百五十四頁,編輯于2023年,星期四假設(shè)檢驗(yàn)的方法之一:置信區(qū)間法繼續(xù)以消費(fèi)-收入為例。某種理論或先前經(jīng)驗(yàn)使我們相信消費(fèi)-收入的真實(shí)斜率系數(shù)β1=
1,那么,我們從樣本得到的=0.777是否與這一先驗(yàn)的假設(shè)值相一致?如果是,我們不拒絕該假設(shè),否則就可以拒絕它。我們知道,所估計(jì)的邊際消費(fèi)傾向是0.777。提出如下統(tǒng)計(jì)假設(shè)
在這里,備擇假設(shè)是一個(gè)復(fù)合假設(shè),或者說雙測(cè)假設(shè),需要進(jìn)行雙尾檢驗(yàn)。與之對(duì)應(yīng)的是單尾檢驗(yàn)。我們所關(guān)心的問題是是否與相符。利用已經(jīng)討論過的置信區(qū)間知識(shí)。第一百二十六頁,共一百五十四頁,編輯于2023年,星期四一元線性模型中,i(i=1,2)的置信區(qū)間:在變量的顯著性檢驗(yàn)中已經(jīng)知道:
意味著,如果給定置信度(1-),從分布表中查得自由度為(n-2)的臨界值,那么t值處在(-t/2,t/2)的概率是(1-)。表示為:
即第一百二十七頁,共一百五十四頁,編輯于2023年,星期四于是得到:(1-)的置信度下,i的置信區(qū)間是
在上述收入-消費(fèi)支出例中,如果給定
=0.05,查表得:
以1
加以說明:因于是,1的置信區(qū)間為:(0.66904,0.87498)
含義:在重復(fù)抽樣意義下,這樣的區(qū)間以95%置信系數(shù)給出真值1落入其中的一個(gè)范圍或界限。第一百二十八頁,共一百五十四頁,編輯于2023年,星期四如果虛擬假設(shè)的β1落入這個(gè)置信區(qū)間,我們就不拒絕虛假設(shè),如果它落在區(qū)間外,我們就可以拒絕虛擬假設(shè)。在假設(shè)H0下落入此區(qū)間的值有100(1-α)%的可信性。若果真落入此域,就不拒絕H0。當(dāng)我們拒絕虛擬假設(shè)時(shí),稱我們的發(fā)現(xiàn)是統(tǒng)計(jì)上顯著的。反之,當(dāng)我們不拒絕虛假設(shè)時(shí),稱我們的發(fā)現(xiàn)不是統(tǒng)計(jì)上顯著的。第一百二十九頁,共一百五十四頁,編輯于2023年,星期四
由于置信區(qū)間一定程度地給出了樣本參數(shù)估計(jì)值與總體參數(shù)真值的“接近”程度,因此置信區(qū)間越小越好。
要縮小置信區(qū)間,需
(1)增大樣本容量n,因?yàn)樵谕瑯拥闹眯潘较?,n越大,t分布表中的臨界值越??;同時(shí),增大樣本容量,還可使樣本參數(shù)估計(jì)量的標(biāo)準(zhǔn)差減小;
(2)提高模型的擬合優(yōu)度,因?yàn)闃颖緟?shù)估計(jì)量的標(biāo)準(zhǔn)差與殘差平方和呈正比,模型擬合優(yōu)度越高,殘差平方和應(yīng)越小。第一百三十頁,共一百五十四頁,編輯于2023年,星期四假設(shè)檢驗(yàn)的方法之二:顯著性檢驗(yàn)
第一百三十一頁,共一百五十四頁,編輯于2023年,星期四
檢驗(yàn)步驟:
(1)對(duì)總體參數(shù)提出假設(shè)H0:1=,H1:1(2)以原假設(shè)H0構(gòu)造t統(tǒng)計(jì)量,并由樣本計(jì)算其值(3)給定顯著性水平,查t分布表,得臨界值t/2(n-2)(4)比較,判斷
若|t|>t/2(n-2),則拒絕H0
,接受H1
;
若|t|
t/2(n-2),則拒絕H1
,接受H0
;第一百三十二頁,共一百五十四頁,編輯于2023年,星期四對(duì)于回歸模型來說,模型系數(shù)的可靠性檢驗(yàn),就是針對(duì)每個(gè)自變量對(duì)因變量的影響是否具有統(tǒng)計(jì)顯著性的一種檢驗(yàn),以判斷解釋變量X是否是被解釋變量Y的一個(gè)顯著性的影響因素。
因此,計(jì)量經(jīng)計(jì)學(xué)中,主要是針對(duì)變量的參數(shù)真值是否為零來進(jìn)行顯著性檢驗(yàn)的。
提出假設(shè):當(dāng)原假設(shè)成立時(shí),有:(3)給定顯著性水平,查t分布表,得臨界值t/2(n-2)(4)比較,判斷。若|t|>t/2(n-2),則拒絕H0
,接受H1
;
若t|
t/2(n-2),則拒絕H1
,接受H0
。第一百三十三頁,共一百五十四頁,編輯于2023年,星期四
對(duì)于一元線性回歸方程中的0,可構(gòu)造如下t統(tǒng)計(jì)量進(jìn)行顯著性檢驗(yàn):
在上述收入-消費(fèi)支出例中,首先計(jì)算2的估計(jì)值
自己去說明有關(guān)0的假設(shè)與檢驗(yàn)步驟第一百三十四頁,共一百五十四頁,編輯于2023年,星期四t統(tǒng)計(jì)量的計(jì)算結(jié)果分別為:
給定顯著性水平=0.05,查t分布表得臨界值
t0.05/2(8)=2.306|t1|>2.306,說明家庭可支配收入在95%的置信度下顯著,即是消費(fèi)支出的主要解釋變量;|t0|<2.306,表明在95%的置信度下,無法拒絕截距項(xiàng)為零的假設(shè)。
第一百三十五頁,共一百五十四頁,編輯于2023年,星期四三、隨機(jī)誤差項(xiàng)的正態(tài)性檢驗(yàn):
Jarque-Bera檢驗(yàn)上述統(tǒng)計(jì)檢驗(yàn)過程是建立在假設(shè)隨機(jī)誤差項(xiàng)服從正態(tài)分布的基礎(chǔ)之上。既然我們不能直接地觀察真實(shí)的誤差項(xiàng)μi,那么,如何證實(shí)μi確實(shí)服從正態(tài)分布呢?我們有μi的近似值ei,因此,可以通過ei來獲悉μi的正態(tài)性。一種常用的正態(tài)性檢驗(yàn)是Jarque-Bera檢驗(yàn),簡(jiǎn)稱JB檢驗(yàn)。它是依據(jù)參差,對(duì)大樣本的一種檢驗(yàn)方法。第一百三十六頁,共一百五十四頁,編輯于2023年,星期四Jarque-Bera檢驗(yàn)首先,計(jì)算偏度系數(shù)S(對(duì)概率密度函數(shù)對(duì)稱性的度量)和峰度系數(shù)K(對(duì)概率密度函數(shù)的陡峭或扁平度的度量):Jarque和Bera建立了如下檢驗(yàn)統(tǒng)計(jì)量——JB統(tǒng)計(jì)量對(duì)于正態(tài)分布變量,偏度為零,峰度為3。他們證明了,在正態(tài)性假定下,JB統(tǒng)計(jì)量漸進(jìn)地服從自由度為2的分布,表示為:第一百三十七頁,共一百五十四頁,編輯于2023年,星期四如果變量服從正態(tài)分布,則S為零,K為3,因而JB統(tǒng)計(jì)量的值為零。但如果變量不是正態(tài)變量,則JB統(tǒng)計(jì)量將為一個(gè)逐漸增大值。我們很容易從分布表得到給定顯著性水平的分布臨界值。若JB統(tǒng)計(jì)量超過臨界值,則拒絕正態(tài)分布的零假設(shè);若沒有
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 廣東酒店管理職業(yè)技術(shù)學(xué)院《食品微生物綜合實(shí)訓(xùn)》2023-2024學(xué)年第一學(xué)期期末試卷
- 廣東金融學(xué)院《公司金融含實(shí)驗(yàn)》2023-2024學(xué)年第一學(xué)期期末試卷
- 廣東建設(shè)職業(yè)技術(shù)學(xué)院《技術(shù)及應(yīng)用實(shí)驗(yàn)》2023-2024學(xué)年第一學(xué)期期末試卷
- 廣東金融學(xué)院《小動(dòng)物影像學(xué)》2023-2024學(xué)年第一學(xué)期期末試卷
- 網(wǎng)絡(luò)文明培訓(xùn)課件
- 《能源互聯(lián)網(wǎng)》課件
- 小班安全課件《狗狗來了》
- 廚具銷售培訓(xùn)課件
- 共青科技職業(yè)學(xué)院《現(xiàn)代基礎(chǔ)化學(xué)》2023-2024學(xué)年第一學(xué)期期末試卷
- 贛州師范高等??茖W(xué)校《金融法》2023-2024學(xué)年第一學(xué)期期末試卷
- 導(dǎo)航通信一體化考核試卷
- 甘肅省會(huì)寧二中2025屆高考仿真模擬數(shù)學(xué)試卷含解析
- 2024年未成年子女房產(chǎn)贈(zèng)與協(xié)議
- 2024-2030年中國(guó)共模電感環(huán)形鐵芯行業(yè)發(fā)展?fàn)顩r規(guī)劃分析報(bào)告
- 眼視光學(xué)理論和方法知到智慧樹章節(jié)測(cè)試課后答案2024年秋山東中醫(yī)藥大學(xué)
- 節(jié)約集約建設(shè)用地標(biāo)準(zhǔn) DG-TJ08-2422-2023
- 《氮化硅陶瓷》課件
- 山東省濟(jì)南市歷城區(qū)2024-2025學(xué)年二年級(jí)上學(xué)期期末數(shù)學(xué)模擬檢測(cè)卷(含答案)
- 叉車維護(hù)維修合同
- 2024年財(cái)務(wù)部年度工作總結(jié)(7篇)
- 2024年度醫(yī)療美容服務(wù)合作合同3篇
評(píng)論
0/150
提交評(píng)論