設定誤差與測量誤差_第1頁
設定誤差與測量誤差_第2頁
設定誤差與測量誤差_第3頁
設定誤差與測量誤差_第4頁
設定誤差與測量誤差_第5頁
已閱讀5頁,還剩56頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

設定誤差與測量誤差引子:簡單一定勝于復雜嗎?

西方國家盛行“Occam`srazor”原則,意思是“簡單優(yōu)于復雜”的節(jié)約性原則。經濟模型永遠無法完全把握現實,在建立模型中一定的抽象和簡化是不可避免的。在研究進口與國內生產總值的關系時,考慮到時間趨勢,建立并估計了以下模型

第2頁,共61頁,2024年2月25日,星期天

有人根據“簡單優(yōu)于復雜”原則,得到以下方程:

(2)

進行比較:兩個方程的檢驗結果都較理想;

方程(2)GDP的t檢驗值似乎優(yōu)于方程(1);方程(2)函數形式也更為簡單;然而,能否根據“Occam’srazor”原則,判斷方程(2)比方程(1)好?第3頁,共61頁,2024年2月25日,星期天對模型的設定是計量經濟研究的重要環(huán)節(jié)。前面各章除了對隨機擾動項分布的基本假定以外,還強調:

假定設定的模型對變量和函數形式的設定是正確地描述被解釋變量與解釋變量之間的真實關系,假定模型中的變量沒有測量誤差。但是在實際的建模實踐中,對模型的設定不一定能夠完全滿足這樣的要求,從而會使模型出現設定誤差。第4頁,共61頁,2024年2月25日,星期天第九章設定誤差與測量誤差本章主要討論:●設定誤差●設定誤差的檢驗●測量誤差第5頁,共61頁,2024年2月25日,星期天

第一節(jié)設定誤差本節(jié)基本內容:●設定誤差及類型●變量設定誤差的后果

第6頁,共61頁,2024年2月25日,星期天一、設定誤差及類型

計量經濟模型是對變量間經濟關系因果性的設想,若所設定的回歸模型是“正確”的,主要任務是所選模型參數的估計和假設檢驗。但是如果對計量模型的各種診斷或檢驗總不能令人滿意,這時應把注意力集中到模型的設定方面:

考慮所建模型是否遺漏了重要的變量?是否包含了多余的變量?所選模型的函數形式是否正確?隨機擾動項的設定是否合理?變量的數據收集是否有誤差?所有這些,計量經濟學中被統(tǒng)稱為設定誤差。第7頁,共61頁,2024年2月25日,星期天從誤差來源看,設定誤差主要包括:(1)變量的設定誤差,包括相關變量的遺漏(欠擬合)、無關變量的誤選(過擬合);(2)變量數據的測量誤差;(3)模型函數形式的設定誤差;(4)隨機擾動項設定誤差。本章主要討論的兩類變量設定誤差:(1)相關變量的遺漏(欠擬合);(2)無關變量的誤選(過擬合)。設定誤差的類型第8頁,共61頁,2024年2月25日,星期天

1.相關變量的遺漏

(OmittingRelevantVariables)例如,如果“正確”的模型為而我們將模型設定為

即設定模型時漏掉了一個相關的解釋變量。這類錯誤稱為遺漏相關變量(“欠擬合”)。第9頁,共61頁,2024年2月25日,星期天

2.無關變量的誤選

(IncludingIrrevelantVariables)

例如,如果“真實模型”為:但我們卻將模型設定為即設定模型時,多選了一個無關解釋變量。這類錯誤稱為無關變量的誤選(“過擬合”)。第10頁,共61頁,2024年2月25日,星期天●數據來源渠道可能不暢。例如,數據很難取得被迫將具有重要的經濟意義變量排斥在模型之外。●不知道變量應當以什么確切的函數形式出現在回歸模型中?!袷孪炔⒉恢浪芯康膶嵶C數據中所隱含的真實模型究竟是什么。設定誤差在建模中較容易出現。設定誤差的存在可能會對模型形成不良的后果。設定誤差的原因第11頁,共61頁,2024年2月25日,星期天二、變量設定誤差的后果當模型設定出現誤差時,模型估計結果也會與“實際”有偏誤;

偏誤的性質與程度與模型設定誤差的類型密切相關。從實質上看,變量設定誤差的主要后果,是一個或多個解釋變量與隨機擾動項之間存在著相關性,進而影響參數估計的統(tǒng)計特性。第12頁,共61頁,2024年2月25日,星期天1.

遺漏相關變量(欠擬合)偏誤采用遺漏了重要解釋變量的模型進行估計而帶來的偏誤,稱為遺漏相關變量偏誤。

設正確的模型為:正確模型離差形式為:第13頁,共61頁,2024年2月25日,星期天卻對方程進行回歸,得:取期望第14頁,共61頁,2024年2月25日,星期天遺漏變量設定誤差的后果由此可以看出,的遺漏將產生如下后果。兩邊取概率極限,有:第15頁,共61頁,2024年2月25日,星期天1.如果漏掉的與相關,則分別在小樣本下求期望、在大樣本下求概率極限,有:2.如果與不相關,則的估計滿足無偏性與一致性第16頁,共61頁,2024年2月25日,星期天3.的方差是方差的有偏估計:

第17頁,共61頁,2024年2月25日,星期天如果與相關,顯然有如果與不相關,也有4.遺漏變量,式中的隨機擾動項的方差估計量將是有偏的,即:5.與方差相關的檢驗,包括假設檢驗、區(qū)間估計,在關于參數的統(tǒng)計顯著性方面,都容易導出錯誤的結論。

第18頁,共61頁,2024年2月25日,星期天(1)

若但實際情形并不完全如此??梢宰⒁獾綒埐钇椒胶蚏SS的計算因此,有可能:第19頁,共61頁,2024年2月25日,星期天(2)若不相關,有似乎分別有:若這兩個等式成立,意味著盡管變量,在理論上分析是有關的變量,但從所選模型中略去似乎也不會導致什么危害。這種認識實際也不正確。第20頁,共61頁,2024年2月25日,星期天因為的有偏估計,即使不相關,也有致使假設檢驗程序很有可能是可疑的。必須清楚,一旦根據相關理論把模型建立起來,再從中遺漏變量需要充分地謹慎。第21頁,共61頁,2024年2月25日,星期天2.包含無關變量偏誤定義:模型中包括了不重要的解釋變量,即采用誤選了無關解釋變量的模型進行估計而帶來的偏誤,稱為包含無關變量偏誤設正確模型但卻估計了如果,則(2)與(1)相同,因此,可將(1)式視為以為約束的(2)式的特殊形式。采用OLS法對(2)進行估計,有:第22頁,共61頁,2024年2月25日,星期天將(1)式的離差形式代入,整理得:期望和方差:第23頁,共61頁,2024年2月25日,星期天

無關變量的設定誤差的后果1.可以證明,(2)式參數的OLS估計量是無偏,且為一致性的。即:同理,可證明:第24頁,共61頁,2024年2月25日,星期天2.

不是有效估計量:

此結論對也成立。3.

隨機誤差項的方差的估計仍為無偏估計。4.

通常的區(qū)間估計和假設檢驗程序依然有效,但方差增大,接受錯誤假設的概率會較高。

第25頁,共61頁,2024年2月25日,星期天(1)遺漏相關變量將導致參數估計量和假設檢驗有偏且不一致;(2)誤選無關變量雖參數估計量具無偏性、一致性,又會損失有效性。(3)注重檢驗的無偏性、一致性寧愿誤選無關變量也不愿遺漏相關變量;(4)注重估計量的有效性,寧愿刪除相關變量。

通常誤選無關變量不如遺漏相關變量的后果嚴重。

因此,模型的設定實際是對偏誤與有效進行權衡,偏愛哪一方取決于模型的研究目的。遺漏相關變量和誤選無關變量的比較第26頁,共61頁,2024年2月25日,星期天第二節(jié)設定誤差的檢驗本節(jié)基本內容:●DW檢驗●拉各朗日乘數檢驗●一般性檢驗第27頁,共61頁,2024年2月25日,星期天對變量設定誤差進行檢驗必須在經濟理論指導下進行,不可拋棄經濟理論而進行假設檢驗。對于是否誤選無關變量的檢驗,只要針對無關變量系數的期望值為零的假設,用t檢驗或F檢驗,對無關變量系數作顯著性檢驗即可。對于遺漏變量設定誤差的檢驗有多種方法,例如DW檢驗、拉格朗日乘數檢驗、豪斯曼檢驗、RESET一般性檢驗等。這里只討論設定誤差的一些最常用的檢驗方法。第28頁,共61頁,2024年2月25日,星期天

基本思想:

遺漏的相關變量應包含在隨機擾動項中,那么回歸所得的殘差序列就會呈現單側的正(負)相關性,因此可從自相關性的角度檢驗相關變量的遺漏。 從遺漏變量的模型看,可以認為遺漏變量模型是無遺漏變量模型的一個特例:被遺漏變量的系數為0。一、DW檢驗第29頁,共61頁,2024年2月25日,星期天,DW檢驗的具體步驟1.對回歸模型運用OLS法得殘差序列2.設定

按遺漏解釋變量的遞增次序對殘差序列,進行排序,對排序后的殘差序列,計算d統(tǒng)計量:第30頁,共61頁,2024年2月25日,星期天

3.

查Durbin-Watson表,若為顯著,則拒絕原假設,受約束回歸模型不成立,存在模型設定誤差,否則接受原假設,受約束回歸模型成立,模型無設定誤差。第31頁,共61頁,2024年2月25日,星期天對下表的數據設定總生產成本函數,準備使用如下三個備選模型:有(1)為真實模型,試用DW法檢驗模型設定誤差。舉例第32頁,共61頁,2024年2月25日,星期天總成本()產出()1193122262324034244452575626067274782978935091042010第33頁,共61頁,2024年2月25日,星期天三個模型分別代入數據回歸(1)(2)第34頁,共61頁,2024年2月25日,星期天本例中遺漏變量已按遞增次序排列,此時的值等于值,無需重新計算d統(tǒng)計量。(3)第35頁,共61頁,2024年2月25日,星期天對上述模型的DW統(tǒng)計量的分析及查表情況如下:1.模型(1):有=2.70,當時=0.525,=2.016,不能表明存在顯著的正相關關系,接受H0,表示沒有遺漏的變量。2.模型(2):有=1.038,當時=0.697,=1.641。顯然有0.697<1.038<1.641,屬于無法確定的區(qū)域。在沒有其他信息的前提下,最好認為存在遺漏變量。第36頁,共61頁,2024年2月25日,星期天

3.

模型(3):

有=0.716,當時,

=0.879,=1.320

,顯然存在正的自相關,拒絕,表明存在遺漏變量;

第37頁,共61頁,2024年2月25日,星期天二、拉格朗日乘數(LM)檢驗

基本思想:●模型中遺漏的相關變量包含在隨機擾動項中,因此隨機擾動項或回歸所得的殘差序列應與遺漏的相關變量呈現出某種依存關系?!窨梢赃M行殘差序列與相關變量的回歸,在一定顯著水平下若相關變量具有統(tǒng)計顯著性,則認為存在遺漏變量形成的設定偏誤,若相關變量不具有統(tǒng)計顯著性,則認為沒有遺漏變量形成的設定誤差。第38頁,共61頁,2024年2月25日,星期天

具體步驟

1.對存在遺漏變量設定偏誤的模型(受約束回歸模型)進行回歸,得殘差序列;2.用殘差序列對全部的解釋變量(包括遺漏變量)進行回歸,得可決系數;3.設定:受約束回歸模型:無約束回歸模型。在大樣本情況下,構造檢驗統(tǒng)計量,漸近地遵從(約束個數)

4.進行顯著性檢驗的判斷:若(約束個數),則拒絕,認為受約束模型不成立,存在遺漏變量;否則,接受,認為受約束模型成立,無遺漏變量。

第39頁,共61頁,2024年2月25日,星期天第四節(jié)案例分析問題:以引子中所提出的問題為例,分析影響中國進口量的主要因素。設定模型(1)

其中:是進口總額,是國內生產總值。分析模型是否有變量設定誤差,進行變量設定誤差檢驗。第40頁,共61頁,2024年2月25日,星期天有人認為,貨物與服務的進口量受到一國的生產規(guī)模、貨物與服務的進口價格、匯率等其他影響因素,而不能只僅用GDP來解釋商品進口的變化。因此,設定的回歸模型應該為:

其中:GDP為國內生產總值,為GDP的線性函數;Exchange為美元兌換人民幣的匯率,為Exchange的線性函數。如果是這樣,回歸模型(1)的設定式中可能遺漏了變量GDP、Exchange以及兩者的線性組合。那么兩者的線性組合是否被遺漏的重要變量呢?

第41頁,共61頁,2024年2月25日,星期天

基本關系圖第42頁,共61頁,2024年2月25日,星期天對模型(1)進行回歸,有回歸結果:第43頁,共61頁,2024年2月25日,星期天顯然,存在自相關現象,其主要原因可能是建模時遺漏了重要的相關變量造成的。作模型(1)回歸的殘差圖

第44頁,共61頁,2024年2月25日,星期天1.DW檢驗

模型(1)的=0.5357,表明存在正的自相關。由于遺漏變量Exchange或GDP已經按從小到大順序排列,因此,無需重新計算d統(tǒng)計量。對=24,=1,5%的德賓-沃森d統(tǒng)計量的臨界值為=1.273和=1.466,表明存在顯著的遺漏變量現象。第45頁,共61頁,2024年2月25日,星期天DependentVariable:IM Method:LeastSquares Date:08/06/05Time:23:41 Sample(adjusted):19812003 Includedobservations:23afteradjustments

Variable CoefficientStd.Errort-Statistic Prob.

C -224.36321892.132-0.118577 0.9069 GDP 1.1482590.1514337.582606 0.0000 GDP(-1) -0.822444 0.147359-5.581213 0.0000 EXCHANGE-4.290746 8.348744-0.513939 0.6135 EXCHANGE^2-0.0186370.008353-2.231162 0.0386 R-squared0.978691Meandependentvar 8434.222 AdjustedR-squared0.973956

S.D.dependentvar 9025.326 S.E.ofregression 1456.525Akaikeinfocriterion 17.59515 Sumsquaredresid38186370Schwarzcriterion 17.84200 Loglikelihood -197.3443

F-statistic 206.6799 Durbin-Watsonstat1.962659

Prob(F-statistic) 0.000000其中,Exchange系數的統(tǒng)計意義不顯著,剔除。再次回歸,結果見下頁表。第46頁,共61頁,2024年2月25日,星期天DependentVariable:IM Method:LeastSquares Date:08/06/05Time:23:53 Sample(adjusted):19812003 Includedobservations:23afteradjustments

Variable Coefficient Std.Error t-Statistic Prob.

C -1159.179 511.0396 -2.268276 0.0352 GDP 1.142897 0.148119 7.716070 0.0000 GDP(-1) -0.815842 0.143928 -5.668420 0.0000 EXCHANGE^2-0.022569 0.003291 -6.857844 0.0000

R-squared 0.978378

Meandependentvar8434.222 AdjustedR-squared 0.974965

S.D.dependentvar 9025.326 S.E.ofregression 1428.041

Akaikeinfocriterion 17.52277 Sumsquaredresid 38746720

Schwarzcriterion 17.72024 Loglikelihood -197.5118

F-statistic 286.5846 Durbin-Watsonstat 2.047965

Prob(F-statistic) 0.000000可以認為,這時模型設定無變量設定誤差。第47頁,共61頁,2024年2月25日,星期天2.LM檢驗按照LM檢驗步驟,首先生成殘差序列(用EE表示),用EE對全部解釋變量(包括遺漏變量)進行回歸,有:

第48頁,共61頁,2024年2月25日,星期天再計算查表,顯然,,接受無約束回歸模型的假設,即確實存在遺漏變量。因此,在本章的引子中,不能判斷雖然簡單但遺漏了重要變量的方程(1)比復雜的方程(2)更好。結論第49頁,共61頁,2024年2月25日,星期天對于觀測不到的變量使用代理變量考慮下面模型:其中是不可觀測的,我們有相信其對被解釋變量有顯著影響,需要找到一個可觀測的變量代替它來得到參數和的無偏估計。這樣的變量我們稱為代理變量。第50頁,共61頁,2024年2月25日,星期天利用WAGE2.RAW中數據,將IQ作為能力的代理變量。解釋變量有:educ,exper,tenure,married,south,urban,black,IQ,educ*IQ回歸結果(略)第51頁,共61頁,2024年2月25日,星期天有測量誤差的OLS性質帶測量誤差的變量是具有完好定義的定量含義,但我們對它的記錄可能包含了誤差。而代理變量是對一個完全觀測不到的變量找一個與其有聯系的變量。在測量誤差問題中,被誤測的變量通常是關心的焦點;而在代理變量中,我們通常關心的是被遺漏變量之外的其他變量。第52頁,共61頁,2024年2月25日,星期天因變量中的測量誤差設回歸模型為:并且假定其滿足高斯——馬爾可夫假定。另y表示觀測到的對實際值的度量,它們之間存在誤差:帶入模型得到:第53頁,共61頁,2024年2月25日,星期天如果假定測量誤差與解釋變量統(tǒng)計上是獨立的,那么OLS估計量是無偏的。假定e和u不相關從而會導致OLS估計量的方差變大,影響其顯著性。總體說來OLS性質是良好的。第54頁,共61頁,2024年2月25日,星期天解釋變量中的測量誤差考慮如下模型:其中存在觀測誤差,觀測值為

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論