




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、Ch5 雙變量回歸的區(qū)間估計與假設檢驗(Interval estimation and hypothesis test)第三章的OLS得到如下模型:上述模型中(MPC)=0.5091,與的差距有多大?(雖然E()=)。尋找和(0<<1)使隨機區(qū)間(-,+)包含的概率為1-一、區(qū)間估計我們是否能找到一個區(qū)間,使其包含真值。*置信區(qū)間是隨機的。二、的置信區(qū)間的置信區(qū)間:因未知,則:遵循自由度為n-2的t分布。用t分布建立的置信區(qū)間給定,可以確定一個臨界值,t在此區(qū)間,的概率為1-。同理可推出的置信區(qū)間:注:置信區(qū)間寬度的決定因素:()在支出一收入一例中 則;解釋:從長遠看,在類似于(0
2、.4268,0.5914)的每100個區(qū)間,將有95個包含真實的值。同樣也可計算出置信區(qū)間。三、的置信區(qū)間用建立的置信區(qū)間四、假設檢驗置信區(qū)間法虛擬假設(null hypothesis)(聲稱的假設)H0:維護(mai ntained hgpotbesis) =0.5091:我們希望Ho正確時,只有5%的次數被錯誤地拒絕。H1:對立假設(alternative hypothesis) 在假設Ho下落入此區(qū)間的值有100(1-)%的可信性。若果真落入此域,就不拒絕Ho拒絕Ho,也說是 統(tǒng)計上顯著的拒絕Ho,也說是 統(tǒng)計上顯著的0.42680.5914 Ho:五、顯著性檢驗法 (test of s
3、ignificance apprach)即利用樣本結果,證實一個虛擬假設的真?zhèn)蔚囊环N檢驗程序。Ho:從而建立了一個100(1-)%接受域,該域以外稱為拒絕域(或臨界域)如Ho:因=0.5091,因此應拒絕Ho:實際中,我們只需計算 即可進行判別如:落入臨界域內,因此拒絕Ho:注:t的大?。簷z驗的顯著性。 (略)五、假設檢驗的實際操作1、“接受”與“拒絕”的含義:(“Accepting” or “Rejecting”)。2、“零”虛擬假設與“2倍t”算法。如果自由度在絕對值上大于2就可拒絕虛擬假設Ho:3、如何建立虛擬與對立假設。a沒有一成不變的Ho。B先假設,后檢驗,以免犯迂回推理(或自欺欺人
4、)的錯誤。4、的選擇。稱為犯第I類錯誤(拒絕了真實的假設)的概率。決策自然狀態(tài)Ho是對的Ho是錯的拒絕I類錯誤沒錯不拒絕沒錯類錯誤我們希望I類和類錯誤都是最小的,但不可能。可能要看哪一類錯誤更加嚴重。一般來說,人們以為犯第I類錯誤可能更加嚴重,所以不要輕易拒絕,因此將接受域擴大,即使取值盡可能小。5、精確的顯著性水平,P值。即Ho被拒絕的最低顯著性水平,即根據計算的t值直接查表。例:五:P114.exampe4.1 (0.104)(0.007) (0.0017) (0.003)n=526 P115.exampie4.2 (0.33) (0.094) (0.011) (0.026) n=141,
5、七、回歸分析與方差分析我們已知:TSS=ESS+RSS.對TSS的構成分析叫方差分析(analysis of varance,間記ANOVA)對雙變量模型,TSS的df=n-1,RSS的df=n-2,ESS的df=1令: (,)在Ho:時 F何作用?看:如果 則上式兩者無區(qū)別,如果 則因此,F可用于檢驗Ho: 即,根據樣本數據計算F,然后求p,最后判斷。對雙變量情形,F=t2 , F的作用在多變量時作用更大。八、回歸分析的應用:預測,如:1.均值預測 給定Xo=100,的估計量,可以證明: 從而得到真值的置信區(qū)間,例子中,置信區(qū)間為:Y均值的置信區(qū)間Y個值的置信區(qū)間OXXY2個值預測令t=Yo
6、的置信區(qū)間為:置信區(qū)間的寬度由se定與的置信區(qū)間相比,相差九、評價回歸分析的結果1、擬合的模型好壞的準則a、所估計系數的符號是否與理論或預期的一致?b、t的顯著性c、r2如何?2、正態(tài)性檢驗:chi-平方(X2)擬合優(yōu)度檢驗chi-square goodness of fit test (chi-平方(X2)擬合優(yōu)度檢驗)JarqueBera test(雅克貝拉檢驗)做ols回歸,求和的樣本標準差(Var()=)計算Ai=,根據se(u;)分A組計算下表數據頻數的分布觀測的殘差(Oi)023410期望的殘差(Ei)0.21.43.43.41.40.20.20.260.050.10.110.22
7、 (N為組數)若 拒絕正態(tài)性假設,否則接受。Ch6 雙變量線性回歸模型的延伸一、過原點的回歸如收入與收入調節(jié)稅的關系如資產定價模型(CAPM) capital asset pricing Model:第i種證券的期望回報率:無風險回報率 :Beta系數 :市場組合證券的期望回報率設如果二、過點回歸的估計SRF: 與含截距項模型的比較應用OLS:Var()= 1 因,不能出現;因此 過原點回歸中,不再成立。因此,非有十足的把握,不宜采用過原點的回歸。2例:組合證券理論的特征線 :Afuture基金回報率 :Fisher指數(一組證券)三、尺度與測量單位定義:四、回歸模型的函數形式1、對數線性模型
8、考慮模型: 令 則 ;a、系數的含義,b、r2(R2)是如何比較的(因不同函數形式)2、半對數模型: ,考慮模型:令半對數模型:a、系數的含義:回歸元的絕變化對回歸子的相對影響b、瞬時與復合增長率(者為2,后者為r)c、t有時用作趨勢變量Oyix對某商品的支出與收入YOxPhillipsYOx成本與產量3、倒數模型:Ch7復回歸分析(multiple Regression analysis)實際中幾乎找不到二變量回歸模型一、三變量回歸模型如:Income=二、三變量回歸模型的CLRM假設1、2、3、4、5、無設定偏誤6、解釋變量間無精確共線性。()7、復回歸模型對參數而言是線性的8、回歸元取固
9、定值9、回歸元取值有足夠的變異性。10、n>k三、復回歸方程的含義對模型 (1) (2)1、偏回歸系數的含義表示保持不變的情況下,每增加一單位,Y的均值的變化?;蛘哒f:表示的單位變化對Y均值的“直接”或“凈”影響。何為凈影響?對模型(1) 做對的OLS: =b1+b133i+得:做: 得:是不含對影響的部分。是不含對影響的部分。做對的OLS:則應為X2的單位變化對Y的凈影響,即2、參數的OLS估計量:最小化 得正規(guī)方程:從中求3、OLS估計量的方差和標準誤Var()= Var() Var() 4、OLS估計量的性質:a、回歸線()b、c、d、e、f、OLS估計量在CLRM假設下是BLUE
10、g、影響Var()大小的因素:、n、5、的含義TSS=ESS+RSS令:6、例見P189 與7.6 phillips 曲線 四、設定偏誤(specification bias)設正確模型為:誤用模型為: 或 ? b32 來自設定偏誤的結果是變大或縮小了解釋變量對回歸子的影響。 Var()和Var(b12)誰大?五、R2 與校正R2 R2復判定系數(multiple coeficient determination)1、修正的R2,當k增加時,減小,使增加.因此,當解釋變量越多時,越大,如何選擇正確的模型,為消除解釋變量個數的問題,建議用: (k為參數個數) 2.比較兩種個 如:兩模型的R2能否
11、比較3. 、t與k間關系及其取舍。4、見例195例7.1 例7.2,例7.3 六、多項式回歸模型的估計無例外地可用復回歸OLS法。不能再說其它不變增加一個增加例: (0.57) (0.115) (0.043) (0.165) (0.013) (0.006)n=506, =0.603 (0.32) (0.117) (0.043) (0.019) (0.006)n=506, =0.581系數的堅定性t和顯著性的變化ch8 復回歸分析的推斷問題一、正態(tài)性假定, 服從自由度為n-3的t分布。二、例見8.1兒童死亡率的例子決定因素為人均GNP和婦女識字率例2個人消費支出 個人可支配收入 以年計的時間(趨
12、勢變量)為什么要引進趨勢變量?1、為了分析應變量與時間的關系2、趨勢變量代替一個影響Y的基本變量(如技術進步)3、為了避免謬誤相關。三、檢驗個別偏回歸系數的假設在顯著性水平下,,拒絕Ho: 不拒絕Ho:或設計置信區(qū)間:四、檢驗樣本回歸的總顯著性1、檢驗Ho: 或 Ho:2.R2與F的關系 R2越大,F也越大,R2=1,F可見Ho: 等價于Ho:R2=03.解釋變量的增量貢獻我們知道,解釋變量個數的增加,R2也增加。R2增加的顯著性檢驗;自由度為新加入回歸元個數,n-新模型中參數個數的F分布.何時加進一個變量,只要t檢驗顯著,F檢驗也顯著何時加進一組變量:4、檢驗兩個回歸系數是否相等考慮:檢驗:
13、Ho: 或可以證明: 服從自由度為n-4的t分布如何檢驗:Ho:如何檢驗:Ho:服從自由度為n-4的t分布。五、受約束的最小二乘法考慮: (1)如何檢驗:Ho: 兩種方法1、t檢驗法:靜觀后效法2、先滿足約束條件,再估計: (2)m:線性約束個數n:觀測次數 (一般地:)(注:如果變量不同,與不能直接對比,需要換算)例見P248 例8.3 六、比較兩個回歸:檢驗回歸模型的結構穩(wěn)定性F分布的另一應用鄒(至莊)檢驗兩變量間的關系在不同時期不一定穩(wěn)定設在T期的結構為: (1)后: (2)不分時期的結構為: (3) 是獨立分布的。程序:(1) 做(3)的OLS得RSS1(2) 分別做(1)和(2)的O
14、LS,分別獲收RSS2 ,RSS3(3)計算F=自由度為(,T+k-2)的F公布如果F值大于表中獲得的F值,拒絕穩(wěn)定性(一致性)。例見P252七、用復回歸做預測1、作均值預測,誤差小。2、作個值預測,誤差大。如:假定1976年的,=567,沒第二篇 放寬經典模型的假定經典模型是建立在10大假設基礎上的。當十大假定有不成立時怎么辦?1參數為線性的。由于非線性用到數學知識較多,再加上經濟現象主要是線性的,該假定不改??煞艞?.(見聯系方程)但不能放棄3,否則,OLS統(tǒng)計量是有偏的。當3出現時,得找替代變量4.的均值為零如果是有偏估計,但不影響其它分析,由于并非十分重要,所以也無足輕生。5.的正態(tài)性
15、。的正態(tài)性假定對估計無任何影響,但是對統(tǒng)計量的分布有影響,對大樣本數據而言,的正態(tài)性假定并非十分重要,但對小樣本數據而言,必須有正態(tài)性假定,否則,t和F統(tǒng)計量未必服從t和F分布。6.觀測次數必須大于回歸元的個數7.回歸元的取值必須有足夠的變異8.回歸元間無確定的線性關系。將在多重共線性一章介紹。9.Va(ui)= 將在異方差一章中討論10.Cov(ui,uj)=0 將在自相關一章討論。11.回歸模型被正確設定。放在模型設定一章中探討。注:a、違反CLRM假定問題的解決方案并非總是令人滿意。b、解決方案不僅一個,可能難以取舍。c、同一模型可能違反CLRM的多項假定。d、解決方法可能不斷更新。下面
16、分析的一貫步驟是:明確問題的性質,分析他的影響,提出偵察的辦法,尋找補救的措施。ch10 多重共線性與微數缺測性一、多重共線性的含義1、完全多重共線性:存在一組不全為零的數,使:2、不完全多重共線性:存在一組不全為零的數,使:其中為隨機誤差項。3、多重共線性產生的原因:a、數據采集所用方法。取值受到的限制。樣本太集中b、模型或總體受到約束:即總體中這些變量之間本身有關系. c、模型設定:如的變化范圍很小時,等d、一個過度決定的模型(n<k)從小數個體中獲得大量特征,如幾個省多個變量。二、出現多重共線性時的估計問題1、如果出現完全多重共線性,如 則: 原因:在此情況之下,保持不變,的變化對
17、Yi的影響()是否可能存在。事實上,可估計,但或無法單獨進行等估計。2、出現不完全多重共線性的估計問題對模型:設是具有的隨機誤差項。當, A多重共線性的理論后果:難于得到標準誤小的系數估計值。相當于過少的觀測次數,或解釋變量過于集中,統(tǒng)計學者無力可為。B多重共線性的實際后果:從模型: 不難推Var 方差澎脹因子, Variance-inflating (inflating factor) Varr23是與間的相關系數。 當時 se()最小當時 se()為無窮大。實際結果:*:更寬的置信區(qū)間:*“不顯著”的t比率:*見例:10.6 P331另一種解決方案:嶺回歸(ridge regression
18、)c如何選取,此時為有偏估計三、多重共線性的偵察多重共線性是一種樣本現象。只有一些經驗性的偵察規(guī)則:1、R2值高而t比率低。(過度解釋)2、回歸元之間有高度的兩兩相關。3、輔助回歸 四、補救措施:(經驗性規(guī)則),也有無為而治的觀點1先驗信息考慮:假設支出,先驗地有: 此時令2橫截面與時間序列數據并用。設先用橫斷面數據估計:設的估計值,令:做OLS 估計出和。問題:本估計假定兩種數據無差別。3剔除變量與設定偏誤剔除變量可能使系數更顯著,但卻出現了設定偏誤。所以,治病可能比疾病更糟。4變量代換如即通過一階差分降低多重共線性。但新的問題:缺截距項。存在序列相關。5補充新數據但總是不那么容易。*多重共
19、線性一定是壞事呀? 預測(No)結構分析或精度分析(Yes)偏最小二乘法-主成份提取法五、一個綜合性的例子(p343)ch11 異方差性CLRM假定:E =1、2、n 即同方差YXO而不能出現異方差。如:支出與收入的關系;利潤與要素收入X一、異方差產生的原因:1、邊錯邊改學習模型。2、隨著收入增加,人們支配收入的能力和范圍更大。3、隨著數據采集技術的改進,可能減少。4、還會因異常值的出現而產生。5、還會因模型的不正確假定。二、出現異方差時的OLS與GLS(廣義最小=乘法)考慮: (1)1.OLS:Var先考慮 則OLS估計量是線性無偏估計量,但不是有效或最優(yōu)的。2.GLS對(1)兩邊同除,令
20、(2)Var此時,都是BLUE估計量Var (3)其中3.OLS與GLS的區(qū)別(OLS)一個是不加區(qū)分(GLS)一個是區(qū)別對待即隱含假定:每一個ui的影響一樣,但事實上不一樣先將ui的方差變成一至,再施加影響三、存在異方差時OLS的后果。1、考慮異方差時的OLS估計Var 結果是:本來顯著的變成不顯著的了。2因Var 的有偏估計則如果存在異方差而不考慮,必將導致有偏推斷四、異方差的偵察只有一組樣本而不知總體的條件下如何發(fā)現異方差。根據OLS的分析,推斷異方差是否存在1非正式方法a、根據問題的性質判斷即根據常識,經驗、理論、假設等判斷如:收入與支出 b、圖解法:即根據OLS的的表現,判斷是否存在
21、系統(tǒng)特征。OO橫軸亦可用某一個回歸元表示。2正式方法a、帕克(Park)檢驗假定:因未知,用OLS得到的代替并做如下回歸:ln若Ho:是顯著的存在異方差(但問題是可能不滿CLRM假設);不顯著不存在異方差 例見P379b、格萊澤(GLejser)檢驗即從OLS回歸中得到,再做如下回歸:等,對大樣本來說,能取得滿足的結果。但是是否滿足CLRM檢驗?例子見P380c、斯皮爾曼(spearman)的等級相關檢驗。斯皮爾曼的等級相關系數為:=第i單元或現象的兩種不同屬性所處的等級之差n=帶級別的單元或現象個數。設 (1)(1)OLS上式得,(2)對從小到大或從大到小進行排序,計算(3)假設總體等級相關
22、系數s為零,且n>8,rs的顯著性可通過t檢驗進行 自由度df=n-2如果|t|>| 接受異方差假設;否則,拒絕。例見P381 例11.3d、戈德菲爾德-匡特檢驗(goldfeld-Quantt test)考慮戈德菲爾德-匡特檢驗的步驟如下:(1)對從小到大排序(對多變量情形,可任選一解釋變量)(2)略去居中的C個觀測值,并將其余n-c個觀測值分為2組XCBAXEFYi(3)分別對前后兩組觀測值做OLS,并分別設、和,(他們的自由度分別為)(4)計算如果若,存在異方差若,存在同方差。問題是c的選擇問題,經驗:n=60.取c=10.n=30.取c=4例見P383-例11.4e、布勞殊
23、一培干-戈費雷(Berusch-Pagan-Godfrey)檢驗考慮模型: (1)假定 如:如果Ho:成立,接受同方差。 不成立,接受異方差。步驟:對(1)做OLS,設。計算 (即的最大似然估計)定義做對Z的回歸(可以是,也可以是的某一函數)OLS上式,得到ESS,并定義若, 則若大于拒絕同方差,否則接受。f、懷特(White)的一般性異方差檢驗考慮模型:程序:對上式做OLS并獲得,做如下模型的OLS: 得R2Ho:判定:若>,存在異方差若<,不存在異方差注:此法優(yōu)于BGP和戈德菲爾德例見P369 例11.5五、補救措施1當已知時,采用加權最小=乘法,問題好辦得多。做OLS例見P3
24、712.當未知a、 懷特程序,(TSP軟件包備有)例見P372 例11.7b、關于異方差性的可能假定考慮如下模型: 設做變換: 則 做變換:則作變換:問題是不知,不過,可將作為的替代變量。(OLS)改變函數形式可能消除或降低異方差性。如:問題:以上變換可能只是一種權定之計。例見P376 11.7CH12 自相關(Auto correlation)一、概念 :序列間的相關與序列內的相關。 (1) (2) serial correlation Autocorrelation產生的原因:1慣性2設定偏誤 a、應含而未含變量的情形b、不正確的函數形式3蛛網現象供給: (與從而與有關)4滯后效應 5數據
25、的編造6. 數據變換:如:一次差分, 可能存在自相關7. 非平穩(wěn)性。由于回歸元或者回歸子的非平穩(wěn)性,可能導致擾動項的自相關。二、自相關存在時的估計考慮時間序列, (:自協(xié)方差系數) (1)此時, (1) 稱為馬爾可夫一階自回歸模式(Markov first-order autoregressive scheme)記為AR(1) 稱為AR(2)對OLS,得 給定AR(1) 很難比較和 注:>0 x值是正相關的則:<如果存在自相關,OLS估計是線性無偏估計,但不是最優(yōu)的(即BIUE)利用GLS,得:GLS=三、自相關出現時OLS的后果1考慮自相關的OLS估計使用 得到的置信區(qū)間比使用得
26、到的置信區(qū)間要寬。結果,本該顯著的卻變成了不顯著。2 忽視自相關的OLS估計存在自相關,但繼續(xù)使用OLS,A可能低估了真實的。【如果,E()=】B高估了R2CVar()可能低估了Dt和F檢驗都可能變得更無效見P404、monte carlo experiment 四、偵察自相關1圖解法通過對OLS能得的,根據所描圖形發(fā)現異方差,自相關和設定偏誤。2游程檢驗 (runs test)定義:游程的長度游程中元素的個數。(-)(+)(-)(+)(-)游程的個數 記:n=總觀測個數= 十號個數 , 一號個數K=游程個數假定:>10 >10 ,則游程個數N(E(k),)E(k)=方差3Durb
27、in waston d Testd=假設A、回歸含有裁距項 B、解釋變量x是非隨機的。 C、干擾是按一階自回歸模式產生的。 D、不能把應變量當作解釋變量。 E、沒有缺落數據。 令 0 2 4正自相關無決定域沒有相關H0:=0無決定域負自相關4大樣本檢驗當很大時,5高階自相關的布勞殊戈弗雷(breusch Goldfrey)檢驗設: 在大樣本條件下,五、補救措施1 自相關的結構已知:如則對方程可做OLS。此時,失去了一個觀測值,建議用補上。一般形式的廣義差分法2.未知a、一次差分法,若=1, (因|1)則或 沒有常數項注:有常數意味著什么? 原來的殘差項不平穩(wěn),差分后就平穩(wěn)了?若=,則或 移動平
28、均回歸如何檢驗:Berenblutt webb test(貝倫布魯特一韋布)設如果計算的g在之下,不拒絕b、 durbin waston d統(tǒng)計量估計c、 估計的Cocharane Orcutt(科克倫一奧克特)迭代法即利用估計的殘差去獲得的信息。如:程序:OLS:或 直至之間相差很小為止。d、Cocharane Orcutt兩步法:即做上述迭代二步即可沒到滿意結果。e、估計的durbin兩步法:將廣義差分方程寫為:程序:求上述的OLS,得到利用,變換得做OLS:例子:P423 多127五、自回歸條件異方差(ARCH)模型時間序列數據中會不會出現異方差性?(如謠言,政局等)出現時將影響預測的精
29、度。時間序列中特別是在金融中, 成立Engle提出自回歸條件異方差性模型(ARCH)即t期的依賴于考慮:若Var 則稱為ARCH(1)過程。一般地,一個ARCH(P)過程可寫為:VarHo:,即沒有自相關。容易通過如下式子去檢驗Ho外生變量也可進入模型的右邊,如可利用F統(tǒng)計量檢驗Ho,或如下方法檢驗;從上式得R2GARCH模型(GARCH model實質上是ARCH的變型)同樣地,也可以將方差作為解釋變量進入模型,如:=這種model稱為:Arch-模型六、存在自相關時的預測 預測值為:為了區(qū)別此處預測與第五章預測結果的差別,此預測被稱為動態(tài)預測,前者是靜態(tài)預測。動態(tài)預測結果準確度高。例子見P
30、453。第13章計量經濟建模:模型設定與診斷檢驗我們設定的模型是正確的嗎?本章的內容將解決如下問題:1)正確模型的準則是什么?2)哪些類型的模型設定誤差?3)存在設定誤差的后果是什么?4)如何發(fā)現設定誤差?5)如何補救?一、模型選擇的準則1.數據容納性:據模型預測的結果應該是符合邏輯的。2.與理論一致:應該有好的經濟含義,應該與理論假設的一致。3.回歸元的弱外生性:回歸元與誤差項沒有關系。4.參數的堅定性。5.數據的協(xié)調性:殘差必須是完全隨機的。6.模型有一定的包容性:應該有普遍性或代表性。二、設定偏誤的類型1.漏掉一個有關變量正確模型:不正確模型:2.包含一個無關變量正確模型:不正確模型:3
31、.錯誤的函數形式正確的函數形式:錯誤的函數形式:4.測量誤差正確的觀察值:不正確的觀察值:其中:三、設定誤差的后果1.漏掉一個有關變量正確模型:不正確模型: Var() 實例:兒童死亡率的決定因素為人均GNP和婦女識字率 (7.1) (7.2)比較系數與方差及其顯著性水平的變化。2.包含一個無關變量正確模型:不正確模型: Var() 四、設定誤差的檢驗1.檢驗模型是否含有無需有的變量設:其他變量如:等變量是否該進入模型,可以采用前面所介紹的t檢驗(單個變量)或者F檢驗(一組變量),如果檢驗是顯著的,可以進入,否則不能進入。當然,這有數據開采的嫌疑,但也不失為一種補救方法。2.檢驗模型是否遺漏變
32、量或函數形式不正確。方法一:殘差分析設:真實模型為:如果用如下形式:那么,應該有系統(tǒng)的變化而不是隨機的。此時可以分析殘差的變化規(guī)律。方法二:D-Wd統(tǒng)計量方法對橫截面數據,d統(tǒng)計量可以用來分析序列的相關性。步驟是:第一,做OLS得到殘差;第二,假設模型漏掉了一個變量Z,對Z從小到大排序。第三,按照Z的排序,計算:第四,根據D-W-d統(tǒng)計表,看d值的顯著性,如果是顯著的,則認為遺漏了變量。方法三:拉姆齊(ramsey)的RESET檢驗。設,RESET檢驗的步驟為:第一,回歸原來的模型,得到第二,做如下模型的回歸:檢驗:方法四:拉格朗日乘數(LM)檢驗模型(1)是模型(2)的受約束模型,LM檢驗的
33、步驟如下:第一,OLS(1).得到殘差。第二,OLS: 得到。第三,因:,如果實際計算的,就拒絕受限回歸。五、測量誤差1.因變量的測量誤差,是真值,但是,我們測量的是,有誤差,即:,則:Var() ,因此,回歸的方差變大,無偏性不變。2.解釋變量的測量誤差,是真值,但是,我們測量的是,有誤差,即:,則:此意味著解釋變量與擾動項相關,結果是有偏估計。事實上:如何糾正?1)盡可能使小。2)找工具變量或代理變量。例子見P492六、嵌套與非嵌套模型因為模型B是模型A的特殊情形,我們說模型B被嵌套在模型A之中。如何做檢驗?這些無異于我們前面學過的受約束回歸。彼此互不嵌套模型:模型C和模型D互不包含,模型
34、D和模型E也互不包含,他們也是個非嵌套模型。模型的決定因素分析:如是貨幣政策決定經濟增長還是財政政策決定經濟增長?1)非嵌套的判別方法:比較模型C、D、E的:2)非嵌套的F檢驗考慮通過F檢驗,如果C成立,則 如果D成立,則這一檢驗方法還是存在很多局限性,如多重共線性、都不顯著或者都顯著等。 例子見P4963)戴維森-麥金農J檢驗1)估計模型D,并得到Y的估計值。2)做模型C的增補回歸: 3)做t檢驗:4)判斷:如果假設不被拒絕,就可以接受模型C為真模型。 如果原假設被拒絕,就拒絕模型C為真模型。5)顛倒過來做,做模型D的增補回歸: 做t檢驗:如果假設不被拒絕,就接受模型D為真模型。如果原假設被
35、拒絕,就拒絕模型D為真模型??赡艿慕Y果是: 策略不拒絕拒絕不拒絕同時接受C和D接受D而拒絕C拒絕接受C而拒絕D同時拒絕C和D例子P498 七、計量經濟建模的其他問題1)異常數據、杠桿數據和有影響力的數據異常數據是指具有很大殘差的觀察:杠桿數據是指某一個回歸元值遠離絕大多數回歸元值。有影響力的數據是指某一個觀察值對回歸結果有顯著影響的數據。有影響力的數據異常數據異常數據可能是一個信號,只有確信是觀察誤差才可以考慮去掉該數據。2)遞歸最小二乘法在結構穩(wěn)定性的鄒至莊檢驗中,如果不知道轉折點,可以采用遞歸最小二乘法:即分別作最小二乘估計,看看估計的系數的變化是否很大?是否隨機?3)鄒至莊預測失靈檢驗考
36、慮模型: 用做回歸,得到估計的。得到:,利用該模型預測的。計算:。計算統(tǒng)計量F: 如果F檢驗是顯著的,則認為預測不可靠,模型結構穩(wěn)定性存在問題。P507:一個總結性的例子CH14 虛擬變量(dummy Variables )and limited dependent Variables引出:計量經濟學反映經濟變量間的量化關系。這就要求經濟變量是定量變量。如GDP、P、收入、FDI。但確實有很多經濟變量是定性變量(qualitative Variable).如:性別、姓名、民族、是否擁有、婚否。1虛擬變量(dummy Variable):取值0、1的變量二分變量: 如:多(n)分變量: 即類型n
37、-1如:員工受教育的水平:中學以下,中學,大學及以上 回歸的意義: 工資 工齡2檢驗回歸模型的結構穩(wěn)定性(Testing for structural stability of Regression Models)如我國居民收入與支出之間的關系,沒有理由說1978年以前的與1978年以后的是一樣的。如:產出與資本收入和勞動力投入之間的關系:沒有理由說1979年以前的()、1979年-1991年,1992年以后的()是一樣的。如何檢驗這種結構的穩(wěn)定性?美籍華人鄒致莊曾提出一種方法:Zhou-Test以為例說明。已知各年的鄒提出將數據分為=組,即1978年以前的數據為一組,1978年以后的數據為一
38、組。分別擬合回歸方程: 1978年以前YO1978RSS1RSSRSS2X 1978年以后再檢驗Ho:如果采用虛擬變量法,問題就簡單得多。設設計回歸函數為:1978年以前:1978年以后:我們即可以用t,也可以用F檢驗檢驗,是否為零即兩時期模型的結構是否穩(wěn)定。這比鄒檢驗更好,因為檢驗只能籠統(tǒng)地檢驗結構穩(wěn)定性,而虛擬變量法既可以檢驗截距的差異,也可以檢驗斜率的差異。這種結構穩(wěn)定性檢驗的用處是十分廣泛的。3變量間的交叉作用效應(interaction)考慮模型: 衣著開支 收入 此模型的一個隱含假定是:男女大學生之間的衣裝支出差異與男女非大學生之間的衣著支出差異相同,都是。同樣,不論是男女,大學生
39、與非大學生的衣著支出差異相同,都是,因此與現實不相符。如果設計如下模型,問題就解決了:4虛擬變量在季節(jié)分析中的應用The use of Dummy variables in seasonal Analysis 銷售收入=再檢驗的顯著性。5橫斷面數據和時間序列數據的合并使用(The use of dummy variables in Combining time series and Cross Sectional data)較為著名的經濟增長模型新古典經濟增長模型:影響經濟增長的因素有一國勞動力的增長,資本的增加。既可以是時間序列數據,又可能是橫斷面數據。由于各國資料的難得性,可能只能用時間序
40、列數據代替橫斷面數據,或兩者兼用。如果兼用,可能出現如下問題:a、時間序列的穩(wěn)定性問題b、異方差問題c、結構變化問題。在此可借用dummy Variable考慮結構穩(wěn)定性問題。如果只有三國的資料,如中、美、日的.,并只考慮截距的差異: ch16 虛擬應變量的回歸應變量為虛擬變量的回歸。如:勞動力的參與與失業(yè)率、工資率、家庭收入、教育的關系;是否擁有住房與收入的關系;債券等級與利潤率、負債率等的關系。0 非線性回歸模型簡介1 本質上的線性和非線性回歸模型(1)本質上的線性回歸模型: 令 則 (2)本質上的非線性回歸模型:對該模型做最小二乘估計稱為非線性最小二乘估計(NLLS),只是此時難以像線性
41、回歸模型的OLS一樣,得到參數的顯性解,其解表現為隱性解。(3)本質上非線性回模型的估計:對這種隱性解進行求解是一件十分艱難的工作,現有的主要方法:直接搜索或者試錯法直接最優(yōu)化(先求出正規(guī)方程,然后通過迭代法解這一正規(guī)方程)迭代線性化方法:如泰勒級數展開(Taylor)、高斯-牛頓迭代法(Gauss-Newton)等,現有軟件均有配置(4)本質上非線性回歸模型的推斷a必須是大樣本,原有統(tǒng)計推斷才是漸進成立。b.擬合優(yōu)度:本章將主要介紹三種模型:線性概率模型對數單位模型概率單位模型一、線性概率模型(LPM)考慮如下模型:收入假設家庭收入為處,的概率的概率則的分布:所以,模型的條件期望可解釋為的條
42、件概率上述模型稱為線性概率模型。二、LPM的估計問題1的非正態(tài)性問題只取兩個值:遵循二項分布。當樣本無限增大時,OLS估計量仍然趨于正態(tài)分布。2的異方差性的分布為:Var()所以,是異方差的,除非當然異方差也是可以克服的令 (在實際中,可先估計)3、不被滿足可能落入0.1之外。兩種處理辦法:4、可疑的擬合優(yōu)度:X10三、LPM的應用1、住房所有權與家庭收入的關系(也可以是汽車)解釋:“勞動力參與”模型a、 應變量和解釋變量都是虛擬變量。b、 解釋變量較多c、 樣本較大(25000)d、 =0.175e、 交互作用3、對債券評級的預測0.686-0.0179 0.0486 0.0572 0.37
43、8E-7 負 利 利 凈 債 潤 潤 資 率 率 的 產 標準誤四、對數單位模型(logit model)LPM受到一些問題的困擾:a、的非正態(tài)性;b、的異方差性;c、可能落在0-1之外;d、可能很低。我們需要的(概率)模型有如下圖形式:XPCDFO考慮如下模型: 對數單位模型(logit model)特點:12與的關系比較符合邏輯。(即上圖的關系)3一旦估計出和,與的關系就確定了。五、logit model 的估計:1、對每一收入水平,計算擁有住房的估計概率2、求:3.估計 4.解決異方差問題:令作變換:則: 為同方差模型5.用OLS方法估計上述模型,進行假設檢驗。六、例子1 見P552例2
44、 見P555 用最大似然法估計 Payout+Turnov+Size+Lev+VoL+ 支付比率 資產轉率 股本的市場價值 杠桿比率 交易量七、概率單位模型(Probit model)XiO步驟:1、計算2、給定,從標準正態(tài)分布CDF讀n.e.d(=)3、做回歸:4、解決異方差(5、用OLS做假設檢驗。八、Probit model的應用。1、數值性的例子(0.0582) (0.0025)t=(-17.33) (19.105)若n.e.d+5= (0.0582)(0.0025) 九、logit和Probit model的最大似然估計在給定下的密度函數為:對LPM, 對Logit模型,對Probi
45、t model, 取對數:對數似然函數為: 最大化該似然函數,可得十、TOBIT模型及其估計總體中一部分樣本的回歸元和回歸子都有信息,另一部分樣本的回歸元有信息,而回歸子的信息不足,怎么辦?TOBIT模型形式為:估計及例子見P577十一 綜列數據 (Panel Data)(1)一個說明性的例子:企業(yè)投資與企業(yè)價值和實際資本存量的關系(P601) (1)(2) 使用綜列數據的好處1) 綜列數據能考慮到個體的差異。2) 綜列數據可以增加自由度。3) 可以做動態(tài)研究。4) 彌補了單純使用時間序列數據或者橫截面數據分析的不足。(3)固定效應模型估計方法1)所有系數都不隨時間和個體而變化方法:直接做OL
46、S2)斜率系數不變而截距隨個體而變化(即固定效應模型:FEM) (2)估計方法:最小二乘虛擬變量法(LSDV)3)斜率系數不變而截距隨時間而變化 (3)估計方法:4)斜率系數不變而截距隨個體和時間而變化 (4)估計方法:如果所有的系數都是顯著的,綜列數據模型毫無意義!5)使用固定效應模型或者LSDV模型應該注意:第一,適當虛擬變量與自由度的消長關系。第二,過多的變量與多重共線性問題。第三,虛擬變量可能無法與其他虛擬變量區(qū)分。第四,對擾動項的假定要求更高,同時要求沒有異方差、自相關。(4)隨機效應模型(REM)估計方法假定:此處:是不可觀測的變量。因此不能直接應用OLS,而應該采用GLS。(5)固定效應與隨機效應的比較a.當T較大而N較小時,FEM和REM的估計幾乎沒有什么區(qū)別。b當T較小而N較大時,FEM 和REM估計有很大區(qū)別。c.當 與回歸元有關是,REM估計是有偏的,而FEM估計是無偏的。d.當T較小而N較大時,模型滿足REM的條件,REM估計量比FEM估計量更為有
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025合同文書模板:華通物流有限公司貨運代理業(yè)務合作協(xié)議
- 2025某物流公司駕駛員工作服采購合同書
- 網絡項目設計合同
- 農村個人贈與土地使用權協(xié)議
- 2025農民房屋租賃合同書范本
- 租用電路合同范本
- 個人與個人借款合同范本
- 2025設備租賃合同(生產線設備租賃用)
- 打架承諾協(xié)議書范本
- 采購教育服務協(xié)議書
- GB/T 44311-2024適老環(huán)境評估導則
- 中醫(yī)藥香囊課件
- 幼兒園美術:交通工具
- 康養(yǎng)服務專業(yè)群建設方案
- 澳大利亞省公開課一等獎新名師比賽一等獎課件
- 2024年高考英語快速提閱讀-科技創(chuàng)新類詞匯記
- 《濕地資源資產評估和資源核算技術規(guī)范》報批稿及編制說明
- 水平垂直運輸專項方案
- (正式版)SHT 3227-2024 石油化工裝置固定水噴霧和水(泡沫)噴淋滅火系統(tǒng)技術標準
- 2023年4月自考02331數據結構試題及答案含解析
- CIE1931-色坐標-三刺激值
評論
0/150
提交評論