Saa與模型的設(shè)定

上傳人：1*** IP屬地：貴州上傳時(shí)間：2023-01-18 格式：PPTX 頁數(shù)：48 大小：794.38KB 積分：23 舉報(bào) 版權(quán)申訴

已閱讀5頁，還剩43頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第七章Stata與模型的設(shè)定主要內(nèi)容：1、遺漏變量的檢驗(yàn)2、解釋變量個(gè)數(shù)的選擇3、多重共線性與逐步回歸法4、極端數(shù)據(jù)的診斷與處理5、虛擬變量的處理6、經(jīng)濟(jì)結(jié)構(gòu)變動(dòng)的Chow檢驗(yàn)實(shí)驗(yàn)7-1遺漏變量的檢驗(yàn)一、實(shí)驗(yàn)基本原理二、實(shí)驗(yàn)數(shù)據(jù)和實(shí)驗(yàn)內(nèi)容根據(jù)統(tǒng)計(jì)資料得到了美國工資的橫截面數(shù)據(jù)，變量主要包括：wage=工資，educ=受教育年限，exper=工作經(jīng)驗(yàn)?zāi)晗?，tenure=任職年限，lwage=工資的對(duì)數(shù)值。完整的數(shù)據(jù)在本書附帶光盤的data文件夾的“wage1.dta”工作文件中。利用wage1的數(shù)據(jù)，分別利用Link方法和Ramsey方法檢驗(yàn)?zāi)Ｐ褪欠襁z漏了重要的解釋變量。三、實(shí)驗(yàn)操作指導(dǎo)1.使用Link方法檢驗(yàn)遺漏變量Link方法進(jìn)行檢驗(yàn)的基本命令語句為：linktest[if][in][,cmd_options]在這個(gè)命令語句中，linktest是進(jìn)行Link檢驗(yàn)的基本命令，if是表示條件的命令語句，in是范圍語句，cmd_options表示Link檢驗(yàn)的選項(xiàng)應(yīng)該與所使用的估計(jì)方法的選項(xiàng)一致，例如檢驗(yàn)之前使用的回歸regress命令，則此處的選項(xiàng)應(yīng)與regress的選項(xiàng)一致。例如，利用wage1的數(shù)據(jù)，檢驗(yàn)?zāi)Ｐ褪欠襁z漏了重要的解釋變量，應(yīng)該輸入以下命令：usec:\data\wage1.dta,clearreglwageeducexpertenurelinktest第一個(gè)命令表示打開數(shù)據(jù)文件wage1，第二個(gè)命令語句是對(duì)模型進(jìn)行回歸估計(jì)，第三個(gè)命令就是進(jìn)行遺漏變量的Link檢驗(yàn)，檢驗(yàn)結(jié)果如圖7.1所示。從第二個(gè)表格中，可以看到hatsq項(xiàng)的p值為0.018，拒絕了hatsq系數(shù)為零的假設(shè)，即說明被解釋變量lwage的擬合值的平方項(xiàng)具有解釋能力，所以可以得出結(jié)論原模型可能遺漏了重要的解釋變量。為了進(jìn)一步驗(yàn)證添加重要變量是否會(huì)改變Link檢驗(yàn)的結(jié)果，我們生成受教育年限educ和工作經(jīng)驗(yàn)?zāi)晗辝xper的平方項(xiàng)，重新進(jìn)行回歸并進(jìn)行檢驗(yàn)，這時(shí)輸入的命令如下：geneduc2=educ^2genexper2=exper^2reglwageeducexpertenureeduc2exper2linktest第一個(gè)命令語句的作用是生成變量educ2，使其值為變量educ的平方；第二個(gè)命令語句的作用是生成變量exper2，使其值為變量exper的平方；第三個(gè)命令語句的作用是對(duì)進(jìn)行回歸估計(jì);第四個(gè)命令就是進(jìn)行遺漏變量的Link檢驗(yàn)，檢驗(yàn)結(jié)果如圖7.2所示。2.使用Ramsey方法檢驗(yàn)遺漏變量Ramsey方法進(jìn)行檢驗(yàn)的基本命令語句為：estatovtest[,rhs]在這個(gè)命令語句中，estatovtest是進(jìn)行Ramsey檢驗(yàn)的命令語句，如果設(shè)定rhs，則在檢驗(yàn)過程中使用解釋變量，如果不設(shè)定rhs，則在檢驗(yàn)中使用被解釋變量的擬合值。例如，利用wage1的數(shù)據(jù)，使用Ramsey方法檢驗(yàn)?zāi)Ｐ褪欠襁z漏了重要的解釋變量，應(yīng)該輸入以下命令：usec:\data\wage1.dta,clearreglwageeducexpertenureestatovtest在這組命令語句中，第一個(gè)命令的功能是打開數(shù)據(jù)文件，第二個(gè)命令是對(duì)模型進(jìn)行回歸估計(jì)，第三個(gè)命令就是進(jìn)行遺漏變量的Ramsey檢驗(yàn)，檢驗(yàn)結(jié)果如圖7.3所示。在圖7.3中，第一個(gè)圖表仍然是回歸結(jié)果，第二部分則是Ramsey檢驗(yàn)的結(jié)果，不難發(fā)現(xiàn)Ramsey檢驗(yàn)的原假設(shè)是模型不存在遺漏變量，檢驗(yàn)的p值為0.0048，拒絕原假設(shè)，即認(rèn)為原模型存在遺漏變量。為了進(jìn)一步驗(yàn)證添加重要變量是否會(huì)改變Ramsey檢驗(yàn)的結(jié)果，我們采取Link檢驗(yàn)中的方法，生成受教育年限educ和工作經(jīng)驗(yàn)?zāi)晗辝xper的平方項(xiàng)，重新進(jìn)行回歸并進(jìn)行檢驗(yàn)，這時(shí)輸入的命令如下：geneduc2=educ^2genexper2=exper^2reglwageeducexpertenureeduc2exper2estatovtest這里不再贅述這些命令語句的含義，調(diào)整之后的檢驗(yàn)結(jié)果如圖7.4所示，可以發(fā)現(xiàn)此時(shí)檢驗(yàn)的p值為0.5404，無法拒絕原假設(shè)，即認(rèn)為模型不再存在遺漏變量。實(shí)驗(yàn)7-2解釋變量量個(gè)數(shù)的的選擇一、實(shí)驗(yàn)驗(yàn)基本原原理好的經(jīng)濟(jì)濟(jì)理論的的標(biāo)準(zhǔn)通通常是希希望通過過更為簡簡潔的模模型來更更加精確確地描述述復(fù)雜的的經(jīng)濟(jì)現(xiàn)現(xiàn)象，但但是這兩兩個(gè)目標(biāo)標(biāo)通常是是矛盾的的，因?yàn)闉橥ㄟ^增增加解釋釋變量的的個(gè)數(shù)可可以提高高模型的的精確程程度，但但是同時(shí)時(shí)也犧牲牲了模型型的簡潔潔性。因因此，在在現(xiàn)實(shí)的的經(jīng)濟(jì)研研究過程程中，通通常使用用信息準(zhǔn)準(zhǔn)則來確確定解釋釋變量的的個(gè)數(shù)，，較為常常用的信信息準(zhǔn)則則有兩個(gè)個(gè)：（1）赤池信信息準(zhǔn)則則，又稱稱為AIC準(zhǔn)則，其其基本思思想是通通過選擇擇解釋變變量的個(gè)個(gè)數(shù)，使使得如下下目標(biāo)函函數(shù)最小小。在這個(gè)公公式中，，e代表殘差差序列，，n代表樣本本數(shù)量，，K代表解釋釋變量的的個(gè)數(shù)。。通過這這個(gè)目標(biāo)標(biāo)函數(shù)可可以看出出，第一一項(xiàng)是對(duì)對(duì)擬合優(yōu)優(yōu)度的獎(jiǎng)獎(jiǎng)勵(lì)，即即盡可能能地使殘殘差平方方和變小小，第二二項(xiàng)是對(duì)對(duì)解釋變變量個(gè)數(shù)數(shù)增多的的懲罰，，因?yàn)槟磕繕?biāo)函數(shù)數(shù)是解釋釋變量個(gè)個(gè)數(shù)的增增函數(shù)。。（2）貝葉斯斯信息準(zhǔn)準(zhǔn)則，又又稱為BIC準(zhǔn)則，其其基本思思想是通通過選擇擇解釋變變量的個(gè)個(gè)數(shù)，使使得如下下目標(biāo)函函數(shù)最小小。在這個(gè)公公式中，，e代表殘差差序列，，n代表樣本本數(shù)量，，K代表解釋釋變量的的個(gè)數(shù)。。通過這這個(gè)目標(biāo)標(biāo)函數(shù)可可以看出出，BIC準(zhǔn)則與AIC準(zhǔn)則的唯唯一區(qū)別別就是K的權(quán)重不不同，一一般來說說ln(n)>2，所以BIC更加注重重模型的的簡潔性性。二、實(shí)驗(yàn)驗(yàn)數(shù)據(jù)和和實(shí)驗(yàn)內(nèi)內(nèi)容：根據(jù)統(tǒng)計(jì)計(jì)資料得得到了美美國工資資的橫截截面數(shù)據(jù)據(jù)，變量量主要包包括：wage=工資，educ=受教育年年限，exper=工作經(jīng)驗(yàn)驗(yàn)?zāi)晗蓿?，tenure=任職年限限，lwage=工資的對(duì)對(duì)數(shù)值。。完整的的數(shù)據(jù)在在本書附附帶光盤盤的data文件夾的的“wage1.dta”工作文件件中。利用wage1的數(shù)據(jù)，，來確定定以下兩個(gè)個(gè)模型：：模型和模型哪個(gè)更為為合理（（其中educ2和exper2分別為educ和exper的平方項(xiàng)項(xiàng)）。三、實(shí)驗(yàn)驗(yàn)操作指指導(dǎo)使用信息息準(zhǔn)則，，對(duì)模型型進(jìn)行檢檢驗(yàn)的命命令如下下：estatic[,n(#)]在這個(gè)命命令語句句中，estatic是進(jìn)行檢檢驗(yàn)的命命令語句句，選項(xiàng)項(xiàng)n(#)的功能是是指定BIC準(zhǔn)則中的的n值，一般般使用默默認(rèn)值。。例如，利利用wage1的數(shù)據(jù)，，獲得模模型的AIC和BIC值，應(yīng)該該輸入以以下命令令：usec:\data\wage1.dta,clearreglwageeducexpertenureestatic第一個(gè)命命令表示示打開數(shù)數(shù)據(jù)文件件wage1，第二個(gè)個(gè)命令語語句是對(duì)對(duì)模型進(jìn)進(jìn)行回歸歸估計(jì)，，第三個(gè)個(gè)命令就就是進(jìn)行行信息準(zhǔn)準(zhǔn)則值的的計(jì)算，，計(jì)算結(jié)結(jié)果如圖圖7.5所示，AIC值為635.10，BIC值為652.16。為了對(duì)比比分析，，我們?nèi)匀匀徊扇∪ink檢驗(yàn)中的的方法，，生成受受教育年年限educ和工作經(jīng)經(jīng)驗(yàn)?zāi)晗尴辝xper的平方項(xiàng)項(xiàng)，建立立新的模模型重新對(duì)其其進(jìn)行回回歸并計(jì)計(jì)算，這這時(shí)輸入入的命令令如下：：geneduc2=educ^2genexper2=exper^2reglwageeducexpertenureeduc2exper2estatic這里不再贅述述這些命令語語句的含義，，調(diào)整之后的的計(jì)算結(jié)果如如圖7.6所示，可以發(fā)發(fā)現(xiàn)此時(shí)計(jì)算算的AIC值為583.66，BIC值為609.25。通過這兩個(gè)模模型信息準(zhǔn)則則值的對(duì)比分分析，可以得得出結(jié)論，第第二個(gè)模型的的信息準(zhǔn)則值值更小，所以以此模型優(yōu)于于第一個(gè)模型型。實(shí)驗(yàn)7-3多重共線性與與逐步回歸法法一、實(shí)驗(yàn)基本本原理多重共線性問問題在多元線線性回歸分析析中是很常見見的，其導(dǎo)致致的直接后果果是方程回歸歸系數(shù)估計(jì)的的標(biāo)準(zhǔn)誤差變變大，系數(shù)估估計(jì)值的精度度降低等。多多重共線性的的問題對(duì)于Stata軟件來說并不不顯著，因?yàn)闉镾tata會(huì)自動(dòng)剔除完完全的多重共共線性，但是是出于知識(shí)的的完整性，這這里還是介紹紹一下Stata對(duì)于多重共線線性的識(shí)別和和處理方法。。多重共線性的的診斷方法主主要有：（1）直觀上說：：當(dāng)模型的擬擬合優(yōu)度非常常高且通過F檢驗(yàn)，但多數(shù)數(shù)解釋變量都都不顯著，甚甚至解釋變量量系數(shù)符號(hào)相相反時(shí)，可能能存在多重共共線性。（2）對(duì)由解釋變變量所組成的的序列組進(jìn)行行相關(guān)分析時(shí)時(shí)，如果有些些變量之間的的相關(guān)系數(shù)很很高，則也反反映出可能存存在多重共線線性。（3）使用命令estatvif，對(duì)膨脹因子子進(jìn)行計(jì)算，，經(jīng)驗(yàn)上當(dāng)VIF的均值>=2且VIF的最大值接近近或者超過10時(shí)，通常認(rèn)為為有較為嚴(yán)重重的多重共線線性。當(dāng)確認(rèn)模型存存在多重共線線性時(shí)，通常常有兩種解決決方法消除其其影響：一種種是收集更多多的數(shù)據(jù)，增增大樣本容量量；另一種是是通過逐步回回歸，改進(jìn)模模型的形式。。在現(xiàn)實(shí)研究究過程中，增增大樣本容量量的操作不易易執(zhí)行，所以以逐步回歸法法應(yīng)用更為廣廣泛。逐步回歸法的的基本原理是是：先分別擬擬合被解釋變變量對(duì)于每一一個(gè)解釋變量量的一元回歸歸，并將各回回歸方程的擬擬合優(yōu)度按照照大小順序排排列，然后將將擬合優(yōu)度最最大的解釋變變量作為基礎(chǔ)礎(chǔ)變量，然后后逐漸將其他他解釋變量加加入模型中并并同時(shí)觀測t檢驗(yàn)值的變化化，如果t檢驗(yàn)顯著則保保留該變量，，否則去除，，不斷重復(fù)此此過程直到加加入所有顯著著的解釋變量量。二、實(shí)驗(yàn)數(shù)據(jù)據(jù)和實(shí)驗(yàn)內(nèi)容容根據(jù)統(tǒng)計(jì)資料料得到了某市市旅游業(yè)的相相關(guān)數(shù)據(jù)，變變量主要包括括：Y=旅游收入（單單位：萬元）），X1=某市旅游人數(shù)數(shù)（單位：人人），X2=城鎮(zhèn)居民人均均旅游支出（（單位：元）），X3=農(nóng)村居民人均均旅游支出（（單位：元）），X4=公路里程（單單位：公里）），X5=鐵路里程（單單位：公里））。完整的數(shù)數(shù)據(jù)在本書附附帶光盤的data文件夾的“l(fā)vyou.dta””工作文件中。利用lvyou數(shù)據(jù)估計(jì)方程程，判斷是否否存在多重共共線性，若存存在，采用逐逐步回歸法消消除多重共線線性。三、實(shí)驗(yàn)操作作指導(dǎo)1.估計(jì)方程若要進(jìn)行多重重共線性的檢檢驗(yàn)與修正，，首先要建立立基本的回歸歸模型。按照照第六章所講講述內(nèi)容，建建立回歸模型型的命令如下：：usec:\data\lvyou.dta,clearregressYX1X2X3X4X5執(zhí)行建建立回回歸的的命令令，可可以得得到如如圖7.7所示的的回歸歸結(jié)果果，通通過判判斷發(fā)發(fā)現(xiàn)：：整個(gè)個(gè)模型型的擬擬合優(yōu)優(yōu)度較較高，，但是是變量量X1和X5未通過過t檢驗(yàn)，，且X5的系數(shù)數(shù)為負(fù)負(fù)，與與常理理違背背，因因?yàn)樵谠谕ǔ３Ｇ闆r況下，，隨著著鐵路路里程程的增增加，，交通通更加加方便便，所所以旅旅游收收入應(yīng)應(yīng)該增增加。。綜上上所述述，可可以初初步認(rèn)認(rèn)為該該模型型存在在多重重共線線性。。2.多重共共線性性檢驗(yàn)驗(yàn)多重共共線性性的檢檢驗(yàn)通通常采采取兩兩種方方法，，一種種是計(jì)計(jì)算膨膨脹因因子，，一種種是計(jì)計(jì)算變變量之之間的的相關(guān)關(guān)系數(shù)數(shù)，下下面將將會(huì)詳詳細(xì)介介紹。。（1）計(jì)算算膨脹脹因子子的命命令為為：estatvif[,uncentered]在這個(gè)個(gè)命令令語句句中，，estatvif是計(jì)算算膨脹脹因子子的命命令語語句，，uncentered選項(xiàng)通通常使使用在在沒有有常數(shù)數(shù)項(xiàng)的的模型型中。。在本實(shí)實(shí)驗(yàn)中中，在在回歸歸之后后輸入入此命命令，，就可可得到到如圖圖7.8所示的的膨脹脹因子子數(shù)值值。結(jié)結(jié)果顯顯示該該模型型的膨膨脹因因子的的平均均值為為14.50，遠(yuǎn)遠(yuǎn)遠(yuǎn)大于于經(jīng)驗(yàn)驗(yàn)值2，膨脹脹因子子最大大值為為20.06，遠(yuǎn)遠(yuǎn)遠(yuǎn)大于于經(jīng)驗(yàn)驗(yàn)值10，所以以可以以認(rèn)為為該模模型存存在嚴(yán)嚴(yán)重的的多重重共線線性。。（2）計(jì)算算相關(guān)關(guān)系數(shù)數(shù)的命命令語語句為為：pwcorr[varlist][if][in][weight][,pwcorr_options]在這個(gè)個(gè)命令令語句句中，，pwcorr是計(jì)算算相關(guān)關(guān)系數(shù)數(shù)的命命令，，varlist為將要要計(jì)算算相關(guān)關(guān)系數(shù)數(shù)的變變量，，if為條件件語句句，in為范圍圍語句句，weight為權(quán)重重語句句，options選項(xiàng)如如表7.1所示。。在本實(shí)實(shí)驗(yàn)中中，可可以通通過計(jì)計(jì)算變變量X1、X2、X3、X4和X5之間的的相關(guān)關(guān)系數(shù)數(shù)來判判斷模模型是是否存存在多多重共共線性性，所所使用的命命令為為：pwcorrX1X2X3X4X5這個(gè)命命令語語句顯顯示的的相關(guān)關(guān)系數(shù)數(shù)矩陣陣如圖圖7.9所示，，通過過觀察察可以以得到到解釋釋變量量X1與X2、X4、X5之間，，X2與X3、X4、X5之間，，以及及X4與X5之間的的相關(guān)關(guān)系數(shù)數(shù)非常常高，，因此此可以以認(rèn)為為解釋釋變量量之間間存在在較為為嚴(yán)重重的多多重共共線性性。3.逐步回回歸法法（1）手動(dòng)動(dòng)逐步步回歸歸法逐步回回顧法法的第第一步步是要要分別別擬合合Y對(duì)每一一個(gè)變變量的的回歸歸方程程，從從中選選出擬擬合優(yōu)優(yōu)度最最高的的方程程作為為基礎(chǔ)礎(chǔ)方程程。這這個(gè)操操作所所使用用到的的命令令為：：regressYX1regressYX2regressYX3regressYX4regressYX5經(jīng)過這這步操操作，，可以以得到到如表表7.2所示的的回歸歸結(jié)果果，為為了便便于觀觀察，，表7.2是根據(jù)據(jù)Stata輸出結(jié)結(jié)果整整理而而成的的。表表7.2內(nèi)容顯顯示，，擬合合優(yōu)度度的大大小排排列順順序?yàn)闉閄2>X5>X1>X4>X3，所以以這時(shí)時(shí)應(yīng)將將X2作為基基礎(chǔ)解解釋變變量，，然后后將X5、X1、X4、X3分別加加入回回歸方方程，，進(jìn)行行逐步步回歸歸。首先先，，將將X5加入入方方程程進(jìn)進(jìn)行行回回歸歸，，這這時(shí)時(shí)輸輸入入的的命命令令為為：：regressYX2X5結(jié)果果如如圖圖7.10所示示，，通通過過觀觀察察發(fā)發(fā)現(xiàn)現(xiàn)，，X5的系系數(shù)數(shù)的的p值為為0.658，沒沒有有通通過過檢檢驗(yàn)驗(yàn)，，所所以以刪刪除除解解釋釋變變量量X5。接下下來來，，將將X1加入入基基本本方方程程進(jìn)進(jìn)行行回回歸歸，，得得到到如如圖圖7.11所示示的的回回歸歸結(jié)結(jié)果果，，結(jié)結(jié)果果顯顯示示X1系數(shù)數(shù)的的p值為為0.068，沒沒有有通通過過檢檢驗(yàn)驗(yàn)，，所所以以刪刪除除。。下面面，，將將X4加入入基基本本方方程程進(jìn)進(jìn)行行回回歸歸，，圖圖7.12顯示示所所有有系系數(shù)數(shù)都都通通過過了了檢檢驗(yàn)驗(yàn)，，所所以以基基本本方方程程得得以以擴(kuò)擴(kuò)展展為為X2和X4兩個(gè)個(gè)解解釋釋變變量量。。最后后，，將將解解釋釋變變量量X3加入入，，以以X2、X4、X3作為為解解釋釋變變量量進(jìn)進(jìn)行行回回歸歸，，這這時(shí)時(shí)得得到到最最終終結(jié)結(jié)果果如如圖圖7.13所示示，，所所有有變變量量都都通通過過了了檢檢驗(yàn)驗(yàn)。。（2）自自動(dòng)動(dòng)逐逐步步回回歸歸法法上述述方方法法對(duì)對(duì)于于解解釋釋變變量量較較多多的的計(jì)計(jì)量量模模型型并并不不適適用用，，所所以以Stata提供供了了直直接接進(jìn)進(jìn)行行分分步步回回歸歸的的命命令令，，命命令令格格式式為為：：stepwise[,options]:command在這這個(gè)個(gè)命命令令語語句句中中，，stepwise是進(jìn)進(jìn)行行逐逐步步回回歸歸的的命命令令，，command為進(jìn)進(jìn)行行回回歸歸分分析析或或建建立立其其他他模模型型的的命命令令，，options選項(xiàng)項(xiàng)顯顯示示在在表表7.3中。。在運(yùn)運(yùn)用用stepwise命令令時(shí)時(shí)，，需需要要特特別別注注意意的的是是搜搜尋尋的的方方法法和和順順序序，，具具體體內(nèi)內(nèi)容容如如表表7.4所示示。。表表7.4較為為詳詳細(xì)細(xì)地地?cái)⑹鍪隽肆嗣棵糠N種方方法法的的內(nèi)內(nèi)在在含含義義和和實(shí)實(shí)際際操操作作方方法法，，所所以以用用戶戶使使用用該該命命令令時(shí)時(shí)應(yīng)應(yīng)根根據(jù)據(jù)研研究究需需要要進(jìn)進(jìn)行行選選擇擇，，或或者者通通過過幾幾種種方方法法結(jié)結(jié)果果的的對(duì)對(duì)比比確確定定最最終終的的模模型型。。例如如，，利利用用這這種種逐逐步步回回歸歸的的方方法法重重復(fù)復(fù)旅旅游游業(yè)業(yè)分分析析的的建建模模過過程程中中，，如如果果采采用用前前向向搜搜尋尋法法，，需需要要輸輸入入如如下下命命令令：：stepwise,pe(0.05):regressYX1X2X3X4X5在這個(gè)命命令語句句中，stepwise是進(jìn)行逐逐步回歸歸的命令令語句，，pe(0.05)是運(yùn)用顯顯著性水水平為5%的前向搜搜尋法，，regressYX1X2X3X4X5則是指明明要建立立回歸模模型。由由于前向向搜尋法法和手動(dòng)動(dòng)逐步回回歸的計(jì)計(jì)算方法法一致，，所以得得到如圖圖7.14所示的結(jié)結(jié)果與圖圖7.13所示的結(jié)結(jié)果基本本一致。。但是如如果使用用其他方方法則會(huì)會(huì)得出不不同的結(jié)結(jié)果，所所以用戶戶應(yīng)當(dāng)根根據(jù)自身身研究的的需要進(jìn)進(jìn)行慎重重的選擇擇。實(shí)驗(yàn)7-4極端數(shù)據(jù)據(jù)的診斷斷與處理理一、實(shí)驗(yàn)驗(yàn)基本原原理二、實(shí)驗(yàn)驗(yàn)數(shù)據(jù)和和實(shí)驗(yàn)內(nèi)內(nèi)容根據(jù)統(tǒng)計(jì)計(jì)資料得得到了美美國汽車車產(chǎn)業(yè)的的橫截面面數(shù)據(jù)(1978年)，變量主主要包括括：price=汽車的價(jià)價(jià)格，mpg=每加侖油油所行駛駛的英里里數(shù)，weight=汽車的重重量，foreign表示是否否是進(jìn)口口車，如如果foreign=0代表是國國產(chǎn)車，，如果foreign=1代表是進(jìn)進(jìn)口車。。完整的的數(shù)據(jù)在在本書附附帶光盤盤的data文件夾的的“usaauto.dta””工作文件件中。利用usaauto數(shù)據(jù)，以以price為因變量量，mpg、weight和foreign為自變量量建立回回歸模型型，找出出樣本數(shù)數(shù)據(jù)中存存在的極極端數(shù)據(jù)據(jù)。三、實(shí)驗(yàn)驗(yàn)操作指指導(dǎo)進(jìn)行極端端數(shù)據(jù)的的檢驗(yàn)通通常用到到的是一一組命令令，這組組命令顯顯示如下下：regressyx1x2……predictlev,leveragegsort––levsumlevlistin1/i在這組命命令語句句中，第第一個(gè)命命令語句句的作用用是以y為因變量量，x1、x2……為自自變量建建立回歸歸分析；；第二個(gè)個(gè)命令語語句的作作用是計(jì)計(jì)算出所所有觀測測數(shù)據(jù)的的lev值；第三三個(gè)命令令語句的的作用是是將lev值降序排排列；第第四個(gè)命命令語句句的作用用是計(jì)算算出lev值的極值值與平均均值，從從而便于于比較；；第五個(gè)個(gè)命令語語句的作作用是從從大到小小列出lev值第1到第i個(gè)觀測值值，以便便處理。。例如，在在美國汽汽車數(shù)據(jù)據(jù)分析中中，建立立如下回回歸模型型之后，，分析一下下是否存存在極端端值所使使用到的的命令為為：regresspricempgweightforeignpredictlev,leveragegsort––levsumlevlistin1/3這組命令令的詳細(xì)細(xì)含義已已做介紹紹，這里里不再贅贅述，其其功能簡簡言之就就是建立立回歸模模型之后后，計(jì)算算lev值，并將將由大到到小前3位的數(shù)據(jù)據(jù)顯示出出來，執(zhí)執(zhí)行結(jié)果果如圖7.15所示。在在結(jié)果中中可以看看到lev值的均值值為0.0541，而最大大的lev值為0.3001，所以該該觀測值值有可能能為極端端數(shù)據(jù)，，可以采采取進(jìn)一一步方法法進(jìn)行處處理，從從而保證證模型的的精確性性。處理理的方法法一般有有兩種，，一種方方法為直直接去掉掉極端值值，另一一種方法法為選擇擇其他更更為適合合恰當(dāng)?shù)牡哪Ｐ瓦M(jìn)進(jìn)行回歸歸分析。。實(shí)驗(yàn)7-5虛擬變量量的處理理一、實(shí)驗(yàn)驗(yàn)基本原原理對(duì)于定性性數(shù)據(jù)或或分類數(shù)數(shù)據(jù)而言言，通常常并不能能將其直直接納入入模型中中進(jìn)行回回歸分析析，因?yàn)闉檫@樣的的分析并并不符合合經(jīng)濟(jì)學(xué)學(xué)理論，，所以這這時(shí)需要要引入虛虛擬變量量進(jìn)行處處理。一一般情況況下，如如果分類類變量總總共有M類，為了了避免多多重共線線性的出出現(xiàn)，通通常只引引入M-1個(gè)虛擬變變量。下下面將會(huì)會(huì)通過一一個(gè)簡單單的例子子，來介介紹一下下引入虛虛擬變量量后，模模型的實(shí)實(shí)際變化化。二、實(shí)驗(yàn)驗(yàn)數(shù)據(jù)和和實(shí)驗(yàn)內(nèi)內(nèi)容根據(jù)統(tǒng)計(jì)計(jì)資料得得到了中中國1978—2006年的消費(fèi)費(fèi)數(shù)據(jù)，，變量主主要包括括：year=年份，c=人均消費(fèi)費(fèi)（單位位：元）），y=人均國民民收入（（單位：：元），，c_ratio=消費(fèi)收入入比。完完整的數(shù)數(shù)據(jù)在本本書附帶帶光盤的的data文件夾的的“consumption_china.dta”工作文件件中。利用此數(shù)數(shù)據(jù)，估估計(jì)中國國的消費(fèi)費(fèi)函數(shù)，，并引入入虛擬變變量，使使得在1992年前后的的模型截截距和斜斜率都不不相同。。三、實(shí)驗(yàn)驗(yàn)操作指指導(dǎo)為了便于于比較，，首先生生成整個(gè)個(gè)時(shí)期中中不含虛虛擬變量量的消費(fèi)費(fèi)函數(shù)方方程，所所使用到到的命令令為：regresscy得到如圖圖7.16所示的回回歸結(jié)果果，這個(gè)個(gè)回歸所所形成的的模型為為c=188.588+0.3977y如果認(rèn)為為在1992年，南巡巡講話導(dǎo)導(dǎo)致了經(jīng)經(jīng)濟(jì)結(jié)構(gòu)構(gòu)的變動(dòng)動(dòng)，這時(shí)時(shí)需要引引入虛擬擬變量將將模型分分成兩段段進(jìn)行回回歸，步步驟如下下：第一步，，生成虛虛擬變量量，所使使用的命命令為：：generatedummy=0replacedummy=1ifyear>=1992在這組命命令中，，第一個(gè)個(gè)命令的的作用是是生成虛虛擬變量量dummy，使其值值全部為為0；第二個(gè)個(gè)的命令令的作用用就是將將1992年以后的的dummy值替換為為1，這時(shí)就就完成了了虛擬變變量的設(shè)設(shè)置。第二步，，生成虛虛擬變量量dummy和解釋變變量y的互動(dòng)項(xiàng)項(xiàng)，所使使用的命命令為：：generatedummy_y=dummy*y這個(gè)命令令的作用用就是生生成互動(dòng)動(dòng)項(xiàng)dummy_y，使其值值為變量量dummy和變量y的乘積。。第三步，，將虛擬擬變量納納入回歸歸方程進(jìn)進(jìn)行估計(jì)計(jì)，所使使用的命命令為：：regresscydummydummy_y執(zhí)行結(jié)果果如圖7.17所示，這這時(shí)得到到的模型型為：這個(gè)模型型是為了了講解虛虛擬變量量的實(shí)際際使用方方法，暫暫不考慮慮某些系系數(shù)不能能通過檢檢驗(yàn)的情情況。通通過引入入虛擬變變量發(fā)現(xiàn)現(xiàn)，模型型的截距距和斜率率都發(fā)生生了變化化。在用用戶實(shí)際際研究過過程中，，可以根根據(jù)需要要引入虛虛擬變量量，進(jìn)行行變斜率率、變截截距以及及二者相相結(jié)合的的模型變變化。實(shí)驗(yàn)7-6經(jīng)濟(jì)結(jié)構(gòu)變動(dòng)動(dòng)的Chow檢驗(yàn)一、實(shí)驗(yàn)基本本原理在時(shí)間序列模模型之中，需需要十分注重重模型系數(shù)的的穩(wěn)定性，如如果沒有考慮慮到結(jié)構(gòu)變動(dòng)動(dòng)，將會(huì)造成成較為嚴(yán)重的的模型設(shè)定誤誤差。Chow檢驗(yàn)提供了一一個(gè)較為嚴(yán)謹(jǐn)謹(jǐn)?shù)臋z驗(yàn)經(jīng)濟(jì)濟(jì)結(jié)構(gòu)變動(dòng)的的方法。例如，在時(shí)期期t1和t2中，認(rèn)為存在在t3時(shí)刻為一個(gè)經(jīng)經(jīng)濟(jì)結(jié)構(gòu)變動(dòng)動(dòng)點(diǎn)，這時(shí)可可以通過三個(gè)個(gè)回歸來確定定該點(diǎn)是否是是結(jié)構(gòu)變動(dòng)點(diǎn)點(diǎn)。二、實(shí)驗(yàn)數(shù)據(jù)據(jù)和實(shí)驗(yàn)內(nèi)容容根據(jù)統(tǒng)計(jì)資料料得到了中國國1978—2006年的消費(fèi)數(shù)據(jù)據(jù)，變量主要要包括：year=年份，c=人均消費(fèi)（單單位：元），，y=人均國民收入入（單位：元元），c_ratio=消費(fèi)收入比。。完整的數(shù)據(jù)據(jù)在本書附帶帶光盤的data文件夾的“consumption_china.dta”工作文件中。利用此數(shù)據(jù)，，估計(jì)中國的的消費(fèi)函數(shù)，，并檢驗(yàn)中國國的消費(fèi)函數(shù)數(shù)是否在1992年鄧小平“南南巡”以后（（含1992年）發(fā)生了結(jié)結(jié)構(gòu)變化。三、實(shí)驗(yàn)操作作指導(dǎo)1.手動(dòng)法進(jìn)行Chow檢驗(yàn)了解了Chow檢驗(yàn)的基本原原理之后，就就可以進(jìn)行檢檢驗(yàn)了，檢驗(yàn)驗(yàn)的方法就是是分別進(jìn)行三三次回歸，下下面將會(huì)以中中國消費(fèi)函數(shù)數(shù)為例詳細(xì)介介紹整個(gè)操作作過程，檢驗(yàn)驗(yàn)中國的消費(fèi)費(fèi)函數(shù)是否在在1992年以后發(fā)生了了結(jié)構(gòu)變化：：（1）首先生成整整個(gè)時(shí)期的回回歸方程，然然后計(jì)算出這這時(shí)的殘差平平方和，這時(shí)時(shí)需要輸入的的命令為：regresscypredicte,residualgena=e^2egenb=sum(a)第一個(gè)命令的的作用是生成成消費(fèi)函數(shù)第二個(gè)命令的的作用是生成成殘差序列；；第三個(gè)命令令的作用是生生成序列a，使其值為殘殘差平方；第第四個(gè)命令的的作用是生成成變量b，使其值為序序列a的和，即殘差差平方和，也就是實(shí)驗(yàn)原原理中所指的的（2）其次生成1992年以前序列的的回歸方程，，然后計(jì)算出出這前半段時(shí)時(shí)期的殘差平平方和，這時(shí)時(shí)需要輸入的的命令為：regresscyifyear<1992predicte1ifyear<1992,residualgena1=e1^2egenb1=sum(a1)第一個(gè)命令的的作用是生成成1992年之前的消費(fèi)費(fèi)函數(shù)第二個(gè)命令的的作用是生成成殘差序列e1；第三個(gè)命令令的作用是生生成序列a1，使其值為殘殘差平方；第第四個(gè)命令的的作用是生成成變量b1，使其值為序序列a1的和，即殘差差平方和，也也就是實(shí)驗(yàn)原原理中所指的的（3）生成1992年以后序列的的回歸方程，，然后計(jì)算出出這后半段時(shí)時(shí)期的殘差平平方和，這時(shí)時(shí)需要輸入的的命令為：regresscyifyear>=1992predicte2ifyear>=1992,residualgena2=e2^2egenb2=sum(a2)第一個(gè)命令令的作用是是生成1992年之后的消消費(fèi)函數(shù)第二個(gè)命令令的作用是是生成殘差差序列e2；第三個(gè)命命令的作用用是生成序序列a2，使其值為為殘差平方方；第四個(gè)個(gè)命

人人文庫> 全部分類> 專業(yè)文獻(xiàn) > 生活休閑

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

Saa與模型的設(shè)定

文檔簡介

溫馨提示

最新文檔

評(píng)論

Saa與模型的設(shè)定

文檔簡介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔