STATA部分常用回歸分析指令_第1頁
STATA部分常用回歸分析指令_第2頁
STATA部分常用回歸分析指令_第3頁
STATA部分常用回歸分析指令_第4頁
STATA部分常用回歸分析指令_第5頁
已閱讀5頁,還剩2頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、聚類分析:cluster kmeans y xl x2 x3, k(3)一一依據(jù)y、xl、x2、x3,將樣本分為n類,聚類的核為隨機(jī)選取cluster kmeans y xl x2 x3, k(3) measure(ll) start(everykth)“start“用于確定聚類的核,“everykth”表示將通過構(gòu)造三組樣本獲得聚類核:構(gòu)造方法 為將樣本 id 為 1、1+3> 1+3x2、1+3x3分為一組、將樣本 id 為 2、2+3、2+3x2、2+3x3分為第二組,以此類推,將這三組的均值作為聚類的核:measure"用于計(jì)算相似 性和相異性的方法,”口“表示采用歐式

2、距離的絕對(duì)值,也直接可采用歐式距離(l2)和歐式 距離的平方(l2squared)。ps:這個(gè)方法所得的結(jié)果與spss所得結(jié)果相同。sort cl c2 (對(duì)cl和c2兩個(gè)分類變量排序)byclc2: regyxlx2x3 (在cl、c2的各個(gè)水平上分別進(jìn)行冋歸)bysort clc2: reg y xl x2 x3訐c3=l(逗號(hào)前面相當(dāng)于將上面兩步驟合一,既排序又回歸,逗 號(hào)后面的“ifc3“”表示只有在c3j的情況下才進(jìn)行回歸)mvreg y1 y2 : xl x2 x3 (多元回歸)mvreg yl y2 y3: xl x3 x3 (多元冋歸分析,yl y2 y3為因變量,xl x3

3、x3為自變量)以下命令只有在進(jìn)行了 mvreg之后才能進(jìn)行test yl(測(cè)試對(duì)yl的回歸系數(shù)聯(lián)合為0)test yl:xl x2 (測(cè)試對(duì)yl的回歸中xl、x2的系數(shù)為0)test xl x2 x3 (測(cè)試在所有的回歸中,xl、x2、x3的系數(shù)均為0)test yl=y2(對(duì)yl的回歸和對(duì)y2的回歸系數(shù)相等)test yl=y2: xl x2 x3, mtest (對(duì)yl和y2的回歸中,分別測(cè)試xl、x2、x3的系數(shù)是否相等, 若沒有mtest這個(gè)命令,則測(cè)試他們的聯(lián)和統(tǒng)計(jì))test yl=y2=y3(三個(gè)冋歸的系數(shù)是否相等,可加mtest以分別測(cè)試)test yl=y2=y3: xl x2

4、 (測(cè)試三個(gè)回歸中的xl、x2是否相等,可加mtest)est命令的用法:(1)儲(chǔ)存回歸結(jié)果:reg y xl x2 x3 (不限于 reg,也可儲(chǔ)存 ivreg> mvreg> reg3)est store a(2)重現(xiàn)回歸結(jié)果:est replay a(3)對(duì)回歸結(jié)果進(jìn)行進(jìn)一步分析est for a:sum (對(duì)a冋歸結(jié)果中的各個(gè)變量運(yùn)行sum命令)異方差問題:獲得穩(wěn)健性標(biāo)準(zhǔn)誤regy xl x2 x3 if cl=l (當(dāng)分類變量時(shí),進(jìn)行y和諸x的回歸)reg y xl x2 x3,robust (冋歸丿舌顯示各個(gè)自變量的異方差穩(wěn)健性標(biāo)準(zhǔn)誤)estat vif (回歸之后獲得

5、vif)estat hettest,mtest (界方差檢驗(yàn))異方差檢驗(yàn)的套路:(1) breuschpagan 法: reg y xl x2 x3 predict u,resid gen usq二"2 reg usq xl x2 x3求f值display r/(l-r)*n2/nl (nl表示分子除數(shù),n2表示分母除數(shù))display ftail()求lm值display r*n (n表示總樣本量)display chi2tail()(2) white 法: reg y xl x2 x3 predict u,resid gen usq二"2 predict y gen y

6、sq二y"2 reg usq y ysq求f值display r/(l-r)*n2/nl (nl表示分子除數(shù),n2表示分母除數(shù))display ftail()求lm值display r*n (n表示總樣本量)display chi2tail()(3)必要補(bǔ)充f值和lm值轉(zhuǎn)換為p值的命令:display ftail(nl,n2,a)(利用f值求p值,nl表示分子除數(shù),n2表示分母除數(shù),a為f值) display chi2tail(n3,b)(利用lm值求p值,n3表示自由度的損失量,一般等于nl, b為lm 值)異方差的糾正一-wls (weighted least square es

7、timator)(1)基本思路:reg y xl x2 x3 aw=xl(將xl作為異方差的來源,對(duì)方程進(jìn)行修正) 上式相當(dāng)于:reg y/(xla0.5) l/(xla0.5) xl/(xla0.5) x2/(xla0.5) x3/(xla0.5),noconstant(2)糾正異方差的常用套路(構(gòu)造h值) reg y xl x2 x3predict ujesidgen usq二"2gen logusq=log(usq) reg logusq xl x2 x3 predict ggen h=exp(g)reg y xl x2 x3 aw=l/h界方差hausman檢驗(yàn):reg y

8、xl x2 x3est store a (將上述回歸結(jié)果儲(chǔ)存到a中)reg y xl x2 x3 aw=l/hest store bhausman a b當(dāng)因變量為對(duì)數(shù)形式時(shí)(log(y)如何預(yù)測(cè)yreg logy xl x2 x3predict kgen m=exp(k)reg y m,noconstantm的系數(shù)為iy的預(yù)測(cè)值二ixexp(k)方差分析:-元方差分析an ova y gl / gl|g2 / (g*表示不同分類變量,計(jì)算g2和交互項(xiàng)/ gl | g2 /這兩種分類的y值是 否存在組內(nèi)差異)anova y dl d2 dl*d2 (d*表示虛擬變量,計(jì)算dl、d2和dl*d2

9、的這三種分類的y值是否有組 內(nèi)差異)anova y dl d2 xl d2*xl, continuous(xl) (x* 衣示連續(xù)的控制變量)多元方差分析webuse jawmanova yl y2 y3 = gender fracture gender*fracture (按性別、是否骨折及二者的交互項(xiàng)對(duì) yl、 y2和y3進(jìn)行方差分析)manova yl = gender fracture gender*fracture (相當(dāng)于一元方差分析,以 yl 為因變量) 進(jìn)行多元回歸的方法:多元回歸分析:(與mvreg相同)foreach vname in yl y2 y3 (確定 y 變量組

10、vname)reg 'vname' xl x2 x3 (將y變量組中的各個(gè)變量與諸x變量進(jìn)行回歸分析,注意vname的標(biāo) 點(diǎn)符號(hào))上式等價(jià)于:mvreg yl y2 y3 = xl x2 x3reg3命令:(1)簡單用法:reg3 (yl = xl x2 x3) (y2 = xl x3 x4) (y3 = xl x2 x5)測(cè)試 yl coefs = 0test yl測(cè)試不同冋歸屮相同變量的系數(shù):test yl=y2=y3, comm ontest (yl=y2) (yl=y3)/ common constant (constant 表示包含截距項(xiàng))用reg3進(jìn)行2slsreg

11、3 (yl = y2 xl x2) (y2 = yl x4),2sls(2)用 reg3 進(jìn)行 olsreg3 (yl = y2 xl x2) (y2 = yl x4),ols對(duì)兩個(gè)回歸結(jié)果進(jìn)行hausman檢驗(yàn):reg3 (yl=xl x2 x3)(y2=yl x4),2slsest store twoslsreg3 (yl=xl x2 x3)(y2=yl x4),olsest store ols即 “yl=xlx2x3” 進(jìn)行 hausman即 “y2二ylx4” 進(jìn)行 hausman 檢hausman twosls ols,equations(l:l)(對(duì)兩次回歸中的方程 1, 檢驗(yàn))h

12、ausman twosls ols,equations(2:2)(對(duì)兩次回歸中的方程 2, 驗(yàn))hausman twosls ols,alleqs (刈所冇方程一起進(jìn)行檢驗(yàn)) 檢驗(yàn)忽略變量(模型的reset): reg y xl x2 x3estat ovtest滯后變量的制収對(duì)變量y滯后一期:gen y_ll=y_n-l滯后兩期:gen y_l2=y_n-2以此類推。制取樣本序號(hào):gen id二_n獲得樣本總量:gen id=_n時(shí)間序列回歸:回歸元嚴(yán)格外生時(shí)ar序列相關(guān)的檢驗(yàn) reg y xl x2predict u,residgen u_l=u_reg u u_loconstant回歸之

13、后,u_1的序數(shù)如果不異于零,則該序列不相關(guān)用 durbin-watson statistics 檢驗(yàn)序列相關(guān):tssetyear (對(duì)時(shí)間序列回歸中代表時(shí)間的變量進(jìn)行定義)reg y xl x2dwstat (求出時(shí)間序列回歸的dw值)durbina (對(duì)該回歸是否具有序列相關(guān)進(jìn)行檢驗(yàn),h0為無序列相關(guān),可根據(jù)chi2值求出p 值)durbina,small (small可以根據(jù)f值求出p值,以代替chi2值)durbina,force (讓檢驗(yàn)?zāi)茉?robust、neway 之后進(jìn)行)durbina,small lag(l/10) (lag可以求出更高階滯后的序列相關(guān),如本例中可求出1到1

14、0階 的序列相關(guān))durbina,robust lag(l/10) (robust可進(jìn)行異方差一穩(wěn)健性回歸,避免未知形式的異方差) bgodfrey (利用 breusch-godfrey test 求出高階序列相關(guān))bgodfrey,small lag(l/10)數(shù)據(jù)調(diào)查:survey data源數(shù)據(jù):dataset文件夾屮的svydata步驟:1、定義 survey datasvyset psuid pweight=finalwgt, strata(stratid)定義primary sampling unit為psuid??赡苁菧y(cè)試的編號(hào),lor2定義 pweight 為 finalwg

15、t定義stratum identifer為stratido可能是測(cè)試中被試的編號(hào),lto312、生成malegen male= (sex=l) if jmissing(sex)當(dāng)sex不缺失且等于1吋,male=sex3、生成行變量為highbp,列變量為sizplace的表格svy, subpop(male): tabulate highbp sizplace, col obs pears on ir null waldsubpop規(guī)定了以male為數(shù)據(jù)調(diào)查的范圍tabulate highbp sizplace表示繪制行變量為highbp,列變量為sizplace的表格col表示每一列的加總

16、為100%, row表示每一行的加總為100%, cell表示橫縱所有單元 格的加總為100%一一obs表示列出每個(gè)單元格的樣本量,se表示列出每個(gè)單元格的標(biāo)準(zhǔn)誤,ci表示列出每個(gè) 單元格的置信區(qū)間pears on 表示寸2取 pears on's chisquired,皮爾遜白勺卡方檢足ir 表示求取 likelihood rationull 表示求収 null-based statisticswald 表示求取 adjusted wald, llwald 表示求取 adjusted log-linear wald, noadjust 表示求 取 unadjusted wald st

17、atistics4、svy:mean xl x2 x3對(duì) xl、x2、x3 求取 mean、se 和 ci5簡單的tabulate twoway (不用svyset就可執(zhí)行)tab2 y x,col chi2 exact ircol、celk row 等均可換用,chi2 指的是 pearson's chi-squared> exact 指的是 fisher exact test> ir 扌旨的是 likelihood-ratio chi-squared6、svy的其他用法:svy:reg y x建立人工數(shù)據(jù)集:創(chuàng)建一個(gè)包含從獨(dú)立標(biāo)準(zhǔn)正態(tài)分布屮抽取的2000個(gè)觀察案例和三個(gè)

18、隨機(jī)zl、z2、z3,并分 別定義他們的平均值和標(biāo)準(zhǔn)差。matrix m=(0/2,3)定義三個(gè)變量的平均值matrix sd=(lz.5,2)定義三個(gè)變量的標(biāo)準(zhǔn)差drawnorm zl z2 z3,n(2000) means(m) sds(sd)創(chuàng)建樣本暈為2000,均值和標(biāo)準(zhǔn)差符合上面定義的數(shù)據(jù)集補(bǔ)充:除了定義均值和標(biāo)準(zhǔn)差之外,還可定義相關(guān)矩陣和協(xié)方差矩陣等。logit回歸logit y xl x2 x3y必須為二分變量glogit outcomedata populationdata xl x2 x3outcomedata為目標(biāo)樣本總量,populationdata為觀測(cè)樣本總量,out

19、comedata/populationdata的值便是一個(gè)概率,相當(dāng)于logit命令中的y面板數(shù)據(jù)(panel data)1、基本套路:xtreg y xl x2,reest store rextreg y xl x2,feest store fehausman re fe如果hausman檢驗(yàn)的結(jié)果為顯著,則采用固定效應(yīng)(fe)模型,不顯箸,則選収隨機(jī)效應(yīng)(re)模型2、隨機(jī)效應(yīng)的檢驗(yàn):xtreg y xl x2,rexttestoxttestlxttestl是xttesto的擴(kuò)展,若這xttesto的結(jié)果為顯著,則采用隨機(jī)效應(yīng)(re)模型 xttestl的假設(shè)是沒有隨機(jī)效應(yīng)和/或沒有序列相關(guān),它的七個(gè)結(jié)果分別表示:1) lm test for random effects, assuming no serial correlation(假設(shè)沒有序列相關(guān)情況下対隨機(jī)效應(yīng)進(jìn)行l(wèi)m檢驗(yàn))2) adjusted lm test for random effects, which works even under serial correlati on(假設(shè)有序列相關(guān)的情況下對(duì)隨機(jī)lm檢驗(yàn))3) one sided version o

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論