Stata統(tǒng)計分析命令_第1頁
Stata統(tǒng)計分析命令_第2頁
Stata統(tǒng)計分析命令_第3頁
Stata統(tǒng)計分析命令_第4頁
Stata統(tǒng)計分析命令_第5頁
已閱讀5頁,還剩3頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

..Stata統(tǒng)計分析常用命令匯總一、winsorize極端值處理范圍:一般在1%和99%分位做極端值處理,對于小于1%的數(shù)用1%的值賦值,對于大于99%的數(shù)用99%的值賦值。1、Stata中的單變量極端值處理:stata11.0,在命令窗口輸入"finditwinsor"后,系統(tǒng)彈出一個窗口,安裝winsor模塊安裝好模塊之后,就可以調(diào)用winsor命令,命令格式:winsorvar1,gen<newvar>p<0.01>或者在命令窗口中輸入:sscinstallwinsor安裝winsor命令。winsor命令不能進(jìn)行批量處理。2、批量進(jìn)行winsorize極端值處理:打開鏈接:,找到winsorizeJ,點擊右鍵,另存為到stata中的ado/plus/目錄下即可。命令格式:winsorizeJvar1var2var3,suffix<w>即可,這樣會生成三個新變量,var1wvar2wvar3w,而且默認(rèn)的是上下1%winsorize。如果要修改分位點,則寫成如下格式:winsorizeJvar1var2var3,suffix<w>cuts<595>。3、Excel中的極端值處理:〔略winsor2命令使用說明簡介:winsor2winsorizeortrim<iftrimoptionisspecified>thevariablesinvarlistatparticularpercentilesspecifiedbyoptioncuts<##>.Indefult,newvariableswillbegeneratedwithasuffix"_w"or"_tr",whichcanbechangedbyspecifyingsuffix<>option.Thereplaceoptionreplacesthevariableswiththeirwinsorizedortrimmedones.相比于winsor命令的改進(jìn):<1>可以批量處理多個變量;<2>不僅可以winsor,也可以trimming;<3>附加了by<>選項,可以分組winsor或trimming;<4>增加了replace選項,可以不必生成新變量,直接替換原變量。范例:*-winsorat<p1p99>,getnewvariable"wage_w".sysusenlsw88,clear.winsor2wage*-left-trimmingat2thpercentile.winsor2wage,cuts<2100>trim*-winsorvariablesby<industrysouth>,overwritetheoldvariables.winsor2wagehours,replaceby<industrysouth>使用方法:1.請將winsor2.ado和winsor2.sthlp放置于stata12\ado\base\w文件夾下;2.輸入helpwinsor2可以查看幫助文件;二、描述性統(tǒng)計1、summarize命令格式:su、sum或者summarize[varlist][if][in][weight][,options]如果summarize或sum后不加任何變量,則默認(rèn)對數(shù)據(jù)中的所有變量進(jìn)行描述統(tǒng)計options選項:detail表示產(chǎn)生更加詳細(xì)的統(tǒng)計變量Separator〔n表示每n個變量畫一條分界線,n=0表示禁止使用分界線Summarize描述統(tǒng)計輸出表中包含:樣本容量、平均數(shù)、標(biāo)準(zhǔn)差、最小值和最大值2、tabstat命令格式:tabstat[varlist][if][in][weight][,options]options選項:stat<statname>表示設(shè)定所需要的統(tǒng)計量col<stat>或c<s>表示將結(jié)果報表轉(zhuǎn)置統(tǒng)計量:mean:平均數(shù)count/n:觀測值數(shù)目sum:加總max/min:最大值/最小值range:極差sd:標(biāo)準(zhǔn)差cv:變異系數(shù)semean:平均標(biāo)準(zhǔn)誤差skewness:偏度var:方差kurtosis:峰度median/p50:中位數(shù)p#:#%百分位數(shù)例如:tabstat[varlist],stat<countmeansdmedianminmaxrange>col<stat>3、描述性統(tǒng)計結(jié)果輸出到word或Excel用sum做的描述性統(tǒng)計:logout,save<miaoshutongji>wordreplace:sum用tabstat做的描述性統(tǒng)計:logout,save<miaoshutongji>wordreplace:tabstat[varlist],stat<countmeansdmedianminmaxrange>col<stat>分組描述:bysortvar:三、相關(guān)性分析〔一相關(guān)性分析1、Pearson相關(guān)系數(shù)命令格式:correlate〔簡寫:cor或corr[varlist][if][in][weight][,options]2、spearman相關(guān)系數(shù)命令格式:spearman[varlist],stats<rhop>3、在Stata中,命令corr用于計算一組變量間的協(xié)方差或相關(guān)系數(shù)矩陣;4、命令pwcorr可用于計算一組變量中兩兩變量的相關(guān)系數(shù),同時還可以對相關(guān)系數(shù)的顯著性進(jìn)行檢驗;option選項中加上sig可顯示顯著性水平:pwcorr[varlist],sig5、命令pcorr用于計算一組變量中兩兩變量的偏相關(guān)系數(shù)并進(jìn)行顯著性檢驗。6、Spearman和Pearson檢驗同在一個表的命令:corrtbl[varlist],corrvars<[varlist]>輸出結(jié)果中,上三角為Spearman相關(guān)系數(shù)和顯著水平,下三角為Pearson系數(shù)和顯著水平?!捕敵鱿嚓P(guān)系數(shù)表到word或Excel中例如:logout,save<mytable>wordreplace:pwcorr_apricempgrep78headroomtrunk,star1<0.01>star5<0.05>star10<0.1>四、截面數(shù)據(jù)單方程線性回歸模型的Stata實現(xiàn)命令格式:regress〔簡寫:regdepvarindepvars[if][in][weigh][option]〔depvar表示因變量,indepvars表示自變量五、異方差的檢驗與處理1、檢驗異方差命令格式:hettest2、判斷異方差的標(biāo)準(zhǔn):看P值的大小來判斷,如果P值小于0.05,則不能排除異方差的可能,上圖中P值等于0.4584>0.05,因此,可以排除異方差的可能性。3、處理異方差命令格式:在reg命令后加上",r"或者",robust"即可。經(jīng)異方差處理后的回歸不顯示調(diào)整后的R2〔adj-R2,如果要查看調(diào)整后的R2,再輸入命令:die<r2_a>六、多重共線性〔自變量之間高度相關(guān)命令格式:vif〔一判斷多重共線性的標(biāo)準(zhǔn)〔兩個標(biāo)準(zhǔn)必須同時滿足:1、最大的vif大于10;2、平均的vif大于1?!捕嘀毓簿€性的修正1、采用逐步回歸進(jìn)行修正,命令格式:swregdepvarindepvar,pr<0.05>2、對于含二次項的,使用"對中"的方法,既可以保留二次項,又可以在一定程度上克服多重共線性的問題:先定義兩個變量,分別為該變量減去其均值和該變量的平方,命令如下:sumvargenvar1=var-r<mean>genvar2=var^2再用新變量代替原來的變量進(jìn)行回歸處理七、內(nèi)生性的檢驗與處理〔內(nèi)生性是指自變量與誤差項之間有關(guān)系1、內(nèi)生性的檢驗:ovtest看P值的大小來判斷,如果P值小于0.05,則不能排除內(nèi)生性的可能,上圖中P值等于0.4717>0.05,因此,可以排除內(nèi)生性的可能。2、內(nèi)生性的處理:使用工具變量法:ivreg內(nèi)生性的三個來源:測量誤差、遺漏變量和雙向因果。1、變量的內(nèi)生性。這個是沒有辦法單獨檢驗的。當(dāng)有合適工具變量時候,是可以檢驗的,就是hausman檢驗2、工具變量的外生性。這個也是沒辦法檢驗的。當(dāng)有很多工具變量時候,可以檢驗是否有不是外生的,就是"過度識別"問題3、工具變量的相關(guān)性。這個可以說成是"弱工具變量"問題,檢驗可以通過一階段的F值。還可以利用PartialR2。4、估計方法stata里面有這么幾個2sls,2slssmal、liml、gmm,各自適用情況:small適合小樣本;liml適合弱工具變量;gmm適合異方差。[例子]webusehsng2*Fitaregressionvia2SLS,requestingsmall-samplestatisticsivregress2slsrentpcturban<hsngval=faminciregion>,small*FitaregressionusingtheLIMLestimatorivregresslimlrentpcturban<hsngval=faminciregion>*FitaregressionviaGMMusingthedefaultheteroskedasticity-robustweightmatrixivregressgmmrentpcturban<hsngval=faminciregion>*FitaregressionviaGMMusingaheteroskedasticity-robustweightmatrix,requestingnonrobuststandarderrorsivregressgmmrentpcturban<hsngval=faminciregion>,vce<unadjusted>*檢驗estatafirststage,allforcenonrobust\\\可以查看第一階段F值,已經(jīng)partialR2estatoverid\\\查看是否過度識別estatendogenous\\\查看是否異方差regress2slsrentpcturbanhsngvaleststorem1ivregress2slsrentpcturban<hsngval=faminciregion>eststorem2hausmanm1m2\\\內(nèi)生檢驗八、線性方程組的回歸分析命令格式:sureg<depvar1varlist1><depvar2varlist2>…<depvarNvarlistN>[if][in][weigh]九、聯(lián)立方程組命令格式:reg3<depvar1varlist1><depvar2varlist2>…<depvarNvarlistN>[if][in][weigh]十、面板數(shù)據(jù)的固定效應(yīng)和隨機(jī)效應(yīng)Xtset固定效應(yīng)命令格式:xtregdepvarindepvars[if][in],fe[FE_options]隨機(jī)效應(yīng)命令格式:xtregdepvarindepvars[if][in],re[FE_options]hausman檢驗固定效應(yīng)還是隨機(jī)效應(yīng)?[例子]xtregyvar1var2var3,feeststorefextregyvar1var2var3,reeststorerehausmanfere,sigmamorehausmanfere,sigmaless*sigmamore利用有效估計量方差,即re*sigmaless利用一致估計量方差,即fe十一:Stata回歸結(jié)果的導(dǎo)出1、在命令窗口中輸入:sscinstallesttab,安裝命令esttab2、reg回歸3、esttabusingfilename.rtf將以word形式輸出回歸結(jié)果,后綴改成.xls或者.csv則以Excel格式輸出,輸出內(nèi)容為變量名稱和相應(yīng)的回歸系數(shù),t值,顯著性水平標(biāo)識。系統(tǒng)默認(rèn)顯著性水平是0.001,0.01和0.05,若要改成0.01,0.05和0.1,則輸出esttabm1m2usingaaa.rtf,star<*0.10**0.05***0.01>。4、批量輸出回歸結(jié)果:每運(yùn)行一個regression,存起來:eststorem1。m1是你要改的,第一個model所以我叫m1,第二個的話指令就變成eststorem2,依次類推,最后運(yùn)行指令:esttabm1m2...usingtest.rtf。esttabm11111usingaaaaa.rtf,star<*0.10**0.05***0.01>b<%6.4f>5、outreg2可以將回歸結(jié)果導(dǎo)入word、excle、latex等,而且可以根據(jù)自己需要改變格式:sscinstalloutreg2useauto,clear[varlist]eststorem1outreg2[m1]usingtest.doc,replace十二、合并樣本〔將關(guān)鍵詞相同的多個樣本合并為一個命令格式:duplicatesdropvarlist,force例如將同一企業(yè)在同一天發(fā)生的多起并購合為一起,可根據(jù)證券代碼和公告日期關(guān)鍵詞,將其合并,命令:duplicatesdropcompany_idevent_date,force十三、均值t檢驗命令格式:ttestCAR1==CAR2,unpaired十四、中位數(shù)Z檢驗〔非參數(shù)Wilcoxon秩和檢驗命令格式:ranksumvar,by<groupvar>groupvar為分組變量十五、檢驗兩組均值的顯著性差異,在t檢驗的后面數(shù)值上面加星號可以用ttest命令執(zhí)行檢驗,它會直接報告星號。亦可采用外部命令meantab執(zhí)行檢驗,自己根據(jù)t值大小標(biāo)注星號。helpmeantab//這個最好用sysusenlsw88,clearmeantabcollgradwagehoursttl_exptenure,///over<union>tstatdiffnoncells另有一個李春濤老師編寫的命令,可以直接標(biāo)注星號:finditttable//多變量,兩組差異十六、刪除有缺失值的樣本egenmis=rowmiss<_all>dropifmis條件語句:cond例如:cond<missing<x>,.,cond<x>2,50,70>>returns.ifxismissing,returns50ifx>2,andreturns70ifx<2十七、中心化處理與標(biāo)準(zhǔn)化處理1、安裝命令:finditcenter2、中心化:centervarlist〔注:生成的新變量默認(rèn)加前置"c_",可一次對多個變量進(jìn)行處理或:centervar,g<newvar>〔注:只能對一個變量進(jìn)行中心化,并生成給定名稱的新變量3、標(biāo)準(zhǔn)化:centervarlist,prefix<z_>standardize〔注:生成的新變量加前置"z_",可多個,可更改十八、恢復(fù)數(shù)據(jù)命令preserve〔處理數(shù)據(jù)前使用該命令,否則沒有數(shù)據(jù)可恢復(fù)dropvar1-var100〔處理數(shù)據(jù)restore〔恢復(fù)數(shù)據(jù)十九、genicv產(chǎn)生交叉項[問題]有時候,想生成很多交叉項,但是又不愿意一個一個寫。有時候,想看一個交叉項,但是又不愿意生成。[方法]genicv可以一鍵生成很多交叉項##可以直接表示交叉項。[例子]sscinstallgenicvsysuseauto,cleargenicvlengthweightforeign//會生成4個交叉項,所有可能情況,并且有l(wèi)abelregpricelengthweightlength_weight*如果不愿意生成,直接用regpricec.length##c.weight\\\和上面回歸一樣一樣的二十、用stata統(tǒng)計變量的個數(shù),但是要去掉重復(fù)的部分bysid:gn=_ncountifn==1二十一、stata中的主成分分析法1、首先,需要對變量進(jìn)行哪些檢驗?KMO?還有什么?KMO檢驗結(jié)果符合什么條件才能繼續(xù)進(jìn)行主成分分析?答:首先使用KMO檢驗和SMC檢驗。KMO的判斷為,UsingtheKaiser<1974>characterizationofKMOvalues,0.00to0.49unacceptable0.50to0.59miserable0.60to0.69mediocre0.70to0.79middling0.80to0.89meritorious0.90to1.00marvelousSMC即一個變量與其他所有變量的復(fù)相關(guān)系數(shù)的平方,也就是復(fù)回歸方程的可決系數(shù)。SMC比較高表明變量的線性關(guān)系越強(qiáng),共性越強(qiáng),主成分分析就越合適。命令是estatkmoestatsmc確定是否需要進(jìn)行主成分分析。如果有些KMO或者SMC值太小,則要考慮要不要將它們放入主成分中。然后進(jìn)行主成分回歸。使用命令為:pcavarlist〔不清楚就helppca2、例如,對Y的5各指標(biāo)執(zhí)行了命令pcay1y2y3y4y5得出結(jié)果方差貢獻(xiàn)率〔proportion就是權(quán)重嗎?答:不是。假如設(shè)定方差貢獻(xiàn)率為95%,那么,累積方差超過95%的那幾個特征值、所對應(yīng)的特征變量,就是權(quán)重。3、看有的帖子上回復(fù)說,需要接著執(zhí)行predicty1y2y3y4y5,score,這是為了得到每個指標(biāo)的主成分得分嗎?為什么我執(zhí)行了一下,只生成了一個y1,別y2、y3、y4、y5都沒生成呢答:直接"predicty1-y4”4、不知道你要問什么?總之,主成分的步驟為1、先通過KMO檢驗和SMC檢驗確定是否需要主成分分析2、進(jìn)行主成分分析,通過累計貢獻(xiàn)率確定需要的哪幾個主成分3、根據(jù)情況看是否需要rotate4、通過predict進(jìn)行得分?;蛘咄ㄟ^scoreplot看得分分布圖。二十二、將一般的數(shù)據(jù)轉(zhuǎn)化為面板數(shù)據(jù)原數(shù)據(jù)的形式〔excel中是:2008一張sheet,2009一張sheet。。。。。即:

然后改成這樣的數(shù)據(jù)形式是:粘貼在stata里就是這樣的形式〔注意:變量名字一定要改:其中Y為因變量,可以是很多個,X1、X2為自變量,也可以是很多個,stata中的變量名依次為:id、Y2008、Y2009、Y2010、X12008、X12009、X12010、X22008、X22009、X22010在stata中輸入命令:reshapelongYX1X2,i<id>j<year>回車即可,變?yōu)椋憾?、關(guān)于數(shù)值型轉(zhuǎn)換為字符型的問題1、股票代碼導(dǎo)入STATA后都變成數(shù)值型,現(xiàn)想用tostring命令變回字符型,但長度小于6位的代碼,在變回字符型后在前面補(bǔ)夠不足6位的0。方法:formatvariable%06s這只是在顯示上補(bǔ)充了0,沒有在值上補(bǔ)充。以下可以改變x的值:replacex=substr<"000000"+x,-6,6>2、11010”gy=substr<string<x,"%12.0f">,1,5>3、將字符型轉(zhuǎn)化為數(shù)值型命令為:destringvar,replace〔轉(zhuǎn)換后替換原來的值若字符型中含其他符號并要生成新變量則用:destring

varlist,

gen<newvarlist>

ignore<"$

,%">二十四、分組均分四組:sortvarxtileprop=var,nq<x>〔括號中的x代表分成的group數(shù)例如:sortinsto_maxtileprop=insto_ma,nq<4>//以insto_ma的四分位點分成四組sortpropinsto_msdegenstdI=xtile<insto_msd>,by<prop>nq<4>//按prop,以insto_msd的四分位點分成四組二十五、估計殘差做完回歸后,使用命令predicte,r排列組合計算:dicomb<3,2>,dicomb<4,2>取整:1.ceil<x>,returnstheuniqueintegernsuchthatn-1<x<=n.returnsx<not".">ifxismissing,meaningthatceil<.a>=.a2.floor<x>,returnstheuniqueintegernsuchthatn<=x<n+1,returnsx<not".">ifxismissing,meaningthatfloor<.a>=.<x>,returnstheintegerobtainedbytruncatingxtoward0;thus,int<5.2>=5,int<-5.8>=-5,returnsx<not".">ifxismissing,meaningthatint<.a>=.a。Onewaytoobtaintheclosestintegertoxisint<x+sign<x>/2>,whichsimplifiestoint<x+0.5>forx

0.However,useoftheround<>functionispreferred任何兩種軟件之間的數(shù)據(jù)轉(zhuǎn)換,有一種方法是人擋殺人,佛擋殺佛。那就是:

先在A軟件里面將其另存為文本格式,然后在B軟件里面里面以文本文件導(dǎo)入,再保存為B軟件的文件格式。文本格式,我一般習(xí)慣將其存為.csv格式,即變量數(shù)據(jù)間以逗號分隔,也可以以制表符分隔或、空格分隔或是固定列寬。伍德里奇《橫截面與面板數(shù)據(jù)的經(jīng)濟(jì)計量分析》下面簡要地分享一下安裝步驟或過程〔這里演示的是WIN7_32:一、下載全部的安裝文件包"Stata_SE_12.1.rar",然后解壓,再打開其中的文件夾Stata12_Win,再"以管理員身份運(yùn)行"其中的Setup.exe。二、選擇并點擊next,再選擇并點擊"Iacceptthelicenseagreement",再選擇并點擊"anyonewhousesthiscomputer"或"onlyforme",然后,就進(jìn)入到以下界面,給你4個選

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論